Fils RSS : état de l’art

Le format RSS (« Rich Site Summary » ou « Real Simple Syndication » selon les sources) est un moyen simple pour extraire automatiquement de l’information d’un contenu régulièrement mis à jour.

Le format RSS
Le format RSS a peu évolué depuis sa création en 1999. La moitié des sites utilisent encore la version initiale 0.91. Une version plus complexe 1.0 a été un échec. Le mieux est d’utiliser directement le RSS 2.0, compatible avec la version 0.91 et dont la plupart des nouvelles options sont facultatives (spécifications officielles du RSS 2.0, traduction française). Si vous créez des fichiers RSS, il existe un validateur en ligne http://feedvalidator.org.

Les utilisations actuelles du RSS
Avec un fil RSS, on peut extraire de l’information de diverses sources : site web, weblog, messagerie, revue électronique, catalogue… L’extraction peut concerner tout ou partie de la source.

L’exploitation et la lecture des informations extraites par fil RSS peut s’effectuer selon divers processus :

  • Lecteur dédié de fil RSS
    L’information provenant d’un ou plusieurs fil RSS peut être lue, fédérée, syndiquée dans un lecteur installé comme logiciel client, ou rendue disponible sur un site web spécifique appelé agrégateur de fils RSS.
  • Navigateur web
    Les principaux navigateurs web du moment autorisent désormais la gestion des fils RSS au même titre que les signets ou favoris.
  • Lecteur de courriel
    Certains lecteurs de courriel permettent de collecter des informations provenant de fils RSS et de les gérer comme des messages électroniques.
  • Page web
    Un manière élégante de collecter l’information provenant de sources RSS est de l’organiser dans une page web

On voit clairement se dessiner un nombre important d’applications potentielles touchant aux domaines de l’information et de la documentation.

Les aspects techniques
Les formats RSS les plus répandus aujourd’hui sont :

  • RSS 0.91 / RSS 0.92 / RSS 2.0

    Le « fichier RSS » est souvent de type « rss.xml ».
    Il doit être conforme aux spécifications XML.
    Le fichier contient un élément (indiquant la version utilisée), comprenant lui-même un seul élement . Ce « channel » (canal, ou flux) comporte le contenu et les meta-données le d?crivant (balises), tout étant décrit dans plusieurs champs . Un « item » est en général une actualité.
    La version 2.0 est bien sûr la plus complète (par exemple, en version 0.91, on ne gère pas de date de publication et d’auteur par actualité, mais globalement pour tout le flux).
  • RSS 1.0
    Le « fichier RSS » est souvent de type « rss.rdf ».
    Il commence par l’élément principal , puis par un élément , et enfin par une liste d’éléments qui sont traités séparément (contrairement à RSS 0.91, qui englobe tous les items dans un « channel »).Ces deux types de formats sont donc différents, tant dans leurs syntaxes que dans les normes sur lesquelles ils s’appuient.
  • exemple de fichier RSS