Flux RSS d'opikanoba.org

Sur l’interopérabilité, l’architecture et les systèmes d’informations de santé


Billets de la catégorie ‘rss’

RSS 1.1 : reprise des travaux sur la branche RDF de RSS

Trois utilisateurs de RSS 1.0, Sean B. Palmer, Christopher Schmidt et Cody Woodard, décident de corriger les bugs de RSS 1.0 et d’améliorer le format en proposant RSS 1.1.

RDF Site Summary (RSS) est une application XML et RDF, qui fournit un format de données permettant de faire de la syndication de contenu.

Ce format, au cœur de bien des querelles, subit sa popularité et voit les intérêts divergents semer le trouble puisqu’il existe deux familles de formats, RSS 1.x et RSS 2.0 qui ne sont pas compatibles entre eux et qui se basent sur des points de vue fort différents. Alors que RSS 2.0, spécifié par Dave Winer, s’attache à la simplicité et ne définit aucun espace de noms, RSS 1.x prend le parti de la formulation sémantique, en adoptant espaces de noms et RDF. Si ces deux formats n’ont pas intégré de structure particulière de standardisation, un troisième format, concurrent des deux précédents, Atom (actuellement en version 0.4), évolue quant à lui au sein de l’IETF. La syndication de contenu est donc un monde complexe, puisque si les aspects techniques engendrent de longues discussions «bruyantes», l’aspect économique, plus discret, ne doit pas être oublié. Ainsi les sociétés comme Google ou Yahoo possèdent des outils stratégiques qu’elles veulent imposer, elles influencent donc l’évolution des formats.

Alors que le début d’année 2004 avait été riche en annonces et rebondissements concernant RSS et Atom, une période de calme s’était installée, propice à la stabilisation. C’est dans ce contexte qu’apparaît RSS 1.1 succédant à une version 1.0 stable et inchangée depuis plus de quatre ans. Les motivations de RSS 1.1 sont simples. Prendre en compte les bugs qui sont apparus sur la précédente version et faire évoluer le format. Si la finalité de cette proposition est classique et limpide, la façon d’agir l’est beaucoup moins. Une liste rss-dev existe et se veut le point central de discussions autour du format RSS/RDF. Or, trois membres de cette liste et utilisateurs de RSS 1.0 ont préparé en comité restreint une nouvelle mouture et l’ont proposé avec un statut proche de la recommandation candidate (pour faire le parallèle avec le processus du W3C). Les auteurs ont abordé le bien fondé de ces évolutions lors de discussions privées avec les précédents protagonistes de RSS 1.0 et ont mis la liste rss-dev devant le fait accompli. Sean B. Palmer, leader de la proposition, a voulu privilégier la rapidité de développement et pallier à l’incapacité, selon lui, du groupe à produire rapidement un nouveau document. Il argue en effet qu’un groupe de trois personnes est plus dynamique et peut accomplir un travail qui ne peut l’être par tous les membres d’une même liste (il semble qu’il ait raison, puisqu’une nouvelle version du document de travail, prenant en compte diverses remarques, est déjà disponible). Son but était donc de ne pas déclencher de discussions sans fin et de faire une proposition constructive au groupe. Malgré ce parti pris sur la forme, le fond semble satisfaire les auteurs de la première version. Les partisans de RSS 2.0,Dave Winer en tête, y voient, quant à eux, un nouveau format inutile, servant une fois de plus la confusion.

Cette version se veut donc être une mise à jour de la version 1.0. Mais elle vise également son remplacement. RSS 1.1 utilise les dernières fonctionnalités de RDF (non disponibles lors de la publication de RSS 1.0) et cherche à réduire les redondances et les ambiguïtés de la précédente version. La compatibilité ascendante est assurée dans la mesure où les points décrits dans une section dédiée sont respectés. RSS 1.1 est également aussi extensible que l’était RSS 1.0 et les modules d’extension peuvent donc être utilisés. Parmi les évolutions techniques, on peut noter :

  • l’élément Channel devient la racine du document (à la place de rdf:RDF)
  • rss:items est supprimé ainsi que tout son contenu (remplacé par une liste typée par l’attribut rdf:parseType=”Collection”)
  • l’attribut xml:lang est autorisé sur tous les éléments
  • l’attribut xml:base peut être utilisé pour simplifier les URI
  • l’espace de noms a changé (le fallait-il ?)
  • l’élément rss:textinput, inutilisé dans_ RSS 1.0_ et contesté dans RSS 2.0, est supprimé.

Autre fait marquant, ce document utilise RELAX NG pour définir de façon formelle le format et utilise les types de donnée de XML Schema. Apparaissent également une ontologie OWL et des versions en Turtle et N-Triplets. Afin de favoriser son adoption, RSS 1.1 est proposé avec un guide (regroupant de nombreux liens) et une gamme d’utilitaires déjà prêts : un validateur de flux RSS 1.1, une mise à jour du célèbre validateur (feedvalidator.org) mis en place par Mark Pilgrim et Sam Ruby, un validateur en python, des feuilles de style XSLT convertissant des fichiers RSS 1.0 en RSS 1.1 ou des fichiers RSS 1.1 en XHTML, la mise à jour de l’analyseur perl XML::RSS

Enfin les applications de weblogs, fournisseurs importants (pour ne pas dire quasi essentiels) de flux RSS, se mettent également à jour. C’est notamment le cas de Wordpress ou de Movable Type (voir la page dédiée).

Cette mise à jour relancera-t-elle l’idée (le besoin) d’opérer une fusion des formats de syndication existants ?

Autres articles sur xmlfr.org:

Canaux atom des groupes de discussions (merci google)

Google propose des canaux Atom pour suivre les groupes de discussions (Usenet). Disponibles dans leur nouvelle version Google Groups 2 bêta

Ils ne sont pas facile à trouver pour l’instant. Deux solutions :

2004, l’année RSS ?

Les deux dernières années furent certainement déterminantes en matière de XML. Son adoption dans de nombreux contextes en a fait une technologie pivot pour l’échange de données. Parallèlement, le phénomène weblog a connu un franc succès en 2003, et a permis de mettre en avant une technologie XML existante depuis 1999 : RSS.

Même si les sites Internet fournissant du contenu (sans distinction de genre) ont adopté rapidement le RSS après sa conception, son usage restait néanmoins restreint (technologie peu connue, nombre de fichiers RSS disponibles marginal, peu d’outils logiciels,…) . Depuis que chaque blogger (auteur d’un carnet diffusé sur internet ou weblog) peut fournir automatiquement un ou plusieurs fichiers RSS (simple fichier XML, désigné par les termes canal, flux ou encore fil) pour lister les derniers articles qu’il écrit, RSS a changé de dimension. Cette évolution s’est accompagnée d’un développement tous azimuts d’outils connexes. Il n’est effectivement plus possible de passer par une simple page Web pour synthétiser la masse considérable d’informations offerte par tous les canaux existants, comme cela pouvait être le cas lors du lancement de ce format par Netscape. Une page Web pouvait alors rassembler les cinq ou six canaux disponibles sur un domaine particulier. Désormais, avec la multiplication des sources d’information, il faut recourir à une application qui facilite la lecture.

Du logiciel de messagerie au navigateur Internet en passant par les portails ou les applications serveurs, lire des canaux RSS est vraiment simple. Il y en a pour tous les goûts, toutes les habitudes.

Certains clients de messagerie, comme bloomba, intègrent désormais, de façon native, un lecteur de canaux RSS et communique sur l’avantage de lire des nouvelles directement dans son logiciel. Evolution, un des clients les plus utilisés sous Linux, propose également un système de lecture de fils RSS. Outlook ne propose pas ce type de fonctionnalité, mais NewsGator s’intègre au logiciel de Microsoft et permet de palier ce manque. La firme de Redmond prévoit un support natif de RSS dans le framework Avalon de son nouveau système d’exploitation (il existe d’ailleurs une première application RSS pour Longhorn, qui a surtout valeur de test : Ocel). Le couplage Mail/RSS donne naissance à des solutions originales.rss.blogstreet.com propose un compte IMAP (uniquement en consultation) dédié aux flux RSS. Les dernières actualités émises par les fournisseurs de contenu que vous choisissez sont envoyées par mail. Vous pouvez ainsi les consulter avec votre propre outil de messagerie en ajoutant seulement une nouvelle configuration de compte mail. Plus classique, fastbuzz.com permet de lire les actualités au choix sur leur site Web ou via un courrier électronique envoyé à une fréquence donnée. A l’opposé, dodgeit.com vous permet de créer une adresse électronique et fournit le canal RSS associé. Ou encore MailFeed qui peut consulter votre boîte aux lettres (via POP ou IMAP) et vous générer un canal RSS de vos messages. Ainsi, vous consultez le flux RSS de vos mails. Si vous préférez nntp, le protocole des groupes de discussion, et les outils l’utilisant, nntp//rss répond au besoin. PubSub.com, quant à lui, fournit le service inverse : des mots clés permettent de créer un flux d’informations qui n’existent pas encore. PubSub sonde régulièrement les groupes de discussion et alimente ce flux avec les fils contenant des termes appropriés. Vous créez ainsi un canal prospectif.

Le monde des navigateurs Internet n’est pas en reste. La nouvelle version d’Opera 7.5 intègre une fonctionnalité de lecture des fils RSS. NewsMonster s’intègre à Mozilla ou Netscape et permet de souscrire à des canaux directement dans le navigateur. La présentation du contenu est basée sur la technologie XSLT et permet donc d’avoir une présentation vraiment personnalisable. Plusieurs plug-ins existent également pour FireFox (la version légère de Mozilla). Côté Mac, la nouvelle version d’OmniWeb (5) lit nativement les flux RSS. Enfin, Pluck est une barre d’outils pour Internet Explorer qui rassemble les canaux auxquels vous avez souscrit. Il affiche alors, dans la partie navigateur, le contenu de la nouvelle.

Bien sûr, il est possible d’utiliser un logiciel à part entière. Il existe une large palette d’outils (blogspace.com, ourpla.net ou 2rss.com fournissent des listes intéressantes) permettant de lire des canaux RSS sur votre système d’exploitation préféré. Ils apportent bien souvent de plus riches fonctionnalités que les plug-ins de navigateur ou de logiciel de messagerie. On trouve ainsi des applications classiques mais aussi des outils à usage plus général comme Desktop sidebar qui offre une barre d’outils s’exécutant sur le bureau Windows, permettant un accès rapide à vos flux RSS. Un autre outil intègre RSS comme technologie pivot : Gush. Il rapproche la messagerie instantanée et RSS. Outre les dialogues via Jabber et la lecture de canaux RSS dans le même logiciel, Gush vous permet de poster (ou de recevoir) des annonces à un ensemble ciblé de personnes, présentes dans votre liste de contacts. Lisez les annonces d’un groupe donné (collaborateurs par exemple) via un canal RSS et discutez-en via Jabber !

Si au contraire, vous souhaitez avoir accès à votre sélection d’informations (on pourrait parler de journal virtuel personnalisé) indépendamment de l’ordinateur et sans installer de logiciel, les sites Internet de syndication constituent la solution. Ils se nomment Meerkat, NewsIsFree, Syndic8 ou bloglines et proposent de créer un espace personnel gérant une liste de canaux RSS. Preuve que cette technologie est décisive, Yahoo! rattrape le train en marche. Depuis plusieurs années, chaque utilisateur des services du géant de l’Internet, peut créer un espace personnel modulable selon ses besoins, ses intérêts ; il s’agit bien sûr de Mon Yahoo!. Cette plate-forme intègre désormais (en version bêta) la lecture de canaux RSS et ne se contente donc plus des informations en provenance uniquement de Yahoo! Actualités. Il est donc possible d’enrichir son propre portail Yahoo! en spécifiant soit explicitement des canaux, soit en faisant une recherche dans la base de données RSS de Yahoo! (alimentée par un robot de recherche et/ou par la mise à jour explicite par les outils de publication RSS via des api RPC et REST).

L’éventail d’outils et de solutions dédiés à la lecture de canaux ne doit pas faire oublier les premières amours de RSS : la syndication de contenu . Consommateur de contenu pour le compte de votre propre site (le terme agrégateur est alors employé), ou producteur de flux RSS, chacun y trouvera son compte. Des technologies java (JSP , application Web , portlet ) au javascript (Meerkat, PrettyRSS) en passant par le php (magpierss, zFeeder), .NET (ASP, C#), python (feedparser, spycyroll ou rawdog), perl (XML::RSS) … il existe quantité de scripts ou d’API Open Source permettant d’intégrer très rapidement des informations issues de canaux RSS.

Mais l’offre logicielle autour de cette technologie a beau être importante, RSS n’échappe pas au problème classique d’Internet : comment localiser une source d’information que l’on ne connaît pas encore ? Une première solution consiste à naviguer sur les sites Internet (NewsIsFree, syndic8,…) répertoriant des milliers de canaux existant. Il est aussi possible de surfer sur différents sites Internet, de façon à repérer les icônes (oranges pour la plupart) estampillées XML ou RSS désignant les flux intéressants, et à copier/coller leurs URL dans votre logiciel préféré (cette manipulation fastidieuse pourra certainement être simplifiée par la création d’un nouveau protocole feed:// ou d’une extension du type MIME, permettant l’ajout d’un canal dans le logiciel de lecture en un seul clic). Ces techniques donnent de bons résultats, mais ne sont pas suffisantes. Le besoin de recherche par mots-clés est grandissant (le même besoin qui a vu le succès de Yahoo! ou Google pour chercher les pages disponibles sur le Web), d’autant que le nombre de canaux croit de façon exponentielle. Les moteurs de recherche permettent de trouver des informations traditionnelles de façon satisfaisante. Mais les moteurs de recherche RSS tels que blogdigger, feedster.com ou encore newstrove.com permettent de réaliser des recherches sémantiques en utilisant des métadonnées positionnées dans les fichiers RSS (les balises XML telles que , , ,… qui décrivent l’information elle-même). Ainsi le format XML de RSS prend tout son sens, et les moteurs de recherche sémantique tant attendus apparaissent (sur une portion encore limitée du Web). Le résultat est une liste de flux répondant à vos critères avec en prime un canal RSS correspondant à votre recherche. Vous pouvez alors faire une veille sur un sujet spécifié par une combinaison de mots clés. En souscrivant à ce nouveau canal, vous serez prévenu, lors d’une future consultation dudit canal, d’une information qui n’existe pas encore au moment de votre recherche, ce qui contraste radicalement avec l’utilisation des moteurs de recherche du Web existants (et rejoint le service fourni par PubSub sur la surveillance des groupes de discussion nntp).

Ainsi le moins que l’on puisse dire, c’est que RSS inspire ! De nouveaux services déclinent RSS à toutes les technologies ou à tous les concepts ! Vous consultez régulièrement le site de Télérama ou de l’Equipe, mais ceux-ci ne fournissent pas de canaux RSS officiels : NewsIsFree vous en fournit un. Une URL suffit à myrss.com pour créer des canaux RSS, dans différents formats, mis à jour quotidiennement… Enfin, rssgenr8 permet de créer des flux à partir d’une page html en se basant sur la présence de certaines balises prédéfinies. Et il y a fort à parier que tout type d’information aura sa déclinaison RSS. Par exemple, vous souhaitez être averti de tout nouvel ajout de logiciel dans la base de dmoz.org : xmlhub.com vous laisse définir des termes à surveiller et génère votre flux personnalisé.

Mais RSS peut s’appliquer à des domaines plus spécifiques encore, comme par exemple les notifications CVS. CVS est un serveur de gestion de configuration, permettant le travail collaboratif sur des projets. Il est courant de s’abonner auprès du serveur CVS pour recevoir un courrier électronique, lorsqu’un collaborateur a modifié un fichier. Cependant le nombre de courriers générés peut être gigantesque si le projet évolue fréquemment, et si beaucoup de personnes travaillent dessus. Pour éviter la surcharge de votre messagerie, cvs2rss permet de suivre les évolutions relatives au projet au même titre que tout autre actualité et votre logiciel de messagerie retrouve sa fonction première : le courrier (et non les notifications). Cet exemple illustre simplement le fait que ce format a convaincu nombre d’utilisateurs et tend à se répandre dans tout ce qui touche à la diffusion d’information, qu’elle soit technique ou informationnelle.

Certaines entreprises ont donc bien compris cet avantage et utilisent RSS comme outil stratégique en formulant leurs communiqués de presse à l’aide de flux RSS. Alors que la constitution d’un fichier d’utilisateurs désirant recevoir un mail sur les dernières nouveautés est longue, fastidieuse et coûteuse pour une entreprise, la diffusion de ces mêmes informations à travers un fichier unique est extrêmement plus efficace. En effet, pour un journaliste qui doit traiter une grande quantité de mails par jour, il est parfois difficile de distinguer une annonce intéressante d’un spam. Dès lors, la consultation d’un flux spécialisé permet d’avoir accès à l’information instantanément. La société fe77 se propose ainsi d’intervenir comme fournisseur de centre de presse et agit donc comme un intermédiaire entre les entreprises et les journalistes. Mais l’utilisation de RSS peut se faire également en interne. Un article très intéressant d’ Anne Chen, détaille comment la société Triple Point a mis RSS au coeur de son système d’information. Son représentant, qui a mis en place weblogs et RSS, estime que les diffusions interne et externe d’informations sont nettement plus efficaces via RSS que par courrier électronique. Quelle que soit la connaissance informatique des acteurs du système, la saisie via un weblog est très aisée, et l’information est relayée instantanément par le biais d’un canal RSS. Aucune connaissance technique du format n’est nécessaire. Concernant la diffusion d’informations, il existe d’ailleurs toute sorte d’initiatives. Par exemple, upcoming.org utilise RSS pour reporter des événements en tout genre. N’importe qui peut saisir un événement, le décrire et le classer. Les utilisateurs de ce groupe d’événements (par exemple dans la ville de Paris) disposent alors instantanément de l’information.

Enfin, comme la publicité est omniprésente sur le Web, il y a pas de raison que RSS y échappe. RSSAds propose d’ajouter des publicités dans les flux RSS. Serait-ce le signe de la véritable montée en puissance de ce format ?

En tout état de cause, nombreux sont ceux qui prédisent un avenir doré à RSS. D’aucuns déclarent la mort de la messagerie, en pensant que RSS est la réponse au problème de spam. De plus en plus de sociétés délaissent la traditionnelle lettre d’actualités et optent pour un canal RSS. Avec la venue des nouveaux virus qui surchargent les boîtes aux lettres, cette solution apparaît réellement satisfaisante. RSS permet de contourner un autre problème bien connu : celui des messages automatiques renvoyés par les abonnés absents et informant l’émetteur et les autres lecteurs de leur indisponibilité. Ces réponses génèrent un trafic tout aussi important qu’inutile. De plus, le canal RSS évite d’avoir à trouver des astuces ou de mal orthographier certains mots pour qu’ils puissent passer à travers les passerelles de sécurité qui rejettent systématiquement les messages contenant un mot catalogué comme indésirable. Ainsi, en remplaçant la lettre d’actualités classique par un canal RSS, l’utilisateur devient actif en sélectionnant les sujets qui l’intéressent et n’est plus à la merci d’un flot de messages plus ou moins contrôlé dont les procédures de désabonnement ne sont pas toujours aisées et immédiates (l’adresse mail n’est plus stockée chez le fournisseur de mail et n’est donc pas susceptible d’être diffusée à des entreprises tierces).

Cependant, cette vague d’enthousiasme ne doit pas occulter quelques aspects qui pourraient nuire à l’essor de ce format. Le premier concerne ni plus ni moins que son succès ! En effet, nombreux sont ceux qui s’inquiètent de la surcharge réseau que peut engendrer une consultation intensive des multiples canaux existants. Pour se tenir à jour d’un flux RSS, un logiciel va télécharger un fichier RSS donné à intervalle de temps donné, toutes les heures par exemple. Ainsi, le jeu des multiplications peut devenir effrayant (nombre de téléchargements dans la journée multiplié par le nombre d’abonnés). De plus, le trafic ainsi généré peut se révéler vraiment inutile si les canaux ne sont mis à jour qu’une seule fois par jour. Les solutions sont multiples, de l’intégration d’une donnée dédiée à la fréquence des mises à jour dans le flux, à l’implémentation pour le fournisseur et le client du GET conditionnel de HTTP. Steve Gillmor propose même d’utiliser conjointement RSS et un logiciel Peer-to-peer, comme BitTorrent. L’avantage ? distribuer un même flux sur de multiples sources. Plus un canal est populaire, plus il est réparti sur le réseau, ce qui évite donc la surcharge du site auteur du canal (d’autres voient dans cette association (BT/RSS), l’utilisation inverse, c’est-à-dire un moyen de se tenir informé des derniers fichiers disponibles en téléchargement…).

Deuxième zone d’ombre sur RSS : la multiplicité des formats, le manque de convergence vers un format précis, les guerres de chapelles… Même si RSS est devenu une technologie clef, il n’en demeure pas moins que cinq ans après la publication du premier format (et un riche historique), il n’existe toujours pas de standard ! En effet, sept formats se regroupent en deux familles (RSS 1.0 et RSS 2.0). Ces deux formats coexistent actuellement (voir graphique) sur Internet et ne sont pas compatibles. La version 1.0 (dont l’ancêtre est RSS 0.90) utilise les espaces de noms et RDF, tandis que RSS 2.0 (issu des versions 0.91, 0.92, 0.93 et 0.94) n’utilise qu’une version minimale de balises XML. Pire, le terme RSS n’est pas clairement défini : Really Simple Syndication pour certains, Rich Site Summary pour d’autres, ou encore RDF Site Summary. RSS cristallise des batailles de chapelles et de fortes personnalités, nuisant parfois au consensus. D’autant que les spécifications sont restées en dehors du circuit du W3C ou tout autre organisme de normalisation. Une recommandation au même titre que SVG ou MathML aurait sûrement assuré plus d’interopérabilité et freiné la multiplication des formats. Cette situation a engendré un nouveau projet. D’abord nommé Echo, Atom risque de précipiter les actuels formats RSS dans la désuétude. Atom est un projet très orienté weblog (et donc soutenu par les acteurs du marché, comme MovableType ou Google), et propose une partie centrée sur la syndication, comme RSS, mais aussi sur les moyens d’archiver, publier, éditer, des billets de journaux Web. Atom n’est pas encore arrivé à maturité mais déjà beaucoup d’outils offrent un support (tant au niveau de la production de canaux, que de la lecture) aux cotés de RSS, et ce format est d’ores et déjà soumis à l’IETF pour standardisation. Devant la rapide montée en puissance d’Atom, Dave Winer (l’auteur de RSS 2.0), après l’avoir sciemment ignoré, propose désormais une fusion des deux formats afin de progresser sur le concept et d’abandonner les querelles desservant les utilisateurs. L’auteur d’Atom, Sam Ruby, ne semble d’ailleurs pas opposé à une telle évolution.

Porté par la vague weblog, RSS s’est imposé comme une technologie indispensable dans la sphère des boulimiques de l’information (Chad Dickerson auteur sur le site d’informations techniques InfoWorld note d’ailleurs que la consultation de leurs flux RSS dépasse désormais celle de leur page d’accueil). Les éditeurs de logiciels (Open Source ou non) l’ont bien compris. En effet, il existe actuellement pléthore d’outils RSS. Chacun s’adaptant aux habitudes de ces consommateurs. D’aucuns prétendent même que RSS est une solution miracle à bien des problèmes, et prédisent la fin de la pollution quasi-quotidienne des boîtes aux lettres par les spams ou un dopage de la communication interne. Même si le format lui-même est houspillé, ce n’est finalement qu’un détail pour les utilisateurs. Le concept mis en exergue par RSS est tellement fondamental, il est si largement plébiscité qu’il s’imposera quel que soit son format. Les éditeurs de logiciels sont prêts ou se renforcent, à l’image de Sun Microsystems qui s’offre Tim Bray pour développer et maîtriser le phénomène syndication. Et si des entreprises comme Nokia ou Apple ouvrent des dizaines de canaux pour organiser et diffuser des quantités d’informations visant des publics différents, il y a fort à parier que d’autres suivront. Il semble donc, comme l’évoque Forbes, que 2004 soit l’année RSS. Ainsi en 2004, vous n’échapperez sans doute pas à la syndication !

Autres articles :

Autres articles sur xmlfr :

Et sur d’autres sites :

RSS - Dates essentielles

RSS ou l’anti-consensus ? Toujours est-il qu’il s’agit bien là d’une technologie où les protagonistes peinent à se mettre d’accord… Zoom sur les dates importantes pour les différents formats de la syndication.

histoire de RSS

Mars 1997 : Microsoft propose au W3C un format XML permettant d’être tenu au courant de nouvelles informations issues d’un canal donné : Channel Definition Format (CDF)

Juin 1997 : A son tour, Netscape soumet au W3C, un autre format XML mettant l’accent sur les métadonnées : Meta Content Framework (MCF). Synthètisant ce format et PICS, le W3C publie la spécification RDF.

Décembre 1997 : Dave Winer, de la société UserLand, propose un format similaire à CDF : scriptingNews. Les deux outils de publication de contenu web développé par UserLand (Manila pour la cible entreprise et RadioUserLand pour les particuliers) utilisent ce format pour syndiquer des informations.

Mars 1999 : Netscape lance son portail my.netscape.com et publie RSS 0.90 (RDF Site Summary). Dans la continuité de MCF, cette version utilise RDF et les espaces de noms. Le portail permet alors à un tout utilisateur de créer son propre compte et d’avoir une page d’accueil personnalisée. La page se présente comme un ensemble de rubriques mises à jour quotidiennement. Les rubriques sont sélectionnées parmi celles proposées par netscape (en réalité, netscape ne fournit que la liste de canaux disponibles, chaque canal étant géré par un site tiers) ou en ajoutant un canal tiers (via une URL). La version actuelle de my.netscape.com n’offre plus ces services, seuls quelques canaux prédéfinis sont désormais accessibles.

Juin 1999 : Ne trouvant pas d’accord avec Netscape quant à une collaboration sur un format commun, Dave Winer propose scriptingNews 2.0b1, format qui inclut les fonctionnalités offertes par RSS 0.90.

Juillet 1999 : Dan Libby (également auteur de la version 0.90), pour le compte de Netscape, spécifie RSS 0.91 et le rebaptise Rich Site Summary. La philosophie du format change, puisque RDF et les espaces de noms sont supprimés. RSS devient un format de syndication, laissant de côté l’idée originale, à savoir le résumé d’un site Internet grâce aux méta-données. Ce nouveau format intègre alors des éléments de scripingNews. UserLand adopte RSS 0.91 et laisse de côté son précédent format ScriptingNews.

Juillet 2000 : Netsape se désinterresse de RSS. La communauté entre en conflit sur l’avenir du format, ce qui donne lieu à une scission (Mark Pilgrim revient dessus en détails). RSS 1.0 voit le jour et se rapproche de la version intiale (0.90). Elle intégre à nouveau le vocabulaire RDF et les espaces de noms XML. L’axe principal de réflexion se porte sur la constitution d’un noyau stable et minimal, agrémenté de modules offrant les possibilités d’extension.

Décembre 2000 : Poursuivant sur la route de RSS 0.91, UserLand (et donc Dave Winer) annonce la version 0.92. Elle reste compatible avec RSS 0.91 puisque seuls de nouveaux éléments optionnels sont ajoutés.

Avril 2001 : Des ajouts mineurs à RSS 0.92 donnent un document de travail RSS 0.93, toujours par UserLand. Cette version ne sera pas déployée.

Août 2002 : Nouveau document de travail par UserLand, RSS 0.94. Un type Mime est introduit au niveau de la description d’un <item>, ce qui n’est pas du goût de tout le monde. Considéré comme une erreur, Il sera d’ailleurs supprimé par la suite. Cette version ne sera pas déployée.

Septembre 2002 : S’appuyant sur les dernières versions 0.92, 0.93, 0.94, Dave Winer spécifie RSS 2.0, après avoir quitté UserLand. Les espaces de noms sont introduits pour permettre l’ajout de modules. Une évolution sur une balise (<skipHour>) est spécifiée en novembre 2002, il s’agit de RSS 2.01, qui remplace la version 2.0.

Septembre 2002 : Parodiant Dave Winer, en intitulant une entrée de son Weblog : “The Road to RSS 3.0” (Winer avait annoncé RSS 2.0, par une entrée “The Road to RSS 2.0“), Aaron Swartz, co-auteur de la version 1.0, propose RSS 3.0. En utilisant quasiment la même façon d’écrire, il spécifie une version de RSS en supprimant la syntaxe XML, les espaces de noms et le HTML des balises <description>.

Février 2003: Dave Winer crée le RSSboard, qui ne détient pas les droits de RSS mais qui doit apporter un support sur le format 2.0

Juin 2003: Face aux difficultés (protectionnisme de Dave Winer sur le format) pour faire évoluer RSS 2.0 , un nouveau groupe de travail se forme pour créer un nouveau format pour la syndication et la gestion des billets dans un weblog : d’abord nommé Echo, son nom sera finalement Atom.

Juillet 2003 : RSS 2.0 change de propriété intellectuelle et de licence. La spécification est désormais hébergée, sous licence Creative Commons, par le “Berkman Center for Internet & Society” de l’Ecole de Droit de Harvard.

Mars 2004 : Devant la popularité de Atom, Dave Winer plaide pour enterrer la hache de guerre et propose une fusion des formats Atom et RSS 2.0. Ce format, à l’image de Atom, serait soumis à l’IETF pour standardisation. Sam Ruby, principal protagoniste de Atom ne semble pas opposer à l’idée.

Juillet 2004 : Dave Winer quitte le RSS board las, dit-il, des querelles. Il déclare faire confiance au board et le laissera travailler.

Décembre 2005: L’équipe IE de microsoft adopte l’icone orange introduite par Firefox pour les flux RSS.

Janvier 2006: Rogers Cadenhead, invité par Winer à rejoindre le RSS board deux mois avant son départ en 2004 et désormais à la tête du comité, s’intérroge sur la viabilité board et mène une concertation auprès de 5 VIP (dont Winer). Collégialement, il est décidé de poursuivre ses activités. Cadenhead lance alors le site rssboard.org et invite huit nouveaux membres. Il tente par ailleurs de modifier RSS 2 pour lever une ambiguité.

Mars 2006: Le RSS board supporte désormais l’icône orange introduite par Mozilla.

Mai 2006: Le RSS board propose à l’IANA d’adopter le type MIME application/rss+xmlpour les flux RSS.

RSS ou la syndication de contenu

La masse d’informations disponibles sur les sites web croît sans cesse. L’information. Voila bien le nouveau nerf de la guerre dans la galaxie internet.

Avec sa popularité, Internet est un nouveau média qui compte chaque jour de nouveaux adeptes. Et chose nouvelle, tout un chacun peut produire de l’information. Ce n’est plus un domaine réservé, comme ce peut être le cas des médias télévisuels ou de presse écrite. Ce nouveau phénomène, porté par les weblogs (ou carnet web) pose un nouveau problème. Si l’information est alors plus disponible, et les avis plus variés, la multiplication des sources crée paradoxalement de la sur-information. Il y a donc une place pour des sites Internet “portails” qui aggrège l’information, c’est à dire qui sélectionnent les sources de données pour leur qualité ou leur spécificité et presente cette information d’une façon agréable et lisible.

Par exemple, un site financier peut proposer une liste d’articles décrivant des analyses, un site de sport peut proposer plusieurs canaux de brèves (une par sport), etc… Il est alors possible pour un site portail de “picorer” à droite, à gauche pour former sa propre identité (par exemple, présenter les dernières nouvelles sur des équipes sportives avec des informations financières sur leurs sponsors, des commentaires de sportifs issus de leur weblog…). Le portail se contente d’afficher une liste de brèves avec un design qui lui est propre. Les actualités sportives et financières étant fournies par le site concerné. Ainsi, le site peut présenter une autre façon de voir l’information, plus ciblée.

Pour réaliser cela, deux approches sont possibles :

  • lire le fichier HTML contenant l’information, analyser sa structure et extraire les données intéressantes. Cette solution nécessite du code adapté au format du fichier HTML, susceptible de changer à tout moment au gré du fournisseur de contenu (les relookages sur le web sont fréquents).
  • utiliser un fichier qui sépare complètement les données de la présentation, éliminant ainsi les défauts décrits ci-dessus. Cette approche est celle de RSS, où, dans un fichier RSS, seul le contenu est présent (avec omission totale d’élements de présentation). Ce format de fichier permet de décrire un ensemble d’informations (sous forme de brèves), offrant pour chacune un lien vers une description plus conséquente. Les nouvelles sont associées à un canal particulier (c’est à dire un type d’information en particulier : sport, finances,…).

Les apports de RSS pour les fournisseurs d’information sont multiples. Le format est défini une fois pour toutes, et il est partagé par tout le monde. De plus, dans un fichier RSS, seuls des titres sont fournis (une collection de liens avec éventuellement par chaque lien une brève description).Le coût de mise en place est donc trés faible : mettre à jour un fichier de contenu !

Deux aspects sont importants pour un fournisseur de contenu :

  • communication externe : le fournisseur met à disposition un fichier RSS qu’il actualise selon la fréquence qu’il désire. Il enregistre le lien (URI) vers ce fichier auprés d’aggrégateur(s) de contenu (NewsIsFree, Syndic8, 2rss) et/ou le laisse disponible sur son site. Enfin, il laisse les utilisateurs qui surfent sur différents sites reprenant l’information ainsi publiée (par présentation du fichier RSS) générer du trafic (puisque l’article complet est localisé chez lui)…
  • communication interne : des collaborateurs d’une même entreprise localisés à différents endroits peuvent se tenir au courant des activités des différentes équipes. Chaque équipe maintient un fichier RSS décrivant quelles sont les nouvelles sur leur activité.

Le partage d’informations est couramment désigné par le terme de syndication. La pratique qui consiste, pour un site portail par exemple, à regrouper plusieurs canaux à un même endroit est désigné par le terme aggregation.

Histoire de formats…

Le succès grandissant, proposer un format et le déclarer standard est crucial. RSS souffre d’ailleurs de nombreuses guerres à ce sujet, et les formats se succèdent et se multiplient… Actuellement, quatre tendances co-habitent sur le marché, en attendant peut-être une fusion générale ?

  • RSS 2.0 : format XML avec des balises dépourvues d’espaces de noms
  • RSS 1.0 : format XML agrémentés de RDF, de modules d’extension désignés par des espaces de noms
  • RSS 0.9x : format XML précédent le format RSS 2.0, qui reste utilisé de façon significative
  • Atom 0.10 : nouvelle proposition utilisant elle aussi les espaces de noms, en passe d’être aprouvé par l’IETF

D’après les statistiques disponibles sur le site syndic8, la répartition des formats serait la suivante : distribution des formats

A noter, que le format Atom est absent des calculs, puisqu’il est récent et en cours de stabilisation.

Pour plus d’informations sur l’historique de RSS, l’apparition des versions, voir les principales dates concernant les différents formats de RSS.

Autres articles :