09/06/2005
Moins de deux semaines après l’annonce de la promulgation, par le consortium OASIS, du format OpenDocument au rang de standard, Microsoft annonce à son tour un nouveau format, Office Open XML, pour sa prochaine version d’Office.
XML est plus que jamais la technologie pivot des systèmes d’informations. Déjà au cœur de l’échange des messages et des services, voici que l’ensemble des suites bureautiques se l’approprie. Si OpenOffice a introduit XML très rapidement, fin 2000, comme format de stockage (les documents sxw
,sxc
,sxi
…), Microsoft vient également d’annoncer que les formats propriétaires doc
, xls
et ppt
ne seraient plus les formats de sauvegarde par défaut (ils seront toujours gérés malgré tout) de la nouvelle suite Office, labellisée Office 12. Cette dernière, planifiée lors du second semestre 2006, adoptera un format plus proche de celui d’OpenDocument : une archive zip contenant plusieurs fichiers distincts.
L’apparition des formats ouverts
La standardisation d’OpenDocument 1.0 par l’OASIS (Organization for the Advancement of Structured Information Standards) pose un jalon important. C’est la première fois, qu’un format de document bureautique est défini de façon indépendante d’un éditeur de logiciel, de façon totalement ouverte et qu’il est mis en œuvre avec succès. La précédente tentative, ODA pour Open Document Architecture, fut jugée trop complexe et ne s’est pas imposée face aux formats SGML et RTF, plus simples et pragmatiques. Si OpenOffice 2 est la figure de proue de ce nouveau standard, basé sur celui utilisé par OpenOffice 1.0 et soumis en 2002 par Sun à l’OASIS, les suites bureautiques alternatives l’ont également adopté ou sont en passe de le faire. StarOffice 8, la version fondée sur OpenOffice et vendue par Sun et Koffice, du projet KDE, l’utilisent déjà. Par ailleurs, AbiWord, du projet Gnome, propose un support expérimental. Séduits par cette carte de l’indépendance du format vis-à-vis des logiciels, de grands acteurs comme Adobe, Corel et IBM ont rallié le comité technique d’OASIS afin de contribuer à cet élan.
La préoccupation en termes de formats ouverts n’a pas l’apanage des grands acteurs du monde logiciel. Les documents bureautiques étant une composante essentielle des systèmes d’informations gouvernementaux, l’interopérabilité et la pérennité des informations sont au cœur des attentions des utilisateurs finals. L’Union Européenne a ainsi commandé, en 2003, à la société de conseil Valoris, un rapport sur les différentes tendances et acteurs autour des formats ouverts de document. Suite aux résultats de ce rapport, qui met face à face Microsoft et le format d’OpenOffice, l’Union Européenne fait des recommandations sur l’utilisation de ce type de format pour les administrations publiques. Elle encourage par la même occasion Microsoft et OASIS à prendre des mesures pour rendre leur format plus ouvert et plus conforme aux attentes de ces administrations.
Suite à ces commentaires et à la pression de certains gouvernements, en particulier du gouvernement danois, Microsoft finit par libérer l’accès aux schémas XML utilisés dans Office 2003. Ils sont alors soumis à licence non contraignante, à acceptation tacite, c’est-à-dire sans obligatoire de signature.
C’est devant cette montée en puissance de OpenDocument et pour répondre à la volonté croissante des clients privés et institutionnels, que Microsoft pousse sa stratégie XML beaucoup plus loin. Non seulement, Office 12 sera publié avec les schémas, les formats par défaut seront XML, mais Microsoft agite le drapeau de l’ouverture de son format comme une véritable révolution.
Microsoft exploite donc le travail réalisé sur ses deux formats WordprocessingML et SpreadsheetML, introduits dans la suite Office 2003, pour créer deux nouveaux schémas, incompatibles avec leurs aînés. C’est également l’occasion de combler une absence concernant le logiciel de présentation Powerpoint et de le doter lui aussi d’un schéma XML, ce qu’OpenOffice met en œuvre depuis longtemps déjà. Les suffixes des fichiers se voient agrémenter d’une lettre ‘x’ finale pour les documents ne contenant pas de macros et d’une lettre ‘m’ finale pour ceux qui en possèdent. Nous aurons donc des fichiers .docx, .docm, .xslx, .xslm, etc… Ces formats seront libres de droits et la documentation des schémas sera disponible. A l’instar d’OpenDocument, ils resteront soumis à une licence libre et gratuite. Cependant, seul Microsoft sera capable de les modifier. Les tierces-applications auront alors pour challenge de suivre et de répercuter ces changements.
Techniquement
D’un point de vue technique, les concepts des deux solutions sont très similaires. OpenDocument et Office Open XML se présentent sous la forme de deux archives compressées au format zip (au format jar pour OpenDocument pour être plus précis). Dans ce conteneur, se trouvent divers fichiers XML. Ils représentent les différentes entités du document : contenu, méta-données, informations de style, de présentation, images référencées dans le document…
Tout deux présentent alors des avantages indéniables :
- taille réduite, grâce à la compression,
- indépendance vis-à-vis de l’application : chaque document peut être décompressé et tout le contenu est lisible et modifiable à l’aide un simple éditeur de texte,
- robustesse améliorée à partir du moment où un fichier corrompu (à l’intérieur de l’archive) n’a pas d’impact sur les autres,
- séparation des concepts : le contenu est clairement séparé de la présentation et des autres informations qui ne sont pas essentielles. Ce mécanisme ouvre la voie de l’évolutivité, de la transparence et de l’agilité des informations. L’abandon d’un format monolithique, difficilement manipulable en dehors de l’outil qui le produit, permet donc d’échanger l’information et de la manipuler facilement. Une feuille de style XSLT pourra, par exemple, suffire à passer d’un format à l’autre,
- la définition de schéma introduit un concept nouveau pour un document bureautique : la validité. Cette validité permettra de renforcer la qualité d’échange de l’information entre applications,
- des technologies maîtrisées : XML, W3C XML Schema et le format zip sont des technologies mûres et maîtrisées. De nombreux outils permettent donc de manipuler ces nouveaux formats quelle que soit la plate-forme ou le langage de programmation. Leur prise en main et donc leur adoption seront rapides.
Il reste néanmoins des différences entre les deux formats. Toutes ne sont pas connues, car l’annonce de Microsoft est très en amont de toutes les informations techniques disponibles. On peut noter cependant qu’OpenDocument fournit un seul schéma qui couvre les documents issus du traitement de texte, du tableur, du logiciel de présentation alors que Microsoft fournit un schéma par type de document. OpenDocument utilise une grammaire RelaxNG, dont les bases mathématiques lui offrent un plus forte robustesse de validation par raport aux autres schémas, alors qu’Office Open XML emploie les schémas XML (XSD). OpenDocument se base fortement sur des standards reconnus : HTML, SVG, XSL, SMIL, XLink, XForms, MathML et Dublin Core. Au vu des documents techniques disponibles, Microsoft semblerait ne pas les prendre en compte.
Malgré tout, de façon générale, les deux formats se ressemblent fortement. Une question essentielle est alors sur toutes les lèvres : OpenDocument étant déjà spécifié et identifié comme un standard, pourquoi Microsoft, membre du consortium OASIS, crée encore un nouveau format et n’adopte pas OpenDocument ? Si Dare Obasanjo (spécialiste XML chez Microsoft) se pose en victime face aux détracteurs du nouveau format, Jean Paoli, architecte XML senior chez Microsoft et l’un des artisans de la technologie XML explique ce choix. Il semblerait que l’adoption du format OpenDocument soit impossible, bien qu’il fût qu’envisagé, en particulier à cause des contraintes de compatibilité avec les formats MS Office précédents et de la somme d’utilisateurs des suites bureautiques de Microsoft. Echaudé par la migration à Office 97, Microsoft tente de faire passer sa révolution en douceur auprès de sa base d’utilisateurs. Toujours selon Jean Paoli, le format OpenDocument ne serait pas adapté pour une telle évolution. Par ailleurs, Microsoft mettra à disposition gratuitement des convertisseurs, permettant de prendre en compte ces nouveaux formats dans les produits déjà déployés. Ils seront disponibles pour chaque version d’Office (Office 97 et ultérieures).
À suivre…
Poussé par le rapport de Valoris pour l’Union Européenne, OpenDocument poursuit son chemin de la reconnaissance en tant que standard. La prochaine étape met en jeu l’ISO, au sein duquel le format est proposé. Quant à sa mise en œuvre, elle est d’ores et déjà concrète puisqu’au cœur des nouvelles versions d’OpenOffice, de StarOffice et de KOffice.
La firme de Redmond, quant à elle, déploie son savoir-faire marketing en multipliant les communiqués de presse et les sites dédiés à sa nouvelle technologie, avec des livres blancs (sur les formats, pour les développeurs) sur le sujet présentant nombre de cas d’utilisation. L’outil weblog n’est pas oublié. Brian Jones, travaillant chez Microsoft depuis 6 ans dans l’équipe Office et plus particulièrement sur le support de XML dans Word, en a ouvert un pour l’occasion. Son but est de créer une dynamique autour de ce nouveau format et de donner des réponses rapides à tous ceux qui s’interrogent sur le tournant que prend Microsoft.
Les plus pessimistes jugeront que Microsoft ne fait pas assez ou ne fait pas assez bien et devrait opter pour un format encore plus ouvert. Ils pointeront du doigt une fausse bonne nouvelle, objectant que délaisser OpenDocument au profit de nouveaux schémas est une erreur. Les plus optimistes, au contraire, se réjouiront que le format des documents bureautiques soit enfin accessible de façon simple et qu’il offrira ainsi des possibilités d’échange jamais atteintes jusqu’à présent. Bien qu’on puisse regretter cette disparité de format entre le monde de l’OpenSource et Microsoft, il est intéressant de noter à quel point la technologie XML s’est imposée en moins de dix ans. Cette omniprésence de XML permet désormais d’envisager de vrais scénarios d’interopérabilité de systèmes et d’échange de données.
voir aussi sur le site xmlfr.org: