あとがき

Office Open XMLに限らず、XMLには多くの利点があります。文書をXML化してデータベースとして活用することは既に世界中のユーザがそのシステムで行っています。しかしながらその編集作業やシステム構築で頭を悩ませているユーザーが多いことも事実です。ドキュメントをXML化する場合、文書の作成・編集作業にかかわるすべての担当者がXMLに精通していなければ編集は容易ではありません。しかしながら、Officeシステムがスタンダードなアプリケーションとなっている今日では、“XMLは知らなくてもWordなら使える”、という人は大勢います。Office 2007であればXMLの知識を必要とせずにXMLデータの作成が可能となります。2007年、OfficeシステムがファイルフォーマットにXMLを採用したことにより、今後のドキュメントのXML化に拍車がかかるのではないでしょうか。
第1版のあとがき

Office 2013でStrictのOOXMLの読み書きに対応したことを挙げましたが、Office 2019の保存形式の既定はTransitionalです。また、商用のOffice互換製品のほとんどは旧バージョンであるバイナリ形式のOffice文書をサポートしています。

2021年となり、文書のXML化は進んだのでしょうか?

新規にMicrosoft WordやExcelで作成されるファイルがXML化されたために、その意味では確実にXML化は進んだといえます。現在、サポートの外れた古いOfficeのユーザーであったり、古いOfficeで作成されたファイルをそのまま引き継いでいない限りは、OfficeユーザーはXMLでOffice文書をやり取りしています。

より広範な視野では、たとえば電子書籍の配布形式であるEPUB形式もXHTMLに基づくものです。エンドユーザーがXMLを直接目にする機会こそ減りましたが、文書の裏側でのXML化は以前より進んだといえるのではないでしょうか。

WebにおけるXML

XHTML仕様は廃止され(HTML5のXHTML記法という意味では残っていますが)、Webブラウザーとサーバーのデータ通信ではXMLよりもProtcol BufferやJSONでのやり取りが主流になりました。Web上のデータ通信用形式としてのXMLは存在感を薄くしています。

WebブラウザーがビルトインのXSLTプロセッサーでXMLをHTML変換して表示するというWebページの方法については主流にはならなかったといえるでしょう。

OOXMLは標準化された仕様である、という点とXMLである点で旧来のOfficeのバイナリファイルと異なります。このことによって新規にOffice互換のソフトウェアへの参入が増えたか、というと少し難しいところです。

商用ソフトウェアでOOXMLと互換のあるオフィスソフト、とくに読み書き可能なソフトウェアを作成する場合、旧バージョンのファイルが埋め込まれたりすることも考えねばなりません。2007年以降にOOXMLのみに対応したオフィスソフトが爆発的に増えたかについては、あまり確かな数字を出すことができませんでした。この要因として、OOXML仕様が固まったことで、バイナリーのOfficeフォーマットの仕様の更新が止まったこともあるのではないかと考えられます。

プログラミング言語のライブラリーでは、OOXML形式に対応したものが様々にあります(これらの中にはMicrosoftの提供するOpen XML SDKをラップしたものも含みます)。これは「標準技術で構成されていて、仕様が公開されている」ということが少なからず影響していると考えられます。ソースコードのホスティングサイトであるGitHubには「OOXML」で検索すると240件ほどの公開リポジトリがありました。WordprocessingML専用であったり、SpreadsheetML専用であったりといった、プログラミング言語ごとの細かなライブラリー、とくに書き込み用のものが増えたようです。

GitHubで「OOXML」を検索した結果
GitHubで「OOXML」を検索した結果

また、2007年から変化したそのほかの潮流として、アプリケーションサーバーやストレージサーバーのクラウド化や、サブスクリプション制を外すことはできません。オンラインでクラウド上の文書を編集することは一般的になり、Microsoft 365、Office 365など、買い切りでない販売方式も普及しつつあります。オフィススイートのクラウド化やサブスクリプション化では、それらの製品が終了したときの対応について、買い切りの製品以上に想定しておくべきでしょう。このとき、オフィス文書仕様が標準に則ったものであり、把握できるということは重要です。

今後OOXMLがどのように変化していくかは分かりません。しかし、すでに膨大なOffice文書資産が存在する以上、標準化仕様を標としながらこの資産を扱う術を学ぶことは有用でしょう。