本スキーマはPDFの文書構造を表現するAHPDFXML形式を記述したものです。
AHPDFXML形式では1個のPDFファイルは複数のファイルに変換・分割されて表現されます。ファイルの種類には以下があります。
1~9はすべてXMLファイルです。10はほとんどがXMLファイルではありません。
1. カタログファイル
分割されたファイルを一括管理するカタログ構造を持ちます。
2. ドキュメントファイル
PDFの文書構造の本体部分を格納します。
3. スタイルファイル
ドキュメントファイルの各要素に適用されるスタイルを定義します。
4. アーティクル
PDF中のアーティクル情報を格納します。
5. 宛先ファイル
PDF中に定義されている各種の宛先に関する情報を格納します。
6. アウトラインファイル
PDF中に定義されているアウトラインの情報を格納します。
7. リストファイル(*1)
リスト構造を管理します。
8. カラー辞書ファイル(*1)
PDF中に格納されているカラースペースの辞書を格納します。
9. 拡張メタデータ
PDFに格納されている拡張メタデータ(Extensible Metadata Platform)を格納します。
10. 埋め込みファイル
PDF中に埋め込まれている別アプリケーションで作成された各種ファイル、または画像として抽出される
SVG,PNG,JPEGなどのファイルを指します。
本スキーマのバージョン: 2.0
編集者: 牧田祐子(アンテナハウス)
最終更新日: 2020-06-22
注:バージョン2.0では、*1の記されたファイル出力または機能は実装されません。スキーマ記述対象は1~8になります。 |