PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr

スペース

PDFのアクセシビリティ標準:PDF/UA-1 (ISO 14289-1)について

本記事は、アンテナハウスブログI love software2!に掲載された「PDF/UA-1 (ISO 14289-1)」関連の記事を一つにまとめ、さらに内容を加筆したものです。

概要

PDF/UA-1規格書の正式名は:
Document management applications —
Electronic document file format enhancement for accessibility —
Part 1: Use of ISO 32000-1 (PDF/UA-1)

PDF/UA-1はタイトルのとおり、PDFのアクセシビリティを高度化することを目的としています。PDFにおけるアクセシビリティの向上とはどのようなものでしょうか。現在、PDFは最も広範に利用されている電子文書形式ですので、多くの人に使いやすいものであることが求められます。障害を持つ人、高齢者にも簡単に使える必要があります。

たとえば、視覚に障害を持つ人が利用する場合、音声読み上げソフト等によって、テキストが確実に読み上げ可能である必要があります。画面に文字が表示されているPDFでも、読み上げが確実とは限りません。コピー&ペーストで他のアプリケーションに文字がコピーできないPDFがありますが、このようなPDFは文字コードを取り出せないため、音声読み上げソフトでも読み上げできません。

また、同じ漢字でも日本語と中国語では読み方が異なる為、そのテキストがどの言語のものなのか、といった情報も必要となります。

また、画像、図形等が使用されている場合、それがどのような意味を持つものなのか、テキストによる説明があると、利用しやすくなります。

規格

PDF/UA-1は、PDFの国際標準であるISO 32000-1(PDF 1.7)で定める機能をベースとして、アクセシビリティの観点から使用すべき機能を決め、使用方法に制限を付けたり・禁止する機能などを決めています。

ISO 14289-1仕様書は2012年7月25日初版、2012年8月1日修正版が出版されました。2016年8月現在では2014年12月15日版が最新です。

この規格はISO 32000-1のほかに、W3Cの Web Content Accessibility Guidelines (WCAG) 2.0をベースとしています。PDF/UA-1ファイルの作成、使用に必要とされる要件は、PDFファイルをWCAGに沿って利用するために必要とされるPDFの機能の使用方法ともいえます。

主な要件

仕様書の中心はPDF/UA-1ファイルの作成者(書き手)側に対する要件です。主な項目は次のとおりです。

PDFの内部のオブジェクトの並びにタグを付ける仕組みは次の図のようになります。タグ付きPDFではPDF内部のオブジェクトの並びにBMC~EMCなどでマークアップします。BMCの前にタグとプロパティがつきます。マークアップした部分から構造ツリーを作成します。

PDFの内部のオブジェクトの並びにタグを付ける仕組み

ISO 32000-1は次の49種類の標準タグを決めています:

                    Document      Part          Art
                    Sect          Div           BlockQuote
                    Caption       TOC           TOCI
                    Index         NonStruct     Private
                    H             H1            H2
                    H3            H4            H5
                    H6            P             L
                    LI            Lbl           LBody
                    Table         TR            TH
                    TD            THead         TBody
                    TFoot         Span          Quote
                    Note          Reference     BibEntry
                    Code          Link          Annot
                    Ruby          RB            RT
                    RP            Warichu       WT
                    WP            Figure        Formula
                    Form
               

PDF/UA-1では、これらのタグの使い方を厳しく指定しています。たとえば、表のタグは論理的な行と列の関係をもつコンテントのみで使うことになっています。上のようにタグを列挙したコンテントを仮に3列の表形式でタグ付けしたならば、PDF/UA-1の教条主義的適用では違反と判断されるでしょう。

リーダー側の要件

PDF/UA-1ファイルが持つアクセシビリティ機能を利用可能とするためにリーダー(読み手)に必要とされる要件が決まっています。準拠リーダーの主な要件は、ISO 32000-1:2008で定義されているドキュメントの論理構造とアーティファクトを処理する能力を持つこと、および、ATとのインターフェース機能を持つこと、とあります。

AT(Assistive Technologies:W3CのWCAG2.0の邦訳では「支援技術」)とのインターフェース機能とは、

とあります。

以下、PDFの各オブジェクトに対して個別に記載されている要件となります。

テキスト
  • 論理的な読み込み順番をATデバイスが利用可能であること
  • 文字コードを適切に処理する能力があること
  • 自然言語、およびその変更をATデバイスが利用可能であること
表のセルが空である場合、その情報をATデバイスが利用可能であること
オプショナルコンテント
オプショナルコンテントを含む場合、複数の表現が選択可能となることがありますが、すべてのオプショナルコンテントを表示する手段を提供し、オプショナルコンテントコンフィギュレーション辞書の階層を表示する手段を提供すること(このようなドキュメントの例として、多言語ドキュメントで、オプショナルコンテントを使用して、各言語別の表現をサポートしているようなドキュメントがあります)
添付ファイルと埋め込みファイル
  • 構造ツリーに存在していない添付ファイルを利用可能とすること
  • 埋め込みファイルの名称を表示するためにメカニズムを提供すること
デジタル署名
デジタル署名されていることをユーザーに報告し、デジタル署名の証明書属性と有効性の状態を提示できること
アクション
アクションがドキュメントの可視状態を変更する場合、ATがその変更を利用できること
メタデータ
ドキュメントのCatalog辞書のMetadataストリームにおけるすべての要素をATが利用できること
ナビゲーション
論理階層構造やしおりを使用してナビゲートする機能を持つこと
注釈
各注釈の代替え記述をATデバイスに利用可能とすること
フォーム
ウィジェット注釈のテキスト記述をATデバイスに利用可能とすること
マルチメディア
動的にではなくユーザーの要求に応じて再生すること

AT(Assistive Technology:支援技術)の要件

ATにはPDF/UA-1を使用するスクリーンリーダーや、音声入力をサポートするデバイス、キーボード入力を容易にする装置、点字に変換して印刷するソフトウェアなど広範なソフトウェア、ハードウェアが含まれます。

ATの要件は、主に次の項目です。

PageLabelとは、たとえば、目次部分は小文字のアラビア数字、本文はローマ数字といったページ番号を持つ文書がありますが、PDFでそのような表現をする機能です。ナビゲーションに、このPageLabelや、文書の章・項といった論理構造の階層情報を使用する機能が必要とされます。

ISO 32000-1のタグ付きPDFとの関係

ISO 32000-1では14.7にマークアップと構造ツリーの枠組みを、14.8に標準的なタグを規定しています。ただし、タグによるマークアップの仕方や構造ツリーの作り方はあまり厳密に決めていません。

PDF/UA-1では、ISO 32000-1で厳密に決めていなかった点について、ISO 32000-1よりも厳密に規定しています。

たとえば、見出しを<P>でタグ付けしてもISO 32000-1のタグ付きPDFの規定には違反しません。しかし、PDF/UA-1では、すべての見出しに見出しタグを付けなければなりません。また、ISO 32000-1ではタグ付けが曖昧であるとしておくことが許されます。しかし、PDF/UA-1は曖昧なタグ付けを許していません。そこで、ISO 32000-1のタグ付きPDF(すなわちPDF 1.7のタグ付きPDF)とPDF/UA-1の関係は次の図の点線と実線の丸のような包含関係で示せるでしょう。

ISO 32000-1のタグ付きPDF(すなわちPDF 1.7のタグ付きPDF)とPDF/UA-1の関係

PDFの長期保存形式:PDF/Aとの関係

ISO 32000-1のタグ付きPDFの仕組みを採用した規格として、PDFの長期保存のためのPDF/Aシリーズがあります。PDF/Aには1から3までのパートがあります。それぞれについて、完全準拠版としてPDF/A-[1|2|3]aという仕様があり、PDF/A完全準拠ではタグ付きPDFであることが要求されています。PDF/A完全準拠版は、ISO 32000-1のタグ付きPDFになります[1]

PDF/UA-1には長期保存のための要件はありません。たとえば、PDF/Aシリーズでは長期保存の目的上セキュリティ設定は禁止です。しかし、PDF/UA-1は、スクリーンリーダーなどの支援技術サポートが許可されていればセキュリティ設定しても問題ありません。このように用途によって許される機能が異なっていますので、使いこなしには、内容の相違を理解する必要があります。

PDF/UA-1がどのように使われるか。

国連の障害者権利条約では、障害者が情報、通信その他のサービス(電子サービス及び緊急事態に関わるサービスを含む)を簡単に利用できるようにする措置をとることを定めており、日本を含む世界の主要国が批准しています。こうした動きを受けて先進国では、政府・行政機関や議会を中心にPDFのアクセシビリティに対する要求が高まっています。

米国の議会図書館では、望ましい受け入れ文書形式を発表しています。デジタル出版物ではBITS/JATSやEPUBの優先順位が高くなっていますが、PDFの優先順位はそれに次いで高く、なかでもPDF/UAはPDF/Aよりも優先度の高い形式とされています。次の図は2016年8月時点の米国議会図書館のデジタル文書形式受け入れ優先順位です。

米国議会図書館のデジタル文書形式受け入れ優先順位

ただし、上述のようにPDF/UA-1では、形式的のみならず、意味的に厳密なタグ付けが求められています。このため、オリジナル文書がXMLなどで構造化されていれば比較的簡単にPDF/UA-1準拠のPDFを作成できます。しかし、一般のオフィス文書から作成するPDFを、PDF/UA-1対応とするのは、現時点では高コストになってしまうでしょう。

現在までに、弊社のXML自動組版エンジン:AH FormatterでPDF/UA-1準拠のPDFを作成したいという要求が、主に欧米のユーザーから多数寄せられています。そこで、アンテナハウスはAH Formatterの次期バージョンの最優先課題として、PDF/UA-1対応のPDF生成を掲げて、開発に取り組んでいます。

参考資料

  • [1] ISO 32000-1のタグ付きPDFの記述は曖昧なため、厳密な判断は難しいでしょう。ISO 32000-2(PDF-2)のドラフトではタグ付きPDFの項が大幅に改訂されています。
  • 『PDFインフラストラクチャ解説』もご参照ください。
スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.