PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ

スペース

PDFとWebにはどんな違いがありますか? インターネットやWebがますます普及するとしてPDFは使い続けられますか?

更新日: 2018/6/21

PDFとWebは、狭い意味では(1)両方とも文書をデジタルデータとして表現するための形式です。また、(2)その形式で表されたデジタル文書自体を指す場合もあります。さらに(3)Webはインターネットを経由するサービスという意味で使われることもあります。ここでは(1)または(2)の範囲で考えてみます。

PDFとWebの共通点

最初に両者の共通点を考えてみましょう。PDFとWebは両方とも1990年代前半というほぼ同じ時期に、インターネットの普及と共に誕生しました。PDFは文章・図・表などの文書の内容(以下、「コンテンツ」)に紙に印刷するためのレイアウトを施して、そのままデジタルデータとして保存したものです。DTP(デスクトップパブリッシング)で使われるページ記述言語PostScriptの後継であり、PDFの生まれは印刷技術に由来します(「参考資料1、2」参照)。PostScriptからPDFに進化したのは、PostScriptはインターネットで配布するには機能的に不十分であったためです。PDFはインターネットのサーバーにアップして蓄積しておき、端末にダウンロードして閲覧します。例えば、数学や物理学などの論文をPDF形式などで保管するarXiv(アーカイブ)は、1991年8月にスタートしています。

Webは分散したコンピュータに配置された情報を取り出して閲覧するための技術として生まれました。Webのコンテンツを表すには、主にHTMLという形式を使います。HTMLは一般にホームページに保存され、PCやスマホなどの端末にダウンロードしてWebブラウザで閲読します。1990年代中頃にはネットサーフィンという言葉が流行ったものですが、Webブラウザを操作してWebのサイトからサイトをHTMLを漁って渡り歩く行動を表すにはまさしくそのような言葉が適切でした。

PDFは、電子メールに添付して交換されることも一般的ですが、Webのコンテンツをメールで配信するにはHTMLメールという方法もあります。このようにPDFやWebはインターネットの普及とともに誕生し、インターネットを介して情報を配信し、ユーザーがそれをダウンロードして、電子機器端末の液晶ディスプレイなどで閲覧するという点で共通です。そして、これらは商業的なメディアとしては、紙による情報提供媒体である新聞や雑誌などと激しく競合しています。

PDFの永続性とWebの揮発性

本題に戻りPDFとWebの違いはなにかを考えてみます。結論からいいますと、一番大きな違いは前者の永続性に対して、後者の揮発性という特性に最大の違いがあります。そしてその特性はページの意味合い、レイアウトの指定方法、コンテンツ配置処理のタイミングと大きな関係があります。

PDF文書の永続性とは

PDF文書は、A4、B5あるいは四六判(縦組書籍)などの所定サイズ(判型)の紙面に、コンテンツを綺麗にレイアウトした状態のデジタルデータです。書籍や冊子の1つの紙面を「ページ」と言います。

この意味のページという言葉は、明治の中頃に洋装本の出版物の広告などで使われ始めた外来語です。つまり欧米から導入された印刷と製本が普及し始めたのをきっかけに広く使われるようになりました。(参考資料3)

書籍などを印刷・製本するには大きなコストがかかります。ページ上の印刷する部分を版面といいますが、コンテンツを見栄えよく、空きがないように版面にレイアウトするのが重要です。商業印刷ではプロの編集者、デザイナーや制作者が版面をデザインします。活版印刷の時代には活字や図をページ上に並べて版面を作ることを組版といいました。現在では、DTPソフトを使ってコンピュータの画面上でコンテンツを対話的にレイアウト処理することを組版といいます。また、サーバーの上で動くプログラムによりコンテンツを一括して組版処理することを自動組版といいます。Antenna House Formatterはこのような自動組版ソフトの代表です。(参考資料4)

PDFのページは、コンテンツの組版処理が完了した状態を保存したデジタルデータであり、PDFのページは永続性の遺伝子を持っています。コンテンツを書籍のような物体に近い状態にして、消去されるまで永続的に、人間の目にとっては同じ見栄えを維持して保存されます。

Web文書の揮発性とは

一方、Webのコンテンツを表すHTMLは、それを受け取り、閲覧する端末において、その画面の大きさに入るようにブラウザなどでレイアウト処理されます。HTMLは所定のサイズの画面を想定して制作されていませんし、ましてや紙のような所定の判型を想定して制作されているものではありません。

Webにも「ページ」という言葉が使われます。WebのページとはHTML形式で表現された情報の単位のことす。HTMLのページはブラウザで、巻物の一部のように画面に表示されます。スクロール方向と行の進行方向が直交するとき画面毎に区切り(「ページ」区切り)が行われますが、それはあくまで端末の画面のサイズに合うように、端末上でダイナミックに処理されます。

こうしてみますと、ページという同じ言葉を使っていても、Webのページと本や冊子のページとは、実態がまったく異なります。

Webはもともと分散して配置されている情報を、瞬時に探し出して端末の画面に表示するのが目的であり、情報が分散配置されていることに特徴があります。リンクによって探し出される毎に、端末上のブラウザが可視化するわけですが、その都度、人間の目に見える状態が変わります。Webのページは、別の端末で可視化されるとき、今表示されている状態と同じである保証はありません。

見栄えは内容に影響を及ぼす

PDFの永続性とWebの揮発性の対比は、紙と画面という表示対象の特性の相違、そしてレイアウト処理の相違に由来する本質的なものです。レイアウトは情報の見方を変えるだけでなく、内容の変更を伴うことがあります。

Webではユーザーからのリクエストにより、サーバー側でユーザーに提供する情報内容も変化します。このようにWebの揮発性は内容への信頼感の低下に繋がり易くなります。これに対して、PDFは静的な情報なので都度変化することがありません。ビジネスの契約書のように書面の形で残していた文書は、デジタル化したときはWebよりPDFで保管する方が適切です。

PDFは使われ続ける

現在、出版などでは紙からデジタル媒体への転換が進んでいます。デジタル媒体ではPDFとWebという2つが普及していますが、両者には本質的な相違があることが分かりました。このように見ますと、Webの普及にかかわらずPDFも長く使われ続けるでしょう。


スペース