PDFをWordやExcelに変換できますか?
そのためには、どのような方法がありますか?

更新日: 2014/04/21

このページの目的

PDFはWordやExcelなどで再利用したり、編集したりできないとお考えではありませんか?実は、PDFファイルの多くは、変換ソフトウェアを使うことでWordやExcelなどのオフィス・ファイルに変換して再利用できます。ここでは、他の人からもらったPDFや、自分や会社の同僚が昔作ったPDFの文章や画像を利用する方法と注意事項を整理してみました。

PDFからWord, Excelなどに変換する製品

アンテナハウスではPDFからOffice(Word、Excel、PowerPoint)などに変換するためのソフトとして、次の製品を販売しています。

製品名 特徴
瞬簡PDF 変換 8 PDFをマイクロソフト・オフィス・ファイルや一太郎ファイルなどに変換するソフトウェア。OCRを使用して、画像PDFからの変換も可能です。
瞬簡PDF 統合版 7.1 瞬簡PDF 変換 8」や、PDFを作成する「瞬簡PDF 作成 7」、PDFに文字や図形を書き込む「瞬簡PDF 書けまっせ 6」など、PDFを有効活用する複数のソフトウェアをセットにしたパッケージです。
PDF to Office 変換ライブラリ 弊社パッケージ製品「瞬簡PDF 変換」シリーズにて使用されている変換エンジンを組み込みライブラリとしてOEM提供します。お客様のシステムに組み込んで使用したり、あるいはパッケージ・ソフトウエアに同梱して販売していただくことができます。

PDFにセキュリティが設定されていなければ、原則としてオフィス文書に変換できます

PDFからオフィスに変換できるかどうかは、セキュリティが設定されているかどうかで異なります。

PDFには作成者がセキュリティを設定することができます。PDFの作成者がセキュリティを設定していなければ、PDFのままでWordや一太郎に変換できますが、PDFのセキュリティ設定で「内容のコピー」「ページの抽出」の項目が「許可しない」になっている場合、PDF内部からデータのコピーやデータの抽出が行えないため、PDFのままでは変換処理を行うことができません。

変換できるPDF

変換できないPDF

PDFのセキュリティ

PDFには、閲覧を制限するユーザーパスワード(閲覧パスワード)と、編集を制限するオーナーパスワード(編集パスワード)の2種類のセキュリティを設定することができます。

ユーザーパスワードについてはPDFを開く際に、パスワードの入力を求められるため、容易に確認することができますが、編集パスワードはPDFを開いただけでは確認することができません。PDFに設定されている編集制限を確認するためには、Adobe Readerで次の操作を行う必要があります。

  1. Adobe ReaderでPDFを開く
  2. [ファイル]メニューから[プロパティ]を選択する
  3. [セキュリティ]タブを開く

なお、PDFのセキュリティについては次のページで解説しています。
☞ PDFの標準セキュリティ機能

セキュリティが設定されているときは、印刷してスキャンしてOCR処理する

変換できないPDFについても、一旦紙に印刷して、印刷結果をスキャナーで読み取って画像化し、画像をOCR(光学式文字読取)で処理することで変換可能となります。

画像をWordやExcelに変換することができるOCRソフトはいろいろあります。アンテナハウス製品の「瞬簡PDF 変換 8」では、画像をWord、Excel、Powerpoint、一太郎に変換する機能が備わっています。
☞ 画像からの変換

【注意】PDFのセキュリティ設定が印刷不許可になっていると印刷ができませんので、この方法は使えません。どうしても変換したいならば、パソコンのディスプレイに表示した結果をスクリーン・キャプチャして、それを画像ファイルとして保存すると良いでしょう。

OCRとは?
OCRとは画像化された文字(紙をスキャナーで取り込んだ文字等)を、コンピュータ上で扱える文字に変換する機能です。この機能を使うことにより、画像として保存されている文字を、編集可能な文字として出力可能となります。
ただし、OCRでは文字認識の誤りや、文字の種類(フォント)設定、大きさなどを完全に認識できませんので、どうしても変換の精度が落ちます。この認識精度は、スキャナーで画像化するときの条件によっても変わってきます。変換精度は画像の作り方にも依存します。

電子文書の方が、電子化文書より精度の良い変換ができます

PDFには大きく分けて、電子化文書としてのPDFと電子文書としてのPDFの2種類があります。アンテナハウスのPDFからオフィスへの変換は、この2種類に対して異なる処理方法をとっており、一般には、電子文書の方がうまく変換できます。

電子文書と電子化文書

電子化文書としてのPDFとは
紙の書類をスキャナーなどで読み取って画像化して、それをPDFに変換したものです。文書の部分が画像です。
電子文書としてのPDFとは
Officeなどのアプリケーションで作成した電子文書から、紙を経由しないで、PDFに出力したものです。文書の部分は画像ではありません。

電子化文書としてのPDFと電子文書としてのPDFではPDFとしての特性がまったく異なります。このためオフィス・ファイルへの適切な変換方法は異なります。

【注意】電子文書としてのPDFでも、DTPソフト(印刷デザイン専門のソフト)等で作成して文字をアウトライン化したようなPDFでは文字の情報がなくなってしまいますので、電子化文書と同じ扱いになります。

電子文書としてのPDFはPDF内部を解読して変換

この機能はアンテナハウスの「瞬簡PDF 変換 8」の独自機能です。

電子文書PDFの内部には、アドビReaderなどのPDF表示・印刷ソフトウェアがPDFをパソコンの画面などに可視化するための様々な情報が含まれています。PDF内部の情報には、テキスト情報や、フォント設定(フォントファミリー、フォントサイズなど)を初め詳細なデータがあります。PDFの内部の情報を解読してOffice文書にします。次項で説明するOCR方式と比べて精度の高いオフィスファイルを作成することができます
pdf2office1.png pdf2office1.png
☞ PDFからの変換

電子化文書としてのPDFは、OCR機能で変換

電子化文書PDFの内部にはスキャナーなどで取り込んだ画像が含まれています。従って、OCR機能をもつ変換ソフトを使って画像部分をオフィス・ファイルに変換します。
pdf2office2.png pdf2office2.png
☞ 瞬簡PDF 変換 8」での変換

フローチャート

以上の説明をフローチャートに整理してみました。

20110121.GIF 20110121.GIF

変換精度比較について

PDFからオフィスに変換するソフトは様々なものがあります。変換精度はソフトによって随分と異なっており、まさにピンからキリまであります。
ここでは、弊社の『瞬簡PDF 変換 8』と、国内で販売されている他の主要なPDF変換ソフトと変換精度の比較を行った結果をご紹介します
比較対象として、現在国内で販売されているPDF変換ソフトのうち人気が高いと思われる4つの製品を選択しました(ここでは「A社製品」、「B社製品」、「C社製品」、「D社製品」とします)。

製品 変換可能形式 OCRの有無 パッケージ価格 ダウンロード価格
A社製品 Word/Excel/PowerPoint × \3,990 \3,990
B社製品 Word/Excel/PowerPoint/一太郎 \2,980 \2,680
C社製品 Word/Excel/PowerPoint 無し \6,980
D社製品 Word × \8,379 \7,980
瞬簡PDF 変換 8 Word/Excel/PowerPoint/一太郎 \8,400 \5,670

各製品の平均点

各製品で8つのPDFファイルを変換し、それぞれに得点をつけました。獲得した総得点と平均点は以下のとおりです。

各製品の平均得点

製品名 合計点数 テスト文書数 平均点
A社製品 25 点 5 ファイル 5.0 点
B社製品 41 点 8 ファイル 5.0 点
C社製品 53 点 8 ファイル 6.6 点
D社製品 3 点 3 ファイル 1 点
瞬簡PDF 変換 8 68 点 8 ファイル 8.5 点

※比較方法やデータの詳細等については、こちらの主要各社のPDFからオフィスへの変換ソフトの精度比較をご覧ください。

上記のように、アンテナハウスのPDF変換ソフトは、日本ではもっとも優れた変換精度をもっています。

お問い合わせは

本ページについて分らないことや、ご意見・ご質問などございましたら、info@antenna.co.jpまでお気軽にお問合せください。

また、弊社オンラインショップでは本ページで紹介した製品をお得な価格でご購入いただくことができます。是非ご利用ください。
オンラインショップ

【注意】PDFに含まれる文書や画像の情報が、自分(同じ会社内)で作成したものでない場合、著作権が第三者に帰属しています。PDFからOffice文書への変換は複製に相当しますので、著作権侵害にならないようにご注意ください。


Copyright © 1996-2014 Antenna House, Inc. All right reserved.
Antenna House is a trademark of Antenna House, Inc.