PDF、組版と文書変換のアンテナハウス株式会社
PDF、組版と文書変換のアンテナハウス株式会社
トップページ > PDF資料室 > PDFをWordやExcelに変換する方法は?
更新日: 2018/1/15
PDFはWordやExcelなどで再利用したり、編集したりできないとお考えではありませんか? 実は、PDFファイルの多くは、変換ソフトウェアを使って、WordやExcelなどのオフィス・ファイルに変換して再利用できます。ここでは、他の人からもらったPDFや、自分や会社の同僚が昔作ったPDFの文章や画像を利用する方法と注意事項を整理してみました。
アンテナハウスではPDFからOffice(Word、Excel、PowerPoint)などに変換するためのソフトとして、次の製品を販売しています。
製品名 | 特徴 |
---|---|
瞬簡PDF 変換 9 | PDFをマイクロソフト・オフィス・ファイルや一太郎ファイルなどに変換するソフトウェア。OCRを使用して、画像PDFからの変換も可能です。 |
瞬簡PDF 統合版 10 | 「瞬簡PDF 変換 9」や、PDFを作成する「瞬簡PDF 作成 8」、PDFに文字や図形を書き込む「瞬簡PDF 書けまっせ 7」など、PDFを有効活用する複数のソフトウェアをセットにしたパッケージです。 |
PDF to Office 変換ライブラリ | 弊社パッケージ製品「瞬簡PDF 変換」シリーズにて使用されている変換エンジンを組み込みライブラリとしてOEM提供します。お客様のシステムに組み込んで使用したり、あるいはパッケージ・ソフトウエアに同梱して販売できます。 |
PDFからオフィスに変換できるかどうかは、セキュリティが設定されているかどうかで異なります。
PDFには作成者がセキュリティを設定できます。PDFの作成者がセキュリティを設定していなければ、PDFのままでWordや一太郎に変換できますが、PDFのセキュリティ設定で「内容のコピー」「ページの抽出」の項目が「許可しない」になっている場合、PDF内部からデータのコピーやデータの抽出が行えないため、PDFのままでは変換処理を行えません。
変換できるPDF
変換できないPDF
PDFのセキュリティ |
PDFには、閲覧を制限するユーザーパスワード(閲覧パスワード)と、編集を制限するオーナーパスワード(編集パスワード)の2種類のセキュリティを設定できます。 ユーザーパスワードについてはPDFを開く際に、パスワードの入力を求められるため、容易に確認できますが、編集パスワードはPDFを開いただけでは確認できません。PDFに設定されている編集制限を確認するためには、Adobe Readerで次の操作を行う必要があります。
なお、PDFのセキュリティについては次のページで解説しています。 |
変換できないPDFについても、一旦紙に印刷して、印刷結果をスキャナーで読み取って画像化すれば、OCR(光学式文字読取)で処理が可能となります。
画像をWordやExcelに変換できるOCRソフトはいろいろあります。アンテナハウス製品の『瞬簡PDF 変換 9』では、画像をWord、Excel、Powerpoint、一太郎に変換する機能が備わっています。
☞ 画像からの変換
【注意】PDFのセキュリティ設定が印刷不許可になっていると印刷ができませんので、この方法は使えません。どうしても変換したいならば、パソコンのディスプレイに表示した結果をスクリーン・キャプチャして、それを画像ファイルとして保存すると良いでしょう。
OCRとは? |
OCRとは画像化された文字(紙をスキャナーで取り込んだ文字等)を、コンピュータ上で扱える文字に変換する機能です。この機能を使えば、画像として保存されている文字を、編集可能な文字として出力できます。 |
PDFには大きく分けて、電子化文書としてのPDFと電子文書としてのPDFの2種類があります。アンテナハウスのPDFからオフィスへの変換は、この2種類に対して異なる処理方法をとっており、一般には、電子文書の方がうまく変換できます。
電子化文書としてのPDFと電子文書としてのPDFではPDFとしての特性がまったく異なります。このためオフィス・ファイルへの適切な変換方法は異なります。
【注意】電子文書としてのPDFでも、DTPソフト(印刷デザイン専門のソフト)等で作成して文字をアウトライン化したようなPDFでは文字の情報がなくなってしまいますので、電子化文書と同じ扱いになります。
この機能はアンテナハウスの『瞬簡PDF 変換 9』の独自機能です。
電子文書PDFの内部には、アドビReaderなどのPDF表示・印刷ソフトウェアがPDFをパソコンの画面などに可視化するための様々な情報が含まれています。PDF内部の情報には、テキスト情報や、フォント設定(フォントファミリー、フォントサイズなど)を初め詳細なデータがあります。PDFの内部の情報を解読してOffice文書にします。次項で説明するOCR方式と比べて精度の高いオフィスファイルを作成できます。
☞ PDFからの変換
電子化文書PDFの内部にはスキャナーなどで取り込んだ画像が含まれています。従って、OCR機能をもつ変換ソフトを使って画像部分をオフィス・ファイルに変換します。
☞ 『瞬簡PDF 変換 9』での変換
PDFからオフィスに変換するソフトは様々なものがあります。変換精度はソフトによって随分と異なっており、まさにピンからキリまであります。
ここでは、弊社の『瞬簡PDF 変換 9』と、国内で販売されている他の主要なPDF変換ソフトと変換精度の比較を行った結果をご紹介します(2016年11月 当社調べ)。
比較対象として、現在国内で販売されているPDF変換ソフトのうち人気が高いと思われる3つの製品を選択しました(ここでは「A社製品」、「B社製品」、「C社製品」とします)。
また、それと別にマイクロソフト社のWord(ワード) 2016のPDF読み込み機能についても比較対象としました。
製品 | 変換可能な Office文書形式 |
備考 |
---|---|---|
A社製品 | Word(doc/docx) Excel(xlsx) PowerPoint(pptx) |
1ファイルごとにOffice形式への変換を選択して保存する。 複数ファイルの一括変換は不可。 OCR処理への切り替えは自動で行う(オプションでOFFも可) |
B社製品 | Word(doc) Excel(xls) PowerPoint(ppt) |
複数ファイルの一括変換可能。 レイアウトが複雑なPDFではテキストボックスでの変換に切り替わる。 |
C社製品 | Word(doc/docx) Excel(xls/xlsx) PowerPoint(ppt/pptx) |
複数ファイルの一括変換可能。 レイアウトが複雑なPDFではOCR処理による変換を選択する必要がある。 |
MS Office 2016 | PDFをWordへ読み込み | 1ファイルごとにPDFを選択して変換する。 Excel 2016、Power Point 2016は PDF読み込み機能なし |
瞬簡PDF 変換 9 |
Word(doc/docx) Excel(xls/xlsx) PowerPoint(ppt/pptx) |
複数ファイルの一括変換可能。 OCR処理への切り替えは自動で行う(オプションでOFFも可) |
※上記は調査時点のもので、実際と異なる場合があります。
比較には、官公庁等で公開されているPDF形式文書などを使用し、それぞれ製品の既定値で変換を行いました。変換結果は採点基準に則って厳正に評価し、各製品に点数を付与しました。これらのテキストPDF/画像PDFの両方について、変換先の種類ごとに変換した結果の平均点を集計しました。その中でも、テキストPDF/画像PDFからExcelへの変換では製品ごとで変換性能の差異が明確に現れました。なお、マイクロソフト社のOffice 2013ではPDFからExcelへの変換はできません。
製品名 | 平均点 | ![]() |
---|---|---|
C社製品 | 3.86 点 | |
A社製品 | 4.57 点 | |
B社製品 | 4.71 点 | |
瞬簡PDF 変換 9 |
7.00 点 |
※比較方法や変換データなどの詳細は、こちらの主要各社のPDFからオフィスへの変換ソフトの精度比較をご覧ください。
上記のように、アンテナハウスのPDF変換ソフトは、日本ではもっとも優れた変換精度をもっています。
本ページへのご意見・ご質問は、info@antenna.co.jpまでお気軽にお問合せください。
また、弊社オンラインショップでは本ページで紹介した製品をお得な価格でご購入いただけます。是非ご利用ください。
【注意】PDFに含まれる文書や画像の情報が、自分(同じ会社内)で作成したものでない場合、著作権が第三者に帰属しています。PDFからOffice文書への変換は複製に相当しますので、著作権侵害にならないようにご注意ください。