| PDF 総合案内 | PDF スイート | 書けまっせ!!PDF | 瞬簡/リッチテキストPDF | 瞬簡PDF | アウトライナー | トップページ |
| PDF 電子署名 | PDF Tool | PDF Server | サーバベース・コンバータ | PDF [OEM] | PDF 資料室 | ブログ |
|
更新日: 2012/05/21
PDFはWordやExcelなどで再利用したり、編集したりできないとお考えではありませんか?実は、PDFファイルの多くは、変換ソフトウェアを使うことでWordやExcelなどのオフィス・ファイルに変換して再利用できます。ここでは、他の人からもらったPDFや、自分や会社の同僚が昔作ったPDFの文章や画像を利用する方法と注意事項を整理してみました。
アンテナハウスではPDFからOffice(Word、Excel、PowerPoint)などに変換するためのソフトとして、次の製品を販売しています。
| 製品名 | Webページ | 特徴 |
|---|---|---|
| 「瞬簡PDF 変換 7」 | http://www.antenna.co.jp/pdftooffice/ | PDFをマイクロソフト・オフィス・ファイルや一太郎ファイルなどに変換するソフトウェア。OCRを使用して、画像PDFからの変換も可能です。 |
| 「PDF スイート」 | http://www.antenna.co.jp/pds/ | 「瞬簡PDF 変換 7」や、PDFを作成する「瞬簡PDF 作成 5」、PDFに文字や図形を書き込む「書けまっせ!!PDF」など、PDFを有効活用する複数のソフトウェアをセットにしたパッケージです。 |
| 「PDF to Excel 変換ライブラリ」 | http://www.antenna.co.jp/OEM/PDF2Excel/ | 弊社パッケージ製品「瞬簡PDF 変換」シリーズにて使用されている「PDFtoExcel 変換モジュール」のC++ I/FライブラリをOEM提供します。お客様のシステムに組み込んで使用したり、あるいはパッケージ・ソフトウエアに同梱して販売していただくことができます。 |
PDFからオフィスに変換できるかどうかは、セキュリティが設定されているかどうかで異なります。
PDFには作成者がセキュリティを設定することができます。PDFの作成者がセキュリティを設定していなければ、PDFのままでWordや一太郎に変換できますが、PDFのセキュリティ設定で「内容のコピー」「ページの抽出」の項目が「許可しない」になっている場合、PDF内部からデータのコピーやデータの抽出が行えないため、PDFのままでは変換処理を行うことができません。
変換できるPDF
変換できないPDF
| PDFのセキュリティ |
|
PDFには、閲覧を制限するユーザーパスワード(閲覧パスワード)と、編集を制限するオーナーパスワード(編集パスワード)の2種類のセキュリティを設定することができます。 ユーザーパスワードについてはPDFを開く際に、パスワードの入力を求められるため、容易に確認することができますが、編集パスワードはPDFを開いただけでは確認することができません。PDFに設定されている編集制限を確認するためには、Adobe Readerで次の操作を行う必要があります。
なお、PDFのセキュリティについては次のページで解説しています。 |
変換できないPDFについても、一旦紙に印刷して、印刷結果をスキャナーで読み取って画像化し、画像をOCR(光学式文字読取)で処理することで変換可能となります。
画像をWordやExcelに変換することができるOCRソフトはいろいろあります。アンテナハウス製品の「瞬簡PDF 変換 7」では、画像をWord、Excel、Powerpoint、一太郎に変換する機能が備わっています。
☞ 画像からの変換
【注意】PDFのセキュリティ設定が印刷不許可になっていると印刷ができませんので、この方法は使えません。どうしても変換したいならば、パソコンのディスプレイに表示した結果をスクリーン・キャプチャして、それを画像ファイルとして保存すると良いでしょう。
| OCRとは? |
| OCRとは画像化された文字(紙をスキャナーで取り込んだ文字等)を、コンピュータ上で扱える文字に変換する機能です。この機能を使うことにより、画像として保存されている文字を、編集可能な文字として出力可能となります。 ただし、OCRでは文字認識の誤りや、文字の種類(フォント)設定、大きさなどを完全に認識できませんので、どうしても変換の精度が落ちます。この認識精度は、スキャナーで画像化するときの条件によっても変わってきます。変換精度は画像の作り方にも依存します。 |
PDFには大きく分けて、電子化文書としてのPDFと電子文書としてのPDFの2種類があります。アンテナハウスのPDFからオフィスへの変換は、この2種類に対して異なる処理方法をとっており、一般には、電子文書の方がうまく変換できます。
一般に、電子文書とはコンピュータでデジタルデータを編集して作った文書のこと。電子化文書とは、紙をスキャナでスキャンして作成した文書のことです。
電子化文書としてのPDFと電子文書としてのPDFではPDFとしての特性がまったく異なります。このためオフィス・ファイルへの適切な変換方法は異なります。
【注意】電子文書としてのPDFでも、DTPソフト(印刷デザイン専門のソフト)等で作成して文字をアウトライン化したようなPDFでは文字の情報がなくなってしまいますので、電子化文書と同じ扱いになります。
この機能はアンテナハウスの「瞬簡PDF 変換 7」の独自機能です。
電子文書PDFの内部には、アドビReaderなどのPDF表示・印刷ソフトウェアがPDFをパソコンの画面などに可視化するための様々な情報が含まれています。PDF内部の情報には、テキスト情報や、フォント設定(フォントファミリー、フォントサイズなど)を初め詳細なデータがあります。PDFの内部の情報を解読してOffice文書にします。次項で説明するOCR方式と比べて精度の高いオフィスファイルを作成することができます。
☞ PDFからの変換
電子化文書PDFの内部にはスキャナーなどで取り込んだ画像が含まれています。従って、OCR機能をもつ変換ソフトを使って画像部分をオフィス・ファイルに変換します。
☞ 「瞬簡PDF 変換 7」での変換
PDFからオフィスに変換するソフトは様々なものがあります。変換精度はソフトによって随分と異なっており、まさにピンからキリまであります。
こちらの主要各社のPDFからオフィスへの変換ソフトの精度比較をご覧ください。
上のWebページでもご確認いただける通り、アンテナハウスのPDF変換ソフトは、日本ではもっとも優れた変換精度をもっています。
このページを読んで分らないことや、ご意見・質問したいことがありましたら、info@antenna.co.jpまでお気軽にお問合せください。
【注意】PDFに含まれる文書や画像の情報が、自分(同じ会社内)で作成したものでない場合、著作権が第三者に帰属しています。PDFからOffice文書への変換は複製に相当しますので、著作権侵害にならないようにご注意ください。