PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr

瞬簡PDF 変換 11 その他の便利な機能


Officeアドインを利用してPDFを直接変換

本製品の変換機能をアドインでMicrosoft Office (Word・Excel・PowerPoint) に組み込み、Office上から直接PDFを変換可能にします。
本製品を既定値でインストールすると、Word・Excel・PowerPointの各リボンに「PDFを変換」ボタンが組み込まれます。リボン上のボタンをクリックしてPDFファイルを選択・変換することで、そのまま内容の編集が可能となります。

Officeアドイン

※アドイン機能はMicrosoft Office 2010 以降のバージョンでのみ動作保証いたします。

OCRによる透明テキスト付きPDFの作成

本製品ではスキャナーから取り込んだPDFまたは画像ファイルに対して、OCR(文字認識)処理を行うことで、その結果をテキストに保存したり、透明テキストとしてPDFに埋め込むことがきます。

OCR処理を行いテキストに保存した例

埋め込んだテキストをテキストファイルに保存

OCR処理をPDFに透明テキストを付加した例

透明テキスト付PDFに変換

※OCR処理を行うことによって出力されるPDFファイルのサイズが、処理対象となる元のファイルより大きくなる場合があります。
これはページを一旦OCR処理に適したDPI(解像度)の画像に変換し、その画像と処理結果のテキストとで構成されたPDFファイルを出力するためです。
そのため、PDFファイルの内容や、OCR処理オプションのDPIの設定によっては、出力されるPDFファイルのほうが、ファイルサイズが大きくなる場合があります。一般にDPIの設定値が大きいほど、出力されるPDFファイルのサイズが大きくなります。
なお、変換条件で元のPDFの画像を使う設定を行うことでサイズを抑制することができます。

瞬簡PDF シリーズを使用した透明テキストの編集

スキャナーから取り込んでPDF作成する場合、スキャン時点でOCR処理を行わない限り画像情報のみで構成されたPDFが作成されます。このようなPDFはPDF内部に文字情報が存在しないため、テキストのコピーはもちろん、検索を行うこともできません。 しかし、『瞬簡PDF シリーズ』を使用すれば透明テキストの付加から透明テキストの編集まで行うことができます。

例えば、次のような文字情報が無いPDFの場合、まず『瞬簡PDF 変換 11』を使用してPDFに透明テキストを付加します。

PDFに透明テキストを付加

付加した文字情報は下記の通りとなりますが、OCR処理で文字情報を付加しているため一部に誤認識している箇所が見られます。

漠字の他界我々が日常使用している言語、日本語には漢字、カタカナ、ひらがながあります。ひらがなやカタカナは、それ自体は意味を持たず、いくつかの音を繋げて言莱を作っていますが、横字はそれ自体が意味を持ち、横字を組合せることによって、より多くの意味を持たせることができます。また、同じ名詞を表す場合でも、漢字は複数の組み合わせがあります。例えば、カツオという魚がいます。一般的に嵌字では「鰹」と表しますが、「堅魚」や「松魚」でも同じカツオを意味します。町薙読涜字まずは右の表をご覧下さい。この表の中にある漢字は全て野菜や果物の名前ですが、全て読むことができますか?この肉の一部は下の写真にもありますので写真をヒントにしてみるのもいいかもしれません。また、次の四角に囲まれた漢字は、ー続めるか々?I- 下にある様々な動物や烏、昆虫のイラストにある動物を表しています。どの動物'1がどの漢字に当てはまるかわかりますか?全てわかったアナタは漢字博士になれるかも?袋熊猟虎熊猫大狸狸長尾職路蛇人鳥紅鶴鯨蛭蝉紅娘難読液字説めるかな?胡瓜甘蕉馬鈴薯齊大蒜柘櫂蕃茄牛芳茄子蓬無花果甘藷玉蜀黍甘藍鳳梨蜜柑無花果葡萄

誤認識した状態で付加されたテキストは『瞬簡PDF 編集 9』の本文編集機能を使用することで削除、訂正を行うことができます。

瞬簡単PDF 編集 9を使って透明テキストを編集

PDFから画像やテキストの抽出

本製品でPDFに含まれるテキストや画像を取り出し、それぞれファイルに保存することができます。保存されたデータを別のソフトに取り込んで再利用するなど、PDF活用の幅が広がります。

データ抽出機能は以下のような特長があります。

複数のPDFから一括してデータを取り出し

複数のPDFを登録しておくことで、一括でデータの抽出を行うことができます。

ページを選択してデータを取り出し

複数ページに渡ったPDFデータの場合、3ページ目のテキストまたは画像のみ取り出すといった、ページを指定してのデータ抽出も できます。

テキスト抽出時にエンコードの指定が可能

テキスト抽出時に以下のエンコードが指定可能です。

テキスト抽出時に改行コードの有無が指定可能

取り出したテキストに改行コードを付加するかどうか指定ができます。
※ 改行コードはCRLF(Win)固定になります。

画像抽出

PDFに含まれる画像を抽出して保存できます。画像抽出を行った場合、取り出された画像はビットマップ形式(BMP)またはJPEG形式(JPG)、PNG形式(PNG)のいずれかとなります(指定することはできません) 。


スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.