リッチテキストPDF

PDFからのデータ抽出

「リッチテキストPDF」を使用することで、PDFからテキストや画像を取り出して、それぞれファイルに保存することができます。これにより、PDF内のデータを別のソフトに取り込んで再利用することが可能になります。

▼機能の特長

データ抽出機能は以下のような特長があります。

最初に複数のPDFを選択しておくことで、一括でデータの抽出を行うことができます。

複数ページに渡ったPDFデータの場合、3ページ目のテキストや画像のみ取り出すといった、ページを指定してのデータ抽出も可能です。

テキスト抽出時にエンコードの指定が可能
テキスト抽出時に以下のエンコードが指定可能です。
- Shift JIS
- UTF-8
- UTF-16（Little Endian）
- UTF-16(Big Endian)
テキスト抽出時に改行コードの有無が指定可能

取り出したテキストに改行コードを付加するかどうか指定ができます。また、改行コードもCRLF（Win）かCR（Mac）のどちらかを指定できます。

画像抽出を行った場合、取り出された画像はビットマップ形式（BMP）またはJPEG形式（JPG）のいずれかとなります。（指定することはできません）

製品情報

変換可能なファイル形式

PDFからのデータ抽出