|
|
 |
PDFからのデータ抽出 |
|
|
「リッチテキストPDF」を使用することで、PDFからテキストや画像を取り出して、それぞれファイルに保存することができます。これにより、PDF内のデータを別のソフトに取り込んで再利用することが可能になります。
|
▼機能の特長 |
データ抽出機能は以下のような特長があります。
- 複数のPDFから一括してデータを取り出すことが可能
最初に複数のPDFを選択しておくことで、一括でデータの抽出を行うことができます。
複数ページに渡ったPDFデータの場合、3ページ目のテキストや画像のみ取り出すといった、ページを指定してのデータ抽出も可能です。
- テキスト抽出時にエンコードの指定が可能
テキスト抽出時に以下のエンコードが指定可能です。
- Shift JIS
- UTF-8
- UTF-16(Little Endian)
- UTF-16(Big Endian)
- テキスト抽出時に改行コードの有無が指定可能
取り出したテキストに改行コードを付加するかどうか指定ができます。また、改行コードもCRLF(Win)かCR(Mac)のどちらかを指定できます。
画像抽出を行った場合、取り出された画像はビットマップ形式(BMP)またはJPEG形式(JPG)のいずれかとなります。(指定することはできません)
|
|
|