テキスト設定

PDFファイルにOCR処理によって得られたテキストが含まれる場合、PDFファイルに含まれるテキストをテキストファイルとして出力する際のオプション設定を行います。

Please enter alt text.
「テキスト設定」画面

1ファイルに全ページのテキストを出力する

PDFファイルから抽出された全ページのデータを1つのテキストファイルに出力します。

1ページずつ別ファイルに出力する

PDFファイルから抽出された複数ページのデータを、1ページ毎に出力します。出力されるファイル名は「ファイル名」+「_(アンダーバー)」+「ページ番号」+「.txt」となります。

付加する連番のゼロ詰め桁数

これは、1ページずつ別ファイルに出力する際にファイル名の「ページ番号」について、ゼロ詰め設定する場合に用いるオプションです。ファイル名のゼロ詰めを行う桁数を1~10の範囲の数値で設定します。

出力項目
(PDF文書情報)

テキストの抽出処理対象となるPDFファイルの文書情報を出力するテキストファイルに追加する場合に用います。テキストファイルに出力したいPDFファイルの文書情報の項目を、チェックボックスを使って選択します。出力できるPDFファイルの文書情報は以下の通りです。

 タイトル サブタイトル 作成者 キーワード 作成
 変換 作成日 更新日 バージョン ページ数 ファイル名
 ファイルサイズ