PDFファイルにOCR処理によって得られたテキストが含まれる場合、PDFファイルに含まれるテキストをテキストファイルとして出力する際のオプション設定を行います。
「テキスト設定」画面
1ファイルに全ページのテキストを出力する |
PDFファイルから抽出された全ページのデータを1つのテキストファイルに出力します。 |
1ページずつ別ファイルに出力する |
PDFファイルから抽出された複数ページのデータを、1ページ毎に出力します。出力されるファイル名は「ファイル名」+「_(アンダーバー)」+「ページ番号」+「.txt」となります。 |
付加する連番のゼロ詰め桁数 |
これは、1ページずつ別ファイルに出力する際にファイル名の「ページ番号」について、ゼロ詰め設定する場合に用いるオプションです。ファイル名のゼロ詰めを行う桁数を1~10の範囲の数値で設定します。 |
出力項目 |
テキストの抽出処理対象となるPDFファイルの文書情報を出力するテキストファイルに追加する場合に用います。テキストファイルに出力したいPDFファイルの文書情報の項目を、チェックボックスを使って選択します。出力できるPDFファイルの文書情報は以下の通りです。 タイトル サブタイトル 作成者 キーワード 作成 |