OCR処理設定

Please enter alt text.
「OCR処理設定」画面

OCR処理方法

OCR処理対象となるページを指定します。

 

OCR処理を行わない

OCR処理を行いません。このオプションは、画像ファイルをPDFファイルに変換するだけの場合やTIFFファイルの出力、ウォーターマークの設定等、OCR以外の処理だけを行う場合などに利用します。

全ページOCR処理を行う

画像/PDFファイルの全てのページを対象にOCR処理を行います。

指定ページのみOCR処理を行う

画像/PDFファイル中の指定したページだけを対象にOCR処理を行います。処理対象となるページは、以下に示す書式で指定します。

範囲指定の方法
 nページからmページまで n-m
 nページのみ        n
 設定例: 1, 5-10, 20-25

上の設定例では、1ページ、5~10ページ、20~25ページを対象にOCR処理を施します。

OCRエラーが発生した場合も無視してPDFを作成する

通常、OCR処理に失敗した場合、そのファイルについてのタスク処理が失敗したものとされ何もファイルを出力しませんが、このオプションを有効にすることでOCRエラーを無視してOCR処理に成功したページを含むPDFファイルなどの出力を行い、処理を継続します。初期状態では、このオプションは選択されていません。

PDFファイルはOCRを実行しない

処理対象となるファイルがPDFファイルの場合にOCR処理を行わず(タスク設定のOCR設定に関するすべての設定を無視して)、タスク処理を進めます。

すべてのPDFファイルでOCRテキスト付きPDFを作成する

処理対象がPDFファイルの場合、そのページを一旦画像に変換し、それに対してOCR処理を施してOCRテキスト付きPDFファイルを作成します。このオプションを有効にした場合、処理対象に含まれていたすべてのテキストがOCR処理によって認識されたテキストと入れ替わるため、テキストの精度やレイアウトがオリジナルのPDFファイルより悪くなる可能性があります。また、複合機などから出力された高圧縮PDFは、この処理によって標準的なPDFファイルに変換されるため、元のファイルよりファイルサイズが大きくなります。

イメージやPDFからQRコードを読み取る

画像、PDFファイルの先頭ページに存在するQRコードの内容に従って、PDF Serverを動作させる場合にこのチェックボックスにチェックマークを付けます。

 

NOTE

通常、複数ページを有する文書について処理していて中途でOCR処理にエラーが生じた場合、途中のページまで正常に処理されていたとしてもエラーとして扱われ、ファイルは一切出力されません。

注意

QRコードの読み取り機能を有効にしたタスクは、以下のように処理されます。

  1. ファイル分割/結合機能についての設定が無効となります。
  2. 複数のQRコードが認識された場合、有効となるのは最初に認識されたものとなります。
  3. マルチページTIFFや、PDFファイルの場合、先頭ページのQRコードだけを対象として処理します。