OCR補正機能について

OCR処理では、画像上でテキストや表として変換したい部分を別の領域として誤認識してしまう場合があります。そのようなときに誤認識したままOCR処理を行うと、文字化けなどが生じてしまいます。このような場合は、「OCR補正機能」を使用することで、画面上の操作により誤認識した領域を正しい領域に補正して、誤変換を改善することができます。

以下では、OCR結果を補正する機能(OCR補正機能)の起動方法について説明します。

OCR補正機能の起動方法

OCR補正機能を起動するには、以下の2通りの選択方法があります。

  • メニューからOCR補正機能を起動する:ファイルリストビューで任意のファイルを選択し、[メニュー]バーから[編集]→[OCR結果を補正...]をクリックします。

ocr-correct-menu.png

  • ファイルリストビューからOCR補正機能を起動する:ファイルリストビューで任意のファイルを選択し、以下のマークをクリックします。

ocr-correct-list.png

OCR結果の補正

起動すると、以下のダイアログボックスが表示され、画面上から任意の範囲を指定して文字認識する領域の種類を設定できます。
OCR補正機能では、リボンと呼ばれるメニューから機能を選択します。メニューは左から順に処理の流れに沿って分類されているため、簡単に操作することが可能です

ocr-correct.png

画像の補正:PDFファイルに回転、傾きの補正を行うことが可能です。


exclem2.png 【注意!】

  • 回転、傾きの補正は選択しているPDFファイルの全ページを対象に適用されます。ページ範囲を指定した補正には対応しておりませんので、ご注意ください。。

  • 回転:回転の角度を90°単位に補正します。
  • 傾き:傾きの角度を1°単位に補正します。

領域認識:クリックすると、現在表示しているページの領域認識処理を行い、結果を種類別に表示します。

  • 横書き:横書きのテキストと認識された領域を赤い枠で表示します。
  • 縦書き:縦書きのテキストと認識された領域をピンクの枠で表示します。
  • 画像:画像領域と認識された領域を青い枠で表示します。
  • 表:表領域と認識された領域を緑の枠で表示します。

lighton.gif 【ヒント】

  • 領域認識結果の枠は、マウスのドラッグでその範囲を自由に変更できます。また、選択している領域をマウスで右クリックするか、領域メニューをクリックすることで、領域の種類を変更することができます。

ツール:現在表示している画面上で、マウスの操作方法を切り替えます。

  • 選択:このボタンが有効である場合に、マウスで領域の選択・移動・変更などが可能になります。。
  • 手のひら:このボタンが有効である場合に、マウスのドラッグで表示範囲をスクロールして移動することが可能になります。
  • ズーム:このボタンが有効である場合に、マウスで任意の範囲を指定して拡大表示が可能になります。

領域:現在選択されている領域範囲を任意の種類に変更できます。また、領域を指定した状態で画面上の任意の範囲をドラッグして、新しい領域を追加することもできます。

編集:領域範囲の切り取り、削除、貼り付けを可能にします。

  • 貼り付け:クリップボードに格納された領域データを画面上の任意の位置に貼り付けます。
  • 切り取り:現在選択されている領域データを画面上から消去し、内容をクリップボードに格納します。
  • コピー:現在選択されている領域データをクリップボードに格納します。
  • 切り取り:現在選択されている領域データを画面上から消去します。削除された領域データは保存されません。
  • 他ページに適用:現在表示しているページで設定した領域データを、別のページにも適用できます。同じレイアウトのページが複数あるような場合に、一括して領域設定を適用できるので便利です。

変換実行:設定された領域データを参照して、変換を実行します。

  • 変換実行:変換時は、OCR補正機能を起動した時点で選択されていた変換先種類、変換設定を参照します。OCR補正機能を使用して変換を行う場合は、あらかじめ変換先や変換条件を指定してから起動してください。
  • フォルダーを開く:変換結果を保存したフォルダーを表示します。

exclem2.png 【注意!】

  • OCR補正機能を実行している間は、メインの操作画面で変換処理を行うことができないなど、操作の一部が制限されます。
  • OCR補正機能を使用して設定した領域データは保存されません。