現在開いているドキュメントに対して、領域解析処理を行います。
以下のいずれかを対象に選択できます。既定値は[現在のページ]です。
- 現在のページ:現在開いているドキュメント中に複数ページがある場合は、現在表示されているページのみ対象となります。
- すべてのページ:現在開いているドキュメントに複数ページがある場合は、すべてのページが対象となります。
【ヒント】
領域解析とは、対象となるページ(画像データとして保持)からテキストのある範囲(文字領域-横書き/縦書き)、罫線に囲まれた表のある範囲(表領域)、画像のある範囲を抽出する処理をいいます。
以下に、領域解析結果の例を示します。
例では、それぞれ文字領域、画像領域、表領域と認識された箇所を示しています。
表示された領域に対して、変更・解除・並べ替えなどの操作を行うことができます。
領域操作のメニューを表示
領域の範囲内でマウスを右クリックするか、領域に付加されたタグをマウスでクリックすると以下のメニューが表示されます。
領域の種類の変更
本製品で認識できる領域の種類には以下の4種類があります。解析結果に問題がある場合は、手動でいずれにも変更できます。
- 文字[横書き]
- 文字[縦書き]
- 表
- 画像
【ヒント】
領域は、入れ子(ネスト)にして指定することも可能です。以下の例のように、表の中に画像が含まれるレイアウトの場合、既定値の領域解析では表中の画像は認識されません。
このような場合、いったん表の領域を解除するか、あるいは場所を移動してから、先に表中の画像部分を領域指定します。
その後に外側の表領域を指定することで、両方の領域を認識させることができます。
領域の認識
選択している領域についてのみ認識処理を行い、テキストビューに結果を表示します。詳しくは、文字認識の説明を参照してください。
領域の解除
選択されている領域を解除して文字認識の対象から外すことができます。領域は、表示されたページ上で何度でも解除、設定しなおすことができます。
詳しくは、以下の説明を参照してください。領域の色を反転
新聞の見出しのような白抜き文字は、そのままでは文字として認識できません。そのようなとき、領域内の背景と文字の色を逆転させることで文字認識できる場合があります。
詳しくは、領域の色を反転の説明を参照してください。
【ヒント】
領域色の反転処理は、領域範囲内にある画像データに対して直接作用します。このため、領域を削除しても反転した画像はそのままとなりますのでご注意ください。
表の編集
表と認識された領域に対して、表の罫線を追加したり、不要な罫線を削除するなどの編集処理が専用ダイアログを使ってできます。
詳しくは、表領域の編集の説明を参照してください。既存の領域削除の確認
領域対象とするページに既に領域解析結果がある場合には、確認画面が表示されます。
詳しくは、[削除の確認]ダイアログの説明を参照してください。
関連...