現在開いているページまたはドキュメントに対して、文字認識処理を行います。
文字認識とは、対象となるページあるいは領域(画像データとして保持)から文字と判断できる範囲を抽出し、編集可能なテキストに置き換える処理をいいます。
文字認識処理では、微細な点の集まりである画像データを解析し、色の濃淡や点の集合の形状などから文字パターンを抽出し文字コードに変換します。
文字認識を実行するには、上の図の矢印で示された[文字認識]ボタンをクリックします。
以下のいずれかを対象に選択できます。既定値は[現在のページ]です。
- 現在の領域:現在選択されている領域のみ対象となります。選択されている領域がない場合、この機能は使用できません。
- 現在のページ:現在開いているドキュメント中に複数ページがある場合は、現在表示されているページのみ対象となります。
- すべてのページ:現在開いているドキュメントに複数ページがある場合は、すべてのページが対象となります。
[領域解析]との関係
文字認識処理は、領域解析の結果に基づいて実行されます。文字認識処理を開始したとき、まだ領域解析がされていない場合は、自動的に領域解析処理が実行されて、その後に文字認識処理が開始されます。
もし、原稿にある表の情報が領域解析によって[画像領域]と認識されていた場合、文字認識処理では画像として扱われるため、表の罫線やテキストなどの情報は変換先に渡らなくなります。
文字認識処理の結果で、文字化けや領域の誤認識がある場合は、領域解析処理に戻ってやり直してください。認識結果の表示
文字認識結果はテキストビューに表示されます。以下に、文字認識結果の例を示します。
例では、領域解析結果に従い、それぞれ文字(テキスト)、画像、表と認識された結果を示しています。
テキストビューの表示
テキストビューは、既定値では、イメージビューと同じ大きさで並べて表示されます。
テキストビューを編集する際に、画面が小さくてやりづらい場合には、テキストビューのみを最大化して表示することができます。テキストビューを最大化するには、ビュー表示ツールバーから[幅に合わせる]ボタンと[テキストビュー最大化]ボタンを順にクリックしてください。
テキストビューが最大化された状態は、ビュー表示ツールバーの[同じサイズ]ボタンをクリックして、元に戻すことができます。
文字認識結果の修正
認識された結果で文字化けがある場合、領域の種類を変更して改善することができます。
以下は、テキストと認識されて文字化けした箇所を画像領域に変更する例を示します。
文字認識結果の編集
認識された文字に対して、置き換え・変更・削除などの編集操作を行うことができます。
- 文字を選択して、直接別の文字に置き換えできます。
- テキストビューでは、編集は1行単位で可能になります。複数行を選択した編集はできませんので、ご注意ください。
以下は、1行を選択して削除した例を示します。
文字候補の表示
文字認識した結果が正しくない場合、その文字のところでマウスをクリックすると、他の変換候補をリスト表示させることができます。
以下の例では、「1」の文字が「|」と認識されていますが、文字の修正候補から「1」を選択して置き換える操作を示しています。
文字の修正
文字認識した結果が正しくない場合、既定値では10個まで文字候補が表示されます。修正したい文字に該当する文字候補がない場合は、直接文字を入力して置き換えることができます(参照:文字の修正)。
文字の一括置き換え
誤認識した文字について、同じ文字パターンをもつ文字をページ上から検索して一括で修正・置き換えすることができます(参照:文字の一括置き換え)。
文字の分割
元の画像で隣り合った2つの文字のパターンを誤認識して、ひとつの文字として変換してしまう場合に、誤認識した文字パターンを2つに分割して正しい文字に置き換えることができます(参照:文字の分割)。
文字の結合
上記と逆に、元の画像でひとつの文字となっているパターンを別々の2つの文字として誤認識してしまう場合に、誤認識した文字パターンを1つに結合して正しい文字に置き換えることができます(参照:文字の結合)。
文字列の検索/置き換え
文字認識された結果に対して、テキストビュー上で文字列を検索したり、置き換えたりすることができます(参照:文字列の検索/置き換え)。
文字の切り取り/コピー/貼り付け/削除
文字認識された結果に対して、テキストビュー上で文字列を検索したり、置き換えたりすることができます。