前へ目次次へ

OCR機能

以下では、OCR機能の概要を説明します。

OCR機能とは？

OCR（Optical Character Recognition:光学式文字認識）とは、画像データから文字を認識しパソコン上で検索・編集可能な文字データに置換する機能です。

OCR機能の利点

画像データやOCRスキャナーで作成したPDFは文字が画像化されているため、テキスト検索やOfficeアプリケーション等で編集して利用できる文字データが含まれていません。しかし、画像にOCR（文字認識）処理を行うことで、画像化された文字を認識し文字データに置換して再利用できます。

また、内部に文字データを含むPDFであっても画面に表示する文字の外観と文字コードの対応づけがされていない場合は正しい文字が取得できず、変換先で"?"に置換されます。このような場合もいったんPDFを画像化してOCR処理を行うことで、文字を認識し文字データとして取り出すことができます。

基本機能

フォントの自動設定機能
- 本製品のOCR機能では、OCRオプションで認識する言語とそれに対応するフォントを設定して変換先に反映できます。既定の言語は「日本語」です。
- OCRオプションの既定値では言語に対応したフォントを自動的に設定しますが、実行環境にインストールされたフォントの一覧から任意に選択することもできます。
- 変換先に使用するフォントは一種類のみ選択可能ですが、言語に「日本語」を選択した場合のみ和文に使用するフォントと英数字に使用するフォントをそれぞれ指定可能です。既定値は「和文：ＭＳＰゴシック」「英数字：Arial」です。
- 英語またはその他のヨーロッパ諸言語を選択してフォントを［自動］に設定した場合は、OCRの認識結果により以下の処理を行います。（言語やフォントによっては正しく認識できない場合があります）
  - 認識したフォントがセリフ（serif）体であった場合は、Times New Romanフォントを出力します。
  - 認識したフォントがサンセリフ（sans serif）体であった場合は、変換先にArialフォントを出力します。
  - 等幅フォントを認識した場合は、Courier Newフォントを出力します。
OCRオプションでOCR指定可能な言語と自動で設定するフォントの一覧を以下に示します。

言　語	自動設定時のフォント
日本語	ＭＳＰゴシック（和文フォント認識時）、 Arial（英数字の認識時）
英語・ドイツ語・フランス語・スペイン語・イタリア語・スウェーデン語・デンマーク語・ノルウェー語・オランダ語・ポルトガル語・チェコ語・ハンガリー語・ポーランド語・ルーマニア語・リトアニア語・スロバキア語・クロアチア語・スロベニア語・ルクセンブルク語・フィンランド語	Times New Roman（セリフ体フォントの認識時）、Arial（サンセリフ体フォントの認識時）、Courier New（等幅フォントの認識時）
リトアニア語・ラトビア語・トルコ語・カタルーニャ語・ブルガリア語・マケドニア語・ロシア語・セルビア語・ウクライナ語	Times New Roman（セリフ体フォントの認識時）、Arial（サンセリフ体フォントの認識時）、Courier New（等幅フォントの認識時）
ギリシャ語	Times New Roman（セリフ体フォントの認識時）、Arial（サンセリフ体フォントの認識時）、Courier New（等幅フォントの認識時）
ベトナム語	Times New Roman
タイ語	Tahoma
韓国語	Malgun Gothic
簡体字中国語	SimSun
繁体字中国語	Microsoft JhengHei

文字サイズ、解像度その他機能

機　能	説　明
認識できる最大文字サイズ	認識可能な文字サイズの制限は解像度に依存します。（300dpiで最大256ピクセル）
対応する画像解像度	96～500dpi（300～400dpiを推奨）
調整可能な項目	・言語種類・dpi値・画像の回転（自動 / 左右90° / 180°）・傾きの補正（自動 / 左右45°）・フォントの指定

変換の制限、注意事項など

OCR処理には以下の制限があります。

本製品のOCR処理で認識可能な文字は、活字で印刷された文字形状のみです。手書き文字や、装飾された文字の認識には対応しておりません。
OCR処理の認識精度は、以下のような条件により影響を受けます。
- 　①　画質：画質とはOCR処理エンジンに与える画像の品質です。画質にはオリジナル文書そのものの品質と、スキャンするときの設定、そしてスキャナーの特性が影響を与えます。具体的には、ノイズ・原稿の歪み・色の不均質などがあげられます。画質の悪い画像データや、画質が悪いままPDF化された文書は、OCR処理を行っても判読できない可能性が高く文字の認識率が低くなります。
- 　②　解像度：解像度とは、1インチ幅（1インチは約25.4mm）の範囲内で点をいくつ表現できるかにより画像の細密さを表現する単位です。一般的には解像度の数値が大きいほどより精密な画像が作成でき、細部まで細かく表現できます。解像度が小さいと、小さな文字などがつぶれてしまいOCR処理を行った場合に認識率が低くなります。ただし、解像度を高くして画像を作成すると非常に多くのメモリーを消費するため、パソコンで利用可能なメモリー使用量をオーバーした場合にはOCR処理の前段階で失敗することがありますので注意が必要です。
- 　③　画像の複雑さ：画像中に文字・図・グラフ・線などが混在していると、OCR処理に影響を与えます。ここで「複雑さ」とは、定量的に平準化が難しい状態を指します。人間の目には「単純」に見えることであってもOCR処理エンジンにとって「複雑」である場合、結果がオリジナル文書と異なったものになる可能性があります。
- 　④　横書き・縦書きの混在：OCR処理では、画像中の範囲をいくつかの領域に分割し、領域毎に文字認識処理を行います。この際に横書き・縦書きが混在していずれか判別がつきがたい場合などは領域分割がうまく行われず、結果として文字認識率が低くなる可能性があります。
- 　⑤　複数言語の混在：OCR処理では、ページ内に複数の異なる言語が混在した場合、いずれか１種類の言語のみ認識できます。例として日本語と中国語または韓国語が混在した場合、[言語]に日本語が指定されていると、それ以外の言語の文字は正しく認識できなくなります（言語を指定して変換する場合はそれらに対応したフォントも合わせて指定してください）。なお、例外として日本語と英語が混在した場合は両方の言語を同時に認識できます。（中国語または韓国語と英語が混在した場合も同様に可。ただし、英語以外の欧文との組み合わせでは同時認識できません）

OCR補正機能

OCR処理では、対象画像を4種類の領域（[横書き]・[縦書き]・[表]・[画像]）に分けて認識します。この領域認識がうまくいかないと、変換結果が期待したものになりません。

本製品のOCR補正機能では、ページ内の画像を手動で任意の領域に分割し文字認識処理を行うことができます。既定のOCR処理で領域認識がうまく行われず結果が思わしくなかった場合に、本機能を使用することで改善できる可能性があります。

前へ目次次へ