PDF変換

PDFは基本的にOCRとPDF編集を以下の流れで行います。

Please enter alt text.

PDFのOCRは基本的にそのページが「画像ファイル」1枚だけで構成されているファイルが対象です。(主にイメージスキャナで出力したものです。)対象外のPDFもOCRが可能ですが、この場合は一度ビットマップに変換してから行うので、時間を要し、場合によっては出力されるPDFファイルのサイズがかなり大きくなり、元々持っていたテキストなどの情報が画像に置き換えられてしまいます。

PDF編集でマスク処理が指定されていても、OCRが指定されていない場合は、PDF編集の中でマスク処理が実行されます。