8-24 -extractImage:画像抽出

処理内容

入力PDFのページに含まれる画像データを抽出します。

補足:抽出対象について

  • 抽出するのはPDFのページに配置された画像データのみです。これはページ全体を画像化する処理ではありません。

コマンド例

[コマンド例の実行内容]

test.pdfに存在する画像データのうち、40ppi以上100ppi以下のものをJPEG形式のファイルとして指定フォルダに出力する。この際、抽出時に変更を加えない。

[Windows]

AHPDFToolCmd80.exe -extractImage C:\out -format 2 -morePPI 40 -lessPPI 100 -passThrough true -d C:\test\test.pdf

[Linux]

AHPDFToolCmd80 -extractImage /home/antenna/sav -format 2 -morePPI 40 -lessPPI 100 -passThrough true -d /home/antenna/test/test.pdf

フォルダ指定:対応有り

「-d」のパラメータに入力フォルダを指定して一括処理することができます。

フォルダ指定をされた場合は入力フォルダ内のPDFファイルから画像データを抽出します。出力フォルダはパラメータ[outFolderPath]で指定してください。

出力フォルダには入力ファイル名のサブフォルダが作成されます。

出力される画像データは各サブフォルダ内に保存されます。

パラメータ

パラメータ

内容

<outFolderPath>

[指定必須]
画像ファイルの出力フォルダパスを指定する。

出力ファイル名は「入力ファイル名_ページ番号_連番」となる。
ページ番号の開始は「1」
連番の開始は「0001」でページごとにリセットする。

-pageNo

省略可。
画像を抽出するページ番号。指定がない場合、全ページの画像を抽出する。

ページ番号は0オリジン。そのため1ページ目を「0」から数える。

複数指定する場合はカンマで区切る。

例)-pageNo “0,2-4”
1ページと3~5ページから抽出される。

-format {0 | 1 | 2 | 3}

省略可。
画像の保存形式。指定がない場合、「0 = AUTO」

0 = AUTO  1 = Bitmap
2 = JPEG  3 = PNG

-morePPI <Val>

省略可。
このパラメータが指定された場合、<Val>で指定された解像度以上の画像を選んで抽出する。

「-lessPPI」との同時指定が可能。その場合、「-morePPI」以上「-lessPPI」以下の画像を抽出する。どちらも指定されていない場合はすべての解像度の画像を抽出する。

-lessPPI <Val>

省略可。
このパラメータが指定された場合、<Val>で指定された解像度以下の画像を抽出する。

「-morePPI」との同時指定が可能。その場合、「-morePPI」以上「-lessPPI」以下の画像を抽出する。どちらも指定されていない場合はすべての解像度の画像を抽出する。

-passThrough {true | false}

省略可。
変更を加えずに抽出する[*1]かどうか。省略した場合はfalseが指定されたものとみなす。

true : 変更を加えない false : 変更する

画像の出力フォーマットにJPEGを指定した場合のみ有効。

JPEG以外の出力フォーマットの場合はエラー。

[*1]:
PDFへの画像埋め込み時に再圧縮をされていない場合にのみ、埋め込み時の画像をそのまま抽出可能。具体的にはPDFへの埋め込み時に以下の条件を満たしている必要がある。

・ カラースペースが、DeviceRGB, DeviceGray,無指定(=PDF_EMPTY_NAME)のいずれかで指定されていること

・ マスクが指定されていないこと

・ Decodeの値がデフォルトであること

・ トランスファ関数を表すグラフィックステートパラメータ辞書の『ExtGState:TR』が指定されていないこと(一般にトランスファ関数はガンマ補正の用途で使用される機能です)