入力PDFのページに含まれる画像データを抽出します。
test.pdfに存在する画像データのうち、40ppi以上100ppi以下のものをJPEG形式のファイルとして指定フォルダに出力する。この際、抽出時に変更を加えない。
AHPDFToolCmd80.exe -extractImage C:\out -format 2 -morePPI 40 -lessPPI 100 -passThrough true -d C:\test\test.pdf
AHPDFToolCmd80 -extractImage /home/antenna/sav -format 2 -morePPI 40 -lessPPI 100 -passThrough true -d /home/antenna/test/test.pdf
「-d」のパラメータに入力フォルダを指定して一括処理することができます。
フォルダ指定をされた場合は入力フォルダ内のPDFファイルから画像データを抽出します。出力フォルダはパラメータ[outFolderPath]で指定してください。
出力フォルダには入力ファイル名のサブフォルダが作成されます。
出力される画像データは各サブフォルダ内に保存されます。
パラメータ |
内容 |
<outFolderPath> |
[指定必須] 出力ファイル名は「入力ファイル名_ページ番号_連番」となる。 |
-pageNo |
省略可。 ページ番号は0オリジン。そのため1ページ目を「0」から数える。 複数指定する場合はカンマで区切る。 例)-pageNo “0,2-4” |
-format {0 | 1 | 2 | 3} |
省略可。 0 = AUTO 1 = Bitmap |
-morePPI <Val> |
省略可。 「-lessPPI」との同時指定が可能。その場合、「-morePPI」以上「-lessPPI」以下の画像を抽出する。どちらも指定されていない場合はすべての解像度の画像を抽出する。 |
-lessPPI <Val> |
省略可。 「-morePPI」との同時指定が可能。その場合、「-morePPI」以上「-lessPPI」以下の画像を抽出する。どちらも指定されていない場合はすべての解像度の画像を抽出する。 |
-passThrough {true | false} |
省略可。 true : 変更を加えない false : 変更する 画像の出力フォーマットにJPEGを指定した場合のみ有効。 JPEG以外の出力フォーマットの場合はエラー。 |
[*1]:
PDFへの画像埋め込み時に再圧縮をされていない場合にのみ、埋め込み時の画像をそのまま抽出可能。具体的にはPDFへの埋め込み時に以下の条件を満たしている必要がある。
・ カラースペースが、DeviceRGB, DeviceGray,無指定(=PDF_EMPTY_NAME)のいずれかで指定されていること
・ マスクが指定されていないこと
・ Decodeの値がデフォルトであること
・ トランスファ関数を表すグラフィックステートパラメータ辞書の『ExtGState:TR』が指定されていないこと(一般にトランスファ関数はガンマ補正の用途で使用される機能です)