News Release
2014年4月15日
PDFファイルの内容をXML形式に変換!!
AHPDFXML 変換ライブラリ 製品ページ公開のお知らせ
アンテナハウス株式会社(本社:東京、社長:小林徳滋、資本金:4,000万円)は、2014年4月15日より「AHPDFXML 変換ライブラリ」の製品ページを公開いたしました。
Antenna House AHPDFXML変換ライブラリ(以下、本ライブラリ)は、PDFファイルを読み込み、内部のテキスト、図、画像などをXML形式に変換するプログラムです。
本ライブラリを使用することで、PDFデータの再利用が簡単にできます。
アンテナハウス株式会社では、製品ページ公開に伴い本ライブラリのアルファ版(開発途上版)を開示いたします。多くの皆様から製品に関するご意見、ご要望をいただくことで、より有用な製品として完成を目指します。
是非この機会にお試しいただけますよう、お願いいたします。
AHPDFXML 変換ライブラリの機能
AHPDFXML 変換ライブラリは、PDFに含まれるコンテンツをテキスト、表、画像などの情報単位にまとめて独自のXML表現(「AHPDFXML形式」)に置き換えます。

- AHPDFXMLの出力例 -
AHPDFXML形式には、以下の各種情報が含まれます。
- テキスト情報:PDFに格納されたテキストデータを位置情報とともに出力します。
- ブロック情報:PDFに格納されたテキストデータの配置から、行、段落、段組みの各書式情報を出力します。
- 表情報:PDFページ内に配置された線分データの配置から表組み情報を出力します。
- 画像情報:PDFページ内に埋め込まれた画像データを外部ファイルとして抜きだします。
- 線画情報:PDFページ内に配置された線分データをSVG形式の外部ファイルに変換します。
AHPDFXML 変換ライブラリの用途
- PDFをXML形式に変換することによって、PDFデータの扱いが容易になります。
- XSLTスタイルシートを定義して用途に応じた加工が柔軟に行えます。
- PDF内のコンテンツはすべて位置(座標)情報とともに出力されます。これによりページ内の任意の範囲を指定したデータ参照が容易にできます。
- PDF内のブロック情報、表情報、画像情報を参照することにより、DocBookなど文書構造を記述するデータに加工することができます。
対応プラットフォーム
AHPDFXML 変換ライブラリ アルファ版では、以下のWindows環境に対応します。
- Windows Server 2012/2012 R2(64bit)
- Windows Server 2008 R2(64bit)
- Windows Server 2008(32bit/64bit)
- Windows 8.1(32bit/64bit)
- Windows 8(32bit/64bit)
- Windows 7(32bit/64bit)
※Linux版は今後開発予定です。他のOSについてもご要望により対応可能です。
お問い合わせ先
アンテナハウス・システム営業グループ
Eメール:oem@antenna.co.jp
本製品の詳細は次の Web ページをご覧ください。
→ http://www.antenna.co.jp/pdfxml/