PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr

スペース

News Release

2014年4月15日

PDFファイルの内容をXML形式に変換!!
AHPDFXML 変換ライブラリ 製品ページ公開のお知らせ

アンテナハウス株式会社(本社:東京、社長:小林徳滋、資本金:4,000万円)は、2014年4月15日より「AHPDFXML 変換ライブラリ」の製品ページを公開いたしました。

Antenna House AHPDFXML変換ライブラリ(以下、本ライブラリ)は、PDFファイルを読み込み、内部のテキスト、図、画像などをXML形式に変換するプログラムです。
 本ライブラリを使用することで、PDFデータの再利用が簡単にできます。

アンテナハウス株式会社では、製品ページ公開に伴い本ライブラリのアルファ版(開発途上版)を開示いたします。多くの皆様から製品に関するご意見、ご要望をいただくことで、より有用な製品として完成を目指します。
 是非この機会にお試しいただけますよう、お願いいたします。

AHPDFXML 変換ライブラリの機能

AHPDFXML 変換ライブラリは、PDFに含まれるコンテンツをテキスト、表、画像などの情報単位にまとめて独自のXML表現(「AHPDFXML形式」)に置き換えます。

AHPDFXMLの出力例
- AHPDFXMLの出力例 -

AHPDFXML形式には、以下の各種情報が含まれます。

  • テキスト情報:PDFに格納されたテキストデータを位置情報とともに出力します。
  • ブロック情報:PDFに格納されたテキストデータの配置から、行、段落、段組みの各書式情報を出力します。
  • 表情報:PDFページ内に配置された線分データの配置から表組み情報を出力します。
  • 画像情報:PDFページ内に埋め込まれた画像データを外部ファイルとして抜きだします。
  • 線画情報:PDFページ内に配置された線分データをSVG形式の外部ファイルに変換します。

AHPDFXML 変換ライブラリの用途

  • PDFをXML形式に変換することによって、PDFデータの扱いが容易になります。
  • XSLTスタイルシートを定義して用途に応じた加工が柔軟に行えます。
  • PDF内のコンテンツはすべて位置(座標)情報とともに出力されます。これによりページ内の任意の範囲を指定したデータ参照が容易にできます。
  • PDF内のブロック情報、表情報、画像情報を参照することにより、DocBookなど文書構造を記述するデータに加工することができます。

対応プラットフォーム

AHPDFXML 変換ライブラリ アルファ版では、以下のWindows環境に対応します。

  • Windows Server 2012/2012 R2(64bit)
  • Windows Server 2008 R2(64bit)
  • Windows Server 2008(32bit/64bit)
  • Windows 8.1(32bit/64bit)
  • Windows 8(32bit/64bit)
  • Windows 7(32bit/64bit)

※Linux版は今後開発予定です。他のOSについてもご要望により対応可能です。

お問い合わせ先

アンテナハウス・システム営業グループ
 Eメール:oem@antenna.co.jp

本製品の詳細は次の Web ページをご覧ください。
 → http://www.antenna.co.jp/pdfxml/

スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.