PDF、組版と文書変換のアンテナハウス株式会社
サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr

評価版のお申し込み

OEMについて詳しくはこちら

アンテナハウス製品紹介セミナー資料はこちらから


スペーサー

4. テキスト抽出

各種ファイルからのテキスト抽出に関わる変換の項目です。
お探しのものが見つからない場合は、sis@antenna.co.jpへお問い合わせください。

お問い合わせ内容

4.1 MS Officeの必要性

4.2 PDFからテキストに変換

4.3 ライセンス

4.4 対象ファイル・機能


以下、質問と回答

お問い合わせへの回答

4.1 MS Officeの必要性

Text Porterの共通の制限事項に、 「抽出元アプリケーションに対応するテキスト抽出エンジンと、その使用ライセンスがないものは、テキスト抽出できません。」 という記述がありますが、例えばMS Officeのデータからテキスト抽出する場合に、「MS OfficeがTextPorterと同じPCにインストールされていないとテキスト抽出ができない。」という意味ととらえればよいのでしょうか。
制限事項内の使用ライセンスとはテキスト抽出エンジン(TextPorter)の抽出対象ファイルフォーマット有効設定フラグのことを指しております。
Microsoft Officeがインストールされている必要はございません。

関連リンク TextPorter ページへ

4.2 PDFからテキストに変換

表示されている内容以外の文字を出力してしまうケースが、TextPorterでありますか。
ファイルのプロパティを抽出する場合を除き、表示されている文字列以外を出力することはありません。

関連リンク TextPorter ページへ

大量(数十万)のファイルを高速にText化することはできますか。
TextPorterで可能です。

関連リンク TextPorter ページへ

PDFからテキスト変換するアプリ作成を検討しています。対応できる製品はありますか。
PDFからテキストを取り出すのであればTextPorterで対応します。但し、TextPorterではPDFのテキストが画面の表示通りに整形されません。画面表示通りに整形することが必要なときは、Antenna House PDFXML変換ライブラリーでXMLからテキストを整形するのが良いと思われます。処理対象PDFによって最適な方法が異なりますので、営業までご相談ください。

関連リンク TextPorter ページへ
関連リンク Antenna House PDFXML 変換ライブラリ ページへ

自社アプリケーションへ、PDFからText部分だけをインポートする機能を実装したいのですが、該当製品はありますか。
TextPorterで可能です。
Text部分のみならず、プロパティも抽出できます。

関連リンク Antenna House PDF Server ページへ
関連リンク TextPorter ページへ

4.3 ライセンス

TextPorterは同時アクセス数や同時使用ユーザ数での利用制限を設けていますか。
ありません。
OEMやASP/SaaSでの組込み契約の場合は、個別契約となりますのでoem@antenna.co.jpへお問い合わせください。

関連リンク TextPorter ページへ

4.4 対象ファイル・機能

TextPorterが対応するDocuWorksのファイル形式はxdwだけで、xbdには対応していないのでしょうか。また、対応予定はありませんでしょうか。対応は困難でしょうか。 それから、複数のxbdをバッチ処理でPDFに変換するソフトウエア製品はありませんでしょうか。
DocuWorksはxdwのみとなります。
xbdは一旦DocuWorksViewerで展開する必要がありTextPorterでは対応できません。
申し訳ございません。

xbdのPDF変換は、DocuworksViewerの印刷機能を使えば変換可能かと思います。
弊社の仮想ドライバPDF Driverをお試しいただけないでしょうか。
PDF DriverはPDF Driver APIに含まれております。
http://www.antenna.co.jp/pdfdriver-api/
評価版は同サイトからお申込みいただけます。
*xbd形式のPDF変換は弊社では実績はございませんので、御社にてご確認いただけないでしょうか。

関連リンク TextPorter ページへ

Microsoft Word/Excel/PowerPointのファイルで、図形(四角や円)、コメント、埋め込みオブジェクト(OLE)も、テキスト抽出可能でしょうか。特に埋め込まれているオブジェクトを含めて抽出できるとかが知りたいです。
OLE含めて抽出可能です。評価版でご確認ください。

  • 抽出仕様
http://www.antenna.co.jp/axx/function03.html

関連リンク TextPorter ページへ

様々な文書ファイルからテキスト部分を抽出する処理を既存プログラムから呼び出して使用できる製品はありますか。
TextPorterで可能です。
C言語や.Net等の様々なI/Fをご用意しております。

関連リンク TextPorter ページへ

トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.