Web/Intranetサーバ組込用テキスト抽出エンジン




販売は終了しました。



BANAR


title
TextPorterV3サーバ版
2003年12月12日よりV3.3.2 へバージョン・アップ
Microsoft Office 2003(Word、Excel、PowerPoint)、PDF1.5に対応!


製 品 概 要
  1. 主要なアプリケーション・ファイルからテキスト抽出

    文書を作成したアプリケーションが無くても、指定したファイル、または埋め込まれたOLEオブジェクトからテキスト文字列、プロパティを取り出せます。
    >>対象ファイル形式
    >>テキスト抽出仕様

  2. 主要なアプリケーション・ファイルの識別

    ファイルを作成したアプリケーション名称とそのバージョンを識別します。

  3. さまざまな文字コードに対応

    抽出するテキストの文字符号化方式は、下記の4タイプを切り替えることができます。また、テキストファイルの文字符号化方式や改行コードの種別を変換することができます。

    国際規格 ISO-10646-UCS-2、UTF-8、UTF-16
    日本語 Shift_JIS、Windows31J、EUC-JP、ISO-2022-JP
    英 語 ISO-8859-1
    中国語/韓国語 GBK、Big5、KS X 1001

  4. 対応インターフェイス
    Cインターフェイスの他に、VB、Java、Perlインターフェースを提供します。

動 作 環 境
下記の5種類のOS用のバイナリをCD-ROMに収容しています。但し、ライセンスはCPU1台毎にお求めください。
  • Intel版Windows 95/98/Me/NT4.0/2000/XP
  • Intel版Windows Server 2003
  • SUN SPARC版Solaris 2.5以降(32Bit)
  • SUN SPARC版Solaris 7以降(64Bit)
  • Intel版Linux glibc2.1
  • IBM AIX5L(RS6000)
価 格
CPU数に応じて設定し、ボリュームディスカウントを実施します
  • 基本価格
    1CPU 525,000円(税込)
  • ボリュームディスカウント
    ライセンス価格(本数) 2〜10 11〜20 21〜50 51〜100 100〜
    1本単価(円) 400,000 350,000 300,000 250,000 200,000

バージョンアップポイント
  • 新規対応ファイルフォーマット
    • Microsoft Office Word2003、Excel2003、PowerPoint2003に対応
    • WordXML(Word2003で作成したXMLファイル)、ExcelXML(Excel2003で作成したXMLファイル)
    • Adobe社Acrobat6(PDF1.5)
  • 新機能
    • WordXML、ExcelXMLのプロパティ抽出機能
    • Adobe社Acrobat6.0で作成したPDF1.2/1.3/1.4形式のテキスト抽出の動作保証
  • セキュリティファイルへの対応
    Adobe社Acrobat5.x/6.0の、128Bitで暗号化されたPDFのテキスト抽出とテキスト抽出の制御が可能
  • 旧バージョンとの速度比較(参考資料)

    旧バージョンの抽出速度に比べ、最大で3倍の処理速度で抽出処理を行います。
    下記表は、弊社で計測したTextPorter Ver3とVer3.3との処理速度比較の例です。
    Microsoft
    Word
    Microsoft
    Excel
    Microsoft
    PowerPoint
    Adobe
    PDF
    JUSTSYSTEM
    一太郎
    Intel版
    Windows用
    Ver.3 50 1,370 280 110 6,540
    Ver.3.3 50 710 273 50 1,320
    SUN SPARC版
    Solaris(32Bit)用
    Ver.3 294 6,188 699 256 11,023
    Ver.3.3 79 1,455 465 126 2,875
    Intel版
    Linux glibc2.1用
    Ver.3 482 8,802 804 308 20,952
    Ver.3.3 148 2,371 538 247 6,989
    • 単位は【ミリ秒】です。
アンテナハウス製品のお問い合わせ先