PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子出版
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr
  • お問い合わせ先
    〒103-0004
    中央区東日本橋2丁目1番6号
    東日本橋藤和ビル
    アンテナハウス株式会社
    CAS-UB販売担当
    電話:03-5829-9021  
  • Eメール:
    cas-info@antenna.co.jp

PDFからSVGを切り取りできる PDF画像化ツール

数式や表や画像を含むPDFからWebページやEPUBを製作するツールです。

想定用途

ワンソースマルチユース方式でマークアップしたファイル(XML/XHTML)からPDFとHTML・EPUBを同時に作れれば良いのですが、必ずしもいつもそうは行きません。印刷用のワークフローで出来上がったPDFを元にWebページやEPUBを製作する作業が必要になることもあります。本ツールはそんなときに役立てていただくツールです。

  • 技術系学会誌記事の校了したPDFを入手してWebページ(HTMLと画像)を作成する。PDFに含まれる数式をSVG(Scalable Vector Graphics)画像[1]にする。
  • 技術系学会誌記事の校了版をPDFで入手してEPUB化する。

PDFからキャプション付画像を切り出す

キャプション付の画像を作る

画像だけを取り出すツールは本家Adobe社の Acrobat をはじめ、いくつもありますが、キャプションを含めてひとつの画像をつくるというツールはまだまだ少ないです。

このソフトウェアは、キャプションに使われている文字(フォント、フォントサイズなど)を予め設定(登録)しておくことで、PDFからキャプションを自動認識します。
認識されたキャプションには、矩形の選択線(領域)が表示されるので、上下左右に選択線を操作し、領域を広狭させることで、無駄な余白のない、理想的なキャプション付画像がつくれます。

PDFから画像と数式を領域指定

インライン・ブロックの数式を画像として取り出す

数式の画像化はとても大変です。特に元データが手元になく、PDFしかない場合などは、制作会社にとって、時間と工程のやりくりに苦心惨憺、四苦八苦かと想像します。画像データとしての取り出しだけでも楽になれば、後の工程も多少のゆとりは持てるのではないかと思います。

実施例

(1)Web生成元PDFの見本。このPDFにはMathMLから組版した数式が入っています。本文のフォントはMSゴシックやMS明朝など。数式のフォントはSTIXを指定しています。

数式のあるPDF(PDFファイル)

(2)本ツールでは数式をフォントで自動認識します。この例では生成元PDFで数式にSTIXフォントを使っていますので、本ツールの設定メニューで数式のフォントを「STIX」に設定します。

(3)数式を自動認識します。認識した数式領域にはブロック数式、インライン数式別に番号が付きます。

(4)数式の認識領域を修正します。

(5)領域の修正が完了したら本ツールの「ファイル」⇒「数式を保存」で数式を保存します。数式は領域毎にSVGファイルとなります。同時に数式の大きさやベースラインの調整用のCSSも自動生成します。SVG+CSSを組み合わせたチェック用のHTMLも生成します。

出力したチェック用HTML

(6)PDF中のテキストをコピーしてHTMLタグを付け、(5)で作成したSVG、CSSと組み合わせて(完成版)HTMLを作成します。:

数式を埋め込んだHTML(スタイル未調整)

任意の場所を画像として出力

このソフトウェアの強みは、任意の箇所を領域指定することで、その場所を画像化できるところです。目下の弱みはキャプションのない画像について自動認識出来ない点です。

動作環境・制限事項について

制限事項

できること 説明
ラスター画像をクリックで領域指定 画像そのものを自動認識しませんが、画像にカーソルを当ててクリックすると、その画像の領域を認識します。
ページ全面がラスタ画像の時は利用できません。
外字認識 JIS X 0213:2004 の文字集合にない文字を自動認識し、枠で囲って表示します(文字コード範囲で外字を認識します)。
手動での認識はできません。また、ASCII文字"."のコードポイントが設定されているようなPDFでは、外字認識出ません。

対象ユーザー

WebページやEPUBを制作する作業を行う制作会社様や、出版物制作の内製化を目指す調査研究所・出版社等の各種団体様向けです。

動作環境

Windows7, Windows8, Windows10 で動作確認しています。

お問い合わせについて

通常のアンテナハウス製品と異なり、誰でもWebページからダウンロードできるような形でのご用意はございませんので、動作等、ご不明点、ご相談ございましたら、弊社 アンテナハウス CAS-UB営業グループ(cas-info@antenna.co.jp)までお問い合わせください。

  • [1] SVG(Scalable Vector Graphics、スケーラブルベクトルグラフィック):Webなどで使うために設計された2次元線画の形式。詳しくは☞Scalable Vector Graphics(Wikipedia)
スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.