PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr

PDF活用講座『PDFからOffice変換編』

この記事は、アンテナハウスのブログサイト『I love software!』に2011年7月11日~14日にかけて掲載された記事を元に加筆・修正されたものです。

第4回 段組みとテキストボックス、どちらを選ぶ?

PDFをWordで編集しなおしたいと考えますと、できるだけ元の体裁を再現して取り込むことができれば編集にかかる手間も時間も削減できて便利です。

PDFを再度Wordに戻す場合、手っ取り早くレイアウトを再現するためにWordのテキストボックスに変換する方法があります。
Wordのテキストボックスは、ページ上に四角い枠を座標で配置できますから、その中にテキストを流しこめばレイアウトも比較的簡単に再現できます。
以下は、2段組みされたPDFをテキストボックスでWordに変換した例です。

[元のPDF]
元のPDF
[テキストボックスでWordに変換した結果]
テキストボックスでWordに変換した結果

実際にこのような変換方法を既定値とする変換ソフトは、OCR変換型に多いようです。OCR処理ではページ上で文字列や表のある場所を最初に「領域」と呼ぶ矩形範囲 でとらえてから文字認識を行うのが一般的で、「領域」をそのままテキストボックスに置き換えれば変換処理は比較的容易に行えるだろうと推測されます。

実は、本製品でも、DTPソフトで作成したPDFなどレイアウトが複雑な文書をWordに再現する ため、変換条件で「レイアウトを優先する」オプションを設けて、選択された場合にはテキストボックスを使用した変換ができるようにしています。

しかし、テキストボックスに頼る変換は、Word上での編集しやすさをスポイルしてしまいます。例えば、本文が横書き2段組みで構成されている文書が左右別々の テキストボックスで変換された場合、左側の段落で文字を削除したり追加したりしても右側の段落には何も影響しませんから、全体で体裁を整えるのがとても 大変になってしまいます。

このようなことから、本製品では、段組みを段組みとしてWordの本文に再現できるよう こだわりを持って変換を行っています。
以下は、上記のPDFを既定値でWordの本文に変換した結果です。

既定値でWordの本文に変換

このような変換だと、段落の文字列はひとつながりで編集できますから、修正も行いやすいですね。

次回は、「グラフのはずが表に変換!?」というお題についてお話しします。

スペース
トップページサポートお問い合わせ会社案内
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.