Word文書とHTMLの構造の違いによる変換時の留意事項

近年のWebページは文書を構造的にHTMLに記述し、レイアウトや装飾などはCSSに記述することで役割を分離しています。

HTMLには構造に関わるタグがあり、それらで囲うことでその中の文字列がどのような役割、またはどのような意味を持つかを決定します。また、タグと文字列の塊を入れ子にすることで、文章と文章の関係が親子関係なのか並列的な関係なのかを決めることができます。

これらの組み合わせによってHTMLを構造的に記述することができます。

構造的に記述したHTMLのイメージ(HTML5の例)
構造的に記述したHTMLのイメージ(HTML5の例)

これに対して、Word文書はもともと印刷を想定した文書ファイルのため、文書の内容とレイアウトや見た目などが分離されておらず、文字に対して直接装飾されています。

このような背景も含めWord文書をHTMLに変換する場合、一部のWordの便利な機能を利用するための構造(見出しや段落、目次、相互参照 など)以外は、HTMLとして文書を構成する情報が十分ではありません。

『HTML on Word』のHTMLへの変換は、HTMLの仕様(HTML5、XHTML 1.0)に準拠して出力することができますが、これらはWord上で指定されているスタイルをもとに独自の変換エンジンで解析し、構造的なHTMLに変換します。また、この構造に対して別途用意したCSSでレイアウトなどのスタイルを適用することができます。
※CSSがない場合はWebブラウザが持つ標準のスタイルで表示されます。

Word文書からHTMLに変換する際の要点について詳しくは、オンラインマニュアルの「第6章 Word編集ガイドライン」をご参照ください。

HTML on Word オンラインマニュアル

ご注意:Word上でのレイアウトや装飾は、HTMLに変換した場合に再現されません

WordからHTMLに変換する場合、Word文書上の基本的なレイアウトや一部の装飾を除いてその他のレイアウトや装飾に関する情報はHTMLに出力されません。

HTMLを装飾したい場合はスタイルシートをご利用ください。本製品にはサンプルのCSSが同梱されておりますので、変換時にそのCSSファイルを指定することでリンクした状態で出力されます。

独自のレイアウトを使用したい場合は、別途CSSをご用意してください。CSSの作成にはCSS及びHTMLの知識が必要になります。

CSSで装飾