HTML on Word V1.2ユーザーズ・マニュアル

はじめに

「HTML on Word」は、Microsoft Word(以下、Word)で編集・保存したdocx形式のファイルをシンプルで編集しやすいHTMLに変換するツールです。使い慣れたWordで作成した文書から簡単にWebページを作ることができます。

Wordには文書校閲機能、見出しスタイルなどのスタイル設定、自動アウトライン番号設定、高度な作図機能、表作成機能、ハイパーリンクの簡単作成など文書を編集する上で便利で強力な編集機能が備わっています。そこで、Wordを使えば品質が高い文書を高い生産性で作成できます。「HTML on Word」を使えばWordで作成した文書を簡単にHTMLに変換できるので、優れた内容のWebページを効率的に作れるようになります。

本マニュアルは「HTML on Word」の機能について説明するとともに、WordをHTML作成ツールとして、上手に活用する方法について説明しています。

本マニュアルの構成は次のとおりです。

第1章 製品の概要」では本製品の機能概要、動作環境、制限事項、ユーザーサポートなど、本製品を利用する前に理解していただきたいことについて説明します。

第2章 インストールとライセンスの設定」では、製品のインストール・アンインストール、ライセンスについて説明します。

第3章 コマンドライン版の機能と利用方法」ではWord文書からHTMLに変換するコマンドライン版の使用方法を説明します。

第4章 アドインの利用方法」ではWordのリボンに組み込むアドインの使い方を説明します。

第5章 変換仕様」では、Wordで設定したスタイルをHTMLのタグに変換する仕様を説明します。

第6章 Word編集ガイドライン」では、Webページを上手に作成するためにWordの編集機能をどのように使うと良いかについてのガイドラインを提供します。

表記法

本マニュアルではHTMLの要素について次のような表記をしています。

  1. HTMLの要素型名を<>で囲って、<>タグのように表記します。
  2. 変換仕様では、出力される開始タグのみを表記し、終了タグが出力される場合も、終了タグを省略します。
  3. 見出しランクタグ(<h1>, <h2>, <h3>, <h4>, <h5>, <h6>)を総称して、<h>タグと表記します。<h>タグはHTMLの要素型名ではないので注意してください。

お問い合わせ先

本製品の機能・操作についての質問は、電子メールで次までお問い合わせください。

xhw@antenna.co.jp

目次

HTML on Word V1.2ユーザーズ・マニュアル

はじめに

表記法

お問い合わせ先

第1章 製品の概要

1.1 コマンドライン版の機能

1.2 アドインの機能

第2章 インストールとライセンスの設定

2.1 インストールの手順

2.1.1 インストールオプション

2.2 ライセンス

2.2.1 評価版

2.2.2 正式ライセンス

2.3 アンインストール

第3章 コマンドライン版の機能と利用方法

3.1 コマンドライン起動時のメッセージ

3.2 変換オプション

3.3 コマンドライン操作例

3.4 設定ファイル

3.4.1 デフォルト設定ファイル

3.4.2 変換オプション設定ファイル

3.4.3 設定ファイルの形式

3.5 アドインメニューで指定できるパラメータ

3.6 エラーメッセージ

第4章 アドインの利用方法

4.1 アドインの登録と解除

4.1.1 アドイン登録

4.1.2 アドイン登録解除

4.2 「アンテナハウス」タブ

4.3 HTMLへ変換ボタン

4.4 HTMLへ変換のメニュー操作

4.4.1 変換結果を表示するアプリケーションの指定

4.4.2 変換先フォルダーを変更

4.4.3 「指定したCSSを用いる」

4.4.4 「ブロックタグで改行する」

4.4.5 ヘルプ

4.5 エラーメッセージ

第5章 変換仕様

5.1 変換元文書

5.2 変換先HTMLのバージョン

5.3 ルート・ヘッダ・メタ情報

5.4 ブロック要素

5.4.1 見出しスタイルとアウトラインレベル

5.4.2 見出しのアウトライン番号

5.4.3 箇条書き

5.4.4 段落番号と順序付きリスト

5.4.5 段落スタイル名(オプション)

5.5 図および図の配置

5.5.1 図の出力フォルダーとファイル名

5.5.2 画像と図形の形式

5.5.3 図の配置指定

5.5.4 文字列の折り返しを指定した図を出力する位置

5.6 数式

5.7 表

5.7.1 表の見出し行

5.7.2 表の見出し列

5.8 インライン要素

5.8.1 フォントグループ

5.8.2 リンクと相互参照

5.9 段落テキストの揃え

5.10 テキストボックス

5.11 文末脚注

第6章 Word編集ガイドライン

6.1 コンテンツとスタイル分離原則について

6.1.1 Webページのコンテンツとレイアウト分離とは?

6.1.2 Wordはコンテンツとレイアウトが混然一体

6.1.3 本製品は変換時にWordのレイアウト指定を原則無視

6.1.4 Word文書を作成するときに避けて欲しいこと

6.2 HTMLの見出しランクタグの出力

6.2.1 Wordの見出しスタイルを設定する

6.2.2 表題を設定する

6.2.3 Wordの段落アウトラインレベルを設定する

6.3 箇条書きと段落番号

6.3.1 箇条書き

6.3.2 段落番号

6.4 図のレイアウト

6.4.1 行内配置

6.4.2 文字列の折り返し

6.5 Wordの空行と空き

6.6 図形・画像のグループ化

6.7 参照リンクの設定方法

6.7.1 リンク

6.7.2 相互参照

6.7.3 リンクの参照先

6.8 表

6.9 文字の修飾・フォントの扱い

奥付け

第1章 製品の概要

本製品は①docxファイルからHTMLファイルに変換処理を行うコマンドライン版プログラム(Word2HTML)と、②Word のリボンに組み込まれるアドインから構成されます。

コマンドライン版の変換対象ファイル形式はMicrosoft Word(以下、Word)で編集して保存したdocx形式ファイルです。Wordの旧文書形式(拡張子doc)文書を変換することはできません。

1.1 コマンドライン版の機能

Word2HTMLはdocx形式ファイルを読み込んでHTML形式に変換するコンバータ(変換エンジン)です。変換エンジンは、アンテナハウスの製品である「Office Server Document Converter」の技術を使って、独自に開発したものです。Wordの「名前を付けて保存」の機能は使用していません。変換エンジンはWindowsのコマンドライン版プログラムとして動作します。

コマンドライン版はWindowsのDOS窓から直接操作できます。Wordで編集中の文書を、アドインのメニューからHTMLに変換するときは、アドインがコマンドライン版を起動します。

コマンドラインの変換動作を変換オプションのパラメータで指定できます。詳細は、「第3章コマンドライン版の機能と利用方法」を参照してください。アドインからもオプション・パラメータの一部を設定できます。

【注意】コマンドライン版のライセンスはローカルPCで使用するためのものです。サーバーとして使用するPC上にインストールして、そのサーバーに接続したクライアントPCからネットワークを通じて本製品を使用することは許諾しておりません。サーバー上にインストールして使用することをご希望の場合は、弊社営業グループ(sis@antenna.co.jp)までお問い合わせください。

【注意】コマンドライン版はMicrosoftのOneDrive上のフォルダーとファイルには対応していません。

  • OneDrive上にあるファイルは変換対象として選択できません。
  • OneDrive上のフォルダーを変換先として指定することができません。

1.2 アドインの機能

アドインは、①変換オプションを設定する機能と、②Wordで編集中の文書の内容をHTMLファイルに変換する機能、③変換結果のHTMLファイルを関連付けられたアプリケーションで表示する機能を、Wordのリボンのメニューとして追加します。

上記②の変換処理自体は、アドインのプログラムがWord2HTMLを起動して行います。docxファイルをHTMLファイルに変換した後、ブラウザなどのアプリを起動してHTMLファイルを表示します。

詳細は、「第4章 アドインの利用方法」を参照してください。

なお、アドインのメニューは日本語と英語を内蔵しています。Wordの言語が日本語のとき、アドインのメニューも日本語になります。Wordの言語が英語のとき、アドインのメニューも英語になります。

第2章 インストールとライセンスの設定

V1.2とそれ以前のバージョンを同一環境にインストールできません。旧バージョン(V1.1以前)をインストールしている場合、旧バージョンをアンインストールしてからV1.2をインストールしてください。アンインストールについては2.3を参照してください。

2.1 インストールの手順

本製品をお手元のPCにダウンロードすると、ダウンロード先フォルダーにZIP形式アーカイブファイル(xhw122_setup.zip)が保存されます。

Please enter alt text.

ZIPファイルからインストールするには、次の1~10の順序で操作してください。

1. ZIP形式アーカイブファイルを解凍すると、解凍先フォルダーに本製品のインストーラファイル(xhw122_setup.exe)ができます。

2. xhw122_setup.exeファイルをマウスで選択し、ダブルクリックすると、Windowsによって「このアプリがデバイスに変更を加えることを許可しますか?」という確認ダイアログが表示されますので、「はい」を選択してクリックします。

3. インストールプログラムが起動し、インストール準備が始まります。

Please enter alt text.

4. インストール準備が完了すると、インストール開始を確認するダイアログが表示されます。

Please enter alt text.

5. 次のダイアログでは本製品の使用許諾契約書が表示されるので、内容をご確認の上、同意される場合は「はい」を選択してクリックします。

Please enter alt text.

6. 次のダイアログで本製品をインストールするフォルダーを選択します。デフォルトのインストール先は次のフォルダーになります。
C:\Program Files\Antenna House\xhw12\
デフォルトのままでよければ、「次へ」ボタンをクリックします。

インストール先フォルダーを変更するときは、右の「参照」ボタンをクリックすると表示されるフォルダー選択ダイアログから、インストール先フォルダーを選択してください。

Please enter alt text.

7. 次はインストール完了時のオプションを選択するダイアログです。次のふたつのオプションがあります。オプションについての説明は2.1.1インストールオプションを参照してください。
□アドイン登録/解除アイコンをデスクトップに登録する
□インストール完了後にReadMeファイルを読む

Please enter alt text.

8. 「次へ」をクリックすると、インストール開始するかどうかの最終確認ダイアログが表示されるので、「インストール」をクリックするとインストールを開始します。

Please enter alt text.

9. インストール処理が実行されます。

Please enter alt text.

10. インストールが完了すると、次のダイアログが表示されます。「完了」をクリックすると、インストール完了時のオプションが実行されます。

Please enter alt text.

2.1.1 インストールオプション

1. アドイン登録/解除アイコンをデスクトップへ設定する

本オプション・チェックボックスにチェックすると、Microsoft Wordのリボンにアドインを登録するプログラムと、そのアドイン登録を解除するプログラムのふたつのアイコンがデスクトップに配置されます。

Please enter alt text.

アドインの登録と登録解除については、「第4章アドインの利用方法」を参照してください。

2. インストール完了後に、ReadMeファイルを読む

本オプションのチェックボックスにチェックすると、インストールが完了したとき、インストーラに同梱されているReadMe.txtファイルをメモ帳で画面に表示します。

2.2 ライセンス

「HTML on Word」のライセンスは30日間評価版と正式ライセンスの2種類があります。2種類のライセンスで変換に係る機能の差はありません。ライセンスの種類はライセンス・ファイルによって切り替えます。

2.2.1 評価版

評価版は本製品のWebページから入手できます。

評価版のインストールが完了すると、インストール先のフォルダーに、30日間評価版のライセンス・データを内容とするライセンス・ファイルが設定されます。

評価版は機能制限がなく、正式版と同じ機能を使えます。但し、評価版の使用期間は30日間に限定されており、インストールしてから30日を過ぎるとコマンドライン版を起動することができなくなります。継続してお使いいただくには、アンテナハウスのオンラインショップで正式版をお求めいただく必要があります。

アンテナハウスのオンラインショップ

https://web.antenna.co.jp/shop/html/

2.2.2 正式ライセンス

本製品を購入された場合、正式ライセンスデータ(ライセンス・ファイル)とライセンス証書が提供されます。ライセンス・ファイル名は「xhwlic.dat」です。

正式ライセンスに切り替えるには、ライセンス・ファイルをコマンドライン版プログラム(Word2HTML.exe)と同じフォルダーにコピーしてください。

コマンドライン版プログラムのインストール先フォルダーのデフォルトは、次のとおりです。

C:\Program Files\Antenna House\xhw12

このフォルダーへの書き込みには管理者権限が必要なため正式ライセンス・ファイルをコピーしようとすると次の警告ダイアログが表示されます。

Please enter alt text.

管理者権限をもっていない場合は、管理者にコピーを依頼してください。

2.3 アンインストール

本製品のアンインストールは次のステップで行います。

1. アドインの登録解除

Wordにアドインを登録しているときは、最初にアドインを登録解除します。アドインの登録解除については、「4.1.2アドインの登録解除」を参照してください。

アドインを解除しないでコマンドライン版のアンインストールをすると、アドインを解除するプログラムも削除されてしまい、Wordのリボンからアドインを解除できなくなるので注意してください。

2. コマンドライン版のアンインストール

コマンドライン版のアンインストールはWindowsの「設定」の「アプリと機能」画面から行います。

「アプリと機能」には、Windowsにインストールされているアプリケーションのリストが表示されます。「HTML on Word V1.2」を探して、クリックすると図のように「アンインストール」ボタンが有効になっています。

Please enter alt text.

「アンインストール」をクリックすると、インストーラが起動して、アンインストール処理を行います。

第3章 コマンドライン版の機能と利用方法

コマンドライン版は、Windowsのコマンドプロンプトから使用するプログラムです。入力したdocxファイルをHTMLファイルに変換する機能を提供します。

3.1 コマンドライン起動時のメッセージ

WindowsのDOS窓でコマンドライン版を起動すると次のメッセージを表示します。

Please enter alt text.

(1) シリアル番号と保守期限

XHW12から始まる英数字がシリアル番号です。シリアル番号に続くメッセージの意味は次のとおりです。

Maintenance Deadline:

正式版のとき

保守期限

Trial Deadline:

試用版・評価版のとき

試用期限

(2) 利用方法

usage: Word2HTMLに続く表示は、コマンドラインの変換オプションです。

3.2 変換オプション

コマンドライン実行時は、Word2HTMLに続けて、入力ファイル名(必須)、出力ファイル名(必須)および変換オプションを指定します。

変換オプションのパラメータは次の表のとおりです。入力ファイルと出力ファイルの指定は必須ですが、それ以外のパラメータは必要な時だけ指定します。パラメータを指定しないときはデフォルト動作となります。

パラメータ

説明

<input-file>

(必須)入力ファイル名を指定します。

<output-file>

(必須)出力ファイル名を指定します。

-clrsettings

本パラメータを指定するとデフォルト設定ファイルなどで指定済のオプション設定をクリアします。

-settings <settings-file>

<settings-file>にて指定した変換オプション設定ファイルを読み込みます。

-xhtml

デフォルトではHTML文法のタグを出力します。-xhtmlを指定するとXML文法のタグを出力します。

-viewport <content>

<head>に次の形式のメタタグを出力します。

<meta name=”viewport” content=”contentに指定した内容”>

-endl

ブロックタグの終わりに改行を出力します。

-emptyP

デフォルトではWordの空の行(改行のみの行)をHTML出力時に無視します。本オプションを指定すると空行の数だけ空の<p></p>タグを出力します。

-nonrefiid

Wordでは編集を重ねると文書ファイル内に参照されていないIDがdocxファイル内に沢山できてしまいます。本コンバータはデフォルトでは文書ファイル内をスキャンして、内部的に参照されていないID をHTML出力時に削除します。本オプションを指定すると参照されていないIDを削除しません。

-imgwidth

イメージの幅を出力します。

-hstrong

見出しスタイルで指定された強調を無視します。

-embedimg

画像をデータURLで本体HTMLに埋め込みます。

-(x|o)math

Wordの数式エディタで編集した数式の出力形式を指定します。次の4とおりの出力形式を指定できます。

未指定 数式を<img>タグにsvg形式ファイルで出力
-math 数式を<img>タグにMathML形式ファイルで出力
-xmath 数式をmathML形式マークアップで出力
-omath 数式をWord独自のOffice Math形式で出力

-throughimg

Wordに挿入した元の画像形式のまま出力します。

-pstyle

段落のスタイル名をclass属性の値に設定して出力します。

-citation

Citationフィールドのtagの値を<a>タグのhref属性の値に設定して出力します。

-textcolor

文字に指定されている色を<span style="color:カラー値”>として出力します。

-italic n|t|s

文字に斜体が指定されているときの出力方法を指定します。

-italic n 出力しない(デフォルト)

-italic t <i>タグとして出力

-italic s <span style="font-style:italic>として出力

-underline n|t|s

文字に下線が指定されているときの出力方法を指定します。

-underline n 出力しない(デフォルト)

-underline t <u>タグとして出力

-underline s style="text-decoration-line:underline;">として出力

-linethrough n|t|s

文字に取り消し線が指定されているときの出力方法を指定します。

-linethrough n 出力しない(デフォルト)

-linethrough t <del>タグとして出力

-linethrough s <span style="text-decoration-line: line-through;">として出力

-encoding <encoding>

HTMLファイルの文字コード(符号化方式)として、UnicodeのUTF-8 以外を指定したいとき本パラメータで符号化方式を指定します。

-encoding Shift_JIS シフトJISで出力(注1参照)

-encoding UTF-16 UnicodeのUTF-16符号化

注1 シフトJISに定義されている文字の種類はUnicodeより少ないため、シフトJISで扱えないUnicodeの文字は&#x文字番号;(文字番号は16進数)で出力されます。なお、JIS X0208にマイクロソフトが追加した旧機種依存文字(①、②など)はシフトJISの文字として扱います。

-defstyle

本オプションを指定すると<head>の<style>要素(デフォルトCSSスタイルを指定する要素)を出力しません。

-spaceindent

本オプションを指定すると段落先頭に1文字以上の字下げが指定されているとき、字下げを1文字の全角空白に変換します。

-outputbr

段落を<p>タグで囲む代わりに、段落の終わりに<br>タグを出力します。-xhtmlパラメータ指定時は無効です。

-fileimages

画像ファイルを格納するフォルダー名を、“変換先ファイル名.images”とします。詳細は、5.5.1をご参照ください。

-css cssfile [media]

CSSファイルをリンクします。CSSファイルはWindows上のフォルダーに置き、そのパスを指定します。指定したCSSファイルが存在しないとエラーになります。オプションでmediaを指定できます。

<head>に次の形式のlinkタグを出力します。

<link href=”xxx.css” rel=”stylesheet” type=”text/css” media=”print”>指定したCSSファイルはHTML出力先フォルダーにコピーされます。

-cssとCSSファイルの組を複数指定できます。

-js javascript-path

<head>にscript タグを置き、そのsrc属性にJavaScriptファイルのパス(URL)を指定します。指定したJavaScriptのパスが存在しなくてもエラーになりません。

-savesettings <settings-file>

コマンドライン実行時変換オプション・パラメータの指定値を<settings-file>にて指定したファイル名で保存します。設定ファイルの詳細は3.4.2を参照してください。

-savedefault

コマンドライン実行時の変換オプション・パラメータの指定値をデフォルト設定ファイル(def-settings.xml)に出力します。デフォルト設定ファイルの詳細は3.4.1を参照してください。

3.3 コマンドライン操作例

次はコマンドラインで、変換元ファイル名:NewsRelease.docx、変換先ファイル名:NewsRelease.htmlとし、CSSファイル:sample.news.css を指定した例です。

Please enter alt text.

変換が正常に実行されると次のメッセージが表示されて、HTMLファイルが作成されます。

Please enter alt text.

3.4 設定ファイル

変換オプションをあらかじめ設定ファイルに保存しておけば、コマンドラインで変換オプションを指定する代わりに設定ファイルで指定できます。設定ファイルには次の2種類があります。

  1. デフォルト設定ファイル
  2. 変換オプション設定ファイル

3.4.1 デフォルト設定ファイル

デフォルト設定ファイルを使うとデフォルト動作を切り替えることができます。デフォルト設定ファイルのファイル名は、「def-settings.xml」で、ファイルの保存場所は次の2か所のどちらかです。

  1. EXEファイル(Word2HTML.exe)と同じフォルダー
  2. Roamingフォルダー

デフォルト設定ファイルをEXEファイルと同じフォルダーに置いた場合、全ユーザー共通のデフォルト値となります。

デフォルト設定ファイルをRoamingフォルダーに置くと、ユーザー毎に異なるデフォルト設定ファイルとなります。Roamingフォルダーのデフォルト設定ファイルのパスは、通常、次のとおりです。

C:\Users\USER\AppData\Roaming\AntennaHouse\xhw\1.2\def-settings.xml

デフォルト設定ファイル上記2か所の両方にあるときは、Roamingフォルダーにあるデフォルト設定ファイルの内容が優先されます。

デフォルト設定ファイルに、ON/OFFタイプの変換オプションの設定があるとき、同じ変換オプションを、アドインまたはコマンドラインのパラメータで指定すると、ON/OFFが反転するので注意してください。

変換オプションの「-savedefault」パラメータを指定すると、Roamingフォルダーにデフォルト設定ファイル(def-settings.xml)を作成できます。デフォルト設定ファイルはXML形式なのでテキスト・エディタで編集できます。

例えば、コマンドラインで次のように指定すると、①ブロックタグの終わりに改行を出力する(-endl)、②下線を<u>タグとして出力する(-underline t)が設定されたデフォルト設定ファイルが作成されます。

Please enter alt text.

また、次のように指定すると、デフォルト設定ファイルの設定値をすべてクリアして、本プログラム自体のデフォルト設定に戻したデフォルト設定ファイルが作成されます。

Please enter alt text.

次は変換オプション・パラメータとして「-clrsettings -savedefault」を指定して作成されるデフォルト設定ファイルです。デフォルト値のないパラメータは設定されません。

<?xml version="1.0"?>
<word-to-html-settings>
<enable-XHTML enable="false"/>
<viewport content=""/>
<enable-endl enable="false"/>
<enable-empty-paragraph enable="false"/>
<enable-non-reference-id enable="false"/>
<enable-image-width enable="false"/>
<enable-heading-strong enable="true"/>
<enable-embed-image enable="false"/>
<enable-mathml enable="false"/>
<xml-mathml enable="false"/>
<xml-omath enable="false"/>
<through-image enable="false"/>
<enable-pstyle enable="false"/>
<enable-citation enable="false"/>
<text-color enable="false"/>
<output-br enable="false"/>
<style-tag enable="true"/>
<space-indent enable="false"/>
<fil-images enable="false"/>
<italic out="n"/>
<underline out="n"/>
<linethrough out="n"/>
</word-to-html-settings>

3.4.2 変換オプション設定ファイル

変換オプション設定ファイルは、変換オプションのパラメータ値を保存するファイルです。

コマンドライン実行時に、変換オプション設定ファイル名を指定して読み込みます。

同じ設定による変換を繰り返すとき、変換オプションを設定ファイルに保存しておくと、次回から同一のオプションを指定する代わりに設定ファイルの指定で済みます。

変換オプション設定ファイルのファイル名は任意です。

変換オプション設定ファイルはコマンドライン実行時に、変換オプションの「-savesettings」で指定したファイルとして作成できます。

変換オプション設定ファイルはXML形式なので、パラメータ設定値をテキスト・エディタで修正できます。

3.4.3 設定ファイルの形式

設定ファイルはルート要素が「word-to-html-settings」で、変換オプションに設定する項目を子供の要素型名とするXMLファイルです。デフォルト設定ファイルと変換オプション設定ファイルの形式は同じです。各要素型名と変換オプションのパラメータの対応関係は次の表のとおりです。

要素型名

属性

プログラムのデフォルト値

対応する変換オプション・パラメータ

word-to-html-settings

enable-XHTML

enable

false

-xhtml

viewport

content

-viewport

enable-endl

enable

false

-endl

enable-empty-paragraph

enable

false

-emptyP

enable-non-reference-id

enable

false

-nonrefiid

enable-image-width

enable

false

-imgwidth

enable-heading-strong

enable

true

-hstrong

enable-embed-image

enable

false

-embedimg

enable-mathml

enable

false

-math

xml-mathml

enable

false

-xmath

xml-omath

enable

false

-omath 

through-image

enable

false

-throughimg

enable-pstyle

enable

false

-pstyle

enable-citation

enable

false

-citation

text-color

enable

false

-textcolor

output-br

enable

false

-outputbr

style-tag

enable

true

-defstyle

space-indent

enable

false

-spaceindent

fil-images

enable

false

-fileimages

italic

out

n

-italic n|t|s

underline

out

n

-underline n|t|s

linethrough

out

n

-linethrough n|t|s

encoding

encoding

なし

-encoding

link-css

src

なし

-css css-file

link-js

src

なし

-js javascript-path

3.5 アドインメニューで指定できるパラメータ

アドインのメニューで指定できる変換オプション・パラメータは、次のふたつのみです。

「指定したCSSを用いる」チェックボックスにチェックするのは、コマンドライン版の変換オプション「-css」パラメータ指定に該当します。コマンドライン版では「-css」とファイル名の組を複数指定できますが、アドインで指定できるのはひとつだけです。

「ブロックタグで改行する」チェックボックスにチェックすることは、変換オプションの「-endl」パラメータの指定にあたります。

アドインでは他の変換オプションを指定できないので、必要に応じてデフォルト設定ファイル(3.4.1を参照)を使って指定してください。

3.6 エラーメッセージ

コマンドライン版のエラーメッセージは次のとおりです。

エラーメッセージ

考えられる原因

“Word2HTML”は、内部コマンドまたは外部コマンド、操作可能なプログラムまたはバッチファイルとして認識されていません。

コマンドライン版が正常にインストールされていない。

(対策)インストールし直す。

コマンドライン版をインストールしたフォルダーへのパスが設定されていない。

(対策)Windowsの設定で、環境変数にpathにフォルダーへのパスを設定する。

“Cannnot Open File”

変換先ファイルパス

変換先ファイルが開けない。

(対策)変換先ファイルがエディタなどで開らかれ、編集がロックされた状態となっていることが考えられます。そのときは編集終了してください。

(対策)リンク指定したCSSファイルが存在しないことも考えられます。

“Input file not found

入力ファイルが見つからない。

第4章 アドインの利用方法

4.1 アドインの登録と解除

4.1.1 アドイン登録

アドインを登録するには、Wordを終了した状態で、デスクトップの「HTML on Word」アドイン登録アイコンをクリックします。

インストールの際、デスクトップにアドイン登録アイコンを作成しなかった場合は、次のようにします。

  1. 「HTML on Word」のインストール先フォルダーにコピーされている、アドイン登録用のプログラムを探す。
  2. アドイン登録用プログラムファイル(install.vbs)をダブルクリックします。

4.1.2 アドイン登録解除

アドイン登録を解除するには、Wordを終了した状態で、デスクトップの「HTML on Word」アドイン登録解除アイコンをクリックします。

インストールの際、デスクトップにアドイン登録解除アイコンを作成しなかった場合は、次のようにします。

  1. 「HTML on Word」インストール先フォルダーにコピーされているアドイン登録解除用のプログラムを探す。
  2. アドイン登録解除用プログラムファイル(uninstall.vbs)をダブルクリックします。

4.2 「アンテナハウス」タブ

アドインが登録されているとき、Wordのリボンに「アンテナハウス」タブができます。このタブの「HTML on Word」グループに次のボタンとチェックボックスがあります。

Please enter alt text.

Wordで編集中の文書をこのボタンとチェックボックスを使ってHTMLファイルに変換し、変換結果をブラウザやテキスト・エディタで確認できます。

Windowsの設定「時刻と言語」の「言語」タブで「優先する言語」が「日本語」のとき、図のように、Wordのタブ名やメニューは日本語になります。このときアドインのタブ名は「アンテナハウス」で、コマンド名やツールチップのメッセージは日本語となります。

Windowsの設定「時刻と言語」の「言語」タブで「優先する言語」を「英語」に変更すると、Wordのタブ名やメニューが英語になります。このとき、アドインのタブ名はAntenna Houseとなり、コマンド名やツールチップのメッセージも英語となります。

4.3 HTMLへ変換ボタン

「HTMLへ変換」のボタンは、上部が「HTMLへ変換」コマンド、下部が「変換オプション」のふたつのコマンドに分かれています。

Please enter alt text.

4.4 HTMLへ変換のメニュー操作

「HTML変換」ボタンの上部をクリックすると「HTMLへ変換」コマンドを起動します。「HTMLへ変換」の動作は次の順となります。

  1. 編集中のdocx文書が更新されているとき、変換開始前に、変更された文書の保存を促すダイアログを表示します。Please enter alt text.
  2. HTML保存先フォルダーが設定されていないとき、保存先フォルダーを選択するダイアログを表示します。表示されるダイアログは「4.4.2変換先フォルダーを変更」と同じ内容なので、そちらを参照してください。
  3. 編集中のdocx文書をHTML形式に変換します。
    ※変換処理は、別途、インストールされたWord2HTMLコマンドライン版を起動します。コマンドライン版については、「第3章コマンドライン版の機能と利用方法」を参照してください。
  4. 変換が正常に終了したとき、Windowsの機能で拡張子htmlに対応付けられているアプリケーションを起動して、変換結果を表示します。

4.4.1 変換結果を表示するアプリケーションの指定

「HTMLへ変換」が終了すると、Windowsで拡張子htmlに対応付けられているアプリケーションでHTMLファイルを表示します。

「HTMLへ変換」を最初に実行時するとき、Windowsで拡張子htmlに対応付けられているアプリケーションの中から、ファイルを表示するアプリケーション(ブラウザまたはエディタ)を選択するダイアログが表示されることがあります。

但し、Windowsの動作環境によっては、アプリケーション選択ダイアログが表示されないときもあります。このダイアログを表示しているのはMicrosoft Windowsであり、アドインでは表示・非表示の制御は行っていません。

Please enter alt text.

Windowsで拡張子htmlに対応付けられているアプリケーションを変更するには、次のようにします。

  1. エクスプローラでHTMLファイルを選択します。
  2. 右クリック・メニューからプロパティを選択します。
Please enter alt text.

3. プロパティのダイアログからプログラムの項の「変更」ボタンをクリックします。

Please enter alt text.

  1. 「今後のhtmlファイルを開く方法を選んでください。」ダイアログでアプリケーションを選択します。Please enter alt text.
  2. 「OK」をクリックして、ダイアログを閉じます。

4.4.2 変換先フォルダーを変更

「HTMLへ変換」ボタンの下部をクリックすると「変換先フォルダーを変更」コマンドが表示されます。

Please enter alt text.

変換結果を表示するフォルダーを選択して、「OK」を押します。

次回から、選択したフォルダーに変換結果が保存されます。

4.4.3 「指定したCSSを用いる」

HTMLファイルはCSSでレイアウトを変更できます。変換出力されるHTMLファイルに、このオプションで指定したCSSファイルへのリンクを設定します。

Please enter alt text.

「指定したCSSを用いる」チェックボックスにチェックすると、CSSファイルを選択するダイアログが開くので、リンクしたいCSSファイルを選択してください。

Please enter alt text.

本製品にはサンプルのCSSファイルが同梱されています。サンプルCSSファイルは、本製品をインストールしたフォルダーのCSSフォルダーにコピーされています。本製品に同梱されているCSSファイルのほか、ご自分で用意したCSSファイルをリンクできます。

リンク設定したCSSファイルは、変換先HTMLファイルと同じフォルダーにコピーされます。

4.4.4 「ブロックタグで改行する」

「ブロックタグで改行する」チェックボックスをオンにすると、各ブロック終了タグの後ろに改行を出力します。変換したHTMLファイルをブラウザで表示するときは差がでませんが、HTMLファイルをテキスト・エディタで表示してタグを確認したり、編集したりするときに便利です。

Please enter alt text.

ブロックタグで改行しないHTMLファイル(デフォルト)と、ブロックタグで改行するにチェックして出力したHTMLファイルを、テキスト・エディタで読み込んで表示を比較すると次の図のようになります。

Please enter alt text.

4.4.5 ヘルプ

「ヘルプ」ボタンをクリックすると、Webヘルプを表示します。ヘルプは、アンテナハウスのホームページにあります。URLは次のとおりです。

  1. (日本語版)https://www.antenna.co.jp/xhw/help/ja/
  2. (英語版)https://www.antenna.co.jp/xhw/help/en/

4.5 エラーメッセージ

アドインの「HTMLへ変換」では、コマンドライン版(Word2HTML)を起動します。

変換時にエラーが発生したとき、ダイアログにコマンドライン版が出力したエラーメッセージが表示されます。

例えば、次のエラーメッセージは、WindowsからWord2HTMLプログラムが見つからないというメッセージです。原因はコマンドライン版が正常にインストールされていないか、または、コマンドライン版をインストールしたフォルダーへのパスが設定されていないことが考えられます。

Please enter alt text.

コマンドライン版のエラーメッセージについては、3.6エラーメッセージを参照してください。

第5章 変換仕様

コマンドライン版でWordからHTMLに変換するときの変換仕様を説明します。

5.1 変換元文書

変換元の対象文書ファイル形式はdocxファイルのみです。古いMicrosoft Wordで保存したdoc形式ファイルは変換処理の対象になりません。

5.2 変換先HTMLのバージョン

デフォルトではHTML仕様に準拠するタグを出力します。

HTML仕様の参照先

変換オプションで 「-xhtml」パラメータを指定するとXHTML1.0準拠のタグを出力します。

なお、以下の変換仕様のタグ見本はHTML仕様準拠の状態で説明しています。

5.3 ルート・ヘッダ・メタ情報

変換元

変換先(HTMLタグ)

備考

ルート

<!DOCTYPE html>

<html lang="">

日本語版:lang=”ja”

英語版:lang=”en”

言語判定は注1

文字符号化方式

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

UTF-8が基本です。それ以外にShift_JIS、UTF-16を変換オプション・パラメータで指定できます。

情報:タイトル

<head>

<title>~</title>

</head>

Word「情報」タブのプロパティ「タイトル」の内容から取得します。

メタ情報

<head>

<meta name="author" content="">

<meta name="description" content="">

<meta name="keywords" content="">

Word「情報」タブのプロパティの項目をname属性の値に、設定内容をcontent属性の値に変換します。name属性値とcontent属性値の対応関係は次のとおりです。

author:作成者
description:コメント
keywords:タグ

CSSのリンク

<link href="xxx.css" rel="stylesheet" type="text/css" media="print">

xxx.cssは指定したCSSファイル名。media属性はオプションです。

デフォルトスタイル

<head>

<style>CSSスタイル</style>

</head>

HTML全体に適用するデフォルトのCSSを設定します。設定する内容は次のふたつです。

①段落テキストの揃え(5.9を参照)

②tableのborder属性

但し、外部CSSをリンクするときは出力しません。

JavaScriptの指定

<head>

<script src=”xx/yy.js”></script>

</head>

xx/yy.js はJavaScriptのパス

注1 言語判定

Wordの文書中の全角幅の文字の割合とデフォルトスタイルの言語設定から推定しています。推定が正しくない場合があります。

5.4 ブロック要素

変換元

変換先(HTMLタグ)

備考

本文

<body>~</body>

表題スタイル

表題スタイルにアウトラインレベル1が設定されているとき

<h1>~</h1>

Wordのスタイルギャラリーに登録されている表題スタイルには、アウトラインレベル1が設定されているものと設定されていないものがある。

表題スタイルにアウトラインレベルが設定されていないとき

<p>~</p>

段落

<p>内容</p>

デフォルトでは改行のみの行は無視する。

-emptyPオプションを指定すると、改行のみの行を空の<p></p>で出力する。

強制改行

<br >

強制改頁、改段

無視

セクション

<h>開始タグが先頭またはその前によりランクの小さい<h>タグのみのとき、<h>開始タグの前に<section>開始タグを出力する。前方に

よりランクの大きい<h>があるとき</section>を出す。

<h> の前の<section>タグでツリー構造を作る。

5.4.1 見出しスタイルとアウトラインレベル

変換元

変換先(HTMLタグ)

備考

見出し1~見出し6(見出しスタイル)

<h1>~<h6>

見出しスタイルのアウトラインレベルを見出しランクタグに設定する。

見出し7~見出し9(見出しスタイル)

<p class=”l7”>~

<p class=”l9”>

見出しスタイルのアウトラインレベル7、8は段落のクラス属性として設定する。

段落のアウトラインレベル1~6

<h1>~<h6>

段落のアウトラインレベルを見出しランクタグに設定する。

段落のアウトラインレベル7~9

<p class=”l7”>~

<class=”l9”>

段落のアウトラインレベル7、8は段落のクラス属性として設定する。

5.4.2 見出しのアウトライン番号

見出しスタイルを指定した段落にアウトライン番号が付加されているとき、アウトライン番号を、class属性の値numberを指定した<span>タグで囲み、<h>タグの内容文字列として変換します。アウトライン番号と見出しのテキストの間に空きがあるときは空きを半角空白として出力、またはタブがあるときは、タブを削除して代わりに半角空白が1文字入ります。

5.4.3 箇条書き

Wordの箇条書きを指定した段落は、HTMLの箇条書き(番号なしリスト)(<ul>/<li>)に変換します。このときWord段落の行頭記号は削除されます。

5.4.4 段落番号と順序付きリスト

Wordの段落番号機能を使用して、段落先頭に番号を付与した段落(番号付きの段落)は次のように変換します。

  1. 番号付きの段落の前後が番号付きでない段落または改行のとき、その番号付き段落をHTMLの段落(<p>タグ)として出力します。このとき段落番号は、class属性の値をnumberとして指定した<span>タグで囲ったうえで、通常の文字として出力します。
  2. 番号付きの段落がふたつ以上連続するとき、HTMLの順序付きリスト(<ol>/<li>タグ)に出力します。
    1. 番号付き段落が階層化されていて、最初の段落と次の段落の階層が異なっていても隣り合っていれば連続しているものと判定します。
    2. Word文書で指定されている番号の種類を<ol>タグのclass属性の値として設定します。

5.4.5 段落スタイル名(オプション)

デフォルトでは段落スタイル名は出力しません。

変換オプションで「-pstyle」パラメータを指定すると、Wordの段落に段落スタイルが指定されているとき、段落スタイルの名前を<p>タグまたは<h>タグのclass属性の値として出力します。段落スタイル機能を使わずに段落書式を指定しているときにはclass属性の値は設定されません。

5.5 図および図の配置

5.5.1 図の出力フォルダーとファイル名

  1. docx文書に挿入された図はdocx文書から取り出され、そのパスがHTMLの<img>タグのsrc属性の値に設定されます。取り出した図ファイルを収めるフォルダーはデフォルトでは “image”です。変換オプションの「-fileimages」パラメータを指定すると、出力HTMLファイル毎に“出力ファイル名.images”フォルダーを作成します。ファイル名は自動生成の連番となります。
  2. docx文書にリンクされた図は、リンク元のファイルのパスをHTMLの<img>タグのsrc属性の値に設定されます。リンクされた図ファイルの複製や移動は行いません。図のパスは出力HTMLファイルからの相対パスに変換します。元のdocx文書とリンクされた図のフォルダーが移動されている場合、パスを適切な相対パスにできないことがあります。

5.5.2 画像と図形の形式

デフォルトではイメージ画像はPNGまたはJPEG形式に変換し、オートシェイプやWordで挿入した線画図形、EMF、WMF形式の図形ファイルはSVG形式に変換して出力します。

変換オプションで「-throughimg」パラメータを指定するとGIF、EMF、WMF形式でWordに挿入された画像・図形はファイル形式を変換しないで、元の形式のまま図の出力フォルダーに保存します。

5.5.3 図の配置指定

Wordの図の配置で指定したレイアウトオプションの種類を<img>のclass属性として保存します。

変換元

オプション

クラス属性

行内

Please enter alt text.

class="inline"

文字列の折り返し

Please enter alt text.

文字列の折り返し共通

class="block"

四角形

Please enter alt text.

class="block square"

狭く

Please enter alt text.

class="block tight"

内部

Please enter alt text.

class="block through"

上下

Please enter alt text.

class="block top-bottom"

背面

Please enter alt text.

class="block behind"

全面

Please enter alt text.

class="block front"

【注意】

CSSでは図の配置がインラインかブロックかをdiplayプロパティで指定します。displayプロパティのデフォルト値はinlineなので、Wordで図の配置に文字列の折り返しを設定してもブラウザでは行内配置として表示される場合があります。このような場合には、CSSで次のように指定してください。

img.block {
display: block
}

5.5.4 文字列の折り返しを指定した図を出力する位置

文字列の折り返しを指定した図のためのimgタグを出力する位置は、見出し、段落ではアンカーを設定したブロックの終了タグの後ろです。しかし、箇条書きの項目では終了タグの直前になります。詳細は、6.4図のレイアウトの項を参照してください。

5.6 数式

Wordの数式エディタで編集した数式は、デフォルトでは<img>タグを使ってSVG形式ファイルとして出力します。

変換オプションのパラメータによって、MathML形式の外部ファイルに変換、MathML形式のマークアップに変換、WordのOffice Open XMLの独自数式表現であるOffice Mathマークアップとして出力できます。

パラメータ

出力形式

未指定

数式を<img>タグにsvg形式ファイルで出力

-math

数式を<img>タグにMathML形式ファイルで出力

-xmath

数式をmathML形式マークアップで出力

-omath

数式をWord独自のOffice Math形式で出力

5.7

変換元

HTML要素

example

<table>

<tbody>

<tr>

<td>

結合

セル結合

<td colspan="n">

nは横結合セルの数

行結合

<td rowspan="n">

nは縦結合セルの数

5.7.1 表の見出し行

表の見出しタグ(テーブルヘッダ:thead)を出力するには、表の先頭行に次のどちらかを設定します。

  1. 表の先頭行を選択して、Wordのリボン「表ツール:レイアウト」の「タイトル行の繰り返し」をオンにする。
  2. Wordのリボン「表ツール:テーブルデザイン」の「表スタイルのオプション」で「タイトル行」のみにチェックする。

変換元

HTML要素

説明

リボンの表ツール:レイアウト

Please enter alt text.

<thead><tr><td>…</td></tr></thead>

表の先頭行が<thead>で囲まれます。

「タイトル行の繰り返し」をオンにすると、表がページを跨ったときに、各ページにタイトル行が繰り返し表示されます。これを避けたいときには、「タイトル行の繰り返し」をオフにして、テーブルデザインの表スタイルのオプションで「タイトル行」にチェックします。

リボンの表ツール:テーブルデザインの表スタイルのオプション

Please enter alt text.

5.7.2 表の見出し列

表の先頭列を選択して、Wordのリボン「表ツール:テーブルデザイン」の「表スタイルのオプション」で「最初の列」のみにチェックすると先頭列のセルを見出しセルに設定します。

変換元

HTML要素

説明

リボンの表ツール:テーブルデザインの表スタイルのオプション

Please enter alt text.

<tr><th>…</th></tr>

表の先頭列のセルが見出しセルのタグでマークアップされます。

5.8 インライン要素

5.8.1 フォントグループ

フォントグループ

HTML要素

example

ボールド

strong

但し、見出しスタイルに設定されたボールドは無視します。

イタリック

デフォルトでは無視します。変換オプションで<i>タグまたは次のCSSスタイル指定を設定して出力します。

<span style="font-style:italic;>

アンダーライン

デフォルトでは無視します。オプションで<u>タグまたは次のCSSスタイル指定を設定して出力します。

<span style="text-decoration-line:underline>

なお、リンクのアンカーテキストにはアンダーラインを付けません。

消し線

デフォルトでは無視します。変換オプションで<del>タグまたは次のCSSスタイル指定を設定して出力します。

<span style="text-decoration-line:line-through;">

下付き

sub

上付き

sup

文字の効果と体裁

無視

ハイライト(蛍光ペンの色)

無視

文字の色

デフォルトでは無視します。変換オプションで次のCSSスタイル指定を設定して出力します。

<span style="color1;カラー値">

<span style="color:red;">文字の色赤</span>、<span style="color:#00B050;">文字の色緑</span>

文字の網掛け

無視

囲い文字

無視

フォント

無視

フォントサイズ

無視

文字種

無視

ルビ

ruby rp rt

<ruby>紫陽花<rt>あじさい</ruby>

<ruby>漢<rp>(</rp><rt>かん</rt><rp>)</rp>字<rp>(</rp><rt>じ</rt><rp>)</rp></ruby>

囲み線

無視

5.8.2 リンクと相互参照

参考資料

HTML要素

example

リンク(外部URL)

<a href=”リンク先URL”>ラベル</a>

リボン「挿入」の「リンク」

リンク(id)

<a href=”#id値”>ラベル</a>

相互参照

<a href=”#id値”> ラベル</a>

リボン「参考資料」の図表グループの「相互参照」によるWord文書内の参照。

<span id=" id値">

idの値

<span id=”id値”></span>

ブックマーク「here」へのリンク

5.9 段落テキストの揃え

Microsoft Wordのリボン「ホーム」のスタイルギャラリーにある「標準」スタイルに設定されている段落の揃えを<head>の<style>要素に設定します。但し、「標準」スタイルに左揃えが設定されているとき、CSS ではtext-align:startはデフォルト値にあたり、揃えを指定する必要がないので設定しません。

なお、<head>の<style>は変換オプションの「-defstyle」パラメータが指定されていると出力されません(「3.2変換オプション)を参照)。

段落の揃え

要素とクラス属性

example

「標準」スタイルの揃え

左揃え

設定なし

<style><style>

中央揃え

text-align:center

<style>html{text-align:center;}

右揃え

text-align:end

<style>html{text-align:end;}</style>

両端揃え

text-align:justify

<style>html{text-align:justify;}</style>

均等割り付け

text-align:justify;

text-justify:auto;

<style>html{text-align:justify;text-justify:auto;}</style>

リボン「ホーム」の「段落グループ」で、標準以外の段落の揃えを指定すると見出しランクタグ(h1~h6)またはpタグに次のクラス属性を設定します。

段落の揃え

要素とクラス属性

example

左揃え

class="start"

<p class=”start”>…</p>

中央揃え

class="center"

<p class=”center”>…</p>

右揃え

class="end"

<p class=”end”>…</p>

両端揃え

class=” justify ”

<p>…</p>

均等割り付け

class="distribute"

<p class=”distribute”>…</p>

5.10 テキストボックス

5.11 文末脚注

本文中の文末脚注の位置を示す合印にアンカータグを設定し、アンカータグのhref属性の値に文末脚注のidが設定されます。

文末脚注のテキストは文書末尾の位置に、文書の末尾の文末脚注を除く段落と同一のレベルに出力されます。文末脚注の番号にはid=”endnote-n”(nは番号)が設定されます。

第6章 Word編集ガイドライン

6.1 コンテンツとスタイル分離原則について

6.1.1 Webページのコンテンツとレイアウト分離とは?

Webページのテキスト、画像、表、などの実質的な内容のことをコンテンツといいます。また、ブロックの配置の指定、ブロック周囲の空き、周囲を罫線で囲むかどうか、その色合い、表示するフォント、文字の大きさなどの見栄え体裁を指定することをレイアウトといいます。

Webページの制作ではコンテンツをHTMLの該当するタグでマークアップして表し、レイアウトをCSSで指定します。最新のHTMLでは、コンテンツとレイアウトを分離するのが基本原則とされています。

6.1.2 Wordはコンテンツとレイアウトが混然一体

これに対して、Wordで文書を編集するときは、テキストの書式や画像の配置などは、画面上で編集しながらテキストや画像に直接指定していく方式です。Wordは文書を印刷したときに画面上のレイアウトのとおりになる「WYSIWYG」という方式で、文書のレイアウトに対する考え方がHTMLとは根本的に異なります。

このためWordで作成した文書からWebページを作成するのは非常に困難です。Microsoft Wordには、リボン「ファイル」の「名前を付けて保存」で、保存するファイルの種類として、「Webページ」を選択すると、一見、ブラウザで表示できるWeb形式で保存できます。しかし、残念ながらWordで保存したWebページ形式は、そのままではまったく使いものになりません。

この原因は、Wordは編集時に画面で指定した印刷用の体裁や配置などのレイアウトをWebページで再現しようとするためです。

6.1.3 本製品は変換時にWordのレイアウト指定を原則無視

こうした問題を解決するために、本製品はWordで作成した文書のレイアウト指定をすべて捨ててコンテンツを純粋なHTMLのタグで表現します。

本製品を使いこなすには、まず、この基本をご理解いただく必要があります。

大前提として、WordでHTMLのタグを直接書くわけではありませんが、Word文書から変換した結果が適切なHTMLになるためには、HTMLのタグについての理解が欠かせません。そのうえで、現在編集しているWordのスタイル設定が、どのようなHTMLのタグに変換されるかを頭において、Word文書を編集する必要があります。

本章では、このような観点から、Word文書を編集する際に注意していただきたい事柄を説明します。

6.1.4 Word文書を作成するときに避けて欲しいこと

Wordの編集画面で、次のような編集操作を避けてください。

  1. 行の先頭位置を空白文字で調整すること
  2. 文章が続いている行の途中で改行すること。

例えば箇条書きの項目が2行に渡るとき、1行目の終わりに改行を入力し、2行目の先頭位置に空白を入れて行頭を整えるような編集をすると、紙への印刷やPDFにするときは問題ありませんが、HTMLにしたときは文章のつながりが崩れてしまいます。

6.2 HTMLの見出しランクタグの出力

HTMLの見出しランクタグ(h1~h6)は、見出しを表すためのタグです。Webページの制作についてSEOの観点から、見出しランク1を表すh1タグは通常文書先頭に、1回だけ全体のタイトルとしての見出しを表す、と説明していることがあります。その場合には、Wordの文書の先頭に(h1タグに変換される)「見出し1」を一回だけ使います。

但し、HTMLとしては、h1タグが文書中に何度もでてきても問題ありません。そのようなHTMLを制作する場合は、「見出し1」を何回でも指定することができます。

本製品では見出しランクタグのランクに応じて、セクションを階層化します。h1を大見出し、h2が中見出し、h3が小見出しという階層構造を表すように使うときは、Word文書には、見出し1、見出し2、見出し3の順で現れるように指定します。見出し1の下に見出し2を繰り返し、見出し2の下に見出し3を繰り返すことができます。

6.2.1 Wordの見出しスタイルを設定する

Wordで見出しを付けるときは、Wordに組み込まれている「見出しスタイル」を適用してください。Wordの「見出しスタイル」は見出し1~見出し9まで用意されています。

Word2HTMLコンバータは、見出しスタイル1にHTMLの見出しランクタグh1を対応付けます。見出しスタイル2から同6までに見出しランクタグh2からh6を設定します。

【注意】Wordのテーマによっては、見出しスタイルにアウトラインレベル(後述)が設定されていないことがあります。Word文書でこのような見出しスタイルを使ったときは、見出しスタイルを設定しても、その段落に見出しランクタグは設定されません。

段落にアウトラインレベルが設定されているかどうかは、段落の上にカーソルを重ねて(ホバー)みることで判断できます。アウトラインレベルが設定されている段落には、カーソルをホバーしたとき段落の左側にPlease enter alt text.マークが表示されます。

Please enter alt text.

6.2.2 表題を設定する

Wordの組み込みスタイルのひとつに「表題」があります。表題スタイルには「アウトラインレベル1」が設定されていることがあります。Word文書で、段落にそのような表題スタイルを適用した場合、Word2HTMLコンバータの変換結果では、当該段落にh1タグが設定されます。

6.2.3 Wordの段落アウトラインレベルを設定する

Wordには段落のアウトラインレベルという機能があり、段落を9段階の階層化設定できます。また、アウトラインレベルを設定した段落はアウトライン編集段落のアウトラインレベルは、リボンの「ホーム」タブの「段落グループ」の「段落」ダイアログで設定します。

Please enter alt text.

「段落」ダイアログは、段落グループの右下にある「」をクリックすると表示されます。

Please enter alt text.

Word2HTMLコンバータは、アウトラインレベル1からアウトラインレベル6までをHTMLの見出しランクタグh1からh6に対応つけます。つまり、Wordでアウトラインレベル1を設定した段落は、HTMLの見出しランク1(h1)となります。

6.3 箇条書きと段落番号

6.3.1 箇条書き

Wordのリボン「ホーム」にある「箇条書き」は、行頭に記号を付けた段落を作成します。

Please enter alt text.

Wordでは行頭文字ライブラリによって、行頭記号の変更ができます。

Please enter alt text.

この行頭記号の多くは、Word独自の特殊なフォントを使って表示されるためHTMLでは正しく表示されない場合があります。このためWord2HTMLコンバータは、行頭記号を削除したうえで、HTMLの順序なし箇条書きに変換します。HTMLでは行頭記号はCSSを使って設定してください。

なお、Wordで箇条書きを指定したブロックは、見かけ上はHTMLの順序なし箇条書きのように見えます。しかし、Wordの内部では、各項目が先頭に記号が付いた段落として書式化されています。Word2HTMLコンバータは、Wordの編集時に「箇条書き」を設定した箇所を分析して、HTMLの順序なし箇条書きに変換しています。段落の書式の指定方法によってはHTMLの順序なし箇条書きに変換できない場合があります。この場合は、段落の書式の変更を試してみてください。

6.3.2 段落番号

Wordのリボン「ホーム」の「段落番号」は、選択した番号形式で段落の行頭に自動番号付けする機能です。

Please enter alt text.

段落番号を指定したブロックは、見かけ上はHTMLの順序付き箇条書きのように見えます。

しかし、Wordには番号付き箇条書きというスタイルはありません。Wordの段落番号を設定した段落は、ひとつひとつの段落項目の先頭に番号のついた段落として保存されています。

Word2HTMLコンバータは、Word編集時に「番号付き段落」を設定した箇所を、HTMLの順序付き箇条書きに変換するか、それとも番号付き段落に変換するかをプログラムで判定します。判定基準は次のとおりです。

  • Word文書中で段落番号を設定した段落がふたつ続いたときに順序付き箇条書きとします。
  • Word文書中に段落番号を設定した段落が単独で現れたときは、番号をその段落行頭の通常の文字に変換します。

この判定は必ずしもうまくいかないことがあるため、期待通りにならない場合は、Word上で段落を編集してみてください。

6.4 図のレイアウト

Wordで図を配置するオプションは、行内配置と文字列の折り返しがあります。このレイアウトオプション)は、図形を選択してマウスの右クリックで表示して選択します(次の図を参照)。

Please enter alt text.

6.4.1 行内配置

行内配置では図を文字と文字の間にあたかもひとつの図形文字のように配置し、前後の文字と一緒に位置が移動します。行内配置の図はこのように(Please enter alt text.)HTMLでは文字の間に配置されます。

HTMLに変換した結果、imgタグにclass=”inline”の属性が設定されます。

6.4.2 文字列の折り返し

文字列の折り返しを指定した図は、Wordの編集画面で図を選択するとアンカーマーク表示されます。

A. 見出しや段落にアンカーマークがついた図は、見出しや段落の終了タグ直後に出力され、また、imgタグにclass=”block”の属性が設定されます。

次の例では、図のアンカーマークが見出しの先頭についています。

Please enter alt text.

これをHTMLに変換すると次のように、見出しランクの終了タグと次の段落の開始タグの間に、imgタグを出力します。

Please enter alt text.

次の例では、図のアンカーマークが段落の先頭についています。

Please enter alt text.

これをHTMLに変換すると次のように、段落の終了タグの直後に、imgタグを出力します。

Please enter alt text.

この例ではWordの画面上では段落のテキストが図の後ろにあるにも関わらず、HTMLに変換すると段落の後ろにimgタグが出力されます。Wordは紙の上に画像を配置するため、画像が1ページにうまく入りきらないとき、画像が次のページに配置されることがあります。このようなときもHTMLファイルに変換したときには、アンカーマークが付いた段落の後ろにimgタグが置かれます。

B. 箇条書きの項目にアンカーマークのついた図は、箇条書き項目の終了タグの直前にimgタグが出力されます。

次の例では、図のアンカーマークが箇条書きの最初の項目の先頭についています。

Please enter alt text.

これをHTMLに変換すると次のように、最初の箇条書き項目の終了タグの直前に、imgタグを出力します。(箇条書きの項目の終了タグの後ろと次の箇条書きの項目の開始タグの間にimgタグを出すとHTMLの文法エラーになるためです。)

Please enter alt text.

6.5 Wordの空行と空き

「HTML on Word」のデフォルト変換ではWord文書の中の空行(行頭の改行のみの行)、改頁は無視します。また、Wordは紙への印刷を想定しているため、図や表がページ中に入りきらないと、次のページに送られて、大きな空きができます。HTMLに変換するときこうした空きは無視されます。

Wordの編集画面上でのレイアウト上できる、空きや空行については気にしないで編集してください。

6.6 図形・画像のグループ化

Word上では、紙の上に図形や画像を配置していくことができます。もし、これらの図形や画像をHTMLの中でひとつにまとめたいときは、Word上でグループ化してください。

複数の図を編集中のWord文書の画面上で同じ位置に配置しただけでは、HTMLに変換したときに図がバラバラになってしまいます。

6.7 参照リンクの設定方法

Wordで参照リンクを設定する方法には、リボン「挿入」の「リンク」と「相互参照」があります。

6.7.1 リンク

Wordのリボン「挿入」タブの「リンク」では外部のURLやWord内部へのリンクを設定できます。

Please enter alt text.

6.7.2 相互参照

Wordのリボン「挿入」タブの「相互参照」ではWord内部で見出し、図、表、番号付き段落へのリンクを設定できます。

Please enter alt text.

6.7.3 リンクの参照先

リンクの参照先は外部URLや文書内部のブックマークです。ブックマークはWordのリボン「挿入」タブのブックマークで追加、削除などの編集ができます。次にブックマークの例を示します。

Please enter alt text.

上のダイアログには4つのブックマークが表示されており、ブックマークの種類は次のようになっています。

  1. Wordで自動生成の目次を作成した目次の項目は「_Toc」から始まるブックマーク
  2. 相互参照の参照先に「_Ref」から始まるブックマーク
  3. 文書内部リンクの参照先に「_見出し2」
  4. ブックマークダイアログで追加したブックマーク「bookmark」

HTMLに変換するとブックマークは<span id=”ブックマーク名”></span>に変換されます。

【例】ここにhereという名前のブックマークが設定されています。

6.8

Wordの表機能で作成した表をHTMLの表タグに変換します。

表をHTMLに変換する際は、表のセル結合は変換しますが、しかし、表の幅、罫線の太さなどの設定、背景、表の中の文字の揃え指定などはすべて無視します。

これらの指定は、出力したHTMLに対してCSSで指定してください。

6.9 文字の修飾・フォントの扱い

Wordのリボン「ホーム」のフォントグループで設定できる機能のうち、太字、上付き、下付きについては、それぞれ<strong>、<sup>、<sub>というHTMLのタグに変換されます。

それ以外の、イタリック、アンダーライン、消し線、文字の色、フォント名、文字の大きさは変換時に無視します。

奥付け

「HTML on Word」 ユーザーズ・マニュアル

バージョン:1.2.2

発行日:2022年10月12日

発行元:東京都中央区東日本橋2丁目1番6号 アンテナハウス株式会社

Copyright ©2021-2022 Antenna House, Inc.

本マニュアルは、Microsoft Word 2019で編集、『HTML on Word』でHTMLに変換しました。

目次へ