「HTML on Word」は、Microsoft Word(以下、Word)で編集・保存したdocx形式のファイルをシンプルで編集しやすいHTMLに変換するツールです。使い慣れたWordで作成した文書から簡単にWebページを作ることができます。
Wordには文書校閲機能、見出しスタイルなどのスタイル設定、自動アウトライン番号設定、高度な作図機能、表作成機能、ハイパーリンクの簡単作成など文書を編集する上で便利で強力な編集機能が備わっています。そこで、Wordを使えば品質が高い文書を高い生産性で作成できます。「HTML on Word」を使えばWordで作成した文書を簡単にHTMLに変換できるので、優れた内容のWebページを効率的に作れるようになります。
本マニュアルは「HTML on Word」の機能について説明するとともに、WordをHTML作成ツールとして、上手に活用する方法について説明しています。
本マニュアルの構成は次のとおりです。
「第1章 製品の概要」では本製品の機能概要、動作環境、制限事項、ユーザーサポートなど、本製品を利用する前に理解していただきたいことについて説明します。
「第2章 インストールとライセンスの設定」では、製品のインストール・アンインストール、ライセンスについて説明します。
「第3章 コマンドライン版の機能と利用方法」ではWord文書からHTMLに変換するコマンドライン版の使用方法を説明します。
「第4章 アドインの利用方法」ではWordのリボンに組み込むアドインの使い方を説明します。
「第5章 変換仕様」では、Wordで設定したスタイルをHTMLのタグに変換する仕様を説明します。
「第6章 Word編集ガイドライン」では、Webページを上手に作成するためにWordの編集機能をどのように使うと良いかについてのガイドラインを提供します。
本マニュアルではHTMLの要素について次のような表記をしています。
本製品の機能・操作についての質問は、電子メールで次までお問い合わせください。
目次
本製品は①docxファイルからHTMLファイルに変換処理を行うコマンドライン版プログラム(Word2HTML)と、②Word のリボンに組み込まれるアドインから構成されます。
コマンドライン版の変換対象ファイル形式はMicrosoft Word(以下、Word)で編集して保存したdocx形式ファイルです。Wordの旧文書形式(拡張子doc)文書を変換することはできません。
Word2HTMLはdocx形式ファイルを読み込んでHTML形式に変換するコンバータ(変換エンジン)です。変換エンジンは、アンテナハウスの製品である「Office Server Document Converter」の技術を使って、独自に開発したものです。Wordの「名前を付けて保存」の機能は使用していません。変換エンジンはWindowsのコマンドライン版プログラムとして動作します。
コマンドライン版はWindowsのDOS窓から直接操作できます。Wordで編集中の文書を、アドインのメニューからHTMLに変換するときは、アドインがコマンドライン版を起動します。
コマンドラインの変換動作を変換オプションのパラメータで指定できます。詳細は、「第3章コマンドライン版の機能と利用方法」を参照してください。アドインからもオプション・パラメータの一部を設定できます。
【注意】コマンドライン版のライセンスはローカルPCで使用するためのものです。サーバーとして使用するPC上にインストールして、そのサーバーに接続したクライアントPCからネットワークを通じて本製品を使用することは許諾しておりません。サーバー上にインストールして使用することをご希望の場合は、弊社営業グループ(sis@antenna.co.jp)までお問い合わせください。 【注意】コマンドライン版はMicrosoftのOneDrive上のフォルダーとファイルには対応していません。
|
アドインは、①変換オプションを設定する機能と、②Wordで編集中の文書の内容をHTMLファイルに変換する機能、③変換結果のHTMLファイルを関連付けられたアプリケーションで表示する機能を、Wordのリボンのメニューとして追加します。
上記②の変換処理自体は、アドインのプログラムがWord2HTMLを起動して行います。docxファイルをHTMLファイルに変換した後、ブラウザなどのアプリを起動してHTMLファイルを表示します。
詳細は、「第4章 アドインの利用方法」を参照してください。
なお、アドインのメニューは日本語と英語を内蔵しています。Wordの言語が日本語のとき、アドインのメニューも日本語になります。Wordの言語が英語のとき、アドインのメニューも英語になります。
V1.2とそれ以前のバージョンを同一環境にインストールできません。旧バージョン(V1.1以前)をインストールしている場合、旧バージョンをアンインストールしてからV1.2をインストールしてください。アンインストールについては2.3を参照してください。 |
本製品をお手元のPCにダウンロードすると、ダウンロード先フォルダーにZIP形式アーカイブファイル(xhw122_setup.zip)が保存されます。
ZIPファイルからインストールするには、次の1~10の順序で操作してください。
1. ZIP形式アーカイブファイルを解凍すると、解凍先フォルダーに本製品のインストーラファイル(xhw122_setup.exe)ができます。
2. xhw122_setup.exeファイルをマウスで選択し、ダブルクリックすると、Windowsによって「このアプリがデバイスに変更を加えることを許可しますか?」という確認ダイアログが表示されますので、「はい」を選択してクリックします。
3. インストールプログラムが起動し、インストール準備が始まります。
4. インストール準備が完了すると、インストール開始を確認するダイアログが表示されます。
5. 次のダイアログでは本製品の使用許諾契約書が表示されるので、内容をご確認の上、同意される場合は「はい」を選択してクリックします。
6. 次のダイアログで本製品をインストールするフォルダーを選択します。デフォルトのインストール先は次のフォルダーになります。
C:\Program Files\Antenna House\xhw12\
デフォルトのままでよければ、「次へ」ボタンをクリックします。
インストール先フォルダーを変更するときは、右の「参照」ボタンをクリックすると表示されるフォルダー選択ダイアログから、インストール先フォルダーを選択してください。
7. 次はインストール完了時のオプションを選択するダイアログです。次のふたつのオプションがあります。オプションについての説明は2.1.1インストールオプションを参照してください。
□アドイン登録/解除アイコンをデスクトップに登録する
□インストール完了後にReadMeファイルを読む
8. 「次へ」をクリックすると、インストール開始するかどうかの最終確認ダイアログが表示されるので、「インストール」をクリックするとインストールを開始します。
9. インストール処理が実行されます。
10. インストールが完了すると、次のダイアログが表示されます。「完了」をクリックすると、インストール完了時のオプションが実行されます。
1. アドイン登録/解除アイコンをデスクトップへ設定する
本オプション・チェックボックスにチェックすると、Microsoft Wordのリボンにアドインを登録するプログラムと、そのアドイン登録を解除するプログラムのふたつのアイコンがデスクトップに配置されます。
アドインの登録と登録解除については、「第4章アドインの利用方法」を参照してください。
2. インストール完了後に、ReadMeファイルを読む
本オプションのチェックボックスにチェックすると、インストールが完了したとき、インストーラに同梱されているReadMe.txtファイルをメモ帳で画面に表示します。
「HTML on Word」のライセンスは30日間評価版と正式ライセンスの2種類があります。2種類のライセンスで変換に係る機能の差はありません。ライセンスの種類はライセンス・ファイルによって切り替えます。
評価版は本製品のWebページから入手できます。
評価版のインストールが完了すると、インストール先のフォルダーに、30日間評価版のライセンス・データを内容とするライセンス・ファイルが設定されます。
評価版は機能制限がなく、正式版と同じ機能を使えます。但し、評価版の使用期間は30日間に限定されており、インストールしてから30日を過ぎるとコマンドライン版を起動することができなくなります。継続してお使いいただくには、アンテナハウスのオンラインショップで正式版をお求めいただく必要があります。
アンテナハウスのオンラインショップ
本製品を購入された場合、正式ライセンスデータ(ライセンス・ファイル)とライセンス証書が提供されます。ライセンス・ファイル名は「xhwlic.dat」です。
正式ライセンスに切り替えるには、ライセンス・ファイルをコマンドライン版プログラム(Word2HTML.exe)と同じフォルダーにコピーしてください。
コマンドライン版プログラムのインストール先フォルダーのデフォルトは、次のとおりです。
C:\Program Files\Antenna House\xhw12
このフォルダーへの書き込みには管理者権限が必要なため正式ライセンス・ファイルをコピーしようとすると次の警告ダイアログが表示されます。
管理者権限をもっていない場合は、管理者にコピーを依頼してください。
本製品のアンインストールは次のステップで行います。
1. アドインの登録解除
Wordにアドインを登録しているときは、最初にアドインを登録解除します。アドインの登録解除については、「4.1.2アドインの登録解除」を参照してください。
アドインを解除しないでコマンドライン版のアンインストールをすると、アドインを解除するプログラムも削除されてしまい、Wordのリボンからアドインを解除できなくなるので注意してください。
2. コマンドライン版のアンインストール
コマンドライン版のアンインストールはWindowsの「設定」の「アプリと機能」画面から行います。
「アプリと機能」には、Windowsにインストールされているアプリケーションのリストが表示されます。「HTML on Word V1.2」を探して、クリックすると図のように「アンインストール」ボタンが有効になっています。
「アンインストール」をクリックすると、インストーラが起動して、アンインストール処理を行います。
コマンドライン版は、Windowsのコマンドプロンプトから使用するプログラムです。入力したdocxファイルをHTMLファイルに変換する機能を提供します。
WindowsのDOS窓でコマンドライン版を起動すると次のメッセージを表示します。
(1) シリアル番号と保守期限
XHW12から始まる英数字がシリアル番号です。シリアル番号に続くメッセージの意味は次のとおりです。
Maintenance Deadline: |
正式版のとき |
保守期限 |
Trial Deadline: |
試用版・評価版のとき |
試用期限 |
(2) 利用方法
usage: Word2HTMLに続く表示は、コマンドラインの変換オプションです。
コマンドライン実行時は、Word2HTMLに続けて、入力ファイル名(必須)、出力ファイル名(必須)および変換オプションを指定します。
変換オプションのパラメータは次の表のとおりです。入力ファイルと出力ファイルの指定は必須ですが、それ以外のパラメータは必要な時だけ指定します。パラメータを指定しないときはデフォルト動作となります。
パラメータ |
説明 |
<input-file> |
(必須)入力ファイル名を指定します。 |
<output-file> |
(必須)出力ファイル名を指定します。 |
-clrsettings |
本パラメータを指定するとデフォルト設定ファイルなどで指定済のオプション設定をクリアします。 |
-settings <settings-file> |
<settings-file>にて指定した変換オプション設定ファイルを読み込みます。 |
-xhtml |
デフォルトではHTML文法のタグを出力します。-xhtmlを指定するとXML文法のタグを出力します。 |
-viewport <content> |
<head>に次の形式のメタタグを出力します。 <meta name=”viewport” content=”contentに指定した内容”> |
-endl |
ブロックタグの終わりに改行を出力します。 |
-emptyP |
デフォルトではWordの空の行(改行のみの行)をHTML出力時に無視します。本オプションを指定すると空行の数だけ空の<p></p>タグを出力します。 |
-nonrefiid |
Wordでは編集を重ねると文書ファイル内に参照されていないIDがdocxファイル内に沢山できてしまいます。本コンバータはデフォルトでは文書ファイル内をスキャンして、内部的に参照されていないID をHTML出力時に削除します。本オプションを指定すると参照されていないIDを削除しません。 |
-imgwidth |
イメージの幅を出力します。 |
-hstrong |
見出しスタイルで指定された強調を無視します。 |
-embedimg |
画像をデータURLで本体HTMLに埋め込みます。 |
-(x|o)math |
Wordの数式エディタで編集した数式の出力形式を指定します。次の4とおりの出力形式を指定できます。 未指定 数式を<img>タグにsvg形式ファイルで出力 |
-throughimg |
Wordに挿入した元の画像形式のまま出力します。 |
-pstyle |
段落のスタイル名をclass属性の値に設定して出力します。 |
-citation |
Citationフィールドのtagの値を<a>タグのhref属性の値に設定して出力します。 |
-textcolor |
文字に指定されている色を<span style="color:カラー値”>として出力します。 |
-italic n|t|s |
文字に斜体が指定されているときの出力方法を指定します。 -italic n 出力しない(デフォルト) -italic t <i>タグとして出力 -italic s <span style="font-style:italic>として出力 |
-underline n|t|s |
文字に下線が指定されているときの出力方法を指定します。 -underline n 出力しない(デフォルト) -underline t <u>タグとして出力 -underline s style="text-decoration-line:underline;">として出力 |
-linethrough n|t|s |
文字に取り消し線が指定されているときの出力方法を指定します。 -linethrough n 出力しない(デフォルト) -linethrough t <del>タグとして出力 -linethrough s <span style="text-decoration-line: line-through;">として出力 |
-encoding <encoding> |
HTMLファイルの文字コード(符号化方式)として、UnicodeのUTF-8 以外を指定したいとき本パラメータで符号化方式を指定します。 -encoding Shift_JIS シフトJISで出力(注1参照) -encoding UTF-16 UnicodeのUTF-16符号化 注1 シフトJISに定義されている文字の種類はUnicodeより少ないため、シフトJISで扱えないUnicodeの文字は&#x文字番号;(文字番号は16進数)で出力されます。なお、JIS X0208にマイクロソフトが追加した旧機種依存文字(①、②など)はシフトJISの文字として扱います。 |
-defstyle |
本オプションを指定すると<head>の<style>要素(デフォルトCSSスタイルを指定する要素)を出力しません。 |
-spaceindent |
本オプションを指定すると段落先頭に1文字以上の字下げが指定されているとき、字下げを1文字の全角空白に変換します。 |
-outputbr |
段落を<p>タグで囲む代わりに、段落の終わりに<br>タグを出力します。-xhtmlパラメータ指定時は無効です。 |
-fileimages |
画像ファイルを格納するフォルダー名を、“変換先ファイル名.images”とします。詳細は、5.5.1をご参照ください。 |
-css cssfile [media] |
CSSファイルをリンクします。CSSファイルはWindows上のフォルダーに置き、そのパスを指定します。指定したCSSファイルが存在しないとエラーになります。オプションでmediaを指定できます。 <head>に次の形式のlinkタグを出力します。 <link href=”xxx.css” rel=”stylesheet” type=”text/css” media=”print”>指定したCSSファイルはHTML出力先フォルダーにコピーされます。 -cssとCSSファイルの組を複数指定できます。 |
-js javascript-path |
<head>にscript タグを置き、そのsrc属性にJavaScriptファイルのパス(URL)を指定します。指定したJavaScriptのパスが存在しなくてもエラーになりません。 |
-savesettings <settings-file> |
コマンドライン実行時変換オプション・パラメータの指定値を<settings-file>にて指定したファイル名で保存します。設定ファイルの詳細は3.4.2を参照してください。 |
-savedefault |
コマンドライン実行時の変換オプション・パラメータの指定値をデフォルト設定ファイル(def-settings.xml)に出力します。デフォルト設定ファイルの詳細は3.4.1を参照してください。 |
次はコマンドラインで、変換元ファイル名:NewsRelease.docx、変換先ファイル名:NewsRelease.htmlとし、CSSファイル:sample.news.css を指定した例です。
変換が正常に実行されると次のメッセージが表示されて、HTMLファイルが作成されます。
変換オプションをあらかじめ設定ファイルに保存しておけば、コマンドラインで変換オプションを指定する代わりに設定ファイルで指定できます。設定ファイルには次の2種類があります。
デフォルト設定ファイルを使うとデフォルト動作を切り替えることができます。デフォルト設定ファイルのファイル名は、「def-settings.xml」で、ファイルの保存場所は次の2か所のどちらかです。
デフォルト設定ファイルをEXEファイルと同じフォルダーに置いた場合、全ユーザー共通のデフォルト値となります。
デフォルト設定ファイルをRoamingフォルダーに置くと、ユーザー毎に異なるデフォルト設定ファイルとなります。Roamingフォルダーのデフォルト設定ファイルのパスは、通常、次のとおりです。
C:\Users\USER\AppData\Roaming\AntennaHouse\xhw\1.2\def-settings.xml
デフォルト設定ファイル上記2か所の両方にあるときは、Roamingフォルダーにあるデフォルト設定ファイルの内容が優先されます。
デフォルト設定ファイルに、ON/OFFタイプの変換オプションの設定があるとき、同じ変換オプションを、アドインまたはコマンドラインのパラメータで指定すると、ON/OFFが反転するので注意してください。
変換オプションの「-savedefault」パラメータを指定すると、Roamingフォルダーにデフォルト設定ファイル(def-settings.xml)を作成できます。デフォルト設定ファイルはXML形式なのでテキスト・エディタで編集できます。
例えば、コマンドラインで次のように指定すると、①ブロックタグの終わりに改行を出力する(-endl)、②下線を<u>タグとして出力する(-underline t)が設定されたデフォルト設定ファイルが作成されます。
また、次のように指定すると、デフォルト設定ファイルの設定値をすべてクリアして、本プログラム自体のデフォルト設定に戻したデフォルト設定ファイルが作成されます。
次は変換オプション・パラメータとして「-clrsettings -savedefault」を指定して作成されるデフォルト設定ファイルです。デフォルト値のないパラメータは設定されません。
<?xml version="1.0"?>
<word-to-html-settings>
<enable-XHTML enable="false"/>
<viewport content=""/>
<enable-endl enable="false"/>
<enable-empty-paragraph enable="false"/>
<enable-non-reference-id enable="false"/>
<enable-image-width enable="false"/>
<enable-heading-strong enable="true"/>
<enable-embed-image enable="false"/>
<enable-mathml enable="false"/>
<xml-mathml enable="false"/>
<xml-omath enable="false"/>
<through-image enable="false"/>
<enable-pstyle enable="false"/>
<enable-citation enable="false"/>
<text-color enable="false"/>
<output-br enable="false"/>
<style-tag enable="true"/>
<space-indent enable="false"/>
<fil-images enable="false"/>
<italic out="n"/>
<underline out="n"/>
<linethrough out="n"/>
</word-to-html-settings>
変換オプション設定ファイルは、変換オプションのパラメータ値を保存するファイルです。
コマンドライン実行時に、変換オプション設定ファイル名を指定して読み込みます。
同じ設定による変換を繰り返すとき、変換オプションを設定ファイルに保存しておくと、次回から同一のオプションを指定する代わりに設定ファイルの指定で済みます。
変換オプション設定ファイルのファイル名は任意です。
変換オプション設定ファイルはコマンドライン実行時に、変換オプションの「-savesettings」で指定したファイルとして作成できます。
変換オプション設定ファイルはXML形式なので、パラメータ設定値をテキスト・エディタで修正できます。
設定ファイルはルート要素が「word-to-html-settings」で、変換オプションに設定する項目を子供の要素型名とするXMLファイルです。デフォルト設定ファイルと変換オプション設定ファイルの形式は同じです。各要素型名と変換オプションのパラメータの対応関係は次の表のとおりです。
要素型名 |
属性 |
プログラムのデフォルト値 |
対応する変換オプション・パラメータ |
word-to-html-settings |
|||
enable-XHTML |
enable |
false |
-xhtml |
viewport |
content |
-viewport |
|
enable-endl |
enable |
false |
-endl |
enable-empty-paragraph |
enable |
false |
-emptyP |
enable-non-reference-id |
enable |
false |
-nonrefiid |
enable-image-width |
enable |
false |
-imgwidth |
enable-heading-strong |
enable |
true |
-hstrong |
enable-embed-image |
enable |
false |
-embedimg |
enable-mathml |
enable |
false |
-math |
xml-mathml |
enable |
false |
-xmath |
xml-omath |
enable |
false |
-omath |
through-image |
enable |
false |
-throughimg |
enable-pstyle |
enable |
false |
-pstyle |
enable-citation |
enable |
false |
-citation |
text-color |
enable |
false |
-textcolor |
output-br |
enable |
false |
-outputbr |
style-tag |
enable |
true |
-defstyle |
space-indent |
enable |
false |
-spaceindent |
fil-images |
enable |
false |
-fileimages |
italic |
out |
n |
-italic n|t|s |
underline |
out |
n |
-underline n|t|s |
linethrough |
out |
n |
-linethrough n|t|s |
encoding |
encoding |
なし |
-encoding |
link-css |
src |
なし |
-css css-file |
link-js |
src |
なし |
-js javascript-path |
アドインのメニューで指定できる変換オプション・パラメータは、次のふたつのみです。
「指定したCSSを用いる」チェックボックスにチェックするのは、コマンドライン版の変換オプション「-css」パラメータ指定に該当します。コマンドライン版では「-css」とファイル名の組を複数指定できますが、アドインで指定できるのはひとつだけです。
「ブロックタグで改行する」チェックボックスにチェックすることは、変換オプションの「-endl」パラメータの指定にあたります。
アドインでは他の変換オプションを指定できないので、必要に応じてデフォルト設定ファイル(3.4.1を参照)を使って指定してください。
コマンドライン版のエラーメッセージは次のとおりです。
エラーメッセージ |
考えられる原因 |
“Word2HTML”は、内部コマンドまたは外部コマンド、操作可能なプログラムまたはバッチファイルとして認識されていません。 |
① コマンドライン版が正常にインストールされていない。 (対策)インストールし直す。 ② コマンドライン版をインストールしたフォルダーへのパスが設定されていない。 (対策)Windowsの設定で、環境変数にpathにフォルダーへのパスを設定する。 |
“Cannnot Open File” 変換先ファイルパス |
① 変換先ファイルが開けない。 (対策)変換先ファイルがエディタなどで開らかれ、編集がロックされた状態となっていることが考えられます。そのときは編集終了してください。 (対策)リンク指定したCSSファイルが存在しないことも考えられます。 |
“Input file not found |
① 入力ファイルが見つからない。 |
アドインを登録するには、Wordを終了した状態で、デスクトップの「HTML on Word」アドイン登録アイコンをクリックします。
インストールの際、デスクトップにアドイン登録アイコンを作成しなかった場合は、次のようにします。
アドイン登録を解除するには、Wordを終了した状態で、デスクトップの「HTML on Word」アドイン登録解除アイコンをクリックします。
インストールの際、デスクトップにアドイン登録解除アイコンを作成しなかった場合は、次のようにします。
アドインが登録されているとき、Wordのリボンに「アンテナハウス」タブができます。このタブの「HTML on Word」グループに次のボタンとチェックボックスがあります。
Wordで編集中の文書をこのボタンとチェックボックスを使ってHTMLファイルに変換し、変換結果をブラウザやテキスト・エディタで確認できます。
Windowsの設定「時刻と言語」の「言語」タブで「優先する言語」が「日本語」のとき、図のように、Wordのタブ名やメニューは日本語になります。このときアドインのタブ名は「アンテナハウス」で、コマンド名やツールチップのメッセージは日本語となります。
Windowsの設定「時刻と言語」の「言語」タブで「優先する言語」を「英語」に変更すると、Wordのタブ名やメニューが英語になります。このとき、アドインのタブ名はAntenna Houseとなり、コマンド名やツールチップのメッセージも英語となります。
「HTMLへ変換」のボタンは、上部が「HTMLへ変換」コマンド、下部が「変換オプション」のふたつのコマンドに分かれています。
「HTML変換」ボタンの上部をクリックすると「HTMLへ変換」コマンドを起動します。「HTMLへ変換」の動作は次の順となります。
「HTMLへ変換」が終了すると、Windowsで拡張子htmlに対応付けられているアプリケーションでHTMLファイルを表示します。
「HTMLへ変換」を最初に実行時するとき、Windowsで拡張子htmlに対応付けられているアプリケーションの中から、ファイルを表示するアプリケーション(ブラウザまたはエディタ)を選択するダイアログが表示されることがあります。
但し、Windowsの動作環境によっては、アプリケーション選択ダイアログが表示されないときもあります。このダイアログを表示しているのはMicrosoft Windowsであり、アドインでは表示・非表示の制御は行っていません。
Windowsで拡張子htmlに対応付けられているアプリケーションを変更するには、次のようにします。
3. プロパティのダイアログからプログラムの項の「変更」ボタンをクリックします。
「HTMLへ変換」ボタンの下部をクリックすると「変換先フォルダーを変更」コマンドが表示されます。
変換結果を表示するフォルダーを選択して、「OK」を押します。
次回から、選択したフォルダーに変換結果が保存されます。
HTMLファイルはCSSでレイアウトを変更できます。変換出力されるHTMLファイルに、このオプションで指定したCSSファイルへのリンクを設定します。
「指定したCSSを用いる」チェックボックスにチェックすると、CSSファイルを選択するダイアログが開くので、リンクしたいCSSファイルを選択してください。
本製品にはサンプルのCSSファイルが同梱されています。サンプルCSSファイルは、本製品をインストールしたフォルダーのCSSフォルダーにコピーされています。本製品に同梱されているCSSファイルのほか、ご自分で用意したCSSファイルをリンクできます。
リンク設定したCSSファイルは、変換先HTMLファイルと同じフォルダーにコピーされます。
「ブロックタグで改行する」チェックボックスをオンにすると、各ブロック終了タグの後ろに改行を出力します。変換したHTMLファイルをブラウザで表示するときは差がでませんが、HTMLファイルをテキスト・エディタで表示してタグを確認したり、編集したりするときに便利です。
ブロックタグで改行しないHTMLファイル(デフォルト)と、ブロックタグで改行するにチェックして出力したHTMLファイルを、テキスト・エディタで読み込んで表示を比較すると次の図のようになります。
「ヘルプ」ボタンをクリックすると、Webヘルプを表示します。ヘルプは、アンテナハウスのホームページにあります。URLは次のとおりです。
アドインの「HTMLへ変換」では、コマンドライン版(Word2HTML)を起動します。
変換時にエラーが発生したとき、ダイアログにコマンドライン版が出力したエラーメッセージが表示されます。
例えば、次のエラーメッセージは、WindowsからWord2HTMLプログラムが見つからないというメッセージです。原因はコマンドライン版が正常にインストールされていないか、または、コマンドライン版をインストールしたフォルダーへのパスが設定されていないことが考えられます。
コマンドライン版のエラーメッセージについては、3.6エラーメッセージを参照してください。
コマンドライン版でWordからHTMLに変換するときの変換仕様を説明します。
変換元の対象文書ファイル形式はdocxファイルのみです。古いMicrosoft Wordで保存したdoc形式ファイルは変換処理の対象になりません。
デフォルトではHTML仕様に準拠するタグを出力します。
変換オプションで 「-xhtml」パラメータを指定するとXHTML1.0準拠のタグを出力します。
なお、以下の変換仕様のタグ見本はHTML仕様準拠の状態で説明しています。
変換元 |
変換先(HTMLタグ) |
備考 |
ルート |
<!DOCTYPE html> <html lang=""> |
日本語版:lang=”ja” 英語版:lang=”en” 言語判定は注1 |
文字符号化方式 |
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> |
UTF-8が基本です。それ以外にShift_JIS、UTF-16を変換オプション・パラメータで指定できます。 |
情報:タイトル |
<head> <title>~</title> </head> |
Word「情報」タブのプロパティ「タイトル」の内容から取得します。 |
メタ情報 |
<head> <meta name="author" content=""> <meta name="description" content=""> <meta name="keywords" content=""> |
Word「情報」タブのプロパティの項目をname属性の値に、設定内容をcontent属性の値に変換します。name属性値とcontent属性値の対応関係は次のとおりです。 author:作成者 |
CSSのリンク |
<link href="xxx.css" rel="stylesheet" type="text/css" media="print"> |
xxx.cssは指定したCSSファイル名。media属性はオプションです。 |
デフォルトスタイル |
<head> <style>CSSスタイル</style> </head> |
HTML全体に適用するデフォルトのCSSを設定します。設定する内容は次のふたつです。 ①段落テキストの揃え(5.9を参照) ②tableのborder属性 但し、外部CSSをリンクするときは出力しません。 |
JavaScriptの指定 |
<head> <script src=”xx/yy.js”></script> </head> |
xx/yy.js はJavaScriptのパス |
注1 言語判定
Wordの文書中の全角幅の文字の割合とデフォルトスタイルの言語設定から推定しています。推定が正しくない場合があります。
変換元 |
変換先(HTMLタグ) |
備考 |
|
本文 |
<body>~</body> |
||
表題スタイル |
表題スタイルにアウトラインレベル1が設定されているとき |
<h1>~</h1> |
Wordのスタイルギャラリーに登録されている表題スタイルには、アウトラインレベル1が設定されているものと設定されていないものがある。 |
表題スタイルにアウトラインレベルが設定されていないとき |
<p>~</p> |
||
段落 |
<p>内容</p> |
デフォルトでは改行のみの行は無視する。 -emptyPオプションを指定すると、改行のみの行を空の<p></p>で出力する。 |
|
強制改行 |
<br > |
||
強制改頁、改段 |
無視 |
||
セクション |
<h>開始タグが先頭またはその前によりランクの小さい<h>タグのみのとき、<h>開始タグの前に<section>開始タグを出力する。前方に よりランクの大きい<h>があるとき</section>を出す。 |
<h> の前の<section>タグでツリー構造を作る。 |
変換元 |
変換先(HTMLタグ) |
備考 |
見出し1~見出し6(見出しスタイル) |
<h1>~<h6> |
見出しスタイルのアウトラインレベルを見出しランクタグに設定する。 |
見出し7~見出し9(見出しスタイル) |
<p class=”l7”>~ <p class=”l9”> |
見出しスタイルのアウトラインレベル7、8は段落のクラス属性として設定する。 |
段落のアウトラインレベル1~6 |
<h1>~<h6> |
段落のアウトラインレベルを見出しランクタグに設定する。 |
段落のアウトラインレベル7~9 |
<p class=”l7”>~ <class=”l9”> |
段落のアウトラインレベル7、8は段落のクラス属性として設定する。 |
見出しスタイルを指定した段落にアウトライン番号が付加されているとき、アウトライン番号を、class属性の値numberを指定した<span>タグで囲み、<h>タグの内容文字列として変換します。アウトライン番号と見出しのテキストの間に空きがあるときは空きを半角空白として出力、またはタブがあるときは、タブを削除して代わりに半角空白が1文字入ります。
Wordの箇条書きを指定した段落は、HTMLの箇条書き(番号なしリスト)(<ul>/<li>)に変換します。このときWord段落の行頭記号は削除されます。
Wordの段落番号機能を使用して、段落先頭に番号を付与した段落(番号付きの段落)は次のように変換します。
デフォルトでは段落スタイル名は出力しません。
変換オプションで「-pstyle」パラメータを指定すると、Wordの段落に段落スタイルが指定されているとき、段落スタイルの名前を<p>タグまたは<h>タグのclass属性の値として出力します。段落スタイル機能を使わずに段落書式を指定しているときにはclass属性の値は設定されません。
デフォルトではイメージ画像はPNGまたはJPEG形式に変換し、オートシェイプやWordで挿入した線画図形、EMF、WMF形式の図形ファイルはSVG形式に変換して出力します。
変換オプションで「-throughimg」パラメータを指定するとGIF、EMF、WMF形式でWordに挿入された画像・図形はファイル形式を変換しないで、元の形式のまま図の出力フォルダーに保存します。
Wordの図の配置で指定したレイアウトオプションの種類を<img>のclass属性として保存します。
変換元 |
オプション |
クラス属性 |
行内 |
class="inline" |
|
文字列の折り返し |
文字列の折り返し共通 |
class="block" |
四角形 |
class="block square" |
|
狭く |
class="block tight" |
|
内部 |
class="block through" |
|
上下 |
class="block top-bottom" |
|
背面 |
class="block behind" |
|
全面 |
class="block front" |
【注意】
CSSでは図の配置がインラインかブロックかをdiplayプロパティで指定します。displayプロパティのデフォルト値はinlineなので、Wordで図の配置に文字列の折り返しを設定してもブラウザでは行内配置として表示される場合があります。このような場合には、CSSで次のように指定してください。
img.block {
display: block
}
文字列の折り返しを指定した図のためのimgタグを出力する位置は、見出し、段落ではアンカーを設定したブロックの終了タグの後ろです。しかし、箇条書きの項目では終了タグの直前になります。詳細は、6.4図のレイアウトの項を参照してください。
Wordの数式エディタで編集した数式は、デフォルトでは<img>タグを使ってSVG形式ファイルとして出力します。
変換オプションのパラメータによって、MathML形式の外部ファイルに変換、MathML形式のマークアップに変換、WordのOffice Open XMLの独自数式表現であるOffice Mathマークアップとして出力できます。
パラメータ |
出力形式 |
未指定 |
数式を<img>タグにsvg形式ファイルで出力 |
-math |
数式を<img>タグにMathML形式ファイルで出力 |
-xmath |
数式をmathML形式マークアップで出力 |
-omath |
数式をWord独自のOffice Math形式で出力 |
変換元 |
HTML要素 |
example |
|
表 |
<table> <tbody> <tr> <td> |
||
結合 |
セル結合 |
<td colspan="n"> |
nは横結合セルの数 |
行結合 |
<td rowspan="n"> |
nは縦結合セルの数 |
表の見出しタグ(テーブルヘッダ:thead)を出力するには、表の先頭行に次のどちらかを設定します。
変換元 |
HTML要素 |
説明 |
リボンの表ツール:レイアウト |
<thead><tr><td>…</td></tr></thead> |
表の先頭行が<thead>で囲まれます。 「タイトル行の繰り返し」をオンにすると、表がページを跨ったときに、各ページにタイトル行が繰り返し表示されます。これを避けたいときには、「タイトル行の繰り返し」をオフにして、テーブルデザインの表スタイルのオプションで「タイトル行」にチェックします。 |
リボンの表ツール:テーブルデザインの表スタイルのオプション |
表の先頭列を選択して、Wordのリボン「表ツール:テーブルデザイン」の「表スタイルのオプション」で「最初の列」のみにチェックすると先頭列のセルを見出しセルに設定します。
変換元 |
HTML要素 |
説明 |
リボンの表ツール:テーブルデザインの表スタイルのオプション |
<tr><th>…</th></tr> |
表の先頭列のセルが見出しセルのタグでマークアップされます。 |
フォントグループ |
HTML要素 |
example |
ボールド |
strong |
但し、見出しスタイルに設定されたボールドは無視します。 |
イタリック |
デフォルトでは無視します。変換オプションで<i>タグまたは次のCSSスタイル指定を設定して出力します。 <span style="font-style:italic;> |
|
アンダーライン |
デフォルトでは無視します。オプションで<u>タグまたは次のCSSスタイル指定を設定して出力します。 <span style="text-decoration-line:underline> なお、リンクのアンカーテキストにはアンダーラインを付けません。 |
|
消し線 |
デフォルトでは無視します。変換オプションで<del>タグまたは次のCSSスタイル指定を設定して出力します。 <span style="text-decoration-line:line-through;"> |
|
下付き |
sub |
|
上付き |
sup |
|
文字の効果と体裁 |
無視 |
|
ハイライト(蛍光ペンの色) |
無視 |
|
文字の色 |
デフォルトでは無視します。変換オプションで次のCSSスタイル指定を設定して出力します。 <span style="color1;カラー値"> |
<span style="color:red;">文字の色赤</span>、<span style="color:#00B050;">文字の色緑</span> |
文字の網掛け |
無視 |
|
囲い文字 |
無視 |
|
フォント |
無視 |
|
フォントサイズ |
無視 |
|
文字種 |
無視 |
|
ルビ |
ruby rp rt |
<ruby>紫陽花<rt>あじさい</ruby> |
<ruby>漢<rp>(</rp><rt>かん</rt><rp>)</rp>字<rp>(</rp><rt>じ</rt><rp>)</rp></ruby> |
||
囲み線 |
無視 |
参考資料 |
HTML要素 |
example |
リンク(外部URL) |
<a href=”リンク先URL”>ラベル</a> |
リボン「挿入」の「リンク」 |
リンク(id) |
<a href=”#id値”>ラベル</a> |
|
相互参照 |
<a href=”#id値”> ラベル</a> |
リボン「参考資料」の図表グループの「相互参照」によるWord文書内の参照。 |
<span id=" id値"> |
||
idの値 |
<span id=”id値”></span> |
ブックマーク「here」へのリンク |
Microsoft Wordのリボン「ホーム」のスタイルギャラリーにある「標準」スタイルに設定されている段落の揃えを<head>の<style>要素に設定します。但し、「標準」スタイルに左揃えが設定されているとき、CSS ではtext-align:startはデフォルト値にあたり、揃えを指定する必要がないので設定しません。
なお、<head>の<style>は変換オプションの「-defstyle」パラメータが指定されていると出力されません(「3.2変換オプション)を参照)。
段落の揃え |
要素とクラス属性 |
example |
|
「標準」スタイルの揃え |
左揃え |
設定なし |
<style><style> |
中央揃え |
text-align:center |
<style>html{text-align:center;} |
|
右揃え |
text-align:end |
<style>html{text-align:end;}</style> |
|
両端揃え |
text-align:justify |
<style>html{text-align:justify;}</style> |
|
均等割り付け |
text-align:justify; text-justify:auto; |
<style>html{text-align:justify;text-justify:auto;}</style> |
リボン「ホーム」の「段落グループ」で、標準以外の段落の揃えを指定すると見出しランクタグ(h1~h6)またはpタグに次のクラス属性を設定します。
段落の揃え |
要素とクラス属性 |
example |
左揃え |
class="start" |
<p class=”start”>…</p> |
中央揃え |
class="center" |
<p class=”center”>…</p> |
右揃え |
class="end" |
<p class=”end”>…</p> |
両端揃え |
class=” justify ” |
<p>…</p> |
均等割り付け |
class="distribute" |
<p class=”distribute”>…</p> |
本文中の文末脚注の位置を示す合印にアンカータグを設定し、アンカータグのhref属性の値に文末脚注のidが設定されます。
文末脚注のテキストは文書末尾の位置に、文書の末尾の文末脚注を除く段落と同一のレベルに出力されます。文末脚注の番号にはid=”endnote-n”(nは番号)が設定されます。
Webページのテキスト、画像、表、などの実質的な内容のことをコンテンツといいます。また、ブロックの配置の指定、ブロック周囲の空き、周囲を罫線で囲むかどうか、その色合い、表示するフォント、文字の大きさなどの見栄え体裁を指定することをレイアウトといいます。
Webページの制作ではコンテンツをHTMLの該当するタグでマークアップして表し、レイアウトをCSSで指定します。最新のHTMLでは、コンテンツとレイアウトを分離するのが基本原則とされています。
これに対して、Wordで文書を編集するときは、テキストの書式や画像の配置などは、画面上で編集しながらテキストや画像に直接指定していく方式です。Wordは文書を印刷したときに画面上のレイアウトのとおりになる「WYSIWYG」という方式で、文書のレイアウトに対する考え方がHTMLとは根本的に異なります。
このためWordで作成した文書からWebページを作成するのは非常に困難です。Microsoft Wordには、リボン「ファイル」の「名前を付けて保存」で、保存するファイルの種類として、「Webページ」を選択すると、一見、ブラウザで表示できるWeb形式で保存できます。しかし、残念ながらWordで保存したWebページ形式は、そのままではまったく使いものになりません。
この原因は、Wordは編集時に画面で指定した印刷用の体裁や配置などのレイアウトをWebページで再現しようとするためです。
こうした問題を解決するために、本製品はWordで作成した文書のレイアウト指定をすべて捨ててコンテンツを純粋なHTMLのタグで表現します。
本製品を使いこなすには、まず、この基本をご理解いただく必要があります。
大前提として、WordでHTMLのタグを直接書くわけではありませんが、Word文書から変換した結果が適切なHTMLになるためには、HTMLのタグについての理解が欠かせません。そのうえで、現在編集しているWordのスタイル設定が、どのようなHTMLのタグに変換されるかを頭において、Word文書を編集する必要があります。
本章では、このような観点から、Word文書を編集する際に注意していただきたい事柄を説明します。
Wordの編集画面で、次のような編集操作を避けてください。
例えば箇条書きの項目が2行に渡るとき、1行目の終わりに改行を入力し、2行目の先頭位置に空白を入れて行頭を整えるような編集をすると、紙への印刷やPDFにするときは問題ありませんが、HTMLにしたときは文章のつながりが崩れてしまいます。
HTMLの見出しランクタグ(h1~h6)は、見出しを表すためのタグです。Webページの制作についてSEOの観点から、見出しランク1を表すh1タグは通常文書先頭に、1回だけ全体のタイトルとしての見出しを表す、と説明していることがあります。その場合には、Wordの文書の先頭に(h1タグに変換される)「見出し1」を一回だけ使います。
但し、HTMLとしては、h1タグが文書中に何度もでてきても問題ありません。そのようなHTMLを制作する場合は、「見出し1」を何回でも指定することができます。
本製品では見出しランクタグのランクに応じて、セクションを階層化します。h1を大見出し、h2が中見出し、h3が小見出しという階層構造を表すように使うときは、Word文書には、見出し1、見出し2、見出し3の順で現れるように指定します。見出し1の下に見出し2を繰り返し、見出し2の下に見出し3を繰り返すことができます。
Wordで見出しを付けるときは、Wordに組み込まれている「見出しスタイル」を適用してください。Wordの「見出しスタイル」は見出し1~見出し9まで用意されています。
Word2HTMLコンバータは、見出しスタイル1にHTMLの見出しランクタグh1を対応付けます。見出しスタイル2から同6までに見出しランクタグh2からh6を設定します。
【注意】Wordのテーマによっては、見出しスタイルにアウトラインレベル(後述)が設定されていないことがあります。Word文書でこのような見出しスタイルを使ったときは、見出しスタイルを設定しても、その段落に見出しランクタグは設定されません。
段落にアウトラインレベルが設定されているかどうかは、段落の上にカーソルを重ねて(ホバー)みることで判断できます。アウトラインレベルが設定されている段落には、カーソルをホバーしたとき段落の左側にマークが表示されます。
Wordの組み込みスタイルのひとつに「表題」があります。表題スタイルには「アウトラインレベル1」が設定されていることがあります。Word文書で、段落にそのような表題スタイルを適用した場合、Word2HTMLコンバータの変換結果では、当該段落にh1タグが設定されます。
Wordには段落のアウトラインレベルという機能があり、段落を9段階の階層化設定できます。また、アウトラインレベルを設定した段落はアウトライン編集段落のアウトラインレベルは、リボンの「ホーム」タブの「段落グループ」の「段落」ダイアログで設定します。
「段落」ダイアログは、段落グループの右下にある「」をクリックすると表示されます。
Word2HTMLコンバータは、アウトラインレベル1からアウトラインレベル6までをHTMLの見出しランクタグh1からh6に対応つけます。つまり、Wordでアウトラインレベル1を設定した段落は、HTMLの見出しランク1(h1)となります。
Wordのリボン「ホーム」にある「箇条書き」は、行頭に記号を付けた段落を作成します。
Wordでは行頭文字ライブラリによって、行頭記号の変更ができます。
この行頭記号の多くは、Word独自の特殊なフォントを使って表示されるためHTMLでは正しく表示されない場合があります。このためWord2HTMLコンバータは、行頭記号を削除したうえで、HTMLの順序なし箇条書きに変換します。HTMLでは行頭記号はCSSを使って設定してください。
なお、Wordで箇条書きを指定したブロックは、見かけ上はHTMLの順序なし箇条書きのように見えます。しかし、Wordの内部では、各項目が先頭に記号が付いた段落として書式化されています。Word2HTMLコンバータは、Wordの編集時に「箇条書き」を設定した箇所を分析して、HTMLの順序なし箇条書きに変換しています。段落の書式の指定方法によってはHTMLの順序なし箇条書きに変換できない場合があります。この場合は、段落の書式の変更を試してみてください。
Wordのリボン「ホーム」の「段落番号」は、選択した番号形式で段落の行頭に自動番号付けする機能です。
段落番号を指定したブロックは、見かけ上はHTMLの順序付き箇条書きのように見えます。
しかし、Wordには番号付き箇条書きというスタイルはありません。Wordの段落番号を設定した段落は、ひとつひとつの段落項目の先頭に番号のついた段落として保存されています。
Word2HTMLコンバータは、Word編集時に「番号付き段落」を設定した箇所を、HTMLの順序付き箇条書きに変換するか、それとも番号付き段落に変換するかをプログラムで判定します。判定基準は次のとおりです。
この判定は必ずしもうまくいかないことがあるため、期待通りにならない場合は、Word上で段落を編集してみてください。
Wordで図を配置するオプションは、行内配置と文字列の折り返しがあります。このレイアウトオプション)は、図形を選択してマウスの右クリックで表示して選択します(次の図を参照)。
行内配置では図を文字と文字の間にあたかもひとつの図形文字のように配置し、前後の文字と一緒に位置が移動します。行内配置の図はこのように()HTMLでは文字の間に配置されます。
HTMLに変換した結果、imgタグにclass=”inline”の属性が設定されます。
文字列の折り返しを指定した図は、Wordの編集画面で図を選択するとアンカーマーク表示されます。
A. 見出しや段落にアンカーマークがついた図は、見出しや段落の終了タグ直後に出力され、また、imgタグにclass=”block”の属性が設定されます。
次の例では、図のアンカーマークが見出しの先頭についています。
これをHTMLに変換すると次のように、見出しランクの終了タグと次の段落の開始タグの間に、imgタグを出力します。
次の例では、図のアンカーマークが段落の先頭についています。
これをHTMLに変換すると次のように、段落の終了タグの直後に、imgタグを出力します。
この例ではWordの画面上では段落のテキストが図の後ろにあるにも関わらず、HTMLに変換すると段落の後ろにimgタグが出力されます。Wordは紙の上に画像を配置するため、画像が1ページにうまく入りきらないとき、画像が次のページに配置されることがあります。このようなときもHTMLファイルに変換したときには、アンカーマークが付いた段落の後ろにimgタグが置かれます。
B. 箇条書きの項目にアンカーマークのついた図は、箇条書き項目の終了タグの直前にimgタグが出力されます。
次の例では、図のアンカーマークが箇条書きの最初の項目の先頭についています。
これをHTMLに変換すると次のように、最初の箇条書き項目の終了タグの直前に、imgタグを出力します。(箇条書きの項目の終了タグの後ろと次の箇条書きの項目の開始タグの間にimgタグを出すとHTMLの文法エラーになるためです。)
「HTML on Word」のデフォルト変換ではWord文書の中の空行(行頭の改行のみの行)、改頁は無視します。また、Wordは紙への印刷を想定しているため、図や表がページ中に入りきらないと、次のページに送られて、大きな空きができます。HTMLに変換するときこうした空きは無視されます。
Wordの編集画面上でのレイアウト上できる、空きや空行については気にしないで編集してください。
Word上では、紙の上に図形や画像を配置していくことができます。もし、これらの図形や画像をHTMLの中でひとつにまとめたいときは、Word上でグループ化してください。
複数の図を編集中のWord文書の画面上で同じ位置に配置しただけでは、HTMLに変換したときに図がバラバラになってしまいます。
Wordで参照リンクを設定する方法には、リボン「挿入」の「リンク」と「相互参照」があります。
Wordのリボン「挿入」タブの「リンク」では外部のURLやWord内部へのリンクを設定できます。
Wordのリボン「挿入」タブの「相互参照」ではWord内部で見出し、図、表、番号付き段落へのリンクを設定できます。
リンクの参照先は外部URLや文書内部のブックマークです。ブックマークはWordのリボン「挿入」タブのブックマークで追加、削除などの編集ができます。次にブックマークの例を示します。
上のダイアログには4つのブックマークが表示されており、ブックマークの種類は次のようになっています。
HTMLに変換するとブックマークは<span id=”ブックマーク名”></span>に変換されます。
【例】ここにhereという名前のブックマークが設定されています。 |
Wordの表機能で作成した表をHTMLの表タグに変換します。
表をHTMLに変換する際は、表のセル結合は変換しますが、しかし、表の幅、罫線の太さなどの設定、背景、表の中の文字の揃え指定などはすべて無視します。
これらの指定は、出力したHTMLに対してCSSで指定してください。
Wordのリボン「ホーム」のフォントグループで設定できる機能のうち、太字、上付き、下付きについては、それぞれ<strong>、<sup>、<sub>というHTMLのタグに変換されます。
それ以外の、イタリック、アンダーライン、消し線、文字の色、フォント名、文字の大きさは変換時に無視します。
「HTML on Word」 ユーザーズ・マニュアル バージョン:1.2.2 発行日:2022年10月12日 発行元:東京都中央区東日本橋2丁目1番6号 アンテナハウス株式会社 Copyright ©2021-2022 Antenna House, Inc. 本マニュアルは、Microsoft Word 2019で編集、『HTML on Word』でHTMLに変換しました。 |