XML |
対応形式 |
XMLドキュメント |
本文 |
タグ<>と</>間の文字を抽出します。 |
CDATA |
CDATAで定義した内容を抽出します。 |
文字列の引用 |
抽出します。 |
テーブル |
抽出します。 |
ハイパーリンク |
抽出します。 |
実体の引用 |
抽出します。 |
イメージ、画像 |
無視します。 |
|
|
※ファイルの先頭に <?XML version =
“1.0”?> があるファイルをXMLファイルと判定します。 |
※スタイルシート(xls)ファイルからは抽出できません。 |
※
対になったタグ<>と</>、或は<>と<>間の文字を抽出し、改行コードを付加します。 |
※ルビ文字は被ルビ文字の後に続けて出力します。 |
※テーブル内のデータは、各セルの内容を1行にして出力します。 |
※タグ<>と</>間の改行コードは無視して一つの半角スペースを出力します。 |
※タグ<>と</>間に半角スペースが連続してある場合は、一つの半角スペースにして抽出します。 |