PDF、組版と文書変換のアンテナハウス株式会社

サイトマップ
hr トップ
ページ
hr デスクトップ
製品情報
hr システム
製品情報
hr DITA
サービス
hr 電子書籍
サービス
hr サポート hr 製品の購入
について
hr お問い合わせ hr 会社案内 hr
スペース

NLM DTDからJournal Article Tag Suiteへの進展:これまでの経過整理

2011年9月26日から27日にかけて米国医学図書館(National Library of Medicine)(NLM)において最初のJournal Article Tag Suite (JATS)ユーザー会議が開催される。明日からこの会議に参加してJATSに関する情報の収集を行なう予定なので、会議参加にあたり、NLM DTDからJATSへの進展の経過を整理してみる。(2/11/9/25)

補足(2014・5・30現在)

(この部分は2014年5月に追加したもので、次項以降とは話が前後するので注意してください。)

  1. 2012年8月にJATSバージョン1.0となった。
  2. 2013年11月にJATSのドラフト・バージョン1.1dが公開されている。

2014年5月16日に学術情報XML推進協議会より青版(Blue)の日本語訳が公開された。
JATS 日本語訳について

JATSとは

JATSは、学術情報誌(ジャーナル)をXMLで表現するための仕様である。米国情報標準化機構(NISO)から2011年3月に試行用ドラフト標準NISO JATS 0.4としてリリースされた。6ヶ月のレビュー期間後、寄せられたコメントに対処する。その後NISOで投票を行い、JATS1.0 となる予定である。

JATSの前身はNLM DTDである。NLM DTDの開発はずっと米国医学図書館で行なわれてきたが、NISOの標準にすることになり、これに際して、NLMの最終版としてV3.0が2008年にリリースされた。当初はV3.0をNISOに提出する予定だったが多くのコメントが寄せられたので、整理したうえでNISOに移すことになった。

NISO JATS 0.4は、もし、NLMとしてバージョンを付けるならばNLM DTD 3.1にあたるものでNLM DTD 3.0と完全に後方互換性をもっている。

簡単な歴史

JATSは、欧米においてジャーナル分野におけるマークアップの利用と大きく関わっている。そこで、これまでの経過を簡単に整理してみる。以下では、2011年3月の東京 J-STAGE3 説明会におけるBruce D. Rosenblum 氏の講演要旨を参考にした。
http://info.jstage.jst.go.jp/society/meeting/110309/meeting_110309_6.pdf

ジャーナル分野におけるマークアップ利用の歴史は、大きく①独自DTDの時代、②NLM DTDの時代、③JATSの時代に分けることができるだろう。

独自DTDの時代

NLM DTDの開発プロジェクトを開始するまえに、2001 年9 月~12 月にかけて、ハーバード大学などが中心になって電子ジャーナルのアーカイブ用DTDに関する可能性調査が行なわれた。

調査報告はE-JOURNAL ARCHIVE DTD FEASIBILITY STUDY(2001年12月5日付け)として下記に公開されている。

この調査は、Elsevier, Blackwell, BioOne, Nature, HighWireなど10出版者が使っているジャーナルのためのDTDとそのDTDによってマークアップしたジャーナルの記事のサンプルを集めて比較検討したものである。以下は、同報告書に基づく。

10出版者のなかでISO 12083をベースにして多少の拡張を行なったDTDを利用している組織と、ElsevierのDTDをベースにしている組織がそれぞれ3、その他の4組織は独自に開発されたDTDを使っている(p.11 表1.)。これらのDTDは様々な理由で改訂され、また、壁にあたって再構築されているものもある。

ISO 12083は電子論文のSGML タグ付けに関する国際規格である。1980年代の終わりにAssociation of American Publishers (AAP)がオリジナルを開発、1988年にANSI標準、1993年にISO標準となり、1995年に改訂された。

10出版者のDTDの中でWileyのものがもっとも複雑で、基本要素250個、表7個、数式7個(数式はTeXで記述しており、これをラップするXML要素が7個)の合計264要素である。一方で、簡単なDTDは要素数が100~130個である(p.13 表3.)。実際のサンプル記事での要素の使用率は50%程度以下であった。その要素の1/4から半分が前付けの中で使われている。記事に占める前付けの分量は少ないが要素の利用は前付けに集中している(p.14 表4.)。

各社のジャーナル記事では次のような項目が様々に表現されており、ジャーナル記事をアーカイブするためのXMLではその内容の保持を検討する必要がある。

XMLでは形式よりも意味でコンテンツにマークアップすることで、形式指示と構造情報を分離する。この際、どこまで分離するかで方針が分かれる。具体的には定型語句、カウンター(章番号、節番号、図番号など)、ラベル(箇条書きの記号など)、句読点などの扱いである。もし、これらを形式として内容から分離し、スタイルシートで生成するならば、XMLインスタンスをスタイルシート抜きで配布すると、最終の見栄えが分からなくなる。定型語句などをXMLインスタンスに残しておけば、スタイルシートを一緒に配布しなくても良くなる。これに関して各出版者の方針は微妙に異なっている。

NLM DTDの開発と普及

ハーバード大、メロン財団が米国医学図書館が中心になり、2002 年4 月に共同開発を開始。2003 年2月にバージョン1.0 がリリースされ、PubMed Central(NLMのジャーナルDB)、Portico、CSIRO などで採用された。

バージョン情報

バージョン情報ページ
Journal Article Tag Suite バージョン

バージョン番号 リリース時期 備考
バージョン1.02003年2月 緑、青の2つの用途別DTD。
バージョン1.12003年11月 緑、青の2つの用途別DTD。
バージョン2.02004年8月 緑、青、紫の3つの用途別DTD。
バージョン2.12005年11月 かぼちゃ色(執筆用)DTDが追加、4つの用途別DTD。
バージョン2.22006年6月 4つの用途別DTD。
バージョン2.32007年3月 4つの用途別DTD。
バージョン3.0 2008年11月 4つの用途別DTD。バージョン3.0で要素名や属性名の変更をおこなっており、バージョン2.3とバージョン3.0は互換性がない。

モジュールセット

現在、次の4つのモジュールセットがある。

用途 特徴 URL
緑(ジャーナルアーカイブ用) 最も緩やか。2003年リリース http://dtd.nlm.nih.gov/archiving/
青(ジャーナル出版用) 少し厳し目。2003年リリース http://dtd.nlm.nih.gov/publishing/
カボチャ色(論文執筆用) 簡潔でコンパクトなサブセット。2005年V2.1で追加 http://dtd.nlm.nih.gov/articleauthoring/
紫色(テキストブック用) http://dtd.nlm.nih.gov/book/

NLM DTDの普及とツール

2005 年ごろから広く採用され出した。コストのかかるDTDの独自開発を行なわなくて済む、あるいは学術ジャーナル出版者による囲い込みからの脱却のほか、XML関連ツールの普及も大きな要因だろう。

NLM DTDと同時にHTMLやPDFに変換するツールも公開されている。

NLM DTDで作成されたジャーナルをAntenna House Formatterを使って自動組版して印刷している団体はNLMのほかに米国の大学、出版社に沢山あるようだ。

XSL-FOスタイルシートの初歩的なものが、次のNLMのWebページで公開されておりだれでも入手できる。公開されているスタイルシートは基本的なものなので、このスタイルシートをベースとしてNLM DTDの様々な機能をもっと活用したスタイルシートを作ったり、各出版者はレイアウトをカスタマイズして使うこともできる。

NLM DTD バージョン3用

バージョン3用にはHTMLとPDFの両方に変換できるスタイルシートが公開されている。FTPサイトのファイル名:jpub3-preview-xslt.zip.

NLM DTD バージョン2.3以前用

バージョン2.3以前は、XHTMLとPDFが別のスタイルシートになっている。PDF用はFTPサイトにあるJournalPublishing-XSL-FO.zipがそれである。

このスタイルシートは、Antenna House のXSL Formatter V2.5.2003.613をベースとして開発されており、MathMLを組版する機能を使っている。MathML以外は、アンテナハウス拡張を使っていないので、他のXSL-FOプロセサでも使えるとある。

JATSへ

JATSバージョン1は現在開発が進んでいる。

2012年5月31日に、JATSは、NISO Z39.96-201x として投票にかけられた。8月末までに投票完了の予定となっている。

日本ではJ-STAGE3で、2012年5月より、JATSでマークアップした学術情報誌の受け入れが始まっている。

AH Formatter用JATSスタイルシート

アンテナハウスでは、AH Formatter V6用のJATSスタイルシートを開発して、オープンソースとして公開しました(2012年6月12日)。

スペース
トップページデスクトップ製品情報システム製品情報DITAサービス電子書籍サービスサポート製品の購入についてお問い合わせ会社案内
RainbowPDF新しいウィンドウで表示Chinese新しいウィンドウで表示クセロPDF新しいウィンドウで表示
サイトマップ個人情報保護の考え方とお願い
Copyright Antenna House, Inc. All rights reserved.
Antenna House is a trademark of Antenna House, Inc.