補足(2014・5・30現在)
(この部分は2014年5月に追加したもので、次項以降とは話が前後するので注意してください。)
- 2012年8月にJATSバージョン1.0となった。
- 2013年11月にJATSのドラフト・バージョン1.1dが公開されている。
2014年5月16日に学術情報XML推進協議会より青版(Blue)の日本語訳が公開された。
☞
JATS 日本語訳について
トップページ > XML資料室 > NLM DTDからJATS(Journal Article Tag Suite)へ
Last update: 更新内容
2011年9月26日から27日にかけて米国医学図書館(National Library of Medicine)(NLM)において最初のJournal Article Tag Suite (JATS)ユーザー会議が開催される。明日からこの会議に参加してJATSに関する情報の収集を行なう予定なので、会議参加にあたり、NLM DTDからJATSへの進展の経過を整理してみる。(2/11/9/25)
(この部分は2014年5月に追加したもので、次項以降とは話が前後するので注意してください。)
2014年5月16日に学術情報XML推進協議会より青版(Blue)の日本語訳が公開された。
☞
JATS 日本語訳について
JATSは、学術情報誌(ジャーナル)をXMLで表現するための仕様である。米国情報標準化機構(NISO)から2011年3月に試行用ドラフト標準NISO JATS 0.4としてリリースされた。6ヶ月のレビュー期間後、寄せられたコメントに対処する。その後NISOで投票を行い、JATS1.0 となる予定である。
JATSの前身はNLM DTDである。NLM DTDの開発はずっと米国医学図書館で行なわれてきたが、NISOの標準にすることになり、これに際して、NLMの最終版としてV3.0が2008年にリリースされた。 当初はV3.0をNISOに提出する予定だったが多くのコメントが寄せられたので、整理したうえでNISOに移すことになった。
NISO JATS 0.4は、もし、NLMとしてバージョンを付けるならばNLM DTD 3.1にあたるものでNLM DTD 3.0と完全に後方互換性をもっている。
JATSは、欧米においてジャーナル分野におけるマークアップの利用と大きく関わっている。そこで、これまでの経過を簡単に整理してみる。以下では、2011年3月の東京 J-STAGE3
説明会におけるBruce D.
Rosenblum 氏の講演要旨を参考にした。
http://info.jstage.jst.go.jp/society/meeting/110309/meeting_110309_6.pdf
ジャーナル分野におけるマークアップ利用の歴史は、大きく①独自DTDの時代、②NLM DTDの時代、③JATSの時代に分けることができるだろう。
NLM DTDの開発プロジェクトを開始するまえに、2001 年9 月~12 月にかけて、ハーバード大学などが中心になって電子ジャーナルのアーカイブ用DTDに関する可能性調査が行なわれた。
調査報告はE-JOURNAL ARCHIVE DTD FEASIBILITY STUDY(2001年12月5日付け)として下記に公開されている。
この調査は、Elsevier, Blackwell, BioOne, Nature, HighWireなど10出版者が使っているジャーナルのためのDTDとそのDTDによってマークアップしたジャーナルの記事のサンプルを集めて比較検討したものである。以下は、同報告書に基づく。
10出版者のなかでISO 12083をベースにして多少の拡張を行なったDTDを利用している組織と、ElsevierのDTDをベースにしている組織がそれぞれ3、その他の4組織は独自に開発されたDTDを使っている(p.11 表1.)。これらのDTDは様々な理由で改訂され、また、壁にあたって再構築されているものもある。
ISO 12083は電子論文のSGML タグ付けに関する国際規格である。1980年代の終わりにAssociation of American Publishers (AAP)がオリジナルを開発、1988年にANSI標準、1993年にISO標準となり、1995年に改訂された。
10出版者のDTDの中でWileyのものがもっとも複雑で、基本要素250個、表7個、数式7個(数式はTeXで記述しており、これをラップするXML要素が7個)の合計264要素である。一方で、簡単なDTDは要素数が100~130個である(p.13 表3.)。実際のサンプル記事での要素の使用率は50%程度以下であった。その要素の1/4から半分が前付けの中で使われている。記事に占める前付けの分量は少ないが要素の利用は前付けに集中している(p.14 表4.)。
各社のジャーナル記事では次のような項目が様々に表現されており、ジャーナル記事をアーカイブするためのXMLではその内容の保持を検討する必要がある。
XMLでは形式よりも意味でコンテンツにマークアップすることで、形式指示と構造情報を分離する。この際、どこまで分離するかで方針が分かれる。具体的には定型語句、カウンター(章番号、節番号、図番号など)、ラベル(箇条書きの記号など)、句読点などの扱いである。もし、これらを形式として内容から分離し、スタイルシートで生成するならば、XMLインスタンスをスタイルシート抜きで配布すると、最終の見栄えが分からなくなる。定型語句などをXMLインスタンスに残しておけば、スタイルシートを一緒に配布しなくても良くなる。これに関して各出版者の方針は微妙に異なっている。
ハーバード大、メロン財団が米国医学図書館が中心になり、2002 年4 月に共同開発を開始。2003 年2月にバージョン1.0 がリリースされ、PubMed Central(NLMのジャーナルDB)、Portico、CSIRO などで採用された。
バージョン情報ページ
Journal Article Tag Suite
バージョン
バージョン番号 | リリース時期 | 備考 |
---|---|---|
バージョン1.0 | 2003年2月 | 緑、青の2つの用途別DTD。 |
バージョン1.1 | 2003年11月 | 緑、青の2つの用途別DTD。 |
バージョン2.0 | 2004年8月 | 緑、青、紫の3つの用途別DTD。 |
バージョン2.1 | 2005年11月 | かぼちゃ色(執筆用)DTDが追加、4つの用途別DTD。 |
バージョン2.2 | 2006年6月 | 4つの用途別DTD。 |
バージョン2.3 | 2007年3月 | 4つの用途別DTD。 |
バージョン3.0 | 2008年11月 | 4つの用途別DTD。バージョン3.0で要素名や属性名の変更をおこなっており、バージョン2.3とバージョン3.0は互換性がない。 |
現在、次の4つのモジュールセットがある。
用途 | 特徴 | URL |
---|---|---|
緑(ジャーナルアーカイブ用) | 最も緩やか。2003年リリース | http://dtd.nlm.nih.gov/archiving/ |
青(ジャーナル出版用) | 少し厳し目。2003年リリース | http://dtd.nlm.nih.gov/publishing/ |
カボチャ色(論文執筆用) | 簡潔でコンパクトなサブセット。2005年V2.1で追加 | http://dtd.nlm.nih.gov/articleauthoring/ |
紫色(テキストブック用) | http://dtd.nlm.nih.gov/book/ |
2005 年ごろから広く採用され出した。コストのかかるDTDの独自開発を行なわなくて済む、あるいは学術ジャーナル出版者による囲い込みからの脱却のほか、XML関連ツールの普及も大きな要因だろう。
NLM DTDと同時にHTMLやPDFに変換するツールも公開されている。
NLM DTDで作成されたジャーナルをAntenna House Formatterを使って自動組版して印刷している団体はNLMのほかに米国の大学、出版社に沢山あるようだ。
XSL-FOスタイルシートの初歩的なものが、次のNLMのWebページで公開されておりだれでも入手できる。公開されているスタイルシートは基本的なものなので、このスタイルシートをベースとしてNLM DTDの様々な機能をもっと活用したスタイルシートを作ったり、各出版者はレイアウトをカスタマイズして使うこともできる。
バージョン3用にはHTMLとPDFの両方に変換できるスタイルシートが公開されている。FTPサイトのファイル名:jpub3-preview-xslt.zip.
バージョン2.3以前は、XHTMLとPDFが別のスタイルシートになっている。PDF用はFTPサイトにあるJournalPublishing-XSL-FO.zipがそれである。
このスタイルシートは、Antenna House のXSL Formatter V2.5.2003.613をベースとして開発されており、MathMLを組版する機能を使っている。MathML以外は、アンテナハウス拡張を使っていないので、他のXSL-FOプロセサでも使えるとある。
JATSバージョン1は現在開発が進んでいる。
2012年5月31日に、JATSは、NISO Z39.96-201x として投票にかけられた。8月末までに投票完了の予定となっている。
日本ではJ-STAGE3で、2012年5月より、JATSでマークアップした学術情報誌の受け入れが始まっている。
アンテナハウスでは、AH Formatter V6用のJATSスタイルシートを開発して、オープンソースとして公開しました(2012年6月12日)。
ページのレイアウト崩れを修正
2014年5月現在の情報を追記