Skip to content
Kazuhiro edited this page Apr 12, 2019 · 7 revisions

ルビTEI化ガイドライン

以下では、東アジア・日本語分科会におけるルビのTEI化に関するガイドラインを述べる。

ルビについて

ルビ・ふりがな・ふり文字

ルビと注釈のちがい

  • ルビは文字との対応関係が重要

ルビの歴史

マークアップのありかた

原則

ルビの多様性

  • ルビのルビへのスタンドオフマークアップについて
    • 文字数を指定することは、Unicodeのコードの組み合わせ上の難しさを生むので避けるべき

通常の半構造化マークアップ

スタンドオフ・マークアップが適するもの

青空TEIにおける現状

東アジア・日本語分科会では、現在、青空文庫のテキストのTEI化を行っている。ルビのマークアップへの解がない現状において、青空文庫のテキスト(XHTML 1.1で記述されている)をTEI化するために、現実的なものとしては、HTMLにおけるルビのありかたを受け入れるというものである。

現状のHTMLでは、ルビにかかわる全体を<ruby>要素で囲み、<rb>要素で本文要素を、<rt>要素でルビ要素を表現することとなっている(このほか、ルビ機能に対応していないブラウザのために、ルビ要素を区別するための括弧を記述する<rp>要素があるが、本来存在したものではないので省略する。また、HTML Living Standardでは<rb>要素を不要とする考え方も用いられているが、XMLとは考え方がおおはばに異なり、そのまま受け入れることはなお困難である)。

これらのいずれも、TEI P5には含まれておらず、青空文庫のXHTMLをそのまま取り込むことは難しい。XHTMLにおけるルビは、すべてインライン要素であるから、インライン要素の種類として表現してしまえばひとまずは足りるわけである。そこで、本会では、現状、<span>要素の属性によってこれらの要素を表現し分けることとしている(本来的には<span>要素にはインライン要素を一般的に表現する機能は現状のTEIにはないかと思われるので、任意の部分を表現する<seg>要素などを用いるべきではあろうが、<span>要素で作業を進めてしまった経緯があるので、ルビ関連マークアップが整備されるまではそのままとしたい)。

すなわち、青空文庫における

路地の奥に一本の<ruby><rb>樟木</rb><rp>(</rp><rt>くすのき</rt><rp>)</rp></ruby>が見え、 宮本百合子 芸術が必要とする科学

という内容は、

路地の奥に一本の<span type="ruby"><span type="rb">樟木</span><span type="rt">くすのき</span></span>が見え、

と改められる。

HTML Standard Requirements for Japanese Text Layout https://www.w3.org/TR/jlreq/#ruby_and_emphasis_dots JEPA|日本電子出版協会 2019年4月11日 Nat McCully氏、W3C下農氏:日本語組版の過去、現在、未来 http://www.jepa.or.jp/sem/20190411/

文献