-
Notifications
You must be signed in to change notification settings - Fork 0
以下では、東アジア・日本語分科会におけるルビのTEI化に関するガイドラインを述べる。
ルビとは、本文の行(以下、本行という)の中の任意の文字に対して、本行に沿わせて(一般的には)本行よりも小さな文字を配置して、読みなどの情報を附与するものである。そのような行為を「ルビを振る」という。ルビはおもに仮名であることからふりがなとも言うが(歴史的にはルビよりもふりがなのほうが古く現れる)、仮名ではなく漢字などを振ることもあることから一般的に拡張してふり文字ということもある。
- ルビは文字との対応関係が重要
- ルビのルビへのスタンドオフマークアップについて
- 文字数を指定することは、Unicodeのコードの組み合わせ上の難しさを生むので避けるべき
東アジア・日本語分科会では、現在、青空文庫のテキストのTEI化を行っている。ルビのマークアップへの解がない現状において、青空文庫のテキスト(XHTML 1.1で記述されている)をTEI化するために、現実的なものとしては、HTMLにおけるルビのありかたを受け入れるというものである。
現状のHTMLでは、ルビにかかわる全体を<ruby>
要素で囲み、<rb>
要素で本文要素を、<rt>
要素でルビ要素を表現することとなっている(このほか、ルビ機能に対応していないブラウザのために、ルビ要素を区別するための括弧を記述する<rp>
要素があるが、本来存在したものではないので省略する。また、HTML Living Standardでは<rb>
要素を不要とする考え方も用いられているが、XMLとは考え方がおおはばに異なり、そのまま受け入れることはなお困難である)。
これらのいずれも、TEI P5には含まれておらず、青空文庫のXHTMLをそのまま取り込むことは難しい。XHTMLにおけるルビは、すべてインライン要素であるから、インライン要素の種類として表現してしまえばひとまずは足りるわけである。そこで、本会では、現状、<span>
要素の属性によってこれらの要素を表現し分けることとしている(本来的には<span>
要素にはインライン要素を一般的に表現する機能は現状のTEIにはないかと思われるので、任意の部分を表現する<seg>
要素などを用いるべきではあろうが、<span>
要素で作業を進めてしまった経緯があるので、ルビ関連マークアップが整備されるまではそのままとしたい)。
すなわち、青空文庫における
路地の奥に一本の<ruby><rb>樟木</rb><rp>(</rp><rt>くすのき</rt><rp>)</rp></ruby>が見え、
宮本百合子 芸術が必要とする科学
という内容は、
路地の奥に一本の<span type="ruby"><span type="rb">樟木</span><span type="rt">くすのき</span></span>が見え、
と改められる。
HTML Standard Requirements for Japanese Text Layout https://www.w3.org/TR/jlreq/#ruby_and_emphasis_dots JEPA|日本電子出版協会 2019年4月11日 Nat McCully氏、W3C下農氏:日本語組版の過去、現在、未来 http://www.jepa.or.jp/sem/20190411/
圏点とは、強調したい文字に「﹅」や「•」を傍書して際立たせる行為である。これは、<seg>
要素や<emph>
要素の@rend
属性にsesami
、dotted
など適宜記述を行うことで十分である。表示の際は、XSLTを通じてHTML等に変換するのであれば、CSSのfont-emphasize-style
プロパティなどを通じて制御することとなる。
たとえば、青空文庫において、
その枝に這いのぼった<strong class="SESAME_DOT">へちま</strong>の黄色い花もいくつか見える。
宮本百合子 芸術が必要とする科学
としてクラスによって圏点が表現されているのは、
その枝に這いのぼった<emph rend="sesami">へちま</emph>の黄色い花もいくつか見える。
と記述しておけばよい。