ids/7/819.txt

[1] [RUBYB[用字系][Script]]を同定するための札、
[DFN[[RUBYB[用字系札][script tag]]]]とかいうものです。

[[RFC 3036]] の[[言語札]]や [[ISO 3166]] の国名符号・
地域符号のように、書字体系を識別します。ここで、
[Q[用字(系)]]あるいは[Q[書字体系]]とは、
広く[Q[[[文字]]・[[記号]]の使い方の体系]]と緩く定義します。
(その意味では [Q[script]] というより [Q[orthography]]
に近いかもしれませんが、そうすると規範の存在を示唆するようなニュアンスがあります。)

*構文

[2] [[RFC 3066]] の規定する[[言語札]]のように、複数の部分札を 
[CODE(char)[HYPHEN-MINUS]] で結んだものを用字系札とします。
大文字・小文字の区別は一切しません。

-[4] [CODE(ABNF)[[DFN[script-tag]] := primary-subtag *("-" subtag)]]
-[6] [CODE(ABNF)[[DFN[primary-subtag]] := 1*8ALPHA]]
-[5] [CODE(ABNF)[[DFN[subtag]] := 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。]]

-[3] 第1部分札 ([CODE(ABNF)[primary-subtag]]) は、
次のように規定します。
-- 4文字であれば、原則として [[ISO 15924]]
による4文字ラテン文字用字符号とします。
[WEAK[(用字系札の大文字・小文字は区別しませんが、特に理由がない場合、 ISO 15924 で定義された名前は最初の1文字のみ大文字で記述することを'''推奨'''します。)]]
---[30] 例外として、 [CODE(SCRIPT)[auto]],
[CODE(SCRIPT)[none]] は [[XSL-FO]] と同じように定義します。
--- [CODE(SCRIPT)[[[Qaaa]]]]〜[CODE(SCRIPT)[[[Qabx]]]] (私用)
は使用しません。
---[7] [CODE(SCRIPT)[[[Zzzz]]]] (未符号化用字系) 
は原則として使用しては'''なりません'''。
-- [CODE(SCRIPT)[inherit]] は XSL-FO と同じように定義します。
-- 第1部分札 [CODE(SCRIPT)[s]] は、 ISO 15924 
で割り当てられていない用字系のために使います。
-- 第1部分札 [CODE(SCRIPT)[x]] は、
私用のために使って'''構いません'''。公式な意味は割り当てません。
-- このほかすべての第1部分札は、将来の拡張のために予約します。
-[8] 第1部分札が ISO 16924 4文字符号の場合における第2部分札、
および第1部分札が [CODE(SCRIPT)[s]] である場合の第3部分札は、
次の通り規定します。
--[18] 第1部分札が4文字符号の場合で、第2部分札が1文字の場合、
>>3 と同じとします。
--[9] 2文字の部分札の場合、 [[ISO 639]] の2文字[[言語符号]]または
[[ISO 3166]] の[[国名符号]]のいずれかとします。
[WEAK[(用字系札の大文字・小文字は区別しませんが、前者は小文字、後者は大文字とすることを推奨します。)]]
--[31] 3文字以上の部分札の場合、 ISO 639
の3文字言語符号とすることを'''推奨'''します。
但し、 ISO 639 の2文字符号が定義されている場合、
3文字符号を使用しては'''なりません'''。
--[10]3文字以上の部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、
互換性のため、''ここ''に登録することを推奨します。
-[32] 第1部分札が [CODE(SCRIPT)[s]] の場合、
第2部分札は''ここ''で規定されているものとします。
- [11] 特に規定のない部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、
互換性のため、''ここ''に登録することを推奨します。

[[#comment]]
*意味
-[12] 用字系を識別する。例: [CODE(SCRIPT)[Latn]] ([[ラテン文字]])
-[13] 小札を使って[[正書法]]・転写法の類も含めることが出来る。
例: [CODE(SCRIPT)[Latn-ja-hebon]] (ヘボン式ローマ字)
-[14] 複数の用字系の組み合わせで一つの体系として機能するものも ISO 15924
に倣って一つの用字系とみなす。例: [CODE(SCRIPT)[Jpan]] (日本語文字 = 漢字 + 仮名)

- [28] [WEAK[2003-10-24 17:29:30 +00:00]] ''[[矧]]'': しん
- [29] [WEAK[2003-10-24 17:33:11 +00:00]] ''[[矧]]'': 
[[#comment]]
*値

[15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。

[16] 
,用字系札               ,ISO 15924 数値符号,用字名 (日本語),用字名 (英語),状態
,[CODE(SCRIPT)[Arab]],[CODE[160]],,Arabic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Armn]],[CODE[230]],,Armenian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[auto]]]],,自動
,[CODE(SCRIPT)[Bali]],[CODE[360]],,Balinese,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Batk]],[CODE[365]],,Batak,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Beng]],[CODE[325]],,Bengali,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Blis]],[CODE[550]],,Blissymbols,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Bopo]],[CODE[285]],,Bopomofo,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Brah]],[CODE[300]],,Brahmi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Brai]],[CODE[570]],,Braille,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Brai-ja]]]],,日本語用6点点字
,[CODE(SCRIPT)[Bugi]],[CODE[367]],,Buginese,2004-05-01 ISO 登録

,[CODE(SCRIPT)[Buhd]],[CODE[372]],,Buhid,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cans]],[CODE[440]],,Unified Canadian Aboriginal Syllabics,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Cham]],[CODE[358]],,Cham,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cher]],[CODE[445]],,Cherokee,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cirt]],[CODE[291]],,Cirth,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Copt]],[CODE[204]],,Coptic,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Cprt]],[CODE[403]],,Cypriot,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cyrl]],[CODE[220]],,Cyrillic;2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cyrs]],[CODE[221]],,Cyrillic (Old Church Slavonic variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Deva]],[CODE[315]],,Devanagari (Nagari),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Dsrt]],[CODE[250]],,Deseret (Mormon),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyd]],[CODE[070]],,Egyptian demotic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyh]],[CODE[060]],,Egyptian hieratic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyp]],[CODE[050]],,Egyptian hieroglyphs,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Ethi]],[CODE[430]],,Ethiopic (Ge‘ez),2004-10-25 ISO 登録
,[CODE(SCRIPT)[Geor]],[CODE[240]],,Georgian (Mkhedruli),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Geok]],[CODE[241]],,Khutsuri (Asomtavruli and Khutsuri),2004-10-25 ISO 登録
,[CODE(SCRIPT)[Glag]],[CODE[225]],,Glagolitic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Goth]],[CODE[206]],,Gothic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Grek]],[CODE[200]],,Greek,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Gujr]],[CODE[320]],,Gujarati,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Guru]],[CODE[310]],,Gurmukhi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hang]],[CODE[286]],,"Hangul (Hang&#365;l, Hangeul)",2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hani]],[CODE[500]],,"Han (Hanzi, Kanji, Hanja)",2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Hani-CN-simp]]]],,[[簡体字]] ([[中共]])
,[CODE(SCRIPT)[[[Hani-kambun]]]],,[[漢文]]
,[CODE(SCRIPT)[[[Hani-kambun-JP]]]],,[[和様漢文]]
,[CODE(SCRIPT)[[[Hani-kangxi]]]],,[[康煕字典体]]
,[CODE(SCRIPT)[[[Hani-trad]]]],,[[伝統字]] ([[繁体字]]),Han (Simplified variant),時代遅れ ->[CODE(SCRIPT)[Hant]]
,[CODE(SCRIPT)[Hano]],[CODE[371]],,Hanunoo (Hanun&#243;o),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hans]],[CODE[501]],,Han (Simplified variant),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hant]],[CODE[502]],,Han (Traditional variant),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hebr]],[CODE[125]],,Hebrew,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hira]],[CODE[410]],,Hiragana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hmng]],[CODE[450]],,Pahawh Hmong,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hrkt]],[CODE[412]],,(alias for Hiragana + Katakana),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hung]],[CODE[176]],,Old Hungarian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Inds]],[CODE[610]],,Indus (Harappan),2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[inherit]]]],,継承
,[CODE(SCRIPT)[Ital]],[CODE[210]],,"Old Italic (Etruscan, Oscan, etc.)",2004-05-29 ISO 登録
,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字
,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]-[VAR[YYYY]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ([VAR[YYYY]] 年に改訂された教育漢字の表)
,[CODE(SCRIPT)[Jpan-JP-jouyou-gendai]],,日本語文字/常用漢字表 (1981年)・現代仮名遣い
,[CODE(SCRIPT)[Jpan-JP-touyou-gendai]],,日本語文字/当用漢字表・現代仮名遣い
,[CODE(SCRIPT)[Jpan-kambun]],,漢文 (書き下し文)
,[CODE(SCRIPT)[[[Jpan-kouki]]]],,[[いわゆる康煕字典体]]
,[CODE(SCRIPT)[Jpan-old]],,日本語文字/旧字旧仮名,,時代遅れ ->[CODE(SCRIPT)[Jpan-trad]]
,[CODE(SCRIPT)[Jpan-old-kana]],,日本語文字/歴史的仮名遣
,[CODE(SCRIPT)[Jpan-trad]],,日本語文字/旧字旧仮名
,[CODE(SCRIPT)[Java]],[CODE[361]],,Javanese,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Kali]],[CODE[357]],,Kayah Li,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Kana]],[CODE[411]],,Katakana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Kana-ainu]]]],,片仮名/アイヌ語
,[CODE(SCRIPT)[Khar]],[CODE[305]],,Kharoshthi,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Khmr]],[CODE[355]],,Khmer,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Knda]],[CODE[345]],,Kannada,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Laoo]],[CODE[356]],,Lao,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latf]],[CODE[217]],,Latin (Fraktur variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latg]],[CODE[216]],,Latin (Gaelic variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latn]],[CODE[215]],,Latin,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Latn-ainu]],,ラテン文字/アイヌ語
,[CODE(SCRIPT)[[[Latn-ja]],,羅馬字
,[CODE(SCRIPT)[[[Latn-ja-hebon]],,ヘボン式羅馬字
,[CODE(SCRIPT)[[[Latn-ja-nihon]],,日本式羅馬字
,[CODE(SCRIPT)[Lepc]],[CODE[335]],,Lepcha (R&#243;ng),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Limb]],[CODE[336]],,Limbu,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Lina]],[CODE[400]],,Linear A,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Linb]],[CODE[401]],,Linear B,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Mand]],[CODE[140]],,Mandaean,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Maya]],[CODE[090]],,Mayan hieroglyphs,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mero]],[CODE[100]],,Meroitic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mlym]],[CODE[347]],,Malayalam,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mong]],[CODE[145]],,Mongolian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mymr]],[CODE[350]],,Myanmar (Burmese),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Nkoo]],[CODE[165]],,N’Ko,2004-10-25 ISO 登録
,[CODE(SCRIPT)[[[none]]]],,指定なし
,[CODE(SCRIPT)[Ogam]],[CODE[212]],,Ogham,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Orkh]],[CODE[175]],,Orkhon,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Orya]],[CODE[327]],,Oriya,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Osma]],[CODE[260]],,Osmanya,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Perm]],[CODE[227]],,Old Permic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Phag]],[CODE[331]],,Phags-pa,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Phnx]],[CODE[115]],,Phoenician,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Plrd]],[CODE[282]],,Pollard Phonetic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Qaaa]],[CODE[900]],,Reserved for private use (start),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Qabx]],[CODE[949]],,Reserved for private use (end),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Roro]],[CODE[620]],,Rongorongo,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Runr]],[CODE[211]],,Runic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sara]],[CODE[292]],,Sarati,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Shaw]],[CODE[281]],,Shavian (Shaw),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sinh]],[CODE[348]],,Sinhala,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sylo]],[CODE[316]],,Syloti Nagri,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Syrc]],[CODE[135]],,;Syriac,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syre]],[CODE[138]],,Syriac (Estrangelo variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syrj]],[CODE[137]],,Syriac (Western variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syrn]],[CODE[136]],,Syriac (Eastern variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tagb]],[CODE[373]],,Tagbanwa,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tale]],[CODE[353]],,Tai Le,2004-10-25 ISO 登録
,[CODE(SCRIPT)[Talu]],[CODE[354]],,New Tai Lue,2004-10-25 ISO 登録
,[CODE(SCRIPT)[Taml]],[CODE[346]],,Tamil,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Telu]],[CODE[340]],,Telugu,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Teng]],[CODE[290]],,Tengwar,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tfng]],[CODE[120]],,Tifinagh (Berber),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tglg]],[CODE[370]],,Tagalog,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Thaa]],[CODE[170]],,Thaana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Thai]],[CODE[352]],,Thai,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tibt]],[CODE[330]],,Tibetan,004-05-01 ISO 登録
,[CODE(SCRIPT)[Ugar]],[CODE[040]],,Ugaritic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Vaii]],[CODE[470]],,Vai,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Visp]],[CODE[280]],,Visible Speech,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Xpeo]],[CODE[030]],,Old Persian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Xsux]],[CODE[020]],,Cuneiform,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Yiii]],[CODE[460]],,Yi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Zxxx]],[CODE[997]],,Code for unwritten languages,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Zyyy]],[CODE[998]],,Code for undetermined script,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Zzzz]],[CODE[999]],,Code for uncoded script,2004-05-01 ISO 登録

[[#form:'%text(lavel=>札,id=>tag); %text(label=>名,id=>langname); %text(id=>src,label=>状態,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',[CODE(SCRIPT)[[[%text(source=>tag);]]]]	,%text(source=>langname);	,,%text(source=>src);	,%text(source=>comment);']]
*言語札との併用

[19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。
-[CODE(LANG)[ja-JP]]+[CODE(SCRIPT)[Hira]] (日本語(日本)/平仮名)
-[CODE(LANG)[ja-old]]; script=[CODE(SCRIPT)[Jpan-old]] (日本語古語/旧字旧仮名)

[20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14)
が、単なる用字系の混在の指定方法はプロトコルによる。例:
-<foo lang='[CODE(LANG)[ja]]; script=[CODE(SCRIPT)[Jpan]]'>日本語のかな漢字混じり文。</foo>
-<foo lang='[CODE(LANG)[en]]; script="[CODE(SCRIPT)[Latn]],[CODE(SCRIPT)[Kana]]"'>[RUBY[English] [イングリッシュ]]</foo>

- [21] >>20 普通ある文字が同時に2つ以上の用字系に属すことはないから、マーク付け言語なら要素を細分化することで対応は出来ますがな。
- [24] >>19 [CODE(SCRIPT)[Jpan-classic]] 又は [CODE(SCRIPT)[Jpan-trad]] が良いと思われ

* 関連

[26] 
他にも[[用字系]]の符号体系がいくつもあります。
[SEE[ [[用字系]] ]]

*メモ
-[17] >>16 なんか無理があるなあ。
- [22] 内容折衝で Accept-Language: [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Japn-JP-educate-2]]"; q=1, [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Hira]]"; q=0.9, [CODE(LANG)[ja]]; q=0.8 とか出来たらいいよなぁ。

-[21] しかし ISO 15924 の WG の日本代表団 (いるんだよな?)
は [CODE(SCRIPT)[Kana]] = [CODE(SCRIPT)[Kata]] + [CODE(SCRIPT)[Hira]]
とかにすればよかったのに、
[CODE(SCRIPT)[Hrkt]] = [CODE(SCRIPT)[Kana]] + [CODE(SCRIPT)[Hira]]
にさせてしまうなんて、何考えてるんだ?
- [23] とりあえず、今の[[言語札]]の規格・実装で使うために、 [CODE[[VAR[言語札]]-script-[VAR[用字系札]]]] とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。
- [25] 「[[康煕字典体]]」 [CODE(SCRIPT)[Hani-kangxi]], 「[[いわゆる康煕字典体]]」 [CODE(SCRIPT)[Hani-kouki]] なんてどうでしょう。後者の日本用字系版 [CODE(SCRIPT)[Jpan-kouki]] は明治時代の出版物の用字系とか。
- [27] >>22 でも独自拡張なので遠慮して [CODE[x-script]] にしておいたほうが。