-
Notifications
You must be signed in to change notification settings - Fork 4
/
819.txt
236 lines (218 loc) · 16 KB
/
819.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
[1] [RUBYB[用字系][Script]]を同定するための札、
[DFN[[RUBYB[用字系札][script tag]]]]とかいうものです。
[[RFC 3036]] の[[言語札]]や [[ISO 3166]] の国名符号・
地域符号のように、書字体系を識別します。ここで、
[Q[用字(系)]]あるいは[Q[書字体系]]とは、
広く[Q[[[文字]]・[[記号]]の使い方の体系]]と緩く定義します。
(その意味では [Q[script]] というより [Q[orthography]]
に近いかもしれませんが、そうすると規範の存在を示唆するようなニュアンスがあります。)
*構文
[2] [[RFC 3066]] の規定する[[言語札]]のように、複数の部分札を
[CODE(char)[HYPHEN-MINUS]] で結んだものを用字系札とします。
大文字・小文字の区別は一切しません。
-[4] [CODE(ABNF)[[DFN[script-tag]] := primary-subtag *("-" subtag)]]
-[6] [CODE(ABNF)[[DFN[primary-subtag]] := 1*8ALPHA]]
-[5] [CODE(ABNF)[[DFN[subtag]] := 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。]]
-[3] 第1部分札 ([CODE(ABNF)[primary-subtag]]) は、
次のように規定します。
-- 4文字であれば、原則として [[ISO 15924]]
による4文字ラテン文字用字符号とします。
[WEAK[(用字系札の大文字・小文字は区別しませんが、特に理由がない場合、 ISO 15924 で定義された名前は最初の1文字のみ大文字で記述することを'''推奨'''します。)]]
---[30] 例外として、 [CODE(SCRIPT)[auto]],
[CODE(SCRIPT)[none]] は [[XSL-FO]] と同じように定義します。
--- [CODE(SCRIPT)[[[Qaaa]]]]〜[CODE(SCRIPT)[[[Qabx]]]] (私用)
は使用しません。
---[7] [CODE(SCRIPT)[[[Zzzz]]]] (未符号化用字系)
は原則として使用しては'''なりません'''。
-- [CODE(SCRIPT)[inherit]] は XSL-FO と同じように定義します。
-- 第1部分札 [CODE(SCRIPT)[s]] は、 ISO 15924
で割り当てられていない用字系のために使います。
-- 第1部分札 [CODE(SCRIPT)[x]] は、
私用のために使って'''構いません'''。公式な意味は割り当てません。
-- このほかすべての第1部分札は、将来の拡張のために予約します。
-[8] 第1部分札が ISO 16924 4文字符号の場合における第2部分札、
および第1部分札が [CODE(SCRIPT)[s]] である場合の第3部分札は、
次の通り規定します。
--[18] 第1部分札が4文字符号の場合で、第2部分札が1文字の場合、
>>3 と同じとします。
--[9] 2文字の部分札の場合、 [[ISO 639]] の2文字[[言語符号]]または
[[ISO 3166]] の[[国名符号]]のいずれかとします。
[WEAK[(用字系札の大文字・小文字は区別しませんが、前者は小文字、後者は大文字とすることを推奨します。)]]
--[31] 3文字以上の部分札の場合、 ISO 639
の3文字言語符号とすることを'''推奨'''します。
但し、 ISO 639 の2文字符号が定義されている場合、
3文字符号を使用しては'''なりません'''。
--[10]3文字以上の部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、
互換性のため、''ここ''に登録することを推奨します。
-[32] 第1部分札が [CODE(SCRIPT)[s]] の場合、
第2部分札は''ここ''で規定されているものとします。
- [11] 特に規定のない部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、
互換性のため、''ここ''に登録することを推奨します。
[[#comment]]
*意味
-[12] 用字系を識別する。例: [CODE(SCRIPT)[Latn]] ([[ラテン文字]])
-[13] 小札を使って[[正書法]]・転写法の類も含めることが出来る。
例: [CODE(SCRIPT)[Latn-ja-hebon]] (ヘボン式ローマ字)
-[14] 複数の用字系の組み合わせで一つの体系として機能するものも ISO 15924
に倣って一つの用字系とみなす。例: [CODE(SCRIPT)[Jpan]] (日本語文字 = 漢字 + 仮名)
- [28] [WEAK[2003-10-24 17:29:30 +00:00]] ''[[矧]]'': しん
- [29] [WEAK[2003-10-24 17:33:11 +00:00]] ''[[矧]]'':
[[#comment]]
*値
[15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。
[16]
,用字系札 ,ISO 15924 数値符号,用字名 (日本語),用字名 (英語),状態
,[CODE(SCRIPT)[Arab]],[CODE[160]],,Arabic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Armn]],[CODE[230]],,Armenian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[auto]]]],,自動
,[CODE(SCRIPT)[Bali]],[CODE[360]],,Balinese,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Batk]],[CODE[365]],,Batak,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Beng]],[CODE[325]],,Bengali,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Blis]],[CODE[550]],,Blissymbols,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Bopo]],[CODE[285]],,Bopomofo,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Brah]],[CODE[300]],,Brahmi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Brai]],[CODE[570]],,Braille,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Brai-ja]]]],,日本語用6点点字
,[CODE(SCRIPT)[Bugi]],[CODE[367]],,Buginese,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Buhd]],[CODE[372]],,Buhid,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cans]],[CODE[440]],,Unified Canadian Aboriginal Syllabics,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Cham]],[CODE[358]],,Cham,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cher]],[CODE[445]],,Cherokee,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cirt]],[CODE[291]],,Cirth,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Copt]],[CODE[204]],,Coptic,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Cprt]],[CODE[403]],,Cypriot,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cyrl]],[CODE[220]],,Cyrillic;2004-05-01 ISO 登録
,[CODE(SCRIPT)[Cyrs]],[CODE[221]],,Cyrillic (Old Church Slavonic variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Deva]],[CODE[315]],,Devanagari (Nagari),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Dsrt]],[CODE[250]],,Deseret (Mormon),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyd]],[CODE[070]],,Egyptian demotic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyh]],[CODE[060]],,Egyptian hieratic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Egyp]],[CODE[050]],,Egyptian hieroglyphs,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Ethi]],[CODE[430]],,Ethiopic (Ge‘ez),2004-10-25 ISO 登録
,[CODE(SCRIPT)[Geor]],[CODE[240]],,Georgian (Mkhedruli),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Geok]],[CODE[241]],,Khutsuri (Asomtavruli and Khutsuri),2004-10-25 ISO 登録
,[CODE(SCRIPT)[Glag]],[CODE[225]],,Glagolitic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Goth]],[CODE[206]],,Gothic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Grek]],[CODE[200]],,Greek,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Gujr]],[CODE[320]],,Gujarati,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Guru]],[CODE[310]],,Gurmukhi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hang]],[CODE[286]],,"Hangul (Hangŭl, Hangeul)",2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hani]],[CODE[500]],,"Han (Hanzi, Kanji, Hanja)",2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Hani-CN-simp]]]],,[[簡体字]] ([[中共]])
,[CODE(SCRIPT)[[[Hani-kambun]]]],,[[漢文]]
,[CODE(SCRIPT)[[[Hani-kambun-JP]]]],,[[和様漢文]]
,[CODE(SCRIPT)[[[Hani-kangxi]]]],,[[康煕字典体]]
,[CODE(SCRIPT)[[[Hani-trad]]]],,[[伝統字]] ([[繁体字]]),Han (Simplified variant),時代遅れ ->[CODE(SCRIPT)[Hant]]
,[CODE(SCRIPT)[Hano]],[CODE[371]],,Hanunoo (Hanunóo),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hans]],[CODE[501]],,Han (Simplified variant),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hant]],[CODE[502]],,Han (Traditional variant),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Hebr]],[CODE[125]],,Hebrew,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hira]],[CODE[410]],,Hiragana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hmng]],[CODE[450]],,Pahawh Hmong,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hrkt]],[CODE[412]],,(alias for Hiragana + Katakana),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Hung]],[CODE[176]],,Old Hungarian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Inds]],[CODE[610]],,Indus (Harappan),2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[inherit]]]],,継承
,[CODE(SCRIPT)[Ital]],[CODE[210]],,"Old Italic (Etruscan, Oscan, etc.)",2004-05-29 ISO 登録
,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字
,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]-[VAR[YYYY]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ([VAR[YYYY]] 年に改訂された教育漢字の表)
,[CODE(SCRIPT)[Jpan-JP-jouyou-gendai]],,日本語文字/常用漢字表 (1981年)・現代仮名遣い
,[CODE(SCRIPT)[Jpan-JP-touyou-gendai]],,日本語文字/当用漢字表・現代仮名遣い
,[CODE(SCRIPT)[Jpan-kambun]],,漢文 (書き下し文)
,[CODE(SCRIPT)[[[Jpan-kouki]]]],,[[いわゆる康煕字典体]]
,[CODE(SCRIPT)[Jpan-old]],,日本語文字/旧字旧仮名,,時代遅れ ->[CODE(SCRIPT)[Jpan-trad]]
,[CODE(SCRIPT)[Jpan-old-kana]],,日本語文字/歴史的仮名遣
,[CODE(SCRIPT)[Jpan-trad]],,日本語文字/旧字旧仮名
,[CODE(SCRIPT)[Java]],[CODE[361]],,Javanese,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Kali]],[CODE[357]],,Kayah Li,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Kana]],[CODE[411]],,Katakana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Kana-ainu]]]],,片仮名/アイヌ語
,[CODE(SCRIPT)[Khar]],[CODE[305]],,Kharoshthi,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Khmr]],[CODE[355]],,Khmer,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Knda]],[CODE[345]],,Kannada,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Laoo]],[CODE[356]],,Lao,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latf]],[CODE[217]],,Latin (Fraktur variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latg]],[CODE[216]],,Latin (Gaelic variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Latn]],[CODE[215]],,Latin,2004-05-01 ISO 登録
,[CODE(SCRIPT)[[[Latn-ainu]],,ラテン文字/アイヌ語
,[CODE(SCRIPT)[[[Latn-ja]],,羅馬字
,[CODE(SCRIPT)[[[Latn-ja-hebon]],,ヘボン式羅馬字
,[CODE(SCRIPT)[[[Latn-ja-nihon]],,日本式羅馬字
,[CODE(SCRIPT)[Lepc]],[CODE[335]],,Lepcha (Róng),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Limb]],[CODE[336]],,Limbu,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Lina]],[CODE[400]],,Linear A,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Linb]],[CODE[401]],,Linear B,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Mand]],[CODE[140]],,Mandaean,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Maya]],[CODE[090]],,Mayan hieroglyphs,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mero]],[CODE[100]],,Meroitic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mlym]],[CODE[347]],,Malayalam,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mong]],[CODE[145]],,Mongolian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Mymr]],[CODE[350]],,Myanmar (Burmese),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Nkoo]],[CODE[165]],,N’Ko,2004-10-25 ISO 登録
,[CODE(SCRIPT)[[[none]]]],,指定なし
,[CODE(SCRIPT)[Ogam]],[CODE[212]],,Ogham,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Orkh]],[CODE[175]],,Orkhon,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Orya]],[CODE[327]],,Oriya,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Osma]],[CODE[260]],,Osmanya,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Perm]],[CODE[227]],,Old Permic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Phag]],[CODE[331]],,Phags-pa,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Phnx]],[CODE[115]],,Phoenician,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Plrd]],[CODE[282]],,Pollard Phonetic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Qaaa]],[CODE[900]],,Reserved for private use (start),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Qabx]],[CODE[949]],,Reserved for private use (end),2004-05-29 ISO 登録
,[CODE(SCRIPT)[Roro]],[CODE[620]],,Rongorongo,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Runr]],[CODE[211]],,Runic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sara]],[CODE[292]],,Sarati,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Shaw]],[CODE[281]],,Shavian (Shaw),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sinh]],[CODE[348]],,Sinhala,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Sylo]],[CODE[316]],,Syloti Nagri,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Syrc]],[CODE[135]],,;Syriac,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syre]],[CODE[138]],,Syriac (Estrangelo variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syrj]],[CODE[137]],,Syriac (Western variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Syrn]],[CODE[136]],,Syriac (Eastern variant),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tagb]],[CODE[373]],,Tagbanwa,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tale]],[CODE[353]],,Tai Le,2004-10-25 ISO 登録
,[CODE(SCRIPT)[Talu]],[CODE[354]],,New Tai Lue,2004-10-25 ISO 登録
,[CODE(SCRIPT)[Taml]],[CODE[346]],,Tamil,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Telu]],[CODE[340]],,Telugu,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Teng]],[CODE[290]],,Tengwar,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tfng]],[CODE[120]],,Tifinagh (Berber),2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tglg]],[CODE[370]],,Tagalog,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Thaa]],[CODE[170]],,Thaana,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Thai]],[CODE[352]],,Thai,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Tibt]],[CODE[330]],,Tibetan,004-05-01 ISO 登録
,[CODE(SCRIPT)[Ugar]],[CODE[040]],,Ugaritic,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Vaii]],[CODE[470]],,Vai,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Visp]],[CODE[280]],,Visible Speech,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Xpeo]],[CODE[030]],,Old Persian,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Xsux]],[CODE[020]],,Cuneiform,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Yiii]],[CODE[460]],,Yi,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Zxxx]],[CODE[997]],,Code for unwritten languages,2004-05-01 ISO 登録
,[CODE(SCRIPT)[Zyyy]],[CODE[998]],,Code for undetermined script,2004-05-29 ISO 登録
,[CODE(SCRIPT)[Zzzz]],[CODE[999]],,Code for uncoded script,2004-05-01 ISO 登録
[[#form:'%text(lavel=>札,id=>tag); %text(label=>名,id=>langname); %text(id=>src,label=>状態,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',[CODE(SCRIPT)[[[%text(source=>tag);]]]] ,%text(source=>langname); ,,%text(source=>src); ,%text(source=>comment);']]
*言語札との併用
[19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。
-[CODE(LANG)[ja-JP]]+[CODE(SCRIPT)[Hira]] (日本語(日本)/平仮名)
-[CODE(LANG)[ja-old]]; script=[CODE(SCRIPT)[Jpan-old]] (日本語古語/旧字旧仮名)
[20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14)
が、単なる用字系の混在の指定方法はプロトコルによる。例:
-<foo lang='[CODE(LANG)[ja]]; script=[CODE(SCRIPT)[Jpan]]'>日本語のかな漢字混じり文。</foo>
-<foo lang='[CODE(LANG)[en]]; script="[CODE(SCRIPT)[Latn]],[CODE(SCRIPT)[Kana]]"'>[RUBY[English] [イングリッシュ]]</foo>
- [21] >>20 普通ある文字が同時に2つ以上の用字系に属すことはないから、マーク付け言語なら要素を細分化することで対応は出来ますがな。
- [24] >>19 [CODE(SCRIPT)[Jpan-classic]] 又は [CODE(SCRIPT)[Jpan-trad]] が良いと思われ
* 関連
[26]
他にも[[用字系]]の符号体系がいくつもあります。
[SEE[ [[用字系]] ]]
*メモ
-[17] >>16 なんか無理があるなあ。
- [22] 内容折衝で Accept-Language: [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Japn-JP-educate-2]]"; q=1, [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Hira]]"; q=0.9, [CODE(LANG)[ja]]; q=0.8 とか出来たらいいよなぁ。
-[21] しかし ISO 15924 の WG の日本代表団 (いるんだよな?)
は [CODE(SCRIPT)[Kana]] = [CODE(SCRIPT)[Kata]] + [CODE(SCRIPT)[Hira]]
とかにすればよかったのに、
[CODE(SCRIPT)[Hrkt]] = [CODE(SCRIPT)[Kana]] + [CODE(SCRIPT)[Hira]]
にさせてしまうなんて、何考えてるんだ?
- [23] とりあえず、今の[[言語札]]の規格・実装で使うために、 [CODE[[VAR[言語札]]-script-[VAR[用字系札]]]] とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。
- [25] 「[[康煕字典体]]」 [CODE(SCRIPT)[Hani-kangxi]], 「[[いわゆる康煕字典体]]」 [CODE(SCRIPT)[Hani-kouki]] なんてどうでしょう。後者の日本用字系版 [CODE(SCRIPT)[Jpan-kouki]] は明治時代の出版物の用字系とか。
- [27] >>22 でも独自拡張なので遠慮して [CODE[x-script]] にしておいたほうが。