/
446.txt
423 lines (330 loc) · 15.2 KB
/
446.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
[5]
[[中文]] ([[中国語]]) を表す[[言語タグ]]は [DFN[[CODE[zh]]]] です。
* 繁体字中文
[3]
[[台湾華語]]には[[言語タグ]]
[DFN[[CODE[zh-TW]]]]
が使われます。
[4]
[[香港]]の[[繁体字]]表記[[中文]]には[[言語タグ]]
[DFN[[CODE[zh-HK]]]],
[[澳門]]の[[繁体字]]表記[[中文]]には[[言語タグ]]
[DFN[[CODE[zh-MO]]]]
が使われます。
[6]
[[繁体字]]表記の[[中文]]全般を表す[[言語タグ]] [DFN[[CODE[zh-Hant]]]]
が使われることもあります。
[28]
[[伝統字]]と明示した[[台湾華語]]を表す[[言語タグ]] [DFN[[CODE[zh-Hant-TW]]]]
が使われることもあります。
[SRC[>>12, >>64]]
[54]
[[繁体字]]と明示した[[香港]]の[[中文]]を表す[[言語タグ]]
[DFN[[CODE[zh-Hant-HK]]]]
が使われることもあります。
[SRC[>>52, >>12, >>64]]
[68]
[[繁体字]]と明示した[[澳門]]の[[中文]]を表す[[言語タグ]]
[DFN[[CODE[zh-Hant-MO]]]]
が使われることもあります。
[SRC[>>12, >>64]]
* 簡体字中文
[1]
[[中華人民共和国]]の[[簡体字]]表記[[中文]]には[[言語タグ]]
[DFN[[CODE[zh-CN]]]]
が使われます。
[2]
[[マレーシア]]の[[簡体字]]表記[[中文]]には[[言語タグ]]
[DFN[[CODE[zh-MY]]]],
[[シンガポール]]の[[簡体字]]表記[[中文]]には[[言語タグ]]
[DFN[[CODE[zh-SG]]]]
が使われます。
[7]
[[簡体字]]表記の[[中文]]全般を表す[[言語タグ]] [DFN[[CODE[zh-Hans]]]]
が使われることがあります。
[29]
[[簡体字]]と明示した[[中華人民共和国]]の[[中文]]を表す[[言語タグ]]
[DFN[[CODE[zh-Hans-CN]]]]
が使われることがあります。
[SRC[>>12, >>64]]
[66]
[[簡体字]]と明示した[[シンガポール]]の[[中文]]を表す[[言語タグ]]
[DFN[[CODE[zh-Hans-SG]]]]
が使われることがあります。
[SRC[>>12, >>64]]
[67]
[[簡体字]]と明示した[[マレーシア]]の[[中文]]を表す[[言語タグ]]
[DFN[[CODE[zh-Hans-MY]]]]
が使われることがあります。
[SRC[>>12]]
* 古典中文
[10]
古典中文を表す[[言語タグ]]は [DFN[[CODE[lzh]]]] です。
[13]
[CODE[lzh]] はたまに使われています。
[SRC[>>9]]
[14]
特に区別の必要ないとき [CODE[zh]] が使われることもあります。
;;
[17]
[CITE[Wikipedia]] の[[文言]]版は[[サブドメイン]]に [CODE[zh-classical]]
を使っています。この部分は[[言語タグ]]のことが多いですが、
[CODE[zh-classical]] は[[言語タグ]]ではありません。
[SRC[>>8]]
[18]
古典中文、いわゆる[[漢文]]の[[言語タグ]]は実は難題です。
[[漢文]]は前近代[[東アジア]]の共通言語だったため、
各国で様々に受容されていて、必ずしも「古典中文」という1つの[[言語]]ではなく、
各地の[[言語]]とも融合しています。
[19]
例えば[[現代日本]]でも学校教育で学習する[[訓読文]]は、
古典中文である[[白文]]に[[返り点]]等を付加して[[日本語]]として読めるようにしたものです。
[[書き下し文]]は[[訓読文]]を機械的に変形して[[日本語]]により近づけたものです。
これらは[[日本語]]であるともいえますし、そうとは断言できないともいえます。
[20]
また、前近代日本で非常に幅広く用いられた[[変体漢文]]は、
古典中文を模して大陸の母語話者の書く文章に近い形に整えられたものもあれば、
[[仮名]]が多く混じって[[日本語]]的性質が相当に強いものまで、
様々な形態のものが知られています。
[23]
[[訓点]]のない[[白文]]、しかも古代[[支那]]で書かれた文章でも、
現代においては表記面で[[国]]によって差が生じています。
[[台湾]]では[[康熙字典体]]に近い[[伝統字]]で印刷され、
[[中華人民共和国]]では[[簡体字]]または[[新字形]]の[[繁体字]]で印刷され、
[[日本]]では[[新字体]]で印刷されます。
表面的な[[字体]]の差に過ぎないとはいっても、
[CH[芸]]や[CH[机]]や[CH[弁]]や[CH[着]]のように[[国]]・[[言語]]ごとに[[字種]]の区切り方に変化が生じているところでは、
現代の[[国]]・[[言語]]に引きづられて[[テキスト]]が変化することになります。
[24]
従って各「[[言語]][VAR[X]]の文脈内に置かれた[[漢文]]」はその[[言語]][VAR[X]]の文章を構成する一部であるから、
「漢文」という独立した[[言語]]の文章が[[言語]][VAR[X]]の文章内に[[埋め込まれている][言語の多重構造]]のではなく、
その[[言語]][VAR[X]]の一部を構成しているのだという考え方も成立します。
[25]
[[日本語]]としての[[漢文]]の[[言語タグ]]については、[[日本語言語タグ]]を参照。
[65]
[DFN[[CODE[lzh-CN]]]]
が使われることがあります。
[SRC[>>64]]
[REFS[
- [8]
[CITE@lzh[維基大典]], [TIME[2024-04-02T10:48:14.000Z]], [TIME[2024-04-04T12:27:48.894Z]] <https://zh-classical.wikipedia.org/wiki/%E7%B6%AD%E5%9F%BA%E5%A4%A7%E5%85%B8:%E5%8D%B7%E9%A6%96>
- [9]
[CITE@ja[Template:Lang-lzh - Wikipedia]], [TIME[2024-03-20T15:21:19.000Z]], [TIME[2024-04-04T12:16:12.387Z]] <https://ja.wikipedia.org/wiki/Template:Lang-lzh>
]REFS]
-*-*-
[26]
[CITE@zh[Category:[[文言文]] - 维基词典,自由的多语言词典]], [TIME[2024-04-03T14:36:44.000Z]], [TIME[2024-04-04T12:49:26.388Z]] <https://zh.wiktionary.org/wiki/Category:%E6%96%87%E8%A8%80%E6%96%87>
[27] >>26 にはこれが何なのか説明がなくよくわかりませんが、
[[言語タグ]]風の識別子が付けられた分類が示されています。
>
[PRE[
文言文 (lzh)
├──── 前古典漢語 (lzh-pre) E
├───┬ 官話漢文 (lzh-cmn) E
│ └──── 臺灣漢文 (lzh-cmn-TW) E
├──── 廣東漢文 (lzh-yue) E
├──── 朝鮮漢文 (lzh-KO) E
├──── 漢文 (lzh-lit) E
├──── 臺山漢文 (lzh-tai) E
├──── 詞 (lzh-cii) E
└──── 越南漢文 (lzh-VI) E
]PRE]
* 地域言語
[50]
規格が二転三転したこともあって過去にはいろいろな[[言語タグ]]がありました。
- [32] [[厦門語]]: [DFN[[CODE[zh-amoy]]]],
[DFN[[CODE[zho-amoy]]]],
[DFN[[CODE[chi-amoy]]]]
- [33] [[広東語]]:
[DFN[[CODE[zh-canton]]]],
[DFN[[CODE[zho-canton]]]],
[DFN[[CODE[chi-canton]]]]
- [34]
[DFN[[CODE[zh-chaozhou]]]],
[DFN[[CODE[zho-chaozhou]]]],
[DFN[[CODE[chi-chaozhou]]]]
- [36]
[DFN[[CODE[zh-fukien]]]],
[DFN[[CODE[zho-fukien]]]],
[DFN[[CODE[chi-fukien]]]]
- [37]
[DFN[[CODE[zh-fuzhou]]]],
[DFN[[CODE[zho-fuzhou]]]],
[DFN[[CODE[chi-fuzhou]]]]
- [38]
[DFN[[CODE[zh-gan]]]]
- [39]
[DFN[[CODE[zh-guoyu]]]]
- [40]
[DFN[[CODE[zh-hainan]]]],
[DFN[[CODE[zho-hainan]]]],
[DFN[[CODE[chi-hainan]]]]
- [41] [[客家語]]
[DFN[[CODE[zh-hakka]]]],
[DFN[[CODE[zho-hakka]]]],
[DFN[[CODE[i-hak]]]],
[DFN[[CODE[chi-hakka]]]]
- [42] [[官話方言]]
[DFN[[CODE[zh-mandarin]]]],
-- [43] [[簡体字]]
[DFN[[CODE[zh-mandarin-smpl]]]],
[DFN[[CODE[zho-mandarin-smpl]]]],
[DFN[[CODE[chi-mandarin-smpl]]]]
-- [44] [[伝統字]]
[DFN[[CODE[zh-mandarin-trad]]]],
[DFN[[CODE[zho-mandarin-trad]]]],
[DFN[[CODE[chi-mandarin-trad]]]]
- [45]
[DFN[[CODE[zh-min]]]],
[DFN[[CODE[zh-min-nan]]]]
- [46]
[DFN[[CODE[zh-wuu]]]]
- [35]
[DFN[[CODE[zh-CN-wu]]]],
[DFN[[CODE[zho-CN-wu]]]],
[DFN[[CODE[chi-CN-wu]]]]
- [47]
[DFN[[CODE[zh-xiang]]]]
- [48]
[DFN[[CODE[zh-yue]]]]
- [49]
[DFN[[CODE[zh-yunnan]]]],
[DFN[[CODE[zho-yunnan]]]],
[DFN[[CODE[chi-yunnan]]]]
- [51] [DFN[[CODE[x-Nise-Chinese]]]] [SRC[>>112]]
[REFS[
[FIG(quote)[
[FIGCAPTION[
[112] [CITE@ja[<img longdesc=...>について]]
([TIME[2010-11-17 21:33:48 +09:00]] 版)
<http://deztec.jp/x/10/faireal/d11223_2.xml>
]FIGCAPTION]
> <img src="img/niseharuna_nisechinese.png"
> xml:lang="x-Nise-Chinese"
> alt="可可逝世!" longdesc="../../../image/d-niseharuna.htm"
> width="500" height="275" />
]FIG]
]REFS]
-*-*-
[56]
[[IETF言語タグ]]の[[プロファイル]]規格のうち
[[LMT]]
と
[[EIDR language code]]
はこれらの表現のどれを選ぶか(だけ)が違っています。
-*-*-
[55]
[[ISO 639-6]] にもいくつか4文字[[符号]]が用意されていました。
* ラテン文字表記
[53]
[[中文ローマ字]]表記を[[言語タグ]]
[DFN[[CODE[zh-Latn]]]]
で表すことがあります。
[SRC[>>52]]
[31]
>>30 では[[言語タグ]] [DFN[[CODE[zh-Latn-x-pinyin]]]] が[[拼音]]表記用として例示されています。
[REFS[
- [30] [CITE[[[TEI]] TEIガイドラインP5: vi 言語と文字集合]], [[edited by Lou Burnard and Syd Bauman]], [TIME[2017-08-31T04:13:07.000Z]], [TIME[2024-04-04T12:53:29.577Z]] <https://docsci.infon.org/stack/P5JA/CH.html>
[FIG(quote)[
[FIGCAPTION[
[52] [CITE@ja-JP[地図作成 - 地図作成 - [[HERE]] Developer]], [TIME[2023-10-20T10:32:01.000Z]], [TIME[2023-11-20T06:59:16.374Z]] <https://jp.developer.here.com/documentation/geojson-map-components-cartography/data_spec_guide/common/globals.html#languagebcp47>
]FIGCAPTION]
>[SNIP[]] "zh" 、 "zh-CN" 、 "zh-hans" 、 "zh-Hans-CN" 、 "zh-Hant" 、 "zh-Hant-HK" 、 "zh-Hant-TW" 、 "zh-HK" 、 "zh-Latn" 、 "zh-TW" 、 "zxx-x-iat"
]FIG]
]REFS]
[58]
[CITE@ja[Multilingual names - OpenStreetMap Wiki]], [TIME[2024-04-05T13:27:21.000Z]] <https://wiki.openstreetmap.org/wiki/Multilingual_names#China>
>
,*Romanization/Transliteration system ,*defined code
,Pinyin romanization ,zh-Latn-pinyin
,Tongyong Pinyin romanization ,zh-Latn-tongyong
,Wade-Giles romanization ,zh-Latn-wadegile
,Jyutping Cantonese Romanization ,yue-Latn-jyutping
>bo-Latn-pinyin
> bo-Latn-wylie
>mnc-Latn-moellendorff
[59] [CITE@ja[Multilingual names - OpenStreetMap Wiki]], [TIME[2024-04-05T13:35:57.000Z]] <https://wiki.openstreetmap.org/wiki/Multilingual_names#Taiwan>
>[SNIP[]]Or use name:zh-Latn-pinyin=*, name:zh-Latn-tongyong=*, name:zh-Latn-wadegile=*[SNIP[]]
* 注音符号表記
[61]
[[注音字母]]表記の[[中文]]の[[言語タグ]] [DFN[[CODE[zh-Bopo]]]] があります。
[SRC[>>60]]
[62]
[[漢字]]および[[注音字母]]表記の[[中文]]の[[言語タグ]] [DFN[[CODE[zh-Hanb]]]]
があります。
[SRC[>>60]]
;; [63] [CODE[Bopo]] はともかく [CODE[Hanb]] が必要な場面があるのかは謎です。
[CODE[Jpan]] 式の[[仮名漢字混じり]] (文中で[[仮名]]と[[漢字]]を使い分ける)
ではなく[[ルビ]]付き ([[漢字]]の[[右][右ルビ]]に[[注音符号]]を明記する)
を表したいときなら [CODE[Hanb]] が便利でしょうか?
[REFS[
- [60]
[CITE@en[Diff - f3afe92^! - platform/frameworks/minikin - Git at Google]], [TIME[2024-04-16T12:27:34.000Z]] <https://android.googlesource.com/platform/frameworks/minikin/+/f3afe92%5E%21/>
]REFS]
* 中文版[CITE[Wikipedia]]の中国語
[11]
[CITE[維基百科]]
([CITE[Wikipedia]])
は[[中文]]版として1つにまとまっていますが、各ページに
- 大陆简体 [CODE[zh-cn]]
- 香港繁體 [CODE[zh-hk]]
- 澳門繁體 [CODE[zh-mo]]
- 大马简体 [CODE[zh-my]]
- 新加坡简体 [CODE[zh-sg]]
- 臺灣正體 [CODE[zh-tw]]
... の6バージョンの切り替えがついていて、同じ記事が変換して表示されるようになっています。
[12]
ソースを見ると、
[PRE[
<link rel="alternate" hreflang="zh" href="/zh/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans" href="/zh-hans/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant" href="/zh-hant/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-CN" href="/zh-cn/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-HK" href="/zh-hk/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-MO" href="/zh-mo/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-MY" href="/zh-my/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hans-SG" href="/zh-sg/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="zh-Hant-TW" href="/zh-tw/Wikipedia:%E9%A6%96%E9%A1%B5"/>
<link rel="alternate" hreflang="x-default" href="/wiki/Wikipedia:%E9%A6%96%E9%A1%B5"/>
]PRE]
... とそれ以外にも地域指定なしの URL が存在しています。 hans, hant を選ぶと、
地域なしの简体、繁體のバージョンが表示されます。
(地域指定ありのバージョンとの違いは不明。)
[16] [CITE@ja[中国語版ウィキペディア - [[Wikipedia]]]]
([TIME[2015-04-26 21:40:41 +09:00]] 版)
<http://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E7%89%88%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%9A%E3%83%87%E3%82%A3%E3%82%A2#.E7.B9.81.E4.BD.93.E5.AD.97.E3.81.A8.E7.B0.A1.E4.BD.93.E5.AD.97.E3.81.AE.E8.87.AA.E5.8B.95.E5.A4.89.E6.8F.9B>
[15] [CITE@en[Automatic conversion between simplified and traditional Chinese - Meta]]
([TIME[2015-03-27 11:12:22 +09:00]] 版)
<http://meta.wikimedia.org/wiki/Automatic_conversion_between_simplified_and_traditional_Chinese>
* 一致判定
[57]
同じ意味の[[言語タグ]]がたくさんあるので、[[一致]]判定演算はかなり複雑になります。
[SEE[ [[言語タグの一致]] ]]
* メモ
[21]
[CITE@ja[ポケモンWiki:会議室/議事録/2019 - ポケモンWiki]], [TIME[2024-02-10T15:50:08.000Z]], [TIME[2024-04-03T15:07:22.512Z]] <https://wiki.xn--rckteqa2e.com/wiki/%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3Wiki:%E4%BC%9A%E8%AD%B0%E5%AE%A4/%E8%AD%B0%E4%BA%8B%E9%8C%B2/2019#%E3%83%9D%E3%82%B1%E3%83%A2%E3%83%B3%E3%81%AE%E4%B8%AD%E5%9B%BD%E8%AA%9E%E5%90%8D%E3%81%AE%E8%A1%A8%E7%A4%BA>
[22]
[CITE@ja[中国語ウェブサイトの言語コード指定(lang属性) | 国際ウェブマーケティングのエクスポート・ジャパン]], [TIME[2024-04-03T15:08:16.000Z]] <https://www.export-japan.co.jp/blog/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E8%A8%80%E8%AA%9E%E3%82%B3%E3%83%BC%E3%83%89%E6%8C%87%E5%AE%9A%EF%BC%88lang%E5%B1%9E%E6%80%A7%EF%BC%89/>
[FIG(quote)[
[FIGCAPTION[
[64]
[CITE@ja-jp[イマーシブ リーダーの言語サポート - Azure AI services | [[Microsoft]] Learn]], [[rwallerms]], [TIME[2024-04-16T12:33:37.000Z]] <https://learn.microsoft.com/ja-jp/azure/ai-services/immersive-reader/language-support>
]FIGCAPTION]
>
,Chinese ,zh
,中国語 (中国) ,zh-CN
,中国語 (香港特別行政区) ,zh-HK
,中国語 (中華人民共和国マカオ特別行政区) ,zh-MO
,中国語 (シンガポール) ,zh-SG
,中国語 (台湾) ,zh-TW
,簡体中国語 ,zh-Hans
,簡体字中国語 (中国) ,zh-Hans-CN
,簡体字中国語 (シンガポール) ,zh-Hans-SG
,中国語 (繁体字) ,zh-Hant
,繁体字中国語 (中国) ,zh-Hant-CN
,繁体中国語 (香港特別行政区) ,zh-Hant-HK
,繁体中国語 (マカオ特別行政区) ,zh-Hant-MO
,繁体字中国語 (台湾) ,zh-Hant-TW
,中国語 (文語) ,lzh
,中国語 (文語、中国) ,lzh-CN
]FIG]