-
Notifications
You must be signed in to change notification settings - Fork 4
/
741.txt
765 lines (607 loc) · 26.7 KB
/
741.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
* TCVN 5773
[1]
[DFN[TCVN 5773:1993]]
[CITE[Information technology. Nom 16-bit standard coded set for information interchange]]。
[8]
[[TCVN 5773:1993]]
([DFN[NSCII]] - Nom Standard Code for Information Interchange [SRC[>>11]])
は、2357文字の[[字喃]]を含む[[符号化文字集合]]。
[9]
[[ハノイ]]の国立社会科学センター字喃研究所が中心となって制定されたらしい。
[[UCS]] [[CJK統合漢字]]の [[V]] 欄の [Q[0]] はこの規格の符号とされている。
[15]
[[Unicode Consortium]] の[[ウェブサイト]]で
[CITE[TCVN-NSCII Stack 1.0]]
という [[HyperCard]] [[スタック]]
([[カード型データベース]])
のファイルが配布されています。
[SRC[>>3]]
[16]
これが [[TCVN 5773]]
の文字データベースらしいのです [SRC[>>11]] が、
果たして今 [[HyperCard]] データベースを表示する方法があるのかどうか。
同じと思われるファイルが [[Internet Archive]]
にも所蔵されています [SRC[>>4]] が、
こちらもファイル変換されていないオリジナルで、内容は確認のしようがありません。
[17]
[[NSCII]] は16ビットの[[符号化文字集合]]。 [SRC[>>11]]
[18]
[[HyperCard]] には2357カードあって、
それが
[[NSCII]]
[[字喃]]と対応しているとのことです。 [SRC[>>11]]
[12]
[[ISO/IEC 10646]]‐1:1993 の [[BMP]] を基にして、
1775文字の字喃を (V+A000〜V+A6EE) 追加しています。 [SRC[>>1, >>11]]
その差分が [[BMP]] の既存の文字
([[CJK統合漢字]]のみ?)
と思われます。
[13]
字喃の典拠は Nguyen Quang Xy and Vu Van Kinh の [CITE[Tu dien chu Nom]]
(字喃辞典, Nom Dictionary; 1971年) だそうだ [SRC[>>1, >>11]]。
[30]
[TIME[1992-03-22]]に
[DFN[[CITE[Nôm Proper Code Table]]]]
([DFN[NPCT]])
がまとめられました。
[SRC[>>33]]
[34]
[[NPCT]] は [[ISO/IEC 10646]] と [[Unicode]] に対する追加要求として[[字喃]]を列挙したものでした。
N0001 から N2403 まで十進数が振られていました。
[[字形]]は手書き、その他も手書きの修正が入って、
N2401 と N2402 は手書きで追加されたものでした。
[SRC[>>33]]
[35]
このときの [[Unicode]] 向け説明資料に既に[[結合文字]]「个」の説明がある
[SRC[>>33 #page=4]]
のに注意したいです。これが [[Unicode]] に追加されるまで、
なぜかそれから二十年程要しました。
[SEE[ [[Vietnamese reading mark]] ]]
[38]
[TIME[1993-05-03]]に
TCVN/TC1 Subcommittee for Standardization of Nôm Codes
によって
[DFN[NPCT 2.0]]
が
Nôm Standard Codes for Information Interchange
の
Draft 1.0
([DFN[TCVN-NSCII-Draft-1.0]])
として採択されました。
[SRC[>>37]]
;; [39] 2.0 は未発見でウェブ上にあるか不明。
内外の専門家37人に配布されたとのこと [SRC[>>37]]。
[31]
[TIME[1993-08-22]]に改訂されて
[DFN[NPCT 2.1]]
となりました。
[SRC[>>37]]
そして [[NPCT]] V2.1 が
[[TCVN 5773:1993]]
となりました。
[SRC[>>26]]
[87]
[DFN[TCVN 5773-1993]] のごく一部のページが >>86 にあります。
[[英語]]で書かれているようですが、
原文なのでしょうか。それとも英訳版なのでしょうか。
[88] [[NPCT 2.1]] と同じように [CODE[U+]] / [CODE[V+]] と[[例示字形]]、
[[越南語国語表記]]が並んでいます。
[REFS[
- [86] [CITE[Proposal to Encode Two Vietnamese Alternate Reading Marks - 17373-viet-alt-reading-marks.pdf]], [TIME[2017-10-13T21:31:47.000Z]], [TIME[2022-11-09T12:39:37.183Z]] <https://www.unicode.org/L2/L2017/17373-viet-alt-reading-marks.pdf#page=10>
]REFS]
[41]
[[NPCT 2.1]]
は当時の
[[CJK統合漢字]]にあるものは [CODE[[[U+]][VAR[hhhh]]]]
の[[符号位置]]、
ないものは
[CODE[[[V+]][VAR[hhhh]]]]
を割り振っていました。
表の掲載順に、 [[CJK統合漢字]]を除いて連番になっていました。
[[文字]]は低品質の[[ビットマップフォント]]のようですが、
一応デジタルデータになっていました。
[SRC[>>26]]
[42]
个など2文字が[[結合マーク]]と明記されている
[SRC[>>26 #page=1]] ことがやはり注目されます。
[SEE[ [[Vietnamese reading mark]] ]]
[43]
2.0 と比べると符号やグリフの変更があったとする一覧があります。
[SRC[>>26]]
;; [40] [[NPCT 2.1]] の [[PDF]] [SRC[>>26]] は文字画像以外はテキストデータ。
おそらくワープロか何かの元データを後年になって [[PDF]] 化したものでしょう。
どの程度原形を保っているのか不明。
[19]
[[HyperCard]] カードには、
[[グリフ]],
[[Quoc ngu]] 表記 ([[TCVN-5712:1993]] 表現),
[[文字符号]]が表示されています。 [SRC[>>11]]
[20]
[[文字符号]]は、
[[Unicode]] の [CODE[[[U+]][VAR[hhhh]]]]
または独自の
[CODE[[[V+]][VARR[hhhh]]]]
です。
他の [ASIS[[[CJKV]]]] 規格にあれば、それも示されています。
[SRC[>>11]]
[59]
この [DFN[V+]] 符号は、 [[Unicode]] の [CODE[U+]] と一応区別はされていますが、
当時 [[Unicode]] の未割当領域だった
[ [CODE[U+A000]], [CODE[U+A6EE]] ]
に割り振って提案したものでした。
実際にはその後別の [[Unicode]] [[符号点]]に割り振られ、
[CODE[V+]] が使っていた領域は[[漢字]]ではないものが割り当てられています。
[SRC[>>26]]
;; [60] 他の事例は[[Unicode非互換割当]]参照
[14]
[TIME[西暦1998年][1998]]に誤りが見つかって修正要求が出された [SRC[>>2]]。
[21]
[[HyperCard]] データベースにその誤りが関係しているのか不明ですが、
ファイルの[[タイムスタンプ]]は[TIME[2001-02-27]]なので、
影響があれば修正後でしょうか。
[REFS[
-
[33]
[CITE[draft_npct_19920322.pdf]], [TIME[2008-12-03T22:04:43.000Z]], [TIME[2022-11-08T13:45:54.700Z]] <https://cs.nyu.edu/~nhan/draft_npct_19920322.pdf>
-
[37]
[CITE[npct-2.1.pdf]], [TIME[2001-08-22T13:54:44.000Z]], [TIME[2022-11-08T14:13:45.670Z]] <https://cs.nyu.edu/~nhan/npct-2.1.pdf>
-[1] ISO/IEC JTC1/[[SC2]]/WG2/[[IRG]] N403
-[2] ISO/IEC JTC1/[[SC2]]/WG2/IRG N451
-
[3] [CITE[Index of /Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN]], [TIME[2022-10-16T13:10:33.000Z]] <https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/>
--
[11]
[TIME[2001-02-27T18:50:00.000Z]], [TIME[2022-11-07T11:42:28.647Z]] <https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/ReadMe.txt>
-
[4] [CITE@en[[[TCVN-NSCII]] Stack, version 1.0 : James Do, TCVN/TC1 : Free Download, Borrow, and Streaming : Internet Archive]], [TIME[2022-10-16T13:11:45.000Z]] <https://archive.org/details/hypercard_tcvn-nscii-stack-version-10>
]REFS]
- [48] [[Unicode Consortium]] 謹製の変換表
(Macintosh HyperCard 2.1 形式 — もっと使いやすい形式にしろよ)
<http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/TCVN/>
[23]
[[TCVN 5773:1993]]
は
[[TCVN 8271-2:2009]]
によって置き換えられたとされます。
[SEE[ [[TCVN 8271-2:2009]] ]]
;; [24]
[[TCVN 5773:1993]]
にあった [[CJK統合漢字]]の出典としての情報が
[[TCVN 8271-2:2009]]
に含まれているのかは不明.
[58]
その後の調査によると [[NPCT 2.1]] と [[CJK統合漢字]]の [[V0]]
で[[字形]]が異なるもの、出典 [[V0]] として掲載されていないもの、
[[CJK統合漢字]]から漏れているものが多数あるようです。
[SRC[>>26]]
[REFS[
- [26] [CITE[IRGN2429_V0-SourceCorrections.pdf]], [TIME[2020-03-09T06:17:27.000Z]], [TIME[2022-11-08T13:34:44.965Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2429_V0-SourceCorrections.pdf>
-- [27] [CITE[IRGN2429R_V0SourceCorrections.pdf]], [TIME[2020-06-23T10:11:50.000Z]], [TIME[2022-11-08T13:34:56.959Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2429R_V0SourceCorrections.pdf>
-- [28] [CITE[20234-v0-src-corr-irgn2429r.pdf]], [TIME[2020-09-21T13:37:38.000Z]], [TIME[2022-11-08T13:35:04.706Z]] <https://www.unicode.org/L2/L2020/20234-v0-src-corr-irgn2429r.pdf>
-- [29] >>26 の改訂が >>27 = >>28
]REFS]
-*-*-
[61]
[[CJK統合漢字]]の出典 [[V0]] [[TCVN 5773:1993]]
は [[94[SUP[2]]集合]]の形式になっていますが、
[[NPCT 2.1]] には
[CODE[U+]] / [CODE[V+]] の [[Unicode]] [[符号位置]]しか掲載されていません。
[[TCVN 5773:1993]]
も同様らしいです。
[SRC[>>26]]
[62]
[[NPCT 2.1]] の一覧表の掲載位置から [[V0]] へは計算式で変換できます。
[SRC[>>26]]
つまり [[V0]] は [[NPCT 2.1]] の一覧表の順番で [[94[SUP[2]]文字集合]]の
16区から41区に配置したもののようです。
[89]
[[Unicode 3.0]] の [[Unihan]] の [[V0]] はおかしなことになっていました。
[[V1]] の [[TCVN 6056:1995]] が当時は[[94[SUP[2]]集合]]の1区から並べられていた
(>>74) のと同じように、
[[CJK統合漢字]] [[URO]] に対応する [[V0]] は1区から並べられていたようです [SRC[>>69]]。
しかし[[CJK統合漢字]]拡張Aに対応する [[V1]] は16区から並べられていたようです
[SRC[>>69]]。
その後のもの [SRC[>>78]] と比較すると、
拡張A部分はほぼ同じで、現在の [[Unihan]] ともほぼ同じなのですが、
[[URO]] 部分は16区分変更されています。
[90] 1区始まりの領域と16区始まりの領域は重なるので、
[[Unicode 3.0]] の [[Unihan]] には
>
[PRE[
U+34ED kIRG_VSource 0-304E
]PRE]
>[SNIP[]]
>
[PRE[
U+7A6D kIRG_VSource 0-304E
]PRE]
のような重複が出てきます。 [SRC[>>69]]
[66]
[[Unicode]] 式 (の [CODE[V+]]),
[[ISO/IEC 2022]] 式 [[V0]]
とも、
[[符号表]]以外に[[文字符号]]としての実利用例があるかは不明。
* TCVN 6056
[44]
[DFN[TCVN 6056:1995]]
[CITE[Information technology. Nom 16-bit standard code for information interchange. Han Nom character]]
[64] [[CJK統合漢字]]の出典 [DFN[V1]]
[49] [[94[SUP[2]]文字集合]]の42区1点〜77区21点に字漢 (漢字) が3311文字らしい。
;; [63] つまり [[V0]] とは重ならないように続きに配置されています。
- [46] 文字集合 (PDF)
<ftp://ftp.oreilly.com/pub/examples/nutshell/cjkv/AppO/tcvn6056.pdf>
([[CJKV]] 本の附録)
-- [47] 消滅確認 [TIME[2022-11-09T08:24:01.900Z]]
-- [65]
[[Arphic Technology]]
の
[CITE[MingTiEGV-Medium]]
[[フォント]]で再現した一覧表。
- [45] 文字集合 ([[Big5]]) <http://www.sungwh.freeserve.co.uk/flux/tcvnbig5.htm>
-- [50] 移転確認 [TIME[2022-11-09T08:25:23.900Z]]
-- [51] [CITE[TCVN 6056:1995 in Big5 encoding]], [TIME[2022-11-09T08:25:03.000Z]] <https://dylansung.tripod.com/flux/tcvnbig5.htm>
--- [57] 出典は >>46 とのこと
- [52] [[UCS]] との対応 <http://www.unicode.org/Public/>
から、 [[Unihan.txt]]
- [53] UCS との対応 <http://www.cse.cuhk.edu.hk/~irg/>
から、 10646 の Code Chart または normative annex
の CJK source ファイル
- [54] ISO/IEC JTC1/SC2/WG2/IRG N403
- [55] ISO/IEC JTC1/SC2/WG2/IRG N451
[56]
いくつか誤りがあって1998年に修正要求がなされたらしい。
[72]
[TIME[西暦1996年][1996]]の時点で、
[[IRG]] の写像と
[[TCVN]] 側の写像で違いがあって、
[[IRG]] のものには、ずれや欠落があると指摘されていました。
[SRC[>>71]]
[73]
それには誤りとは別に符号化についても言及があります。
[[TCVN 6056:1995]]
は、[[文字]]を
[ [N[1]], [N[3349]] ]
の[[十進数]]で識別しているようです。
[SRC[>>71]]
[74]
そして [[IRG]] は 1-2121 から始まる [[94[SUP[2]]集合]]の1区から配置した[[符号]]を使っていますが、
42区からの配置に変更することが提案されていました。
どちらも十進数をそのまま順に割り振ったもののようです。
[SRC[>>71 (対照表あり)]]
[75]
[[Unicode 3.0]] の [[Unihan]] の [[IRG]] 出典Vは、
1-2121 などこの旧 [[IRG]] 符号らしきものが示されています。
[SRC[>>69]]
[76]
現在の [[Unihan]] の [[IRG]] 出典Vは、 V1-4A21
などこの提案による変更後の符号が示されています。
>>46 もそれと同じです。
[77]
これらからすると
[[TCVN 6056:1995]]
には出典 V に使われているような [[ISO/IEC 2022]]
式の符号は書かれていないように読めます。
[67]
いずれの方式も[[文字符号]]としての実利用例があるかは不明。
[REFS[
- [70]
[CITE[[[IRG]] Document Index - IRGN301- IRGN400]], [TIME[2022-11-09T11:46:29.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/n0301-0400.html>
-- [71] N398: [CITE[TCVN 6056:1995 mapping errors]],
[[Ken Lunde]],
Mon, 28 Oct 1996 11:41:38 PST
]REFS]
* CJK統合漢字の出典V
[81]
現在の [[Unihan]] は、出典 [DFN[V]] を
- V0 TCVN 5773:1993
- V1 TCVN 6056:1995
- V2 VHN 01:1998
- V3 [ASIS[VHN 02: 1998]]
- V4 [I[Kho Chữ Hán Nôm Mã Hoá]] (Hán Nôm Coded Character Repertoire), Hà Nội, 2007
- VN Vietnamese horizontal extensions; the value is its code point
と説明しています。
[SRC[>>80]]
[68]
[[Unihan]] は [[Unicode 3.0]] で初めて出典 V を掲載するようになりました。
そのファイルには
>
[PRE[
# V1 TCVN 5773:1993
# V2 TCVN 6056:1995
]PRE]
とありましたが、ファイルの中身はこれと合っておらず、
0- と 1- が使われていました。
[SRC[>>69]]
[79]
それより新しい [[Unihan]] には
>
[PRE[
# V0 TCVN 5773:1993
# V1 VHN 01:1998
# V2 VHN 02:1998
# V3 TCVN 6056:1995
]PRE]
と書かれているものもあります。
ところがファイルの中身を見ると
V1 は [[TCVN 6056]] のようです。
[SRC[>>78]]
[REFS[
-[69] [TIME[2001-02-27T09:25:50.000Z]], [TIME[2022-11-09T10:03:20.959Z]] <https://www.unicode.org/Public/3.0-Update/Unihan-3.txt>
-
[78]
[TIME[2004-01-30T19:08:05.000Z]], [TIME[2022-11-09T12:08:11.748Z]] <https://www.unicode.org/Public/4.0-Update1/Unihan-4.0.1.txt>
- [80]
[CITE@en-us[[[UAX #38]]: Unicode Han Database (Unihan)]], [TIME[2022-09-12T17:16:37.000Z]], [TIME[2022-11-09T12:10:01.948Z]] <https://www.unicode.org/reports/tr38/#kIRG_VSource>
]REFS]
-*-*-
[25]
V 典拠
- 1 VHN 01:1998
- 2 VHN 02:1998
というものは実在するのか? 例によって嘘規格?
(Vietnamese Han & Nom かなにかの略だと藁える)
[82]
[[V2]]
は [[V1]] の続きで
V2-6E[VAR[hh]] から始まりますが、
V2-91[VAR[hh]]
まで、 [[94[SUP[2]]集合]]を超えて続いています。
[83]
[[V3]]
は続きではなく
V3-30[VAR[hh]]
から始まって
V3-39[VAR[hh]]
まで続いています。
[84]
[[V4]]
は少し離れて
V4-40[VAR[hh]]
から
V4-58[VAR[hh]]
まで続いています。
[85]
なぜ [[V2]] だけ[[94[SUP[2]]集合]]から逸脱しているのか謎です。
* [CITE[Kho Chữ Hán Nôm Mã Hoá]] と [CITE[Nôm Na Tống]] フォント
[6]
[[出典V]]で使われている
[DFN[[CITE[Nôm Na Tống]]]]
[[フォント]]は
[[MITライセンス]]で公開されています。
[SRC[>>5]]
[92]
[TIME[西暦1999年][1999]]に
[DFN[Vietnamese Nôm Preservation Foundation]] ([DFN[VNPF]])
が設立された後に開発されてきた
[DFN[Kho Chữ Hán Nôm Mã Hoá]]
([DFN[Hán-Nôm Coded Character Repertoire]])
および[[フォント]]
[DFN[[CITE[Nôm Na Tống Light]]]]
は、
[TIME[西暦2006年][2006]]の
[CITE[Kho Chữ Hán Nôm Mã Hoá]]
の出版で一旦完成したのだそうです。
[SRC[>>7]]
[93]
そしてそれ以後も[[フォント]]開発を継続しつつ [[IRG]] とも協調して
[[CJK統合漢字]]の[[越南]]典拠を拡張しているようです。
[SRC[>>7]]
[[Unicode]] の[[符号表]]がいつからこのフォントになったのか不明ですが、
[TIME[西暦2006年][2006]]以後なのでしょうか。
[94]
[[Unihan]] は典拠 [DFN[V4]] を[TIME[西暦[ASIS[2007]]年][2007]]の
[CITE[Kho Chữ Hán Nôm Mã Hoá]]
だとしています。
[SRC[>>80]]
[98]
>>97 に
[CITE[Hán-Nôm Coded Character Repertoire]]
のごく一部が引用されていますが、
[[字形]]に対して当時の [[Unicode]] にあるものは [CODE[[[U+]][VAR[hhhh]]]]、
ないものは
[CODE[[[V+]]6[VAR[hhhh]]]]
と
[CODE[V04-[VAR[hhhh]]]]
の符号が示されているようです。
[99]
[TIME[2007-08-15]]の
[CITE[Kho chữ Hán Nôm Mã hoá]]
掲載の文字と[[越南語国語表記]]の対照表が
[CITE[[[漢字データベースプロジェクト]]]]
で公開されています。
このデータファイルでは [[Unicode]] にない文字は
[[IDS]]
で表現され、
[CODE[V+]]
または [CODE[V04-]]
の符号が示されています。
[SRC[>>96]]
;; [101] [[IDS]] の一部は[[私用域]]。 [[CDP外字]]?
[102]
>>98 ではすべての[[非Unicode文字]]に [CODE[V+]] と [CODE[V04-]] が割り振られていますが、
>>99 では両方があるのはごく一部だけで、ほとんどはどちらか一方だけです。
原書ではどうなっているのでしょう?
[103]
[[ISO/IEC 10646:2003]]/Amd.5 の [[V4]]
と
[CITE[Kho chữ Hán Nôm Mã hoá]]
の [CODE[V04-]]
は
8文字が一致しないそうです。
[SRC[>>96]]
[105]
>>104
で文字を検索して情報を見ることができます。
例えば
>
,Unicode ,U+2cc8a
,TCVN Code ,V4-5735
,Kho chữ Hán Nôm ,V+632BF
のように表示されます。
[106] ここで [DFN[TCVN Code]] が [[CJK統合漢字]]の典拠Vと同じもののようです。
V0 から V4 までのほか [[VN]] も確認できます。
典拠Vがないとこの欄は出てきません。
[107]
[[Kho chữ Hán Nôm]] は
[CITE[Kho chữ Hán Nôm Mã hoá]]
の [CODE[V+]]
があれば表示されるようです。
[[TCVN Code]] が [[V4]] のものもあれば、
[[TCVN Code]] が表示されないものもあります。
[109]
>>99
に示された符号を検索してみると、 [CODE[V04-]] で示されたものには
[CODE[V4-]] も [CODE[V+]] もあり、
[CODE[V+]] で示されたものには [CODE[V+]] しかありません。
>>99 の対照表では原典に [CODE[V04-]] が記載されていればそちらを優先して書いているのでしょうか。
[108]
なお、
[[TCVN 5773]]
の
[CODE[V+]]
符号は検索しても何も見つかりませんし、
対応する正式な [[Unicode]]
で表示しても表に [CODE[V+]] 符号はありません。
[CODE[V+]] を [CODE[U+]] に置き換えても何も見つかりません。
[[TCVN 5773]]
の
[CODE[V+]]
はもうまったく使われていないのでしょうか。
[110]
中には
>
,Unicode ,U+f063d*
,Kho chữ Hán Nôm ,V+60691
のように [[Unicode]] が U+F[VAR[hhhh]] の[[私用文字]]のものもあります。
[CODE[*]] 印は将来の [[Unicode]] 候補だと注釈があります。
[111]
[CITE[Nôm Na Tống]]
は[[越南語国語表記]]用の[[ラテン文字]]等の[[非漢字]]と、
[[CJK統合漢字]]や[[CJK互換漢字]]の一部を実装しています。
[112] 加えて、
[[私用文字]]
[ [CODE[U+F0000]], [CODE[U+F2388]] ]
が定義されています。
[113] [[私用文字]]は[[ウェブサイト]]で検索できるものと同じようです。
[114] [[TCVN Code]] が [[VN]]
になるものもありますが、
>
,Unicode ,U+f0000*
,TCVN Code ,VN-F0000
,Kho chữ Hán Nôm ,V+60000
のようになっています。 [[Unicode]] では [[VN]] は[[水平拡張]]を表すことになっていて
(>>81)、[[私用文字]]の[[水平拡張]]では意味が通じず、
こちらの [[VN]] がどういう符号なのか不明です。
[128]
>>114 see >>127
[115] [[TCVN Code]] 欄も [[Kho chữ Hán Nôm]] 欄も表示されない
>
,Unicode ,U+f2388*
のような例もあります。
[117]
[[フォント]]の
[CODE[U+F1DAB]]
が
[[Unicode]] の
[CODE[U+200C9]]
であると発見された報告があります。
報告を受けて
[CODE[U+200C9]]
に
[CODE[U+F1DAB]]
と同じグリフデータが設定されたようです。
[SRC[>>116]]
([[フォント]]内に別[[グリフ]]として同字形が重複して入っています。)
[118]
報告内の [[URL]] と[[画面写真]]によると、変更前は
<http://nomfoundation.org/common/nom_details.php?codepoint=f1dab>
で
>
,Unicode,U+f1dab*
,Kho chữ Hán Nôm ,V+6EF98
と表示されていたようです。 [SRC[>>116]]
しかし現在そのページは表示できません。
[CODE[U+200C9]]
で検索すると、
>
,Unicode ,U+200c9
だけが表示されます。
[CODE[U+F1DAB]]
や
[CODE[V+6EF98]]
の情報は表示されなくなっています。
[119]
では
[CODE[U+F1DAB]]
の情報がデータベースから消されたのかというと、そうでもないらしく、
符号「F1DAB」で検索すると
[CODE[U+200C9]]
のページが表示されます。旧符号を知っていれば新符号を知ることはできるようです。
ただし [CODE[V+6EF98]]
では検索もできません。
[123]
[[フォント]]側は、このような変更はあっても、履歴をぱっと見た感じ、
[[私用文字]]の削除や移動のような[[非互換変更]]は行われていないようです。
[120]
[[フォント]]中の[[私用文字]]のいくつかは、
[[CJK統合漢字]] + [[Vietnamese alternate reading mark]]
の
[CODE[ccmp]]
でもアクセスできます。
[SEE[ [[Vietnamese alternate reading mark]] ]]
[122]
[[フォント]]中の[[私用文字]]のいくつかは、
[[IVS]]
でもアクセスできます。
[SRC[>>121]]
多数の [[IVS]] が定義されていますが、しかし現時点では [[IVC]] に登録されていません。
今後登録する予定があるのかは不明です。
[125]
>>124 で[[私用文字]]の[[ローマ字入力]]用[[辞書]]データが配布されています
([[ライセンス]]不明)。
[[私用文字]]
[ [CODE[U+F0000]], [CODE[U+F2388]] ]
の範囲 (9097符号位置) ですが、
6262個分のデータが入っています。
[REFS[
- [91] [CITE[null]], [TIME[2022-11-09T13:41:43.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Font?uiLang=vn>
-- [7] [CITE[null]], [TIME[2022-11-07T03:21:19.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Font?uiLang=en>
- [5] [CITE@en[GitHub - nomfoundation/font: Source for [[NomNaTong]]-regular Vietnamese chữ Nôm font.]], [TIME[2022-11-07T03:16:59.000Z]] <https://github.com/nomfoundation/font>
- [96] [CITE@ja[[[字喃]](チュノム)に関する情報]], [TIME[2010-05-16T03:18:48.000Z]], [TIME[2022-11-09T13:57:10.997Z]] <https://kanji-database.sourceforge.net/chunom.html>
-- [100] [CITE@en[[[cjkvi]]-data/nom_qn.txt at master · cjkvi/cjkvi-data · GitHub]], [TIME[2022-11-09T14:00:55.000Z]] <https://github.com/cjkvi/cjkvi-data/blob/master/nom_qn.txt>
-- [95] [CITE@ja[グループ-ノート:字喃 - [[GlyphWiki]]]], [TIME[2022-11-09T13:56:48.000Z]] <https://glyphwiki.org/wiki/Group-talk:%E5%AD%97%E5%96%83>
- [97] [CITE[[[IRG]]N2443_3B3F_disunify.pdf]], [TIME[2020-12-22T13:49:34.000Z]], [TIME[2022-11-09T13:57:25.822Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg53/IRGN2443_3B3F_disunify.pdf#page=3>
-[104]
[CITE[Another Nôm Lookup Tool[BR[]] based on Unicode]],
[TIME[2022-11-09T14:14:13.000Z]] <http://www.nomfoundation.org/nom-tools/Nom-Lookup-Tool/Nom-Lookup-Tool?uiLang=en>
- [116] [CITE@en[F1DAB should be mapped to 200C9 · Issue #12 · nomfoundation/font · [[GitHub]]]], [TIME[2022-11-12T05:13:42.000Z]] <https://github.com/nomfoundation/font/issues/12>
- [121] [CITE@en[font/UnicodeVariationSequences.txt at master · nomfoundation/font · [[GitHub]]]], [TIME[2022-11-12T05:29:02.000Z]] <https://github.com/nomfoundation/font/blob/master/src/UnicodeVariationSequences.txt>
- [124]
[CITE@en[[[GitHub]] - Hulenkius/NNTPUA_cangjie5: 喃那宋私用區字符的倉頡五代編碼收入 Cangjie for Nom Na Tong PUA]], [TIME[2022-11-12T05:36:34.000Z]] <https://github.com/Hulenkius/NNTPUA_cangjie5>
]REFS]
[126]
[CODE[V+]] 符号は、現在見つかっているものはすべて [CODE[V+6[VAR[hhhh]]]]
の形式です。これは [[Unicode]] の未使用の領域 ([[私用域]]ではない)
を表しているのでしょうか?
書籍やデータベース以外で利用されることがあるのかは不明です。
[[機械可読]]な変換表も見当たらず、
配布されている[[フォント]]もこの符号は使っていません。
[133]
この [CODE[V+]] は、旧フォントで [ [CODE[U+60000]], [CODE[U+63FFF]] ]
に割り当てられていたものなのだそうです。
[SRC[>>129, >>130, >>131, >>132]]
[REFS[
- [129] [CITE[The mapping table between Quoc Ngu - Nôm - Unicode]], [TIME[2023-07-10T06:00:24.000Z]], [TIME[2012-05-17T11:18:09.674Z]] <https://web.archive.org/web/20120517111637/http://nomfoundation.org/nom-project/Han-Nom-coded-Characters/The-mapping-table-between-Quoc-Ngu-Nom-Unicode>
-- 1ページ目のみ [[Internet Archive]] 所蔵
- [130] [CITE[The mapping table between Unicode - Nôm - Quoc Ngu]], [TIME[2023-07-10T06:00:43.000Z]], [TIME[2013-05-14T13:08:50.485Z]] <https://web.archive.org/web/20130514130651/http://nomfoundation.org/nom-project/Han-Nom-coded-Characters/The-mapping-table-between-Unicode-Nom-Quoc-Ngu>
-- 1ページ目のみ [[Internet Archive]] 所蔵
- [131] [CITE@ja[グループ:VNPF外字 - GlyphWiki]], [TIME[2023-07-10T06:01:08.000Z]] <https://glyphwiki.org/wiki/Group:VNPF%e5%a4%96%e5%ad%97>
- [132] [CITE@ja[グループ-ノート:VNPF外字 - GlyphWiki]], [TIME[2023-07-10T06:01:16.000Z]] <https://glyphwiki.org/wiki/Group-talk:VNPF%e5%a4%96%e5%ad%97>
]REFS]
* メモ
- [10] <http://www.tcvn.gov.vn/>
[36] [CITE[Microsoft Word - PhmemNom-u+.rtf - PhanMemChuNom.pdf]], [TIME[2001-07-09T20:27:25.000Z]], [TIME[2022-11-08T13:56:56.113Z]] <https://cs.nyu.edu/~nhan/PhanMemChuNom.pdf>
[22] [CITE[Microsoft PowerPoint - Computing in Vietnamese 0.99IMUGweb.ppt - VietComputing.pdf]], [TIME[2015-01-18T17:51:58.000Z]], [TIME[2022-11-08T09:30:23.936Z]] <http://www.imug.org/presentations/VietComputing.pdf#page=20>
[32] [CITE[VietNhan_day_chu_Nom.pdf]], [TIME[2020-02-03T23:19:59.000Z]], [TIME[2022-11-08T13:39:45.164Z]] <http://nomfoundation.org/Conf2006/VietNhan_day_chu_Nom.pdf>
[127] [CITE[IRG N2490 - IRGN2490VSourceChanges.pdf]], [TIME[2021-04-27T00:31:29.000Z]], [TIME[2023-02-27T01:48:06.859Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg56/IRGN2490VSourceChanges.pdf>