-
Notifications
You must be signed in to change notification settings - Fork 4
/
671.txt
1754 lines (1294 loc) · 77.6 KB
/
671.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
[1]
[DFN[[[JIS X 0213]]]]
[DFN[[CITE[7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合]]]]
は、
[[JIS漢字]]の[[規格]]の1つです。
[25]
形式的には現在も有効な [[JIS]]
ですが、
すっかり [[Unicode]]
化が済んだ今となっては[[実効性を有していません][実効性喪失]]。
* 文字集合
[4] [[JIS X 0213]] 第1面は、 [[JIS X 0208:1997]]
に更に[[非漢字]]と[[第3水準]]漢字集合を追加したものでした。
[113]
[TIME[平成12(2000)年][2000]]版第1面には次の[[文字]]が含まれていました。
- 1-01-01〜1-13-94 [[非漢字]] ([[JIS X 0208:1997]] + 追加分)
- 1-14-01〜1-15-94 [[第3水準]]漢字集合
- 1-16-01〜1-47-51 [[第1水準]]漢字集合 ([[JIS X 0208:1997]])
- 1-47-53〜1-47-93 [[第3水準]]漢字集合
- 1-48-01〜1-84-06 [[第2水準]]漢字集合 ([[JIS X 0208:1997]])
- 1-84-08〜1-94-89 [[第3水準]]漢字集合
[5] [[非漢字]]は、 [[Windows-31J]] の拡張がそのまま取り込まれています。ただし
[[JIS X 0208]] と重複する[[面区点位置]]は、[[予約]]とされています。
;; [114] [[漢字]]について [[Windows-31J]] との[[互換性]]はありませんでした。
これでは何のための[[非漢字]]の[[互換性]]なのかわかりませんね。
[6] その他幾つか空きがありますが、
[[JIS X 0213:2000]] 3.2.2
によれば第1面の空きはすべて利用禁止です。
[9] [[JIS X 0208:1997]] をそのまま拡張したものとなっていますが、
厳密に両仕様を解釈すると、[[包摂規準]]が変更されており、
完全に互換性があるわけではありません。
[SEE[ [[JIS X 0208]], [[JIS X 0212]] ]]
(が実用上は問題にはなりません。)
[7] 第2面は、次の範囲に[[第4水準]]漢字集合が含まれていました。
[FIG(list)[
- 2-01-01〜2-01-94
- 2-03-01〜2-05-94
- 2-08-01〜2-08-94
- 2-12-01〜2-15-94
- 2-78-01〜2-94-86
]FIG]
[8] [[EUC]] で [[G3]] に使うことを想定していました。
[36] 従来[[日本語EUC]]で [[G3]] に割り当てられていた
[[JIS X 0212-1990]] と衝突しないように配置されています。
[37] 空き領域は使用禁止とされています。
[42]
[[JIS X 0213:2000]] 本体3.によれば、
[[実装水準]]3と4があり、
[[実装水準]]3は[[第3水準漢字]]までで[[第4水準漢字]]を含まない
([[符号化文字データ要素]]や[[装置]]である)
ことを意味します。
つまり一口に [[JIS X 0213]] 対応といっても、
第3水準までの場合もあるので要注意です。
実装しない場合第4水準の領域は空きとされます。
[43]
[[JIS X 0213:2000]] 3.2.2
によれば第2面の空きには[[情報交換の当事者間の合意]]により[[外字]]を割り当てられます。
(ここでいう空きは、実装水準3で使用しない第4水準の領域は含みません。)
[45]
[[JIS X 0213:2000]] 3.2.2
によれば第2面に[[外字]]を割り当てる場合、
[[終端バイト]]
[N[5/0]]
は使用禁止されています。
[46]
[[JIS X 0213:2000]] 本体 3.2.2 や [[Shift_JISX0213]]
によれば、
- [48] 1面の文字を空きに割り当ててはならない
- [49] 実装水準4の場合、2面の文字を空きに割り当ててはならない
とされます。
[47]
従って、
- [50] 第4水準を元の面区点位置につまみ食い的にまばらに実装することは認められません。
- [51] 実装水準3の場合、第4水準漢字をつまみ食いして外字領域に割り当てることはできます。
- [52] [[包摂規準]]の範囲内の[[異体字]]を[[外字]]に割り当てることはできません。
- [53] 第2面の空き領域に [[JIS X 0212-1990]] を実装することはできません。
-- 第1面や第2面と同じ文字が含まれるため。
- [54] ちなみに [[JIS X 0212-1990]] 側も[[外字]]領域の制約があるので、
空き領域に [[JIS X 0213:2000]] 第2面を割り当てることはできません。
[64]
[[ISO-2022-JP-3]] は[[外字]]割当を認めていません。
[38] 一説に第2面の空きを [[UCS]] の [[BMP]]
の[[私用域]]に対応付けることも想定していたといわれます。
[82]
[[JIS X 0213:2000]] の正誤票 [SRC[>>3]]
は一部の[[文字の名前]]と [[UCS]] 対応を変更しています。
その中には [[JIS X 0208]] 由来の[[文字]]も含まれていました。
[66]
[[JIS X 0213:2004]]
は第1面にいくつかの[[文字]]を追加するとともに、
[[包摂規準]]のいくつかを改正しました。
([[包摂規準]]に関しては [[JIS X 0208]] も参照。)
[80]
[[JIS X 0213:2004]]
ではいくつかの[[文字の名前]]や [[UCS]] 対応
([[漢字]]の [[UCS]] [[符号位置]]は[[文字の名前]]でもある)
を変更しました。
[81]
[[文字の名前]]こそが[[符号化文字]]の同定に使われるという原則によれば、
これ (>>82, >>80) は重大な改正のはずです。
変更は第2面にも及んでいますが、
第1面と違って第2面の[[終端バイト]]は変更されていません。
[[文字の名前]]や[[包摂規準]]の変更は
[[ISO-IR]]
の[[図形文字集合]]の改訂に値しないと判断されているようです。
[39] [[ARIB STD-B24]] は第1面と第2面を独自の[[終端バイト]]で使っていました。
第1面はかわりに [[JIS X 0208]] (相当) + [[ARIB外字]]としてもよいとされていました。
[155]
[[JIS 漢字の改定に関係する規定の表]]
** Unicode との対応関係
[107]
すべての[[文字]] [WEAK[([[空き領域]]は含みません。)]]
に
[[ISO/IEC 10646]]
との対応関係が規定されています。
[[ISO/IEC 10646]] は [[Unicode]] と実質的に同じです。
[108]
[[JIS X 0213]] の1文字が [[Unicode]] の複数文字の列に対応する場合があります。
[109]
対応関係はあっても、[[意味論的]]に同じ[[文字]]とは限りません。
両[[規格]]の[[包摂規準]]は違いも多いです。
-*-*-
[170]
[[Unicode]] の[[CJK統合漢字]]・[[CJK互換漢字]]の[[出典J]]には
[[JIS X 0213]]
関連がいくつかに分けられています [SRC[>>169]]。
-[[J0]] JIS X 0208-1990
- [DFN[J3]] JIS X 0213:2004 level-3
- [DFN[J3A]] JIS X 0213:2004 level-3 addendum from JIS X 0213:2000 level-3
- [DFN[J13]] JIS X 0213:2004 level-3 ideographs replacing J1 ideographs
- [DFN[J13A]] JIS X 0213:2004 level-3 ideograph addendum from JIS X 0213:2000 level-3 replacing J1 ideographs
- [DFN[JA3]] JIS X 0213:2004 level-3 ideographs replacing JA ideographs
- [DFN[J4]] JIS X 0213:2004 level-4
- [DFN[J14]] JIS X 0213:2004 level-4 ideographs replacing J1 ideographs
- [DFN[JA4]] JIS X 0213:2004 level-4 ideographs replacing JA ideographs
[171]
出典名に 0、 3 が入っているのが第1面関係、
4 が入っているのが第2面関係です。
[[JIS X 0213]] 以前の出典が [[J1]], [[JA]] だった履歴と
[[JIS X 0213:2004]] の改正履歴が組み込まれていますが、
符号はいずれも [[JIS X 0213]] の [[GL]] [[符号]]です。
[172]
[[J0]] は[[CJK統合漢字]]が出来た当初から [[JIS X 0208-1990]]
とされていますが、実際には時代によって変更されています。
[EG[
[173]
例えば
[[JIS X 0213:2004]]
で字形が変更された第1面80区55点 = J0-7057 は U+9771 (靱) ですが、
[[URO]] の[[符号表]]の [[J欄]]字形も同じように差し替えられています。
[SRC[>>174, >>175]]
合計168字がこの関係で差し替えられていると推測されます。
]EG]
[309]
[[JIS X 0212]] および [[JA]] からの字形変更については、 [[JIS X 0212]]
参照。
[REFS[
- [169] [CITE@en-us[UAX #38: Unicode Han Database (Unihan)]], [TIME[2023-09-02T00:41:01.000Z]], [TIME[2023-09-13T04:56:57.182Z]] <https://www.unicode.org/reports/tr38/#kIRG_JSource>
- [174]
[[Unicode 5.2]], [TIME[2023-09-13T05:12:54.000Z]] <https://web.archive.org/web/20100627104527/http://www.unicode.org/charts/PDF/U4E00.pdf>
#page=548
- [175]
[CITE[The Unicode Standard, Version 15.0 - U4E00.pdf]], [TIME[2022-09-09T19:17:38.000Z]], [TIME[2023-09-13T05:13:13.672Z]] <http://www.unicode.org/charts/PDF/U4E00.pdf#page=477>
]REFS]
-*-*-
[183]
[[JIS X 0213:2004]] ベースに切り替わる前:
- [[J0]] [[JIS X 0208-1990]]
- [[J3]] [[JIS X 0213:2000]] 第1面
- [DFN[J3A]] [[JIS X 0213:2004]] 第1面 (追加分のみ)
- [[J4]] [[JIS X 0213:2000]] 第2面
-*-*-
[286]
[[Unicode]] との対応関係には[[諸説あります]]。
違う点な何通りかあって、
組合せで無限の実装が実在する地獄が広がっているみたいです。
違う点をまとめると:
- [287] [[代替名称]]の利用の有無
-- [288] [[IRV]] 用か [[JIS X 0201]] 用か (どちらでも規格の範囲内)
-- [289] 両方ともか、一部のみか (規格の範囲内か疑わしい)
- [292] [[括弧付きUCS]]
-- [294] 1-94-31 が [CODE[U+9B2D]] か [CODE[U+FA6B]] ([CODE[J+FA6B]]) か (平成12年正誤票関係)
-- [296] 1-2-54, 1-2-55 が
(第1次規格)
[CODE[U+2050]] ([CODE[J+2050]]), [CODE[U+2051]] ([CODE[J+2051]])
か
(第2次規格)
[CODE[U+FF5F]], [CODE[U+FF6F]]
か
(第1次規格と[[文字の名前]]が同じ)
[CODE[U+2985]], [CODE[U+2986]]
か
-- [297]
1-3-26
が
(第1次規格) [CODE[U+2052]] ([CODE[J+2052]])
か
(第2次規格) [CODE[U+29BF]]
か
(非標準) [CODE[U+2299]]
か
-- [293] その他全般 (平成16年改正関係)
- [291] 1-1-29 が U+2014 か U+2015 か (平成12年正誤票関係)
- [290] 2-93-27 が U+9B1C か U+9B1D か (平成16年改正関係)
- [315] 2-94-5 が U+29FCE か U+29FD7 か ([[UCS]] の[[重複符号化]], >>236)
- [295] ¢、£、¬ の半角全角 (全角は規格違反)
- [298] 第2次規格追加文字 (平成16年改正関係)
- [299] [[符号化]]関連
-- [300] [[JIS X 0212]] と同時実装するか
--- [301] する場合どちらを優先するか
-- [302] [[JIS X 0213]] への変換時に非標準の[[UCS符号位置]]からの多対1変換をするか
-- [303] 複数の[[UCS符号位置]]の列との相互変換に対応するか
-- [304] [[UCS]] 2面に対応するか
-- [305] [[CP932]] 重複符号で [[CP932]] を採用するか (するのは規格違反)
-- [306] 13区の [[CP932]] 保留面区点位置を [[CP932]] 相当で実装するか
- [40] [CITE[Nate: PerlのEncode::JIS2KとPython]], [TIME[2022-04-10T23:21:31.000Z]], [TIME[2022-05-08T01:10:18.998Z]] <https://nathancorvussolis.blogspot.com/2017/07/perl-encode-jis2k-python.html>
-[35] [CITE[Nate: 主な実装における EUC-JIS-2004, Shift_JIS-2004 から Unicode への変換結果の違い]], [TIME[2022-04-10T23:21:31.000Z]], [TIME[2022-05-03T02:31:57.543Z]] <https://nathancorvussolis.blogspot.com/2016/12/jisx0213-2004-unicode-table.html>
[41] [CITE@en-US[ucm/euc-jp.ucm - metacpan.org]], [TIME[2022-04-07T03:18:23.000Z]], [TIME[2022-05-08T01:11:52.727Z]] <https://metacpan.org/release/DANKOGAI/Encode-3.17/source/ucm/euc-jp.ucm>
>>40 に言及ないが [CODE[Encode::JIS2K]] と同じ
[248] [CITE@en[GitHub - hatukanezumi/Encode-JISX0213: JIS X 0213 encodings, Perl module]], [TIME[2023-09-19T13:05:50.000Z]] <https://github.com/hatukanezumi/Encode-JISX0213>
[157] [CITE[Japanese Font Encodings]], [TIME[2022-06-12T14:35:24.000Z]], [TIME[2023-08-05T07:45:41.297Z]] <https://unifoundry.com/japanese/index.html>
> These were taken as the canonical Japanese encoding, using fullwidth alternates when they were specified, and using Windows code page mappings except for three Plane 1 mappings that would have been duplicates of other code point mappings; the mappings adopted for Unifont were 0x2142 → U+2016, 0x215D → U+2212, and 0x2141 → U+301C.
[158] 意味はよくわからないけど独自の変換表を使っているということらしい。
[250] >>119
[263] [CITE@ja[使いこなそうユニコード]], [[SADAHIRO Tomoyuki]], [TIME[2021-07-10T12:54:11.000Z]], [TIME[2023-09-19T16:16:52.822Z]] <http://nomenclator.la.coocan.jp/unicode/index.htm>
[264] >>263 [[括弧付きUCS]]と [[JIS X 0213:2004]] の両方入り。
[[JIS X 0218]] の珍しい用例でもある。
[249]
あちこちに転がっているそれっぽい変換表や実装 (のソースコード)
のどれも少しずつ違っててやばい。 [[JIS X 0213]] が普及していないから深刻な問題になっていないのは幸か不幸か。
[247]
[[JIS X 0213]] ができたころには既に [[JIS X 0208]] の変換表の違いが問題になってたはずなのになぜ
[[JISC]] が正式な[[機械可読]]ファイルを公表しなかったのか謎。
せめてすべての [[Unicode符号位置]]が確定した平成16年にはやるべきだったのに。
-*-*-
[161] [CITE@ja[ノート:u9115 - GlyphWiki]], [TIME[2023-08-11T14:06:15.000Z]] <https://glyphwiki.org/wiki/Talk:u9115>
>ISO-IR-233 の92区76点の字形と、ISO/IEC 10646とUnicode のJ3-7C6Cの字形が異なっています。どっちのほうが0213の正しい例示字形でしょうか。 --johotogoshinentai 2011年12月4日(日) 05:54
[162] そんなことあるのか... J3 は [[JIS X 0213:2000]] の[[平成明朝]]をそのまま使っているわけではないということ?
- [386] [CITE[Wayback Machine]], [TIME[2023-09-29T13:05:22.000Z]] <https://web.archive.org/web/20100627104527/http://www.unicode.org/charts/PDF/U4E00.pdf>
#page=501
- [164] [CITE[The Unicode Standard 6.0 - U4E00.pdf]], [TIME[2023-08-11T14:17:04.000Z]] <https://web.archive.org/web/20120111104930if_/http://www.unicode.org/charts/PDF/U4E00.pdf#page=431>
- [163] [CITE[The Unicode Standard, Version 15.0 - U4E00.pdf]], [TIME[2022-09-09T19:17:38.000Z]], [TIME[2023-08-11T14:16:16.061Z]] <http://www.unicode.org/charts/PDF/U4E00.pdf#page=436>
[165] たしかに当時の字形 (>>386 >>164) は違っていて
(MJ026366 = IP9115)、今 (>>163)
は修正されている模様。
[384] [TIME[2010-01-29]]の
IRGN1656CJK_501-600.pdf#page=37 (当時再制作された新しい[[符号表]]案)
ではまだ正しかったようで。
[387] その後[TIME[2010-04-23]]の
IRGN1670M_P7.pdf#page=70
や[TIME[2010-11-29]]の
n3967.zip/fcd-10646-02-4e00-9fff.pdf #page=430
になると間違っていて、そのまま出版されてしまった、と。
[385] [[ISO/IEC 10646:2003]] まで遡ると[[出典J]]がない。
するとその後新[[符号表]]制作までの間に追加するタイミングはないはずで、
新[[符号表]]の誤字形が初出だった?
-*-*-
[316]
[[JIS X 0213:2004]] 改正の変更部分には、
1つの [[JIS X 0213]] [[面区点位置]]と複数の [[UCS符号位置]]の列
([[名前付き文字列]]) が対応付けられているものが25個あります。
[342]
[[JIS X 0213:2004]] はそれらに[[文字の名前]]を与えていますが、
[[参考]]とされています (改正規格 8. によって置き換えられた本体 5.3)。
[317]
25個中23個は現在の [[UCD]] で規定される[[名前付き文字列]]と同じ
[[Unicode符号点]]の列と[[文字の名前]]が使われています。
[318]
[[JIS X 0213:2004]] と [[UCD]] で[[Unicode符号点]]の列に与えられた[[文字の名前]]が異なるものが2個あります。
- [319] 1-11-69 = <[CODE[U+02E9]], [CODE[U+02E5]]>
-- [320] [[JIS X 0213]]: [CODE(charname)@en[RISING SYMBOL]]
-- [323] [[Unicode]]: [CODE(charname)@en[MODIFIER LETTER EXTRA-LOW EXTRA-HIGH CONTOUR TONE BAR]]
- [321] 1-11-70 = <[CODE[U+02E5]], [CODE[U+02E9]]>
-- [322] [[JIS X 0213]]: [CODE(charname)@en[FALLING SYMBOL]]
-- [324] [[Unicode]]: [CODE(charname)@en[MODIFIER LETTER EXTRA-HIGH EXTRA-LOW CONTOUR TONE BAR]]
[325] [CITE[IPAmj明朝]]の[[非漢字]]情報ファイルは [[Unicode]] の方の名前を採用しています。
[330]
25個中
[CODE(charname)@en[KATAKANA LETTER AINU P]]
と
[CODE(charname)@en[MODIFIER LETTER EXTRA-HIGH EXTRA-LOW CONTOUR TONE BAR]]
だけはなぜか先行して[TIME[平成17(2005)年][2005]]の
[[Unicode]] 4.1
で追加されていました。
[SRC[>>326, >>327]]
[333]
この時点で何故か名前が1つ変更されていました。
[331]
残りの23個は[TIME[2008-11-07]]に予備登録、
[TIME[2010-05-14]]に承認されました。
[SRC[>>327]]
[332]
[TIME[平成20(2008)年][2008]]に [[JSC2]] は残り23個の追加を提案しましたが、
その際に1つ名前が違って登録されているので、
それに合わせてもう1つも変更するか伺いを立てて承認されています。
[SRC[>>329, >>328]]
[334]
日本[[NB]]が [[JIS X 0213]] のために登録した[[名前付き文字列]]の新しい名前であるにも関わらず、
なぜか [[JIS X 0213]] は変更されずそのままです。
平成24年の [[JIS X 0213:2012]] 改正のタイミングで反映させられたはずなのに謎です。
[REFS[
- [326] [TIME[2005-02-14T21:08:15.000Z]], [TIME[2023-09-21T12:38:08.884Z]] <http://www.unicode.org/Public/4.1.0/ucd/NamedSequences.txt>
- [327] [TIME[2023-08-28T16:08:56.000Z]], [TIME[2023-09-21T12:38:24.984Z]] <http://www.unicode.org/Public/UCD/latest/ucd/NamedSequences.txt>
- [329]
[CITE[ISO/IEC JTC 1/SC 2/WG 2 N3529]], [[Masahiro Sekiguchi]], [TIME[2023-09-21T12:38:47.000Z]] <http://webcache.googleusercontent.com/search?q=cache:MjLVJedmjbMJ:www.dkuug.dk/jtc1/sc2/wg2/docs/n3529.doc>
- [328] [TIME[2008-10-29T21:11:28.000Z]], [TIME[2023-09-21T12:38:37.272Z]] <http://www.unicode.org/L2/L2008/08397-wg2consent.txt>
]REFS]
-*-*-
[391]
U+FA15
(J3-775A)
は平成24年の
[[Unicode]] 6.1
までは
[[JIS X 0213:2000]]
と同じ字形でしたが、
平成24年の
[[Unicode 6.2]]
以後違う字形に変わっています。
[[Unicode]] 6.2
は
[[ISO/IEC 10646:2012]]
相当とされ、そちらでもこのタイミングで変わったのでしょうか (未確認)。
なお
[[出典U]]は
[[Unicode]] 6.1 も現在も同字形で、
[[出典J]]の新字形と同じ字形です。
[389]
令和5年に正式公開された [[Unicode]] 15.1 の[[符号表]] [SRC[>>388]] と同じく令和5年時点で
[[Unicode Consortium]] ウェブサイト内 [[WG2]] ページで公開されている
[[ISO/IEC 10646:2020]]/Amd.2 案の[[符号表]] [SRC[>>313]]
との間では、
[[CJK互換漢字]]の [[J字形]]が変更されています。
DAM2 では[[文字情報基盤]]の[[水平拡張]]が追加されましたが、
[[CJK互換漢字]]の従来の [[J3]] も[CITE[IPAmj明朝]]に変更されているように見えます。
[CODE[U+FA55]] がわかりやすいです。
[390]
Amd.2 は本段落執筆時点で未発行で、これは
[TIME[2023-08-24]]付の
ISO/IEC 10646:2020/CD Amd 2.3
の[[符号表]]と思われます。
3回目の [[CD]]
ですが、そろそろ [[WG2]] を通過するでしょうか?
字形変更もこのままになるのでしょうか?
[392]
[CODE[U+FA36]]
の
[[Unicode]] 6.1 - [[Unicode]] 15.1 字形と
[[IVD]] の [CODE[JC1512]] や [[JIS X 0213:2000]]
を見比べると、 [[Unicode]] 6.1 の時点で既に
[CODE[JC1512]]
とは違う字形になっているような?
[395]
U+51DE は J1-3328 から J13-2E57 に変更されました。
[[JIS X 0212]] 19-8 = [[JIS X 0213]] 最終案 1-14-55 (JB1908, AJ CID+1435, MJ になし)
から
[[JIS X 0213:2000]] 1-14-55 (JC1455, AJ CID+20300, MJ007414)
の字形変更があったはずですが、
AMD2:2023 [[符号表]]は JB1908 のまま変更されていません。
(ちなみに [[JIS X 0212:1990]] [[ISO-IR]] はどちらとも別の字形 (KS020430, MJ007413) でした。)
[REFS[
- [388]
[CITE[The Unicode Standard, Version 15.1 - UF900.pdf]], [TIME[2023-08-25T18:19:58.000Z]], [TIME[2023-10-07T04:53:59.848Z]] <http://www.unicode.org/charts/PDF/UF900.pdf>
- [313] [CITE[ISO/IEC 10646:2020 6th edition, DRAFT Amd 2 Code charts - iso10646-6th-Amd2-CodeCharts.pdf]], [TIME[2023-08-10T03:54:28.000Z]], [TIME[2023-10-04T16:04:43.204Z]] <https://www.unicode.org/wg2/iso10646/edition6/charts/Amd2/iso10646-6th-Amd2-CodeCharts.pdf#page=1224>
]REFS]
** JIS X 0212 との対応関係
[SEE[ [[JIS X 0212]] ]]
* 符号化表現
[65]
[[JIS X 0213:2000]] は本体6種類、附属書3種類の[[符号化文字集合]]を定義していました。
(各[[符号]]とも自由度があるので全組み合わせはもっと多い。)
それが [[JIS X 0213:2004]] による[[文字集合]]の改正に伴い倍増しました。
[110]
なぜこれほど多く規定する必要があったのかは謎です。
** JIS X 0213:2000 本体の符号
[10]
[DFN[漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] = [[G0]] : [[JIS X 0208:2000]] 第1面
- [CODE(charname)@en[DEL]]
- [[G1]] : [[JIS X 0213:2000]] 第2面 (実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
[71]
[DFN[漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[DEL]]
- [[CR]] = [[C1]] : [[JIS X 0211]] [[C1]] または使用しない
- [[GR]] : [[JIS X 0213:2000]] 第2面 (実装水準3では空き)
[73]
[DFN[国際基準版・漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [CODE(charname)@en[DEL]]
- [[G0]] : [[ISO/IEC 646 IRV]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [[JIS X 0211]] [[C1]] [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
- [[GL]] 初期状態は[[情報交換の当事者間の合意]]による、 [[IRV]] が「望ましい」
[74]
[DFN[国際基準版・漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] : [[ISO/IEC 646 IRV]]
- [CODE(charname)@en[DEL]]
- [[CR]] = [[C1]] : [[JIS X 0211]] [[C1]]
- [[GR]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
;; [57] [[EUC-JISX0213]] はこれの拡張だと書いてある。
[75]
[DFN[ラテン文字・漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [CODE(charname)@en[DEL]]
- [[G0]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [[JIS X 0211]] [[C1]] [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
- [[GL]] 初期状態は[[情報交換の当事者間の合意]]による、 [[IRV]] が「望ましい」
[76]
[DFN[ラテン文字・漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]]
- [CODE(charname)@en[DEL]]
- [[CR]] = [[C1]] : [[JIS X 0211]] [[CR]]
- [[GR]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
[78] [[IRV]]/[[ラテン文字用図形文字集合]]を使う場合、
[[JIS X 0213]] 中の同じ文字は使用禁止。
ただし「慣用的な利用との互換」のため[[代替名称]]を使っても良い。
[58] 第2面を原則使用しないというとき、原則でないケースは何かよくわからない。
[[外字]]利用する場合ということ?
[59]
[[JIS X 0213:2000]] は新規格なのに[[固定シフト]]の初期状態が決められていなかったり、
「慣用的な利用との互換」が想定されていたり、意味がわからない。
[[JIS X 0208:1997]] 本体が規定する符号との互換性が想定されているのだろうか。
[77] [[重ね打ち]]禁止。
** JIS X 0213:2004 本体の符号
[69]
[[JIS X 0213:2004]] 本体では旧版の[[符号化文字集合]]の規定自体は改変されていませんが、
第1面が改正されているため、それが反映された別の[[符号化文字集合]]となっています。
** JIS X 0213:2000 附属書の符号
[11] [[Shift_JISX0213]]
(と [[Shift_JISX0213-plane1]])
は実質的に [[JIS X 0208:1997]]
の[[シフト符号化表現]]を拡張したものとなっていました。しかし当時[[事実上の標準]]だった
[[Windows-31J]] との互換性はありませんでした。
[63] [[代替名称]]使用可能。
[12] [[EUC-JISX0213]]
(と [[EUC-JISX0213-plane1]])
は、 [[JIS X 0212]] を除き、
当時利用されていた [[EUC-JP]] を拡張したものとなっていました。 [[JIS X 0212]]
は含まれませんでしたが、衝突しないよう配慮されていたため、
そのままでは使えないながらも、 [[EUC-JP]] を拡張して用いることは可能でした。
ただし当時普及しつつあった [[eucJP-open]] との互換性はありませんでした。
[13] [[ISO-2022-JP-3]]
(と [[ISO-2022-JP-3-plane1]])
は、 [[ISO-2022-JP]] 風ですが、
互換性はありませんでした。
[14] これら3つの符号化表現は、実装したくない業界各社の反対を押し切る[[政治的]]決着で、
[[規定]]ではなく[[参考]]とされたようです。
;; [15] [[JIS]] の現実との乖離を修正する路線だった [[JIS X 0208:1997]]
から引き続き開発された [[JIS X 0213]]
がなぜ明らかに実装できない[[符号化方式]]ばかり規定したのか謎ですが。。。
;; [55] 本体に誰がどこで使うのかさっぱりわからない[[符号]]が規定されており、
そちらは参考に格下げされなかったのも謎です。
;; [56] 業界各社が [[JIS X 0208:1997]] に反対しなかったのも謎です。
あっちの附属書も [[Windows-31J]] と矛盾してるという意味では実装不能だと思いますが...
[18] [CITE@en[draft-ohta-jcs-jis-x-0213-00 - Japanese Character Encoding on the Internet with JIS X 0213]]
([TIME[2015-10-19 01:00:39 +09:00]] 版)
<https://tools.ietf.org/html/draft-ohta-jcs-jis-x-0213-00>
[67]
>>18
は6つの[[符号化表現]]名を
[[MIME charset]]
として登録するものでしたが、
[[RFC]]
化に至らず放置されています。
** JIS X 0213:2004 附属書の符号
[70]
[[JIS X 0213:2004]] は第1面の改正に伴い[[符号]]の名称を変更しました。
- [[Shift_JIS-2003]], [[Shift_JIS-2003-plane1]]
- [[ISO-2022-JP-2003]], [[ISO-2022-JP-2003-plane1]]
- [[EUC-JIS-2003]], [[EUC-JIS-2003-plane1]]
[72]
[[JIS X 0213:2004]] の正誤表は[[符号]]の名称を再変更しました。
- [[Shift_JIS-2004]], [[Shift_JIS-2004-plane1]]
- [[ISO-2022-JP-2004]], [[ISO-2022-JP-2004-plane1]]
- [[EUC-JIS-2004]], [[EUC-JIS-2004-plane1]]
[79]
[[シフトJIS]]と[[日本語EUC]]は旧規格と同構造で第1面だけ差し替わっていますが、
[[ISO-2022-JP-2004]] は構造も改正されています。
** ISO/IEC 2022 エスケープシーケンス
[60] [[JIS X 0213:2000]] 本体は
[[ISO/IEC 2022]]
環境における[[指示シーケンス]]を定めています。
- [102] [[JIS X 0213:2000]] 第1面 [[終端バイト]] [N[4/15]]
- [61] [[JIS X 0213:2000]] 第2面 [[終端バイト]] [N[5/0]]
[16]
[[JIS X 0213:2004]]
は[[指示シーケンス]]も改正しました。
- [68] [[JIS X 0213:2004]] 第1面 [[終端バイト]] [N[5/1]]
[99] [[外字]]を使う場合はこれらを使ってはならないとされます。
[[JIS X 0208:1997]] と違って[[私用終端バイト]]を使えとは書かれていません。(なぜ?)
[62] [[代替名称]]使用可能.
** Unicode による符号化
[141]
[[JIS X 0213]] は [[Unicode]] による[[符号化]]の方法を定めていませんが、
すべての[[文字]] ([[文字]]が割り当てられた[[面区点位置]])
に [[JIS X 0221]] ([[ISO/IEC 10646]]) との対応関係が定められている (>>107) ため、
それを通じて
「[[Unicode]] の[[符号化方式]]による [[JIS X 0213]] [[符号化文字集合]]」
を構築できます。
[142]
[[JIS X 0213]] の制定以後[[日本政府]]は多くのシステムで [[JIS X 0213]]
を採用すると言っていますが、ほとんどすべてに於いて、
この使い方を指しています。
[143]
ただし、 [[Unicode]] で[[符号点]]1つだけで表現できない
[[JIS X 0213]] の[[非漢字]]の取り扱いなど、
本当に「[[JIS X 0213]] の[[文字集合]]に対応」しているのか怪しいところもあります。
* 平成12(2000)年の新規制定
[17]
[TIME[2000-01-20]]に[[制定]]され[TIME[2000-02-29]]に発行されたのが第1次規格
[DFN[[[JIS X 0213:2000]]]]
[CITE[7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合]]
でした。
[266]
[[規格票]]掲載版と同内容の[[符号表]]が [[ISO-IR]] で公開されています。
[REFS[
- [127]
[CITE[228.pdf]], [TIME[2022-11-02T03:16:37.000Z]], [TIME[2022-12-10T06:23:31.381Z]] <https://itscj.ipsj.or.jp/ir/228.pdf>
- [128]
[CITE[229.pdf]], [TIME[2022-11-02T03:16:37.000Z]], [TIME[2022-12-10T06:25:05.954Z]] <https://itscj.ipsj.or.jp/ir/229.pdf>
]REFS]
** 正誤票
[3] [TIME[平成13(2001)年5月][2001-05]]に[[正誤票]]が発表されています。
[[JSA]] の検索サイトで [[JIS X 0213:2000]] を検索して [SRC[>>86]]、
規格本文のサンプルの閲覧を選ぶと、
[[正誤票]]が挟み込まれた規格冒頭部分 [SRC[>>185]]
を閲覧できます。
;; [87] [[JSA]] の [[JIS]] 正誤票一覧ページには発行時期の関係で掲載されておらず、
わかりにくい。
[267]
[[適合性]]に関係し得る重要な変更が3点あります。
- [186]
2-79-54の字形が修正されています。 [SRC[>>185]]
--
[187]
かつて [[JISC]] のウェブサイトで入手できた [[JIS X 0213:2000]]
規格票は、附属書の字形は明らかに修正前のものです。
符号表の字形は潰れて判別が難しいですが、修正前に見えます。
--
[188]
[[ISO-IR]] の符号表 [SRC[>>128]] の字形も潰れて判別が難しいですが、
修正前のようにも修正後のようにも見えます。
登録は[TIME[2000-07-31]]なので、正誤票より1年近く前です。
-- [269]
「最終案」の[[符号表]] [[PDF]] では修正後と同じ字形に見えます。
--
[189]
[[CJK統合漢字]]の [CODE[U+7065]] の[[出典J]]は昔は [[JIS X 0212]] の
[CODE[J1-4943]]
ですが、これは修正後と同じ字形に見えます。
[[JIS X 0212-1990]] の 41-35
は、
かつて [[JISC]] のウェブサイトで入手できた規格票でも
[[ISO-IR]] でも潰れて判別が難しいですが、
修正後と同じ字形に見えます。
--
[190]
現在の [CODE[U+7065]]の[[出典J]]は [[JIS X 0213]] の [CODE[J14-6F56]]
で、修正後と同じ字形に見えます。
--
[191]
ちなみに[[文字情報基盤]]の [CODE[MJ016253]] は当然修正後相当の字形です。
ただ [CODE[MJ016253]] は上と右の「水」右下は払いですが、
左の「水」右下は止めです。
[[JIS]] の[[平成明朝]]はすべて払いです
(ただし [[JIS X 0212]] とその [[ISO-IR]] は潰れていて、左だけ止めのように見えないこともありません)。
- [268]
1-1-29
の [[UCS符号位置]]が [CODE[U+2015]] から [CODE[U+2014]] に変更されました。
-- [270]
[[文字の名前]] [CODE(charname)@en[EM DASH]]
や[[日本語通用名称]]「ダッシュ(全角)」は変更ありません。
-- [271]
附属書4 ([[非漢字]]の規定) は変更されましたが、附属書11 (索引)
は元から [CODE[U+2014]] でした。
-- [272]
「最終案」 [[CSV]] には [[JIS X 0208]] からあるこの文字は含まれませんでした。
-- [273]
[CITE[IPAmj明朝]]では [CODE[U+2014]] です。
-- [274]
変換ライブラリー類では [CODE[U+2014]] の実装と [CODE[U+2015]] の実装があります。
- [275]
1-94-31
の [[UCS符号位置]]と [[JIS X 0212]] [[区点位置]]が変更されました。
-- [276]
附属書6 (漢字の規定) と附属書11 (索引) の両方が変更されています。
-- [277]
「最終案」 [[CSV]] では [[JIS X 0212]] なし、
[[UCS]] は修正前 (fa66)、「修正」後 (fa67) でした。
-- [278]
完成版規格票と正誤表「誤」では [[JIS X 0212]] なし、
[[UCS]] (FA6B) でした。
-- [279]
正誤表「正」では [[JIS X 0201]] 74-18、
[[UCS]] (9B2D) でした。
--- [280] 「正」が[[括弧付きUCS]]になっているのは誤りで、
括弧なしの 9B2D が「正」よりも正しい。
-- [281] [[JIS X 0212]] と [[JIS X 0213]] は[[例示字形]]が違います。
新規[[CJK互換漢字]]を提案するのをやめて既存 [[CJK統合漢字]] ([[JIS X 0212]]
に対応) を使うことにしたようです。
--- [282] 新規提案[[CJK互換漢字]]の末尾だったので、連鎖的な修正は発生していません。
-- [283] [[文字情報基盤]]によると[[住基ネット統一文字コード]]は
[CODE[J+FA6B]] ([CODE[MJ028995]]) です。
[[住基ネット統一文字コード]] [CODE[J+9B2D]] ([CODE[MJ028993]]) は
[[JIS X 0212]] に対応します。
[CITE[IPAmj明朝]]の [CODE[U+9B2D]] ([[IVS]] ではない[[デフォルトグリフ]])
は [CODE[MJ028993]] です。
-- [284] 変換ライブラリー類は [CODE[U+9B2D]] で実装しています。
[REFS[
- [86] [CITE@ja[規格詳細 | [[JSA]]ライブラリサーバ]], [TIME[2022-05-10T15:32:56.000Z]] <https://library.jsa.or.jp/standard-detail?id=JIS+X+0213%3A2000>
-- [184] 消滅確認 [TIME[2023-09-17T11:46:58.400Z]]
-- [185] [CITE[pre_jis_x_00213_000_000_2000_j_pr10_i4.pdf]], [TIME[2009-03-11T06:40:58.000Z]], [TIME[2023-09-17T11:46:45.188Z]] <https://webdesk.jsa.or.jp/preview/pre_jis_x_00213_000_000_2000_j_pr10_i4.pdf#page=3>
]REFS]
-*-*-
[167] [CITE@ja[JIS X 0213]], [TIME[2011-09-07T13:50:21.000Z]], [TIME[2023-09-12T12:24:32.607Z]] <https://kanji-database.sourceforge.net/charcode/jis/jisx0213.html>
[168]
>>167 によると未修正の誤りが本体1箇所、附属書1箇所、解説3箇所あるとのこと。
** 制定
[2] 1998年/平成10年11月6日〜1999年/平成11年2月28日に[[公開レビュー]]が行われ、
原案が[[Web]]で公開されています。
[160] [CITE[教科書調査中間報告]], [TIME[2023-08-10T14:55:29.000Z]], [TIME[2000-03-06T02:59:02.370Z]] <https://web.archive.org/web/20000306025845/http://www.tiu.ac.jp/JCS/text1.html>
[159] [CITE[New JIS KANJI public review]], [TIME[2023-08-10T11:51:08.000Z]], [TIME[2000-09-15T15:41:21.510Z]] <https://web.archive.org/web/20000915153901/http://jcs.aa.tufs.ac.jp/jcs/pubrev/index.htm>
- [205] [CSECTION[符号表]]
- [206] [CSECTION[区点位置詳細]]
[207] >>205 に [[JIS X 0208]] および追加非漢字の字形、
>>206 に追加非漢字の字形と情報がありました。
完成版とは多少の出入りがあり、共通文字でも[[面区点位置]]が変わっているものも多いです。
- [197] [CSECTION[漢字一覧表]]
- [198] [CSECTION[更に調査を要する漢字の一覧表]]
- [199] [CSECTION[テキストファイル(CSV)版]]
[200] >>197, >>198 では文字画像 (用例字形等) と部首画数に整理番号が振られ、
[[大漢和辞典]]、
[[UCS]]、
[[JIS X 0201]]
符号があれば書かれていました。
>>199 は整理番号、部首画数、[[UCS]]、[[JIS X 0212]]
です。それらは >>197 >>198 の [[PDF]] と同内容ですが、
[[大漢和辞典]]番号は入っていませんでした。
([[面区点位置]]はありませんでした。)
[204] [[UCS]] が「?」付きのものが >>197 >>198 >>199 にいくつかあります。
[[大漢和辞典]]が「?」付きのものが >>198 にあります。
[201]
>>198 の不審な値:
- [202] 46-6-6R の [[UCS]] が [ASIS[HCDF]]
- [203] 141-10-2R の大漢和辞典が [ASIS[32745-]]
- [208]
[CSECTION[漢字用例表]]
[209] >>208 は >>197 に加え、
大漢語林、
新大字典、
新字源、
漢語林、
大字源の番号があり、
文字画像が最大4つ、
その用例文があれば書かれていました。
- [210] [CSECTION[常用漢字表康煕別掲字・人名漢字用許容字体の追加]]
[211] >>210
追加予定字に 1 - 105 の連番が振られ、既存 [[JIS X 0208]] 文字と
[CITE[常用漢字表]]
字形画像が示されていました。
- [212] [CSECTION[字体記述要素の追加(理由書及び文字表)]]
[213] >>212
追加予定字に 1 - 137 の連番が振られ、字形が示されていました。
[214]
これらの資料の掲載の文字は最終的な規格の文字との対応関係を示す資料がどこにも提供されていないようで、
[[UCS]] や[[大漢和辞典]]など不完全な情報と字形画像で比較するしかありません。
[225] >>224 >>246 で対応調査がされています。網羅されているのかはわかりません。
- [217] [CITE[New JIS KANJI public review]], [TIME[2023-09-18T11:17:53.000Z]], [TIME[2000-12-10T09:20:29.907Z]] <https://web.archive.org/web/20001210082700/http://jcs.aa.tufs.ac.jp/jcs/fdis-an.htm>
- [219] [CITE[errata : New JIS KANJI public review]], [TIME[2023-09-18T11:18:51.000Z]], [TIME[2000-09-19T21:40:50.817Z]] <https://web.archive.org/web/20000919204618/http://jcs.aa.tufs.ac.jp/jcs/errata/index.htm>
[218] >>217 [TIME[1999-07-15]]に「最終案」が公開されました。
[220] >>217 >>219 [TIME[1999-08-09]]に「最終案」の「誤りの訂正」が公開されました。
[221]
公開されたのは[[符号表]] [[PDF]] と文字情報の [[CSV]] ファイルと、
[[UCS]] / [[Unicode]] への追加提案 [[PDF]] でした。
規格本文・附属書や解説は公開されなかったようです。
[222]
修正されたのは[[符号表]]中1文字の字形と、
[[CSV]] 中の多数の [[Unicode符号位置]]でした。
- [223] [[符号表]] 2-79-39 の字形を 1-87-32 字形から正しい字形に変更
-- [228] >>219 には書かれていないが、 [[UCS]] 提案 [[PDF]] の字形も誤字形
-- [229] [[UCS]] 提案 [[PDF]] の [[UCS符号位置]] & [[CSV]] の[[括弧付きUCS]]:
U+AB29
-- [230] 完成版規格の[[括弧付きUCS]] & [[住基ネット統一文字コード]]: U+AB1B
- [226] [[CSV]] 1-47-66 の [[UCS]] が [CODE[U+5C6E]] から[[括弧付きUCS]]に変更
- [227] [[CSV]] 2-85-84 の [[UCS]] が [CODE[U+2EC0]] から[[括弧付きUCS]]に変更
- [241] [[CSV]] 2-89-73 の [[UCS]] が [CODE[U+2ECC]] から[[括弧付きUCS]]に変更
- [242] [[CSV]] 2-92-44 の [[UCS]] が [CODE[U+2EDE]] から[[括弧付きUCS]]に変更
- [231] >>226 >>227 >>241 >>242 のため多くの[[括弧付きUCS]]が連鎖的に変更
[234]
誤字形は修正版を公開する予定だと書かれていますが [SRC[>>219]]、
[[Internet Archive]] で見る限り、公開されないままだったようです。
[232]
ここでの[[括弧付きUCS]]は、修正前も修正後も、完成版規格の[[括弧付きUCS]]と違っています。
[233]
それ以外にも[[符号表]]と [[CSV]] の情報は完成版規格と違いがあります。
[[非漢字]]の[[面区点位置]]に変更があります。
[235]
「最終案」+「誤りの訂正」と完成版の差異 (不完全):
- [236] 2-94-5 の字形変更
-- [243] [[CNS 11643]] の11面35点43区の[[宋体]]が旧字形と同じ。
楷体は新字形と同じ。
--- [244] [[CNS 11643]] の変換表によると [CODE[U+29FCE]] に対応。
しかし [[CJK統合漢字]]は[[出典J]] ([[J4]]) 単独。
--- [245] 重複の [CODE[U+29FD7]]
に対応する [[CNS 11643]] 7面11区84点は、
[[CNS 11643]] の[[宋体]]も[[楷体]]も新字形と同じ。
[[CJK統合漢字]]は GHZ と T7 でどちらも新字形と同じ。
-- [382] [CITE[Re: Mule-UCS: JIS X 0213:2004 support]], [TIME[2023-09-26T13:04:16.000Z]], [TIME[2010-07-14T18:33:30.121Z]] <https://web.archive.org/web/20100714183148/http://www.m17n.org/mlarchive/mule-ja/200612/msg00001.html>
-- [383] [CITE@ja[U+29FCEとU+29FD7の混乱 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ]], [TIME[2023-09-26T13:05:28.000Z]] <https://moji-memo.hatenablog.jp/entry/20080110/1199956026>
- [314] 2-79-54 の字形変更 (>>186)
- [251] [[日本語通用名称]]の変更
-- [252] 10区、11区あたりの多くの文字の[[日本語通用名称]]が変更されています。
-- [261] その他にも表記変更などがあります。
-- [253] [[IPA]] の[[日本語通用名称]] (>>149) は何によるものか明記されていませんが、
おそらく
(すべてチェックはしていませんが)
[[JIS X 0213:2000]] 完成版と同じものです。
-- [260] ちなみに、最終案ファイルでは括弧は半角文字、完成版では括弧は半角印刷ですが、
[[IPA]] の[[日本語通用名称]]では括弧は全角文字になっています。
[CODE[,]] は最終案ファイル、[[IPA]] とも全角文字、完成版では全角印刷です。
- [255] [[文字の名前]]の変更
-- [256] 1-11-38
--- 最終案ブロック「拡張ラテン文字」
--- 最終案[[日本語通用名称]]「グレーブアクセント付きALPHA小文字」
--- 最終案[[文字の名前]]「LATIN SMALL LETTER ALPHA WITH GRAVE」
--- 最終案 [[UCS]] [CODE[U+1F70]]
--- 最終案 [[UCS]] ブロック「GREEK EXTENDED」
--- 完成版表「拡張ラテン文字」
--- 完成版[[日本語通用名称]]「グレーブアクセント付きスクリプトA小文字」
--- 完成版[[文字の名前]]「GREEK SMALL LETTER ALPHA WITH VARIA」
--- 完成版 [[UCS]] [CODE[U+1F70]]
--- 完成版 [[UCS]] ブロック「GREEK EXTENDED」
-- [257] 1-11-39
--- 最終案ブロック「拡張ラテン文字」
--- 最終案[[日本語通用名称]]「アキュートアクセント付きALPHA小文字」
--- 最終案[[文字の名前]]「LATIN SMALL LETTER ALPHA WITH ACUTE」
--- 最終案 [[UCS]] [CODE[U+1F71]]
--- 最終案 [[UCS]] ブロック「GREEK EXTENDED」
--- 完成版表「拡張ラテン文字」
--- 完成版[[日本語通用名称]]「アキュートアクセント付きスクリプトA小文字」
--- 完成版[[文字の名前]]「GREEK SMALL LETTER ALPHA WITH OXIA」
--- 完成版 [[UCS]] [CODE[U+1F71]]
--- 完成版 [[UCS]] ブロック「GREEK EXTENDED」
-- [258] 1-11-48
--- 最終案ブロック「拡張ラテン文字」
--- 最終案[[日本語通用名称]]「グレーブアクセント付きオープンE小文字」
--- 最終案[[文字の名前]]「LATIN SMALL LETTER OPEN E WITH GRAVE」
--- 最終案 [[UCS]] [CODE[U+1F72]]