-
Notifications
You must be signed in to change notification settings - Fork 4
/
234.txt
121 lines (92 loc) · 4.87 KB
/
234.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
[3] [DFN@en[CCCII]]
([SPAN@zh[中文資訊交換碼]],
[SPAN@en[Chinese Character Code of Information Interchange]])
は、[[中華民国]] ([[台湾]]) の[[符号化文字集合]]です。
* 符号化文字集合
[11] [[CCCII]] における[[符号位置]]は[[面句点]]で表され、また6つの[[面]]が1[[層]] ([[レイヤー]])
とされています。合計15層あり、異体字関係にある文字同士が別の層の同じ符号位置に来るように設計されています。
[12] [[ISO/IEC 2022]] の [[94[SUP[3]]文字集合]]の形になっていますが、正式な[[終端バイト]]は割り当てられていません。
[13]
[FIG[
- 第1層 [[繁体字]]
-- 1面 (0x21)
--- 2区 数学記号56文字
--- 3区 ASCII94文字
--- 4区~10区 保留
--- 11区 括弧、句読点その他の記号35文字
--- 12区~14区 [[部首]]214文字
--- 15区 中文数字45文字、[[注音字母]]37文字、[[音調符号]]4文字
--- 16区~67区 (0x3021~0x6330) [[最常用字]]4808文字
-- 1面68区~3面64区 (0x216421~0x23607E) [[次常用字]]17032文字
-- 3面65区~6面5区 (0x236121~0x262543) その他の漢字20583文字
- 第2層 [[簡体字]]
-- 0x273021~0x2C7E7E [[簡体字]]11517文字 (大陸簡体字3625文字とその他の簡体字7892文字、0x213021~0x267E7E 相当)
- 第3層~第12層 その他の異体字
-- 0x2D3021~ 異体字 (0x213021~0x267E7E 相当)
- 第13層 日本漢字
- 第14層 韓国漢字
- 第15層 予約
-- 91面 [[JIS C 6226-1978]] 相当の漢字
-- 92面 [[KIPS]] に予約
-- 93面 補遺漢字に予約
-- 94面 [[CB2]] 非漢字に予約
]FIG]
第1層以外の最初の[[面]]の1区~15区は[[私用域]]。
* フォント名
[14] 「cccii.1989.21xxxx-0」など (21 が[[面]]番号 + 0x20) が使われています。
* EACC
[18] ANSI/NISO Z39.64-1989(R1995) (EACC)
[CITE@en[East Asian Character Code for Bibliographic Use]], 1986年1月16日。ISBN 0-88738-947-3。
[19] [[REACC]], [[EACC]]
(REACC の R は RLIN (Research Libraries Information Network) より。)
[20] [[The Research Libraries Group]] ([[RLG]]) が US Library of Congress, Chinese Character Analysis Group
とともに開発し、1983年から主に北米の図書館で利用されている。
[21] [[符号化文字集合]]はおおむね [[CCCII]] と同じだが、
[FIG[
- 含まれていない漢字がある
- いくつかの入れ替えがある
- 13層1面に [[JIS C 6226-1983]] から293文字追加
- 14層1面に [[KIPS]] から[[ハングル]]追加
- 14層2面に [[GB 2312-80]] から44文字追加
]FIG]
* 歴史
[4]
1980年 (民国69年) に[[行政院]]文化建設委員会が発表しました。
一説4808字、別説6139字。
[5]
1981年 (民国70年) に[Q@zh[第二批]]が発表されました。
[6]
1982年 (民国71年) に[Q@zh[第二冊第二版]]が発表されました。
[7]
1985年 (民国74年) 5月に[Q@zh[第二冊第三版]]が発表されました。
21840 文字あり、うち[[常用字]] 4804文字、
[[備用字]] 17302 文字でした。
[9]
1985年 (民国74年) 5月に[CITE@zh[中文資訊交換碼異體字表(甲)]]の
[Q@zh[第二冊第三版]]が発表されました。
[[異体字]]が11517字あり、そのうち[[簡体字]]が3625字ありました。
[8]
1987年 (民国76年) 2月に[Q@zh[第三冊]]が発表されました。
これは[Q@zh[罕用字集]]で、20583字あり、
そのうち[[教育部]]選定の[[罕用字]]が12924字、
[[次常用字]]が314字、その他[[康熙字典]]、[[中文大辭典]]、
[[財?資料考核中心字]]、[[電信傳輸碼字]]、[[五大專題碼字]]、
[[其它資訊字]]から7345字が含まれていました。
[10] 1989年 (民国78年) 月に[CITE@zh[中文資訊交換碼異體字表第一次綜合修訂稿]]が発行されました。
ここまでに発行された[[符号化文字集合]]には異体字関係のミスなどが多く含まれており、
それを修訂したものとなっています。
* メモ
[1]
[CITE[中文資訊交換碼解決方案藍圖草稿]] <http://cell.cs.uh.edu/computing/techroadmap.html>
[2]
[CITE[中文資訊交換碼 (Chinese Character Code for Information Interchange)]] <http://www.cccii.org.tw/>
[15] [CITE@en[Notes on CJK Codes and Encodings]]
<http://ftp.cityu.edu.hk/pub/chinese/ifcss/info/cjk-codes/94x94x94.htm>
[16] [CITE@zh[我的倉頡]] <http://www.geocities.com/mycj3/>
[17] [CITE[GBK による CCCII 文字表]]
<http://www.nease.net/~stonec/hanzi/cccii/c32-gbk.txt>
[22] [CITE@en[Notes on CJK Codes and Encodings]]
<http://ftp.cityu.edu.hk/pub/chinese/ifcss/info/cjk-codes/94x94x94.htm>
[23] [CITE@en[MARC 21 Specifications: Character Sets: East Asian]]
<http://lcweb.loc.gov/marc/specifications/specchareacc.html>
[24] [CITE[文字コードについて]] <http://www.wul.waseda.ac.jp/PUBS/fumi/64/64-06.html>