-
Notifications
You must be signed in to change notification settings - Fork 4
/
456.txt
253 lines (185 loc) · 12.9 KB
/
456.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
[1] [DFN[[RUBYB[香港増補字符集] [Hong Kong Supplementary Character Set]]]]
(略称 [DFN[HKSCS]]) は、香港特別行政府政府 ([[HKSAR]])
による[[符号化文字集合]]です。
[[Big5]] の[[私用域]]に独自に[[文字]]を割り当てるものとなっています。
[FIG(important)[
[25] 本項は [[HKSCS]] の拡張部分に関するものです。全容については、
[[Big5]] を参照。
]FIG]
* 仕様書
[REFS[
- [24] [CITE@en[OGCIO : Hong Kong Supplementary Character Set-2016 (HKSCS-2016)]], [[OGCIO (www.ogcio.gov.hk)]], [TIME[2020-10-18T03:18:46.000Z]] <https://www.ogcio.gov.hk/en/our_work/business/tech_promotion/ccli/hkscs/2016_summary.html>
- [26] [CITE@en[Common Chinese Language Interface Website]], [TIME[2019-11-06T07:12:54.000Z]], [TIME[2020-10-18T03:21:07.651Z]] <https://www.ccli.gov.hk/en/hkscs/>
- [23] [CITE@en[OGCIO : Download Area - Hong Kong Supplementary Character Set Document]] ([TIME[2015-11-28 14:50:06 +09:00]] 版) <http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/download_area/document.htm>
-- 消滅確認 [TIME[2020-10-18T03:19:01.800Z]]
-- [CITE@en[OGCIO : Download Area - Hong Kong Supplementary Character Set Document]], [TIME[2020-11-15T11:59:11.000Z]], [TIME[2014-04-12T22:50:46.939Z]] <https://web.archive.org/web/20140412225032/http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/download_area/document.htm>
- [7] 旧URL
-- 中文版 <http://www.digital21.gov.hk/chi/hkscs/document.html>
-- 英文版 <http://www.digital21.gov.hk/eng/hkscs/document.html>
]REFS]
* 符号化文字集合
@@ 次の表は 2001年版時点でのものです。
[3]
,*符号位置 ,*名前 ,*内容
,[CODE(char)[0x8140]]〜[CODE(char)[0x8DFE]] ,UDA3 ,1999年版で 641 文字。2001年版で 757 文字。
,([CODE(char)[0x8140]]〜[CODE(char)[0x84FE]]) ,UDA3 ,628符号位置。 HKSCS は使用しない (外字用)。
,([CODE(char)[0x8C40]]〜[CODE(char)[0x8CDC]]) ,UDA3 ,2001年に116文字を追加。
,[CODE(char)[0x8E40]]〜[CODE(char)[0xA0FE]] ,UDA2 ,漢字 2898 文字。GCCS から 84 文字削除し、701 文字追加。(追加の内 100 字程は以前より GCCS の拡張として使用されていたもの。)
,[CODE(char)[0xA140]]〜[CODE(char)[0xA3FE]] ,Big-5 Symbols and Control Codes
,[CODE(char)[0xA440]]〜[CODE(char)[0xC67E]] ,Big-5 Primary Character Set
,[CODE(char)[0xC6A1]]〜[CODE(char)[0xC8FE]] ,VDA ,359 文字。倚天から部首 6 文字を削除したもの。
,[CODE(char)[0xC940]]〜[CODE(char)[0xF9D5]] ,Big-5 Secondary Character Set
,[CODE(char)[0xF9D6]]〜[CODE(char)[0xF9FE]] ,VDA ,41 文字。倚天から。
,[CODE(char)[0xFA40]]〜[CODE(char)[0xFEFE]] ,UDA1 ,漢字 763 文字。GCCS から 22 文字削除し、17 文字追加。
HKSCS は追加部分だけで、 Big5 本体部分は規定していませんが、
多くの実装は 1984年版 Big5 に加えて [CODE(char)[[[EURO SIGN]]]]
を実装しているようです。
* Unicode
[33]
前の版で [[Unicode]] [[PUA]] に対応付けられていたのが [[Unicode]]
の新しい文字に置き換えるケースがかなり多いです。
たまに [[Unicode]] の既存の文字から他の新しい文字に置き換えられるケースもあります。
-*-*-
[31]
[[HKSCS-2016]] では [[Big5]] への新規追加ではない、
[[CJK統合漢字]]の出典 [DFN[H]] としての[[漢字]]の追加が行われています。
[32]
[[HKSCS-2016]] の JSON ファイルには [[Unicode]] の[[符号点]]と、
出典 [[H]] としての [[Big5]] の符号が書いてあります。
[[Unicode]] の [[PUA]] は含まれていません。
[[Big5]] は [[ETen]] 由来部分 ([[非漢字]]含む。) も含まれていますが、
元祖由来部分は含まれていません。
[[GCSS]] 重複符号も入っていません。
[34]
0x8862 のような [[Unicode]] 1文字で表せない旧 [[HKSCS]] の文字が
[[HKSCS-2016]] の [[JSON]] ファイルには入っていません。
[35]
[[HKSCS-2016]] の [[JSON]] ファイルと [[Unihan]] の出典 [[H]] の [[Big5]]
を比較すると、パッと見た感じ[[漢字]]部分は等しいようです。
がよく見ると稀に違う (変更されている) ことがあります。
([[非漢字]]は [[Unihan]] に入っていません。)
[36]
どちらも一般的な実装が採用している旧版の [[Unicode]] と [[Big5]]
の対応関係と違っているところがあるので要注意です。
[37]
以上の理由より、
[[HKSCS]] を実装するなら、
[[HKSCS-2016]]
ではなく旧版に従うのが妥当でしょう。
[[HKSCS-2016]]
はもはや [[Big5]] の一種ではなく [[Unicode]]
の香港用部分集合と考えるべきものです。
[SEE[ [[Big5]] ]]
[50] [CITE@zh[昭源字體的新造字元 | 昭源字體]], [TIME[2022-09-26T03:58:18.000Z]], [TIME[2022-11-04T09:28:00.030Z]] <https://chiron-fonts.github.io/technical-details/codepoint-additions/#%E9%A6%99%E6%B8%AF%E5%A2%9E%E8%A3%9C%E5%AD%97%E7%AC%A6%E9%9B%86%E8%A3%9C%E7%B7%A8%E6%96%B0%E6%94%B6%E5%AD%97%E5%85%83>
[51]
[CITE@zh[[[CJKUI]]修正笔记(一):WG2 N5006R(未竟) - 知乎]], [TIME[2022-11-07T13:26:27.000Z]] <https://zhuanlan.zhihu.com/p/44819911>
[[CJK統合漢字]]の出典HBが後から変更された事例
-*-*-
[41]
[[Adobe-CNS1]] の [[Unicode]] は [[HKSCS]] のものです。
[SEE[ [[Adobe-CNS1]] ]]
[39] [CITE@en[Appendix:Unicode/Private Use Area/HKSCS - Wiktionary]], [TIME[2022-10-12T20:28:49.000Z]], [TIME[2022-10-13T15:09:20.049Z]] <https://en.wiktionary.org/wiki/Appendix:Unicode/Private_Use_Area/HKSCS>
[52] [CITE[03411-gbhkscs.pdf]], [TIME[2003-11-01T00:35:34.000Z]], [TIME[2022-11-07T14:08:32.381Z]] <https://www.unicode.org/L2/L2003/03411-gbhkscs.pdf>
* 字形
[8] 字形には[CITE[常用字字形表 (二零零零年修訂本)]]
(香港教育學院, 2000, <urn:isbn:962-949-040-4>) のものを採用しているそうです。
(この表の字形は香港の教育課程で使われているそうです。)
* 実装戦略
[SEE[ [[Big5]] ]]
* IVC
[43]
[[中華人民共和国]][[香港特別行政区]]当局のウェブサイトには
[DFN[HKSARG Collection]]
と称する [[IVC]] の登録提案が掲載されています。
[SRC[>>42]]
しかし現在に至るまで [[IVD]] 登録に至っていません。
[44]
本提案は [CODE[HB-[VAR[hhhh]]]] 形式の[[グリフ部分集合]]の [[IVS]]
を登録するものでした。 [SRC[>>42]]
[[HB]] は [[Big5]] (本体) を表しており、
[[PDF]] の字形一覧には[[台湾]]側の字形と対照して、
[[香港]]用の字形が示されています。
[SRC[>>45]]
[47]
本提案のファイルの日付は[TIME[公元2015年][2015]]で、その後に
[[HKSCS-2016]] が出版されました。
[[HKSARG Collection]]
が頓挫した理由は不明ですが、
[[IVS]] を使わないことにしたのでしょうか。
;; [49] [[中華人民共和国]][[澳門特別行政区]]当局は同時期に
[CODE[MSARG]] を [[IVD]] に登録しました。
[REFS[
- [42] [CITE[HKSARG collection]], [TIME[2015-08-06T03:41:54.000Z]], [TIME[2022-10-25T07:39:22.660Z]] <http://www.iso10646hk.net/ivd/1/>
-- [45] [CITE[Glyphs_[[HKSARG]].pdf]], [TIME[2015-08-06T03:00:06.000Z]], [TIME[2022-10-25T07:41:38.212Z]] <http://www.iso10646hk.net/ivd/1/Glyphs_HKSARG.pdf>
-- [46] [TIME[2015-08-06T04:19:19.000Z]], [TIME[2022-10-25T07:42:13.380Z]] <http://www.iso10646hk.net/ivd/1/IVD_Sequences_HKSARG.txt>
- [48] [CITE@ja[グループ-ノート:prefix-hka - GlyphWiki]], [TIME[2022-10-25T07:45:22.000Z]] <https://glyphwiki.org/wiki/Group-talk:prefix-hka>
]REFS]
* 関連
[29] [[MSCS]],
[[Adobe-CNS1]]
* 歴史
[17] 1998年に [[Big5]] の拡張として [DFN[[[GCCS]]]]
([DFN[[[Government Common Character Set]]]]) が規定されました。
[28]
[CITE[中文編碼網頁 → Windows NT 4.0 Workstation 國際中文版香港字集]], [TIME[2021-04-24T15:50:24.000Z]], [TIME[2022-10-11T06:11:37.365Z]] <http://code.web.idv.hk/charset/pcntw.php>
[39] [CITE@ja[グループ-ノート:Big5-GCCS外字 - GlyphWiki]], [TIME[2022-10-20T15:15:21.000Z]] <https://glyphwiki.org/wiki/Group-talk:Big5-GCCS%e5%a4%96%e5%ad%97>
[40] [CITE@en[Unicode mappings for GCCS "not verifiable" characters · GitHub]], [TIME[2022-10-20T15:19:38.000Z]] <https://gist.github.com/Artoria2e5/63fa5747c7093238ddcc1458a7582aca>
[2] 1999年9月28日版 ([DFN[[[HKSCS-1999]]]]) は、 [[GCCS]] から一部重複
(真の重複・[[包摂規準]]を考慮した重複) を削除 (その[[符号位置]]は保留)
し、新たな文字を大幅に追加したものでした。
1984年版 [[Big5]] に対して 4702 文字の追加[[漢字]]・[[非漢字]]が含まれています。
[9] 2001年12月版 ([DFN[[[HKSCS-2001]]]]) は、 HKSCS-1999 に更に116文字 [SRC[>>16]]
を追加すると共に、[[ISO/IEC 10646]]‐2:2001 にあわせて変換表を修正しています [SRC[>>16]]。
Big5 に対して 4818 文字の追加となっています。
[10]
更に、 2001年以降に承認された123文字の追加 [SRC[>>16]] と
[[ISO/IEC 10646]]:2003/Amd.1 に対応した変換表を含む
[DFN@en[[[HKSCS‐2004]]]] が制定されました (200''5''年5月)。
これによって文字数は4941文字になっています。
;;
[11] [[HKSAR]] は文字登録の申請・審査手続き [SRC[>>19]] を定めているので、
規格自体の改訂を待たずに随時文字が追加されています。
[18] 2009年12月には更に68文字を追加 [SRC[>>16]] した [DFN[[[HKSCS-2008]]]]
が出版されています。 [[ISO/IEC 10646]]:2003/Amd.6:2009 に対応しています [SRC[>>16]]。
* 実装
[4] HKSAR は Windows 用の [[EUDC]] フォントを提供しています。
このフォントは GCCS にあって HKSCS で削除した文字にも字形を用意しています。
[5] [[Windows]] や多くの [[GNU/Linux]] の配布も含めて、
[[中文]]対応のほとんどのシステムで HKSCS が実装されているようです。
[12]
[CITE[Microsoft Character Code Conversion Routines for HKSCS-2004]] <http://www.microsoft.com/globaldev/outreach/dnloads/MSCCCR_HKSCS_2004.mspx>
([[名無しさん]] [WEAK[2006-01-11 11:05:54 +00:00]])
[13]
[CITE@en[I'm not a Klingon : How do I get HKSCS 2004 characters from Big-5 in .Net?]] ([TIME[2007-05-05 11:09:05 +09:00]] 版) <http://blogs.msdn.com/shawnste/archive/2007/05/03/how-do-i-get-hkscs-2004-characters-from-big-5-in-net.aspx>
([[名無しさん]] [WEAK[2007-05-05 02:10:56 +00:00]])
* 識別子
[6] [[MIME]] などで使用される [[IETF]] ([[IANA]]) の [[charset]]
名としては、 [CODE(charset)[[[Big5-HKSCS]]]] が登録されています。
この名前は HKSCS-1999 に対応します。
[20] [[Web]] で使用される [[Encoding Standard]] の[[符号化ラベル]]としての
[CODE(charset)@en[[[Big5-HKSCS]]]] は[[文字符号化]] [[big5]]
を表しています。 [[big5]] は[[符号化器]]が素の [[Big5]] 相当となっており、
[[復号器]]は [[HKSCS]] 相当となっています。
* 歴史
[14] [CITE@en[GovHK: Hong Kong Supplementary Character Set (HKSCS)]]
([TIME[2015-02-22 19:03:16 +09:00]] 版)
<http://www.gov.hk/en/about/helpdesk/softwarerequirement/hkscs.htm>
[15] [CITE@en[OGCIO : Hong Kong Supplementary Character Set (HKSCS)]]
([TIME[2015-02-22 19:03:35 +09:00]] 版)
<http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/>
[16] [CITE@en[OGCIO:Development of the HKSCS]]
([TIME[2015-02-22 19:04:30 +09:00]] 版)
<http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/development.htm>
[19] [CITE@en[OGCIO:Inclusion of New Characters in the HKSCS]]
([TIME[2015-02-22 19:11:54 +09:00]] 版)
<http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/new_characters_inclusion.htm>
[21] [CITE@en[912470 – Merge big5-hkscs and big5 as per the Encoding Standard]]
([TIME[2015-02-22 19:49:45 +09:00]] 版)
<https://bugzilla.mozilla.org/show_bug.cgi?id=912470>
[22] [CITE@en[Opera: Opera 11.00 for Windows changelog]]
( ([[Frank M. Palinkas, Technical Writer, Opera Software ASA]] 著, [TIME[2011-04-24 11:17:12 +09:00]] 版))
<http://www.opera.com/docs/changelogs/windows/1100/>
[27] [CITE[char2015-06 - char2015-06.pdf]], [TIME[2017-12-07T04:16:16.000Z]], [TIME[2021-01-18T12:10:39.181Z]] <https://www.ogcio.gov.hk/tc/our_work/business/tech_promotion/ccli/cliac/doc/char2015-06.pdf>
[30] [CITE@en[36329 - Hong Kong Special Character Set display problem - chromium]], [TIME[2022-10-19T07:24:17.000Z]] <https://bugs.chromium.org/p/chromium/issues/detail?id=36329>
[38] [CITE[中文編碼網頁 → 香港增補字符集(HKSCS)]], [TIME[2022-09-26T04:01:52.000Z]], [TIME[2022-10-20T14:41:34.710Z]] <http://code.web.idv.hk/hkscs/hkscs.php>
[53] [CITE@en[Main Page - FreeFonts]], [TIME[2022-11-08T03:36:18.000Z]], [TIME[2005-02-16T10:01:36.155Z]] <https://web.archive.org/web/20050216095932/http://freefonts.oaka.org/en/index.php/Main_Page>