/
31.txt
135 lines (95 loc) · 6.54 KB
/
31.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
[4] [DFN[GB 18030]] は、[[中華人民共和国]]で用いられている[[文字コード]]です。
[[文字集合]]としては [[Unicode]] と実質的に等しく、
[[符号化文字集合]]としては [[GB 2312]] や [[GBK]] の拡張です。
* GB 18030-2000
[7] [CITE@zh[信息技朮 信息交換用漢字編碼字符集 基本集的拡充]],
[CITE@en[Information technology - Chinese ideograms coded character set for information interchange - Extension for the basic set]], 2000-03-17発布施行。
[5] [[中華人民共和国]]では法的に [[GB 18030]] の実装が義務付けられています (2001/9/1 より)。
[8]
>中国政府が認可したビットマップフォント以外のビットマップフォントを搭載した文字
情報処理製品は、搭載されているビットマップフォントが、定められた字形との相違が
1書体(1サイズ)当たり0.1%以下でなくてはならない
[9] [[フォント]]作る人大変そう・・・。
- [1]
''GB18030 standard'' <http://www.anycities.com/gb18030/standard.htm>
-- 消滅確認 [TIME[2020-10-10T01:53:00.700Z]]
-- [CITE[GB18030 standard]], [TIME[2020-10-10T01:52:50.000Z]], [TIME[2002-09-11T17:39:56.628Z]] <https://web.archive.org/web/20020911173918/http://www.anycities.com/gb18030/standard.htm>
-- [24] [CITE@ZH-CN[Foreword]], [TIME[2020-10-10T01:53:53.000Z]], [TIME[2002-09-11T22:35:44.470Z]] <https://web.archive.org/web/20020911223430/http://www.anycities.com/gb18030/document/gb18030m.htm>
--- 2000 の英訳
- [3]
[CITE[中国新文字コード規格 GB18030 - DynaComware Corp.(ダイナコムウェア)]] <http://www.dynacw.co.jp/license/gb18030/index.html>
-- 消滅確認 [TIME[2020-10-10T01:59:03.100Z]]
-- [25] [CITE[中国新文字コード規格 GB18030 - DynaComware Corp.(ダイナコムウェア)]], [[DynaComware Corp.(ダイナコムウェア)]], [TIME[2020-10-10T01:56:11.000Z]], [TIME[2005-05-08T08:16:41.994Z]] <http://web.archive.org/web/20050508081514/http://www.dynacw.co.jp/license/gb18030/index.html>
-- [26] [[日本]]での代理店。
関連[[ビットマップフォント]]規格の情報、
認証の情報、
[[規格票]]誤植の情報などあり。
** 当初の符号化文字集合
[10] 割当が差し替えられる前のもの。
[FIG[
- 0x00-0x7F 単字節: [[ASCII]]
- 0x80 単字節: [CODE(char)[[[U+20AC]]]] [CODE(charname)@en[[[EURO SIGN]]]]
- 0x8140-0xFEFE 双字節: [[GBK 1.0]]
- 0x81308130-0x8439FE39 四字節: 双字節に含まれない [[BMP]] の文字、残りは保留
- 0x85308130-0x8539FE39 四字節: 保留
- 0x86308130-0x8F39FE39 四字節: 保留
- 0x90308130-0xE339FE39 四字節: [[UCS]] 0x01面〜0x10面、残りは保留
- 0xE4308130-0xFC39FE39 四字節: 保留
- 0xFD308130-0xFE39FE39 四字節: [[私用域]]
]FIG]
** 解説サイト
[27] [CITE@ja[漢字文献情報処理研究会: GB 18030関連情報]], [TIME[2020-10-10T02:03:03.000Z]], [TIME[2005-04-04T22:55:20.496Z]] <http://web.archive.org/web/20050404225055/http://www.jaet.gr.jp/gb18030/>
[28] [CITE[GB 18030: A mega-codepage]], [TIME[2020-10-10T02:03:58.000Z]], [TIME[2005-04-04T13:03:38.665Z]] <http://web.archive.org/web/20050404130113/http://www-106.ibm.com/developerworks/library/u-china.html?dwzone=unicode>
- [12] ( ([TIME[2013-12-15 14:22:18 +09:00]] 版))
<ftp://ftp.oreilly.com/pub/examples/nutshell/cjkv/pdf/GB18030_Summary.pdf>
-- [29] 和訳 [TIME[2020-10-10T02:06:18.000Z]] <http://web.archive.org/web/20050515194414/http://www.jaet.gr.jp/gb18030/GB18030_Summary_14Jb5.pdf>
* GB 18030-2005
[2]
GB 18030 は2004年に改訂されて [[CJK統合漢字拡張B]]
なども含むようになったそうです。
(2005年6月現在、 <http://www.sac.gov.cn/> で検索しても 2000
としか出てませんが・・・。その 2000 も途中ですりかえられたわけで、
いいかげんなもんだ。)
[11] [CITE@en[Bug 11837 – GB18030-2005 is not supported!]]
( ([TIME[2013-12-15 10:38:01 +09:00]] 版))
<http://sourceware.org/bugzilla/show_bug.cgi?id=11837>
* エスケープシーケンス
[SEE[ [[ANSIエスケープシーケンス]] ]]
[SEE[ [[DOCS]] ]]
* メモ
[6] [CITE[92806 – need to support GB18030 in universal detector]]
( ([TIME[2013-03-02 13:02:49 +09:00]] 版))
<https://bugzilla.mozilla.org/show_bug.cgi?id=92806>
[13] [CITE[IRC logs: freenode / #whatwg / 20131216]]
( ([TIME[2013-12-17 23:32:46 +09:00]] 版))
<http://krijnhoetmer.nl/irc-logs/whatwg/20131216#l-291>
[14] [CITE[IRC logs: freenode / #whatwg / 20131218]]
( ([TIME[2013-12-20 09:03:33 +09:00]] 版))
<http://krijnhoetmer.nl/irc-logs/whatwg/20131218#l-470>
[15] [CITE@en[GB 18030 - Wikipedia, the free encyclopedia]]
( ([TIME[2013-12-20 12:31:45 +09:00]] 版))
<http://en.wikipedia.org/wiki/GB_18030>
[16] [CITE[Turn gb18030 into a real UTF and make gbk et al labels for it. https://w... · 182ad9e · whatwg/encoding]]
( ([TIME[2014-02-01 23:37:21 +09:00]] 版))
<https://github.com/whatwg/encoding/commit/182ad9e607a7c6f0fa51d9dd6c638edaa5ec59fd>
[17] [CITE@en[gb18030 is returned lowercase · dd172fa · whatwg/dom]]
( ([TIME[2014-12-05 17:20:32 +09:00]] 版))
<https://github.com/whatwg/dom/commit/dd172fa5f8c2fc82d0c66b7f9305fd59666c95ba>
[18] [CITE@en[Bug 28740 – GB18030-2000 and GB18030-2005 : Decide what to do about their differences]]
([TIME[2015-06-03 12:43:32 +09:00]] 版)
<https://www.w3.org/Bugs/Public/show_bug.cgi?id=28740>
[19] [CITE@en[28740 – GB18030-2000 and GB18030-2005 : Decide what to do about their differences, especially PUA codepoints in GB18030-2000]]
([TIME[2015-08-20 13:22:58 +09:00]] 版)
<https://www.w3.org/Bugs/Public/show_bug.cgi?id=28740>
[20] [CITE@en[gb18030, shift_is, euc-kr: put byte back if code point is null (not p… · whatwg/encoding@640bf69]]
([TIME[2015-08-20 13:25:44 +09:00]] 版)
<https://github.com/whatwg/encoding/commit/640bf69847a17fd98df027fd6cd5ae384ac82dab>
[21] [CITE@en[Indicate that we follow GB18030-2000. Fixes https://www.w3.org/Bugs/P… · whatwg/encoding@257aa5b]]
([TIME[2015-08-22 11:48:07 +09:00]] 版)
<https://github.com/whatwg/encoding/commit/257aa5b64f5ccae76b8ed20d87cc2895deb17f0a>
[22] [CITE@en[Remove the last 14 characters PUA of GB18030-2005 · Issue #27 · whatwg/encoding]]
([TIME[2016-12-20 20:28:39 +09:00]])
<https://github.com/whatwg/encoding/issues/27>
[23] [CITE@en[Document minimal implementation requirements]]
([[annevk]]著, [TIME[2017-03-20 20:06:36 +09:00]])
<https://github.com/whatwg/encoding/commit/9323530fae940d95b2c0b9f00a6a654bd2097aff>