-
Notifications
You must be signed in to change notification settings - Fork 4
/
671.txt
369 lines (260 loc) · 15.9 KB
/
671.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
[1] [DFN[[[JIS X 0213:2000]]]] [CITE[7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合]]
は、2000年/平成12年1月20日制定、2000年/平成12年2月29日発行。
[2] 1998年/平成10年11月6日〜1999年/平成11年2月28日に[[公開レビュー]]が行われ、
原案が[[Web]]で公開されています。
[3] 2001年5月に正誤表が発表されています。
@@
[17] [DFN[[[JIS X 0213:2004]]]]
[25]
形式的には現在も有効な [[JIS]]
ですが、
すっかり [[Unicode]]
化が済んだ今となっては実効性を有していません。
* 符号化文字集合
[4] 第1面は、 [[JIS X 0208:1997]] に更に[[非漢字]]と[[第3水準]]漢字集合を追加したものでした。
2000年版は次の[[文字]]が含まれていました。
[FIG(list)[
- 1-01-01〜1-13-94 [[非漢字]] ([[JIS X 0208:1997]] + 追加分)
- 1-14-01〜1-15-94 [[第3水準]]漢字集合
- 1-16-01〜1-47-51 [[第1水準]]漢字集合 ([[JIS X 0208:1997]])
- 1-47-53〜1-47-93 [[第3水準]]漢字集合
- 1-48-01〜1-84-06 [[第2水準]]漢字集合 ([[JIS X 0208:1997]])
- 1-84-08〜1-94-89 [[第3水準]]漢字集合
]FIG]
[5] [[非漢字]]は、 [[Windows-31J]] の拡張がそのまま取り込まれています。ただし
[[JIS X 0208]] と重複する[[面区点位置]]は、予約とされています。
;; [[漢字]]について [[Windows-31J]] との互換性はありませんでした。
[6] その他幾つか空きがありますが、
[[JIS X 0213:2000]] 3.2.2
によれば第1面の空きはすべて利用禁止です。
[9] [[JIS X 0208:1997]] をそのまま拡張したものとなっていますが、
厳密に両仕様を解釈すると、[[包摂規準]]が変更されており、
完全に互換性があるわけではありません。
[SEE[ [[JIS X 0208]] ]]
(が実用上は問題にはなりません。)
[7] 第2面は、次の範囲に[[第4水準]]漢字集合が含まれていました。
[FIG(list)[
- 2-01-01〜2-01-94
- 2-03-01〜2-05-94
- 2-08-01〜2-08-94
- 2-12-01〜2-15-94
- 2-78-01〜2-94-86
]FIG]
[8] [[EUC]] で [[G3]] に使うことを想定していました。
[36] 従来[[日本語EUC]]で [[G3]] に割り当てられていた
[[JIS X 0212-1990]] と衝突しないように配置されています。
[37] 空き領域は使用禁止とされています。
[42]
[[JIS X 0213:2000]] 本体3.によれば、
[[実装水準]]3と4があり、
[[実装水準]]3は[[第3水準漢字]]までで[[第4水準漢字]]を含まない
([[符号化文字データ要素]]や[[装置]]である)
ことを意味します。
つまり一口に [[JIS X 0213]] 対応といっても、
第3水準までの場合もあるので要注意です。
実装しない場合第4水準の領域は空きとされます。
[43]
[[JIS X 0213:2000]] 3.2.2
によれば第2面の空きには[[情報交換の当事者間の合意]]により[[外字]]を割り当てられます。
(ここでいう空きは、実装水準3で使用しない第4水準の領域は含みません。)
[45]
[[JIS X 0213:2000]] 3.2.2
によれば第2面に[[外字]]を割り当てる場合、
[[終端バイト]]
[N[5/0]]
は使用禁止されています。
[46]
[[JIS X 0213:2000]] 本体 3.2.2 や [[Shift_JISX0213]]
によれば、
- [48] 1面の文字を空きに割り当ててはならない
- [49] 実装水準4の場合、2面の文字を空きに割り当ててはならない
とされます。
[47]
従って、
- [50] 第4水準を元の面区点位置につまみ食い的にまばらに実装することは認められません。
- [51] 実装水準3の場合、第4水準漢字をつまみ食いして外字領域に割り当てることはできます。
- [52] [[包摂規準]]の範囲内の[[異体字]]を[[外字]]に割り当てることはできません。
- [53] 第2面の空き領域に [[JIS X 0212-1990]] を実装することはできません。
-- 第1面や第2面と同じ文字が含まれるため。
- [54] ちなみに [[JIS X 0212-1990]] 側も[[外字]]領域の制約があるので、
空き領域に [[JIS X 0213:2000]] 第2面を割り当てることはできません。
[38] 一説に空きを [[UCS]] の [[BMP]]
の[[私用域]]に対応付けることも想定していたといわれます。
[39] [[ARIB STD-B24]] は第1面と第2面を独自の[[終端バイト]]で使っていました。
第1面はかわりに [[JIS X 0208]] (相当) + [[ARIB外字]]としてもよいとされていました。
* 符号化表現
** JIS X 0213:2000 本体の符号
[10]
[DFN[漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] = [[G0]] : [[JIS X 0208:2000]] 第1面
- [CODE(charname)@en[DEL]]
- [[G1]] : [[JIS X 0213:2000]] 第2面 (実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
[71]
[DFN[漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[GL]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[DEL]]
- [[CR]] = [[C1]] : [[JIS X 0211]] [[C1]] または使用しない
- [[GR]] : [[JIS X 0213:2000]] 第2面 (実装水準3では空き)
[73]
[DFN[国際基準版・漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [CODE(charname)@en[DEL]]
- [[G0]] : [[ISO/IEC 646 IRV]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
- [[GL]] 初期状態は[[情報交換の当事者間の合意]]による、 [[IRV]] が「望ましい」
[74]
[DFN[国際基準版・漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[G0]] : [[ISO/IEC 646 IRV]]
- [CODE(charname)@en[DEL]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
;; [57] [[EUC-JISX0213]] はこれの拡張だと書いてある。
[75]
[DFN[ラテン文字・漢字用7ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [CODE(charname)@en[DEL]]
- [[G0]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
- [[固定シフト]] [CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
- [[GL]] 初期状態は[[情報交換の当事者間の合意]]による、 [[IRV]] が「望ましい」
[76]
[DFN[ラテン文字・漢字用8ビット符号]]
- [[CL]] = [[C0]] : [[JIS X 0211]] [[C0]]
- [CODE(charname)@en[SP]]
- [[G0]] : [[JIS X 0201]] [[ラテン文字用図形文字集合]]
- [CODE(charname)@en[DEL]]
- [[G1]] : [[JIS X 0213:2000]] 第1面
- [CODE(charname)@en[SS3]] / [[G3]] = [[JIS X 0213:2000]] 第2面
(実装水準3では原則、使用しない)
[78] [[IRV]]/[[ラテン文字用図形文字集合]]を使う場合、
[[JIS X 0213]] 中の同じ文字は使用禁止。
ただし「慣用的な利用との互換」のため[[代替名称]]を使っても良い。
[58] 第2面を原則使用しないというとき、原則でないケースは何かよくわからない。
[[外字]]利用する場合ということ?
[59]
[[JIS X 0213:2000]] は新規格なのに[[固定シフト]]の初期状態が決められていなかったり、
「慣用的な利用との互換」が想定されていたり、意味がわからない。
[[JIS X 0208:1997]] 本体が規定する符号との互換性が想定されているのだろうか。
[77] [[重ね打ち]]禁止。
** ISO/IEC 2022 エスケープシーケンス
[60] [[JIS X 0213:2000]] 本体は
[[ISO/IEC 2022]]
環境における[[指示シーケンス]]を定めています。
- [102] [[JIS X 0213:2000]] 第1面 [[終端バイト]] [N[4/15]]
- [61] [[JIS X 0213:2000]] 第2面 [[終端バイト]] [N[5/0]]
[99] [[外字]]を使う場合はこれらを使ってはならないとされます。
[[JIS X 0208:1997]] と違って[[私用終端バイト]]を使えとは書かれていません。(なぜ?)
[62] [[代替名称]]使用可能.
** JIS X 0213:2000 附属書の符号
[11] [[Shift_JISX0213符号化表現]]
(と [[Shift_JISX0213-plane1]])
は実質的に [[JIS X 0208:1997]]
の[[シフト符号化表現]]を拡張したものとなっていました。しかし当時[[事実上の標準]]だった
[[Windows-31J]] との互換性はありませんでした。
[63] [[代替名称]]使用可能。
[12] [[EUC-JISX0213符号化表現]]は、 [[JIS X 0212]] を除き、
当時利用されていた [[EUC-JP]] を拡張したものとなっていました。 [[JIS X 0212]]
は含まれませんでしたが、衝突しないよう配慮されていたため、
そのままでは使えないながらも、 [[EUC-JP]] を拡張して用いることは可能でした。
ただし当時普及しつつあった [[eucJP-open]] との互換性はありませんでした。
[13] [[ISO-2022-JP-3符号化表現]]は、 [[ISO-2022-JP]] 風ですが、
互換性はありませんでした。
[14] これら3つの符号化表現は、実装したくない業界各社の反対を押し切る[[政治的]]決着で、
[[規定]]ではなく[[参考]]とされたようです。
;; [15] [[JIS]] の現実との乖離を修正する路線だった [[JIS X 0208:1997]]
から引き続き開発された [[JIS X 0213]]
がなぜ明らかに実装できない[[符号化方式]]ばかり規定したのか謎ですが。。。
;; [55] 本体に誰がどこで使うのかさっぱりわからない[[符号]]が規定されており、
そちらは参考に格下げされなかったのも謎です。
;; [56] 業界各社が [[JIS X 0208:1997]] に反対しなかったのも謎です。
あっちの附属書も [[Windows-31J]] と矛盾してるという意味では実装不能だと思いますが...
[16] 実装によっては
[CODE[[[ISO-2022-JP-3-Compatible]]]]
や [CODE[[[ISO-2022-JP-3-Strict]]]] のようなバリエーションに対応してますが、
[[JIS]] では規定されていません。
[18] [CITE@en[draft-ohta-jcs-jis-x-0213-00 - Japanese Character Encoding on the Internet with JIS X 0213]]
([TIME[2015-10-19 01:00:39 +09:00]] 版)
<https://tools.ietf.org/html/draft-ohta-jcs-jis-x-0213-00>
* 2004年の改訂
[26]
[TIME[平成16(2004)年][year:2004]]の変更は、
[[表外漢字字体表]]に関するものでした。
[[JIS X 0208]] 部分に関わるのに
[DFN[JIS X 0213:2004]] としてだけ[[改正]]され、
[[JIS X 0208]] は放置されました。
[19]
[CITE@ja-jp[Microsoft Windows Vista:Windows XP および Windows Server 2003 向けJIS2004 対応 MS ゴシック & MS 明朝フォントパッケージについて]] ([TIME[2007-02-26 22:17:54 +09:00]] 版) <http://www.microsoft.com/japan/windows/products/windowsvista/jp_font/jis04/default.mspx>
[20]
[CITE@ja[いつの間にか知っていた漢字が変わっていた - Togetter]], [TIME[2020-07-16 11:10:29 +09:00]] <https://togetter.com/li/1559678>
[21]
>>20 人それぞれフォントが違うらしく、
困っている人が多いけど何に困っているのかさっぱりわからないという地獄・・・
[22]
[[83JIS]] の惨状を知っててこんな酷い変更を強行したのだから、
この改訂の関係者は悪意があるとしか思えん。
[23]
[[包摂規準]]の範囲内の字形変更だとしても、
その[[包摂規準]]が一般的な人々の[[字体]]の差異の認識と乖離してるんだからなあ。
しかも[[例示字形]]の変更が一般[[フォント]]に波及することを期待しての変更だからたちが悪い。
[24]
時流に反して[[新字体]]をやめて[[旧字体]]に誘導しようとした新[[常用漢字表]]が悪いともいえる。
[FIG(quote)[
[FIGCAPTION[
[32] [CITE@ja[異体字リスト(JIS2004標準字体) Prog20が完成しました! : 永和印刷のブログ e-blog]]
([[eiwa-p]], [TIME[2021-08-14T01:54:42.000Z]])
<https://eiwap.exblog.jp/20559474/>
]FIGCAPTION]
> 文字の規格が変更された際には、
> OS変更が進まなかったせいもあり意外と問題にならなかったのですが、
> 今後はパソコンの環境により、画面で目にする文字の字形が異なったり、
> 画面で目にする文字と、印刷のために組版した文字の字形が異なるということが想定されます。
]FIG]
[33] [CITE@ja[Masanori Kusunoki / 楠 正憲さんはTwitterを使っています 「Windows VistaがJIS 2004に移行した当時マイクロソフトに勤務し経産省に呼び出され各府省のCIO補佐官連中に囲まれて「字形が変わっては困る。どうしてくれるんだ」と吊し上げられて「JIS 78→JIS 83 → JIS 2004と標準字形をコロコロ弄ったのは経産省。文句あるなら省内でいえ」と逆ギレしたんだったな」 / [[Twitter]]]]
([TIME[2021-10-18T04:35:29.000Z]], [TIME[2021-10-18T05:29:14.555Z]])
<https://twitter.com/masanork/status/1449361742111272960>
[34]
でも [[Windows]] が実装しているのは 2004年に字形が改正されていない
[[JIS X 0208]]
だけで、
改正された [[JIS X 0213]] は実装していないのでは。
[[Unicode]] 用[[フォント]]に [[JIS X 0213]] の改正を勝手に反映させた経営判断(?)を
[[JIS]] に責任転嫁するのは違うのではなかろうか。
経産省も MS もそれぞれ自業自得。。。
* 2012年の改正
[44]
[TIME[平成24(2012)年][year:2012]]の変更は、
[[常用漢字表]]改正に関係するもので、
[[JIS X 0208:2012]]
と
[DFN[JIS X 0213:2012]]
として[[改正]]されました。
どちらも元の[[仕様書]]に対する[[差分仕様書]]として発行されました。
* Unicode との対応関係
- [40] [CITE[Nate: PerlのEncode::JIS2KとPython]], [TIME[2022-04-10T23:21:31.000Z]], [TIME[2022-05-08T01:10:18.998Z]] <https://nathancorvussolis.blogspot.com/2017/07/perl-encode-jis2k-python.html>
-[35] [CITE[Nate: 主な実装における EUC-JIS-2004, Shift_JIS-2004 から Unicode への変換結果の違い]], [TIME[2022-04-10T23:21:31.000Z]], [TIME[2022-05-03T02:31:57.543Z]] <https://nathancorvussolis.blogspot.com/2016/12/jisx0213-2004-unicode-table.html>
[41] [CITE@en-US[ucm/euc-jp.ucm - metacpan.org]], [TIME[2022-04-07T03:18:23.000Z]], [TIME[2022-05-08T01:11:52.727Z]] <https://metacpan.org/release/DANKOGAI/Encode-3.17/source/ucm/euc-jp.ucm>
>>40 に言及ないが [CODE[Encode::JIS2K]] と同じ
* メモ
[27] [CITE@ja[日本工業標準調査会:ニュースとお知らせ-JIS X 0213:2004に関連する情報について]]
([TIME[2020-11-15T07:42:43.000Z]])
<https://warp.ndl.go.jp/info:ndljp/pid/10217941/www.jisc.go.jp/newstopics/2005/tp0213.htm>
[28] [CITE[040220kanjicode.pdf]], [TIME[2020-11-15T07:42:56.000Z]] <https://warp.ndl.go.jp/info:ndljp/pid/10217941/www.jisc.go.jp/newstopics/2005/040220kanjicode.pdf>
[29] [CITE@ja[日本工業標準調査会:ニュースとお知らせ-<報道発表> 人名用漢字に対するJIS漢字コード表の対応状況の公表について]], [TIME[2020-11-15T07:43:46.000Z]] <https://warp.ndl.go.jp/info:ndljp/pid/10217941/www.jisc.go.jp/newstopics/2004/041221kanjicode.htm>
[30] [CITE[Wayback Machine]], [TIME[2020-11-15T08:22:27.000Z]] <https://web.archive.org/web/20040226191408/http://www.meti.go.jp/kohosys/press/0004964/0/040220jis.pdf>
[31] ([TIME[2020-11-19T09:33:25.000Z]], [TIME[2007-12-27T06:21:50.434Z]])
<https://web.archive.org/web/20071227062149/http://www.jsa.or.jp/stdz/instac/h13reports/jcs_houkoku.htm>