/
922.txt
102 lines (78 loc) · 3.34 KB
/
922.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
[2] [DFN[[[DIS 10646]]]] は、 [[ISO/IEC 10646]] の [[JTC1]] で投票される段階にある原案 ([[DIS]])
を指す用語です。
[1]
有名な割に具体的な情報はほとんどない。矛盾した情報もある。
正式な規格になる以前の段階だから、委員会関係者しか詳しい資料を持っていないのか?
* 呼称
[8]
[[ISO/IEC 10646]] の [[DIS]] はすべて [[DIS 10646]]
と呼ばれますが、 [[ISO/IEC]] の委員会以外で敢えて「[[DIS 10646]]」と呼ぶ時は、
[[Unicode]] 化される前の、否決された当初の [[DIS 10646]] を指すことが多いようです。
[9]
[[RFC 1345]] は [DFN[ISO-10646-1DIS]] とも書いています。
(がそれ以外では使われていない呼び名です。)
[10] なお、 [[DIS 10646]] 否決後の [[Unicode]] 化された [[DIS]] は
[[DIS 10646-1.2:1992]] と呼ばれます。
* 符号構造
[3]
[[面]]は [[ISO/IEC 2022]] の [[CL]]・[[CR]] を避けて、
4つの[RUBY[四分区][クォードラント][quadrant]]に分けられる。
四分区はそれぞれ96×96。
[PRE(aafig)[
0x20 0x7E 0xA0 0xFF
+-------------+
| +----+ +----+
| |A-00| |A-01|
| +----+ +----+
| |I-00| |I-01|
| +----+ +----+
| +----+ +----+
| |A-10| |A-11|
| +----+ +----+
| |I-10| |I-11|
+-+----+-+----+
]PRE]
[7]
面が191個で群、 UCS 全体で群が191個。
* 符号化表現
[4]
4オクテット固定長の正規形と、各種の[[符号短縮法]]がある。
[5]
[[符号短縮法]]を使っていても [CODE(charname)@en[SGCI]] によって短縮されていない[[符号化文字]]を利用可能。
* 文字集合
四分区ごとの割当。重複等は、版の違いによるのか、
情報源のどれかが間違っているのか・・・
情報源の情報源である版がどれか分かっていれば添えておいた。
- G = 032, P = 032: [ABBR[BMP][基本多言語面]]
-- A-[VAR[nn]]: Alphabet, 記号類
--- R = 032: [[ISO/IEC 8859]]‐1 [SRC[1989-10, 1991-02]]
-- Q = 00: Alphabet, 記号類
-- Q = 00: [[JIS X 0208]] (16区以降) [SRC[1989-01]]
-- Q = 01: 予約
-- Q = 01: Restricted use (Presentation form, [[DRCS]], Private use) [SRC[1989-10]]
-- Q = 10: [[GB 2312]]‐80 (16区以降) [SRC[1989-01]]
-- Q = 11: [[KS C 5601]] (16区以降) [SRC[1989-01]]
- G = 032, P = 040
-- Q = 11: GB 2312‐80 [SRC[1990-08]]
- G = 032, P = 048: 中国
-- Q = 11: GB 2312‐80 [SRC[1990-11-04]]
-- Q = 11: JIS X 0208 [SRC[1990-08]]
- G = 032, P = 056
-- Q = 11: KS C 5601 [SRC[1990-08]]
- G = 032, P = 064: 日本
-- Q = 01: Private use
-- Q = 10: [[JIS X 0212]]‐1990
-- Q = 11: JIS X 0208 [SRC[1990-11-04]]
- G = 032, P = 080: 韓国
-- Q = 11: [[KS C 5601]] [SRC[1990-11-04]]
BMP の I 領域は各国の面から符号短縮形で呼び出したものだとか。
* 関連
[SEE[ [[ISO/IEC 646]], [[ISO/IEC 2022]], [[DECの文字コード]], [[TRONコード]] ]]
* メモ
[6]
<http://www.y12.doe.gov/sgml/wg8/document/91kyoto/n1298.asc>
によれば、 DIS 10646 はほとんどの文字が手書き字形。
X の [[wchar]] は一時 DIS 10646 の subset だったとか。
<http://archive.adaic.com/pol-hist/history/9x-history/reports/charset-Oct89.txt>
''proposed rfc on SMTP and 10646''
<http://www.imc.org/ietf-smtp/old-archive/msg00210.html>