/
922.txt
79 lines (61 loc) · 2.79 KB
/
922.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
[2] [DFN[[[DIS 10646]]]] は、 [[ISO/IEC 10646]] の [[JTC1]] で投票される段階にある原案 ([[DIS]])
を指す用語です。 [[ISO/IEC 10646]] の第2版以降の [[DIS]] もまた [[DIS 10646]]
と呼ばれますが、 [[ISO/IEC]] の委員会以外で敢えて「[[DIS 10646]]」と呼ぶ時は、
[[Unicode]] 化される前の、否決された当初の [[DIS 10646]] を指すことが多いようです。
[1]
有名な割に具体的な情報はほとんどない。矛盾した情報もある。
正式な規格になる以前の段階だから、委員会関係者しか詳しい資料を持っていないのか?
* 符号構造
4オクテット固定長の正規形と、各種の[[符号短縮法]]がある。
[[面]]は [[ISO/IEC 2022]] の [[CL]]・[[CR]] を避けて、
4つの[RUBY[四分区][クォードラント][quadrant]]に分けられる。
四分区はそれぞれ96×96。
0x20 0x7E 0xA0 0xFF
+-------------+
| +----+ +----+
| |A-00| |A-01|
| +----+ +----+
| |I-00| |I-01|
| +----+ +----+
| +----+ +----+
| |A-10| |A-11|
| +----+ +----+
| |I-10| |I-11|
+-+----+-+----+
面が191個で群、 UCS 全体で群が191個。
[[#comment]]
* 文字集合
四分区ごとの割当。重複等は、版の違いによるのか、
情報源のどれかが間違っているのか・・・
情報源の情報源である版がどれか分かっていれば添えておいた。
- G = 032, P = 032: [ABBR[BMP][基本多言語面]]
-- A-[VAR[nn]]: Alphabet, 記号類
--- R = 032: [[ISO/IEC 8859]]‐1 [SRC[1989-10, 1991-02]]
-- Q = 00: Alphabet, 記号類
-- Q = 00: [[JIS X 0208]] (16区以降) [SRC[1989-01]]
-- Q = 01: 予約
-- Q = 01: Restricted use (Presentation form, [[DRCS]], Private use) [SRC[1989-10]]
-- Q = 10: [[GB 2312]]‐80 (16区以降) [SRC[1989-01]]
-- Q = 11: [[KS C 5601]] (16区以降) [SRC[1989-01]]
- G = 032, P = 040
-- Q = 11: GB 2312‐80 [SRC[1990-08]]
- G = 032, P = 048: 中国
-- Q = 11: GB 2312‐80 [SRC[1990-11-04]]
-- Q = 11: JIS X 0208 [SRC[1990-08]]
- G = 032, P = 056
-- Q = 11: KS C 5601 [SRC[1990-08]]
- G = 032, P = 064: 日本
-- Q = 01: Private use
-- Q = 10: [[JIS X 0212]]‐1990
-- Q = 11: JIS X 0208 [SRC[1990-11-04]]
- G = 032, P = 080: 韓国
-- Q = 11: [[KS C 5601]] [SRC[1990-11-04]]
BMP の I 領域は各国の面から符号短縮形で呼び出したものだとか。
[[#comment]]
* その他
<http://www.y12.doe.gov/sgml/wg8/document/91kyoto/n1298.asc>
によれば、 DIS 10646 はほとんどの文字が手書き字形。
X の [[wchar]] は一時 DIS 10646 の subset だったとか。
<http://archive.adaic.com/pol-hist/history/9x-history/reports/charset-Oct89.txt>
''proposed rfc on SMTP and 10646''
<http://www.imc.org/ietf-smtp/old-archive/msg00210.html>