/
253.txt
145 lines (113 loc) · 6.17 KB
/
253.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
[12]
[DFN[私用終端バイト]] [DFN[[CODE[Fp]]]]
は、
[[私用]]のための[[終端バイト]]です。
* ISO/IEC 2022 の一般規則
[1] [DFN@en[Fp]] は[[終端バイト]]のうち、
[CODE[03/00]]〜[CODE[03/15]] を表します。
[SRC[[[JIS X 0202]]:1998 13.2]]
[2]
どの[[エスケープ・シーケンス]]でも、 Fp
は常に[[私用]]に予約されています。私用の[[エスケープ・シーケンス]]は
[[ISO 2375]] による登録の範囲外とされています。
[SRC[[[JIS X 0202]]:1998 13.3.3]]
[4]
[[ISO/IEC 2022]] は[Q[どの[[エスケープ・シーケンス]]でも]]と書いていますが、
本当にどの[[エスケープ・シーケンス]]でもよいのかはよくわかりません。
例えば [[7F]] 型[[エスケープ・シーケンス]]は [[ISO/IEC 2022]]:1994
では使われていません (将来の標準化のために予約されています) が、
それに属する、例えば [CODE@en[[CODE(charname)[[[ESC]]]] 02/07 03/00]]
を[[情報交換の当事者間の合意]]で適当な意味に割当ててしまってもよいのかははっきりしません。
あるいは使用されていない[[中間バイト]]を用いた
[CODE@en[[CODE(charname)[[[ESC]]]] 02/08 02/07 02/06 02/05 03/08]]
を使っても良いのか、良いとしたらどんな意味に使っても良いのかはよくわかりません。
[EG[
[3] [SAMP(char)[[[ESC]] 02/04 02/08 03/00]]
(私用の[[多バイト図形文字集合]]を [[G0]] に[[指示]]) において、
[CODE[03/00]] が [CODE[Fp]]。
]EG]
* 規格による割当
[13]
[[ISO/IEC 2022]]
にとっての「私用」
は、
他の[[応用]]規格がその目的の範囲内で定義して利用させることと矛盾しません。
実際いくつかの事例がありました。
[5] [[CNS 11643]] は[[私用終端バイト]]
[[3/0]] - [[3/15]],
[[2/1]] [[3/0]] - [[2/4]] [[3/15]]
の80個の[[94[SUP[2]]文字集合]]として用いられると定められています。
[SEE[ [[CNS 11643]] ]]
[9] [[KS C 5601-1987]] は[[94[SUP[2]]文字集合]]の[[私用終端バイト]]
[[3/1]] を用いていました。
[SEE[ [[KS C 5601-1987]] ]]
[11] [[ARIB STD-B24]] は独自の[[図形文字集合]]に [CODE[3/0]]-[CODE[3/11]]
を割り当てています。
[[3/1]] - [[3/8]] は[[94集合]]、
[[3/9]] - [[3/11]] は[[94[SUP[2]]集合]]です。
[SRC[>>15]]
[14]
[[Videotex]] は独自の[[図形文字集合]]に[[私用終端バイト]]を用いていました。
[[94集合]]の [[3/3]] と
[[96集合]]の [[3/8]] と [[3/9]] がありました。
[SRC[ [[T.101]] の1個目の PDF、111頁 ]]
[39]
[[ctext]] は [[3F]] の[[中間バイト]]1バイト + [[3/0]] or [[3/1]]
を[[版付け]]に使っています。
[SEE[ [[ctext]] ]]
[38]
[[ctext]] は非標準復帰 [CODE(charname)@en[DOCS]] の
[[3/0]] - [[3/4]] を規定しています。
[[3/5]] - [[3/15]] も将来の拡張で利用する可能性を想定した実装が要請されています。
[SEE[ [[ctext]] ]]
[41]
[[MARC-8]] は [[3/1]], [[3/2]], [[3/3]], [[3/4]] を定義していました。
[[3/1]] は[[94[SUP[3]]集合]] ([[EACC]]),
その他は [[94集合]]でした。
[SEE[ [[MARC-8]], [[EACC]] ]]
[REFS[
- [15]
[CITE[Data Coding and Transmission Specification for Digital Broadcasting ARIB STANDARD - 6-STD-B24v6_4-1p3-E1.pdf]], [TIME[2021-09-29T18:13:18.000Z]], [TIME[2022-04-30T04:58:39.850Z]] <http://www.arib.or.jp/english/html/overview/doc/6-STD-B24v6_4-1p3-E1.pdf#page=56>
]REFS]
* 実装による割当
[10] [[MULE]] はいくつかの[[私用終端バイト]]を使っていました。 [SRC[>>16]]
- [19] [CODE[chinese-sisheng]] ("SiSheng (PinYin/ZhuYin)") - [[94集合]] [[3/0]]
- [26] [CODE[lao]] ("Lao" [CODE[U+0E81]] - [CODE[U+0EDF]]) - [[94集合]] [[3/1]]
- [23] [CODE[arabic-digit]] ("Arabic digit") - [[94集合]] [[3/2]]
- [24] [CODE[arabic-1-column]] ("Arabic 1-column") - [[94集合]] [[3/3]]
- [25] [CODE[arabic-2-column]] ("Arabic 2-column") - [[94集合]] [[3/4]]
- [27] [CODE[indian-is13194]] ("Indian IS 13194 (DEV)") - [[94集合]] [[3/5]]
- [20] [CODE[ipa]] ("IPA") - [[96集合]] [[3/0]]
- [21] [CODE[vietnamese-viscii-lower]] ("VISCII lower-case") - [[96集合]] [[3/1]]
- [22] [CODE[vietnamese-viscii-upper]] ("VISCII upper-case") - [[96集合]] [[3/2]]
- [17] [CODE[chinese-big5-1]] ("Big5 (Level-1) A141-C67F") - [[94[SUP[2]]集合]] [[3/0]]
- [18] [CODE[chinese-big5-2]] ("Big5 (Level-2) C940-FEFE") - [[94[SUP[2]]集合]] [[3/1]]
- [36] [CODE[ethiopic]] ("Ethiopic characters") - [[94[SUP[2]]集合]] [[3/3]]
- [30] [CODE[indian-2-column]] ("Indian 2 Column") - [[94[SUP[2]]集合]] [[3/5]]
- [29] [CODE[indian-1-column]] ("Indian 1 Column") - [[94[SUP[2]]集合]] [[3/6]]
- [31] [CODE[tibetan]] ("Tibetan 2 column") - [[94[SUP[2]]集合]] [[3/7]]
- [32] [CODE[tibetan-1-column]] ("Tibetan 1 column") - [[94[SUP[2]]集合]] [[3/8]]
- [35] [CODE[mule-unicode-0100-24ff]] ("Unicode subset (U+0100..U+24FF)") -
[[96[SUP[2]]集合]] [[3/1]]
- [33] [CODE[mule-unicode-2500-33ff]] ("Unicode subset (U+2500..U+33FF)") -
[[96[SUP[2]]集合]] [[3/2]]
- [34] [CODE[mule-unicode-e000-ffff]] ("Unicode subset [ASIS[(U+E000+FFFF)]]") -
[[96[SUP[2]]集合]] [[3/3]]
- [28] [CODE[indian-glyph]] ("Indian glyph") - [[96[SUP[2]]集合]] [[3/4]]
- 文字合成を表現する[[制御機能]] [SEE[ [[私用制御機能]] ]]
[37] [[Mule内部コード]]も参照。
[REFS[
-
[16]
[CITE@en[lisp/international/mule-conf.el · master · emacs / emacs · GitLab]], [TIME[2022-04-30T05:59:59.000Z]] <https://emba.gnu.org/emacs/emacs/-/blob/master/lisp/international/mule-conf.el>
]REFS]
[7] >>8 の「[[ISO-2022-JP-MS]]」は ESC $ ( ? を [[EUDC]] に割り当てています。
[REFS[
- [8] [CITE@ja[libiconv-1.11-ja-1.patch.gz]] ([TIME[2007-10-27 07:56:21 +09:00]] 版) <http://www2d.biglobe.ne.jp/~msyk/software/libiconv-1.11-ja-patch.html>
]REFS]
[40]
[[VT][VT100]] は私用の[[告知シーケンス]]を使っています。
[SEE[ [[VT][VT100]] ]]
* 利用するよう求めた事例
[6] [[JIS X 0208]] は[[外字]]利用時に[[私用終端バイト]]を用いることを求めています。
* メモ