/
763.txt
186 lines (139 loc) · 8.88 KB
/
763.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
[21] [DFN[[[JIS X 0208]]]] は、[[日本語]]表記に用いられる基本的な[[文字]]を含んだ[[符号化文字集合]]でした。
[[Unicode]] が普及する前に[[日本]]国内で広く用いられていました。
* 符号化文字集合
[FIG(list)[
- 7ビット符号
- 8ビット符号
- [[シフト符号化表現]] ([[シフトJIS]]の一種)
- [[RFC1468符号化表現]] ([[ISO-2022-JP]] もどき)
]FIG]
* 適合性
[4] '''情報交換の適合性''' [SRC[JIS97 3.2]]
-[5] [Q[[[交換用符号化情報]]の[[符号化文字データ要素]]]]は、
そのすべての[[文字]]の[[ビット組合せ]]が[[JIS X 0208]]:1997のいずれかの[[符号化文字集合]]の条件をすべて満たす場合、[[適合]]します。
-[7] [[適合性]]を主張する場合は、
採用した[[符号化文字集合]]を[Q[[[文書]]に明記]]しなければなりません。
-[8] 採用した[[符号化文字集合]]の[[制御機能]]の[[適合性]]は、
[[JIS X 0211]] (最新版) によります。
;; 3.1節 (>>1-3) は適用されるのでしょうかね?
内容からすれば >>2-3 は適用できそうですが。。。
[9] '''装置の適合性'''
-3.1 (>>1-3)
-3.3.1 (>>10)
-3.3.2 (>>11) または 3.3.3 (>>12) の一方又は両方
のすべてを満たす場合、[[装置]]は[[適合]]します。
[[適合性]]を主張する場合、
採用した[[符号化文字集合]]を[Q[[[装置]]に附属する[[文書]]に明示]]しなければなりません。
[SRC[JIS97 3.3]]
[10]
[Q[[[利用者]]が[[装置]]に[[文字]]を供給するための方法、又は[[文字]]が[[利用者]]に提示されたときにその[[文字]]であることを認識するための方法を示す記述を備えなければならない。]]
[SRC[JIS97 3.3.1]]
[11] '''送信装置の要件'''
>[[送信装置]]は、[[符号化文字集合]]から作られる任意の[[文字]]の列を、
[[利用者]]が供給できるようにしなければならない。さらに、
[[送信装置]]は、[[CCデータ要素]]中にあるそれらの[[文字]]の[[ビット組合せ]]を[[送信]]する能力をもたなければならない。
[SRC[JIS97 3.3.2]]
[12] '''受信装置の要件'''
>[[受信装置]]は、3.2 [INS[(>>4)]] に[[適合]]し、[[CCデータ要素]]を構成する任意の[[符号化文字]]を[[受信]]し、
解釈することができなければならない。さらに、
採用した[[符号化文字集合]]の対応する[[文字]]を[[利用者]]がその[[文字集合]]から識別し、互いに区別できるように[[利用者]]に渡さなければならない。
ただし、[[受信装置]]に[[表現]]上の制約がある場合は、
[[点画]]の省略などを行ってもよいが、
同じ種類の[[図形文字]]中の他のいかなる[[図形文字]]とも区別できなければならない。
> '''備考''' [[装置]]に[[表現]]上の制約があるために[[点画]]の省略などを行う場合、
[[利用者]]に渡される[[図形]]に、6.6.3に定める[[包摂規準]]によって[[包摂]]できないものがあってもよい。
[SRC[JIS97 3.3.3]]
[1]
'''図形文字の適合性'''
[Q[この規格に対して適合性を主張する場合、この規格で規定する6879文字のすべてを実装し[INS[〜]]なければならない。]]
[SRC[JIS97 3.1.1]]
;; 明記されていませんが、流石に[[情報交換]]の適合性を主張するためにこの条件を満たす必要はなく、
[[装置]]の適合性に関する規定と思われます。
[2]
'''空き領域'''
- [[空き領域]]を[[情報交換]]用に用いてはなりません。
[SRC[JIS97 3.1.2]]
- 次の条件を満たす場合は、用いても構いません。
-- [Q[この規格]]が規定している[[図形文字]]を割り当ててはなりません。
[SRC[JIS97 3.1.2 a)]]
-- [[空き領域]]に[[図形文字]]を割り当てる場合、
利用する[[区点位置]]と[[図形文字]]の対応一覧を[Q[[[文書]]で明示]]しなければなりません。
[SRC[JIS97 3.1.2 b)]]
--- 1つの[[図形文字]]を複数の[[空き領域]]に割り当ててはなりません。
[SRC[JIS97 3.1.2 b) 1)]]
--- [[図形文字]]の[[同定]]補助情報
([[名前]], 用途, 意味など) を1つ以上示さなければなりません。
[SRC[JIS97 3.1.2 b) 2), 3)]]
-- [[空き領域]]に[[図形文字]]を割り当てる場合、
[[JIS X 0208]]‐1990に登録された[[終端バイト]]および[[更新番号]]を用いてはなりません。
[SRC[JIS97 3.1.2 c)]]
;; [[情報交換]]にも[[装置]]にも適用されるような感じです。
[3] '''互換性のための包摂規準'''
[[JIS X 0208]]:1997 6.6.4 の[[包摂規準]]の[[区点位置]]それぞれの
(A)、(B)のどちらの[[字体]]を採用したかを[Q[[[文書]]に明示]]しなければなりません。
[SRC[JIS97 3.1.3]]
;; [[情報交換]]にも[[装置]]にも適用されるような感じです。
[13]
'''附属書の符号化表現'''
[[規格本体]]の[[符号化文字集合]]に対する[[適合性]]とは別に、
附属書1で[[シフト符号化表現]]に関する[[適合性]]、
附属書2で[[RFC 1468符号化表現]]に関する[[適合性]]が規定されています。
[14] '''文書に明示'''
頻繁に出てくる[Q[[[文書]]に明示]]とは、どこに明示すればよいのでしょうか。
[[装置]]に関する[[適合性]]ならば、[[装置]]に附属する[[文書]]でよいですが、
[[情報交換]]の[[適合性]]を主張するべき[[文書]]とは何でしょうか。
[[プロトコル]]や[[書式]]の仕様書でよいのでしょうか。
[[#comment]]
* 空き領域
[15]
[[JIS X 0208]]‐1990 の解説によれば・・・。
[[空き領域]]には[Q[[[保留領域]]]]と[Q[[[自由領域]]]]の2つの性質があり、
どの空き部分がどちらの性質かは定めないものの、
2区〜8区、47区、84区は[Q[[[保留領域]]としての性格が強い]]、
9区〜15区、85区〜94区は[Q[[[自由領域]]としての性格が強い]]。
[[自由領域]]は[Q[一時的・局所的に[[文字]]を割り当てて利用しても構わない]]ものの、
[Q[8区及び84区のそれぞれに続く[[区]]は、将来標準化の対象となる可能性があるので、利用する場合には、それぞれの領域の[[区]]番号の最も大きい区 (15区及び94区) から区番号の小さくなる方向に、逆順に割り当てることが望ましい]]そうです。
* 歴史
** 1978年制定
@@
** 1983年改訂
@@
** 1990年改訂
[16] [DFN[[[JIS X 0208-1990]]]] [CITE[情報交換用符号]]は、
1990年/平成2年9月1日制定、9月6日[[官報]]公示。
** 符号化方式
[22] 初期には ([[JIS]] は無視して) 色々な符号化方式が試みられたようです。
[23] [[PC-9801]] より前の [[NEC]] の [[BASIC]] の[[文字コード]]は、
[DFN[NEC漢字コード]]や [DFN[NEC JIS]] と呼ばれていました。
ESC 4B で2バイトモードに、 ESC 48 で1バイトモードに切り替わりました。
1バイトモードは、
[FIG(list)[
- 0x00-7F [[ASCII]] (?)
- 0x80-9F 罫線・記号
- 0xA1-DF [[JIS X 0201片仮名用図形文字集合]]
- 0xE0-FF 罫線・記号
]FIG]
が含まれていました。2バイトモードは、 0x2121-7E7E に [[JIS X 0208]]
が含まれていました。 [SRC[>>24]]
[25] [[8801漢字BASIC]]や[[新8801漢字BASIC]]は、
0x00-FF [[JIS X 0201]] と 0xA1A1-FEFE [[JIS X 0208-1978]]
を 0x7F で切り替えるものでした。文字列の最初と最後は1バイトモードでした。
[SRC[>>24]]
[26] [[N[SUB[88]]-漢字BASIC]] は、
0xFD から始まる [[JIS X 0201]] モードと
0xFA から始まる [[JIS X 0208-1978]] (0x2121-7E7E) モードを切り替えるものでした。
先頭は必ず 0xFD か 0xFA でした。
[[JIS X 0208]] は[[リトルエンディアン]]でした。 [SRC[>>24]]
[REFS[
- [24] [CITE@ja[88のBASICとその漢字コードについて]] ([[Yoshihiko Ohta]] 著, [TIME[2011-07-09 02:21:53 +09:00]] 版) <http://www.kiwi-us.com/~ohta/pc88/kanji/>
]REFS]
** 1997年改訂
[17] [DFN[[[JIS X 0208:1997]]]] [CITE[7ビット及び8ビットの2バイト情報交換用符号化漢字集合]]]]。
[18] 1996年11月〜1997年12月には[[公開レビュー]]が行われました。
[19] [[JIS漢字字典]] (初版、増補改訂版) にも収録されています。
[20] <http://www.webstore.jsa.or.jp/webstore/JIS/html/jp/errata/errata0205/jis_x_00208_000_000_1997_cor_1_200205_j_i4.pdf>
で正誤表が発行されています。
* メモ
[6]
[CITE[Windowsの次期バージョンWindows Vista(TM)において日本語フォント環境を一新]] <http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353>
([[名無しさん]] [WEAK[2005-07-30 02:52:18 +00:00]])