/
300.txt
123 lines (94 loc) · 6 KB
/
300.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
[1]
[CITE[8‐Bit Single‐Byte Coded Graphic Character Sets]]
([CITE[[8ビットの1バイト符号化図形文字集合群]])
,*部:版 ,*出版日 ,* ,*[[GR]] [CODE(math)[[VAR[Ft]]]] ,*[[ECMA]] ,*[[GB]] ,*[[CNS]]
,1:1987 , ,Latin Alphabet No. 1 ,04/01 ,94:1986 ,GB/T 15273.1‐1994 ,[[CNS 13246]] (X 5023)‐82 (1993)
,1:1998 ,1998-04-15 ,Latin Alphabet No. 1 ,04/01
,2:1987 , ,Latin Alphabet No. 2 ,04/02 ,94:1986 ,GB/T 15273.2‐1995 ,[[CNS 13247]] (X 5024)‐82 (1993)
,2:1999 ,1999-01-15 ,Latin Alphabet No. 2 ,04/02
,3:1988 , ,Latin Alphabet No. 3 ,04/03 ,94:1986 ,GB/T 15273.3‐1995 ,[[CNS 13325]] (X 5028)‐82 (1993)
,3:1999 ,1999-01-15 ,Latin Alphabet No. 3 ,04/03
,4:1988 , ,Latin Alphabet No. 4 ,04/04 ,94:1986 ,GB/T 15273.4‐1995 ,[[CNS 13326]] (X 5029)‐82 (1993)
,4:1998 ,1998-07-01 ,Latin Alphabet No. 4 ,04/04
,5:1988 , ,Latin/Cyrillic Alphabet ,04/12 ,113:(2nd) , ,[[CNS 13327]] (X 5030)‐82 (1993)
,5:1999 ,1999-01-15 ,Latin/Cyrillic Alphabet ,04/12 ,113:1999
,6:1987 , ,Latin/Arabic Alphabet ,04/07 ,114:1986 , ,[[CNS 13384]] (X 5034)‐83 (1994)
,6:1999 ,1999-01-15 ,Latin/Arabic Alphabet ,04/07
,7:1987 , ,Latin/Greek Alphabet ,04/06 ,118:1986 ,GB/T 15273.7‐1996 ,[[CNS 13385]] (X 5035)‐83 (1994)
,7:2003 ,2003-10-15 ,Latin/Greek alphabet
,8:1988 , ,Latin/Hebrew Alphabet ,04/08 ,121:1987 , ,[[CNS 13386]] (X 5036)‐83 (1994)
,8:1999 ,1999-01-15 ,Latin/Hebrew Alphabet ,05/13
,9:1989 , ,Latin Alphabet No. 5 ,04/13 ,128 , ,[[CNS 13328]] (X 5031)‐82 (1993)
,9:1999 ,1999-01-15 ,Latin Alphabet No. 5 ,04/13 ,128:1999
,10:1992 , ,Latin Alphabet No. 6 , ,144:1992
,10:1998 ,1998-07-15 ,Latin Alphabet No. 6 ,
,11:2001 ,2001-12-15 ,Latin/Thai Alphabet , ,[[TIS620]]-2533 + [[NBSP]]
,13:1998 ,1998-10-15 ,Latin Alphabet No. 7 (Baltic Rim) , ,
,14:1998 ,1998-11-15 ,Latin Alphabet No. 8 (Celtic) ,05/15 ,
,15:1999 ,1999-03-15 ,Latin Alphabet No. 9 ,06/02 ,
,16:2001 ,2001-07-15 ,Latin Alphabet No. 10 ,06/06 ,SR 14111:1998
[2]
[[ISO/IEC 2022]] の一応用であり、 [[ISO/IEC 4873]] の実装水準1
に適合します。また、 [[EUC]] の一実装とも見なされます。
7ビットの範囲 [CODE(char)[0/0]]〜[CODE(char)[7/15]] ([[CL]] + [[GL]]) は、
[[ASCII]] = [[ISO/IEC 646]]:1991 [[IRV]] と同じです。
[CODE(char)[10/0]]〜[CODE(char)[15/15]] ([[GR]]) に96図形文字集合が[[指示]]・
[[呼出]]された状態です。指示・呼出・[[告知]]列などは使用しません。
文字 [CODE(char)[[[CR]]]] や [CODE(char)[[[BS]]]] を使った重ね打ちは禁止されています。
[[結合文字]]を使った文字合成を使用しません。
[3]
多くの部では [CODE(char)[10/0]] に [CODE(char)[[[NBSP]]]] を、
[CODE(char)[10/13]] に [CODE(char)[[[SHY]]]] を割り当てています。
6 は Arabic で、[[語頭形]]などの変化が必要ですが、
[Q[文脈分析が必要だけどこの規格の適用範囲外なのねん]]だそーな。
6 で [CODE(char)[3/0]]〜[CODE(char)[3/9]] が Arabic script の digit
の代替字形が規定されてます (西洋のアラビア数字と、どちらでもよい)。
6 Arabic と 8 Hebrew は[[右横書き]]が混在します。
6 では [CODE(char)[2/8]], [CODE(char)[2/9]], [CODE(char)[3/12]], [CODE(char)[3/14]],
[CODE(char)[5/11]], [CODE(char)[5/13]], [CODE(char)[7/11]], [CODE(char)[7/13]]
([[括弧]]と[[不等号]]) は[[制御機能]]の先行無しに[[鏡像]]になります。
8 にはそんな話は出てきません。
右横書きをどう扱うかについての話は出てきません。
8:1999 には [CODE(char)[[[LRM]]]] と [CODE(char)[[[RLM]]]] が追加されました。
- [4] [CITE[Final proof of ISO/IEC 8859-14:1998 (E)]]
<http://www.evertype.com/standards/iso8859/8859-14-en.pdf>
- [5] [CITE[Final proof of ISO/IEC 8859-15:1999 (E)]]
<http://www.evertype.com/standards/iso8859/8859-15-en.pdf>
- [6] [CITE[FDIS ISO/IEC 8859-16:2001 (E)]]
<http://www.evertype.com/standards/iso8859/fdis8859-16-en.pdf>
[7]
[[ECMA-94]]:1986 は [[ISO/IEC 8859]]‐1〜4 に相当するのですが
(文章・規定自体がどの程度一致しているのかはわかりません)、
[[ECMA-94]] は[[符号化文字データ要素]]の[[適合性]]をほとんど規定していません。
[[適合性]]の[[条項]]にあるのは実装に対する[[適合性]]の規定だけです。
唯一、[[適用範囲]]の[[条項]]に、[[合成文字]]の[[符号化表現]]のために
[CODE(charname)@en[[[BACKSPACE]]]] や [CODE(charname)@en[[[CARRIAGE RETURN]]]]
のような[[制御機能]]を使うことを禁止すると述べられています。
([[名無しさん]])
[8]
>>7 あと、 [[Latin3]] と [[Latin4]] については[[空き領域]]は使用してはならない
([[shall not]]) という[[条項]]がありました。なので、
明記はされていませんが、[[符号化文字データ要素]] (あるいは[[情報交換]])
の[[適合性]]は一応定義されているといえます。
* IANA charset
[9] [[IANA charset]] では多くの部について [CODE(charset)@en[[[ISO-8859-[VAR[n]]]]]]
という名前が登録されています。
[10] [[XML]] の[[符号化名]]としては特に [CODE(charset)@en[[[ISO-8859-[VAR[n]]]]]]
が [[ISO/IEC 8859]] の第[VAR[n]]部を表すと定義されています。
;; 詳しくは[[XMLにおける文字コード]]を参照。
* 関連
[13] [[同型符号化]]、[[同型復号]]も参照。
* メモ
[11] [CITE[Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No.1 ]]
([TIME[1998-12-16 18:11:34 +09:00]] 版)
<http://www.open-std.org/JTC1/SC2/WG3/docs/n411.pdf>
[12] ([TIME[2017-08-22 11:43:56 +09:00]])
<ftp://std.dkuug.dk/JTC1/sc2/wg3/docs/n411.pdf>
[FIG(quote)[
[FIGCAPTION[
[14] ([TIME[2013-10-04 11:15:30 +09:00]])
<https://upload.wikimedia.org/wikipedia/commons/3/3a/Bahia_Municip_Itapicuru.svg>
]FIGCAPTION]
> <?xml version="1.0" encoding="iso-8859-1"?>
;; [15] ただし先頭に [[BOM]] あり
]FIG]