-
Notifications
You must be signed in to change notification settings - Fork 4
/
231.txt
120 lines (88 loc) · 4.93 KB
/
231.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
[11] [[符号化文字集合]]における[[文字]]のうち[[制御文字]]でないものを[DFN[[RUBYB[[[図形文字]]]@en[graphic character]]]]といいます。
* 仕様書
[REFS[
- [19] [CITE[[[The Unicode Standard]], Version 12.0 - ch03.pdf]] ([TIME[2019-03-02 07:15:30 +09:00]]) <https://www.unicode.org/versions/latest/ch03.pdf#G30602>
D50
]REFS]
* 意味
[20]
[[図形文字]]は、
[[General Category]]
が
[CODE[Letter]] ([CODE[L][Letter]])、
[CODE[Combining Mark]] ([CODE[M][Combining Mark]])、
[CODE[Number]] ([CODE[N][Number]])、
[CODE[Punctuation]] ([CODE[P][Punctiation]])、
[CODE[Symbol]] ([CODE[S][Symbol]])、
[CODE[Space Separator]] ([CODE[Zs]])
の[[文字]]です。
[SRC[>>19]]
[21]
[[私用文字]] ([CODE[Co]]) を[[図形文字]]と解釈するかどうかは、
実装により定めることとされています。
[SRC[>>19]]
* 一覧
[REFS[
- [22] [CITE@en[[[Character set]] "$unicode:L | $unicode:M | $unicode:N | $unicode:P | $unicode:S | $unicode:Zs"]] ([TIME[2019-07-01 15:10:13 +09:00]]) <https://chars.suikawiki.org/set?expr=%24unicode%3AL+%7C+%24unicode%3AM+%7C+%24unicode%3AN+%7C+%24unicode%3AP+%7C+%24unicode%3AS+%7C+%24unicode%3AZs>
]REFS]
;; + [[私用文字]]
* 歴史
[14] [[画面]]に表示できる[[文字]]を、
[DFN[[RUBYB[印字可能文字]@en[printable character]]]]といいます。
[15] [[図形文字]]は、[[文字コード]]の[[仕様書]]で伝統的に使われてきた[[専門用語]]です。
[[印字可能文字]]は、それ以外の場面で使われることが多い用語です。
[[印字可能文字]]の厳密な定義があるのかどうかはわかりませんが、
両者は交換可能な用語と思われます。
[1] >>4 「通常・・・可視的表現をもち」ってなんだろう?
[[ソフトハイフン]]みたいな意味不明な「図形文字」もあるからかなあ。
[2] なお、 >>4 の定義からみても分かるように、
[CODE(math)[図形文字 ⊂ [[符号化文字]]]]なわけです。
[3] >>1 でもって、その[[符号化文字集合]]の1単位長 (1オクテットとか2オクテットとか。) で表現されるとは限りません。例えば [SAMP(char)[NOT EQUAL SIGN]] ([SAMP(char)[≠]]) は [[ISO/IEC 646]] では [CODE[3/13 [[BS]] 2/15]] (など) というビット組合せ群で表現されます。
[16] [CODE(charname)@en[SP]] も[[印字可能文字]]に含まれるのが普通です。
[[ISO/IEC]] などの定義では [CODE(CHARNAME)[SP]] は「[[図形記号]]を持たない[[図形文字]]」であるからです。
[18] でも含まないこともあるよ。
[17] 変な感じもしますが、歴史的な絡みとかもあって仕方ないんでしょう。
** ISO 文字コード
[23]
[[ISO文字コード]]では[[文字]]は[[制御機能]]か[[図形文字]]でした。
[8]
>
:図形文字 (graphic character):
[[制御機能]]以外で、通常、[[手書き]]・[[印字]]・[[表示]]の可視的表現をもち、
一つ以上の[[ビット組合せ]]からなる[[符号化表現]]をもつ[[文字]]。
([[JIS X 0211]]‐1994 4.2.42)
[9]
>
:図形文字 (graphic character):
[[制御機能]]以外で、通常、[[手書き]]・[[印字]]・[[表示]]の可視表現をもち、
一つ以上の[[ビット組合せ]]からなる[[符号化表現]]をもつ[[文字]]。
[SRC[[[JIS X 0202]]:1998 4.15]]
[4]
>
:図形文字 (graphic character):
[[制御機能]]以外で、通常,
[[手書き]]・[[印字]]・[[表示]]の[[可視的表現]]をもち,
一つ以上の[[ビット組合せ]]からなる[[符号化表現]]をもつ[[文字]]。
[SRC[[[JIS X 0201]]:1997 3.7]]
[7]
>
:図形文字 (graphic character):
制御機能以外の文字であって、通常は、手書き、
印字又は表示の可視化表現を持つ。
([[JIS X 0221]]‐1:2001 4.20)
[5] 旧訳 [[図形キャラクタ]]。
[6] 一般的に使われる意味での[CODE[[[文字]]]]にほぼ相当する。
[10]
> すべての[[図形文字]]は、
[[現在位置の前進動作を伴う文字]] ([[スペーシング文字]]) とする。
[SRC[[[JIS X 0201]]:1997 5.5]]
** 図形文字の符号化
[12] [[ISO R 646]] 以来の [[ISO]] や [[JIS]]
の[[符号化文字集合]]が採ってきたとされる原則で、
符号化(図形)文字集合は意味や[[文字観念]]の類ではなく、
(抽象化された) [[図形表現]]そのものを符号化する、というもの。
[13] とはいえ、実際には [[JIS X 0208]]‐1983, ‐1990 は文字観念を符号化していた
(つもりでいた) し、 [[KS X 1001]] は漢字を読みによって符号化しているし、
[[ISO/IEC 10646]] は色々な
「意味」を含めた「[[図形文字]]」を符号化しているのだから、
この原則が一体どれだけの重みを持ったものなのかには疑問を抱かずにはいられないだろう。