-
Notifications
You must be signed in to change notification settings - Fork 4
/
900.txt
78 lines (64 loc) · 3.18 KB
/
900.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
=GCC = CSI [GCC-Ps] %x20 %x5F ;; GRAPHIC CHARACTER COMBINATION (図形文字合成)
=GCC-Ps = "0" / "1" / "2"
2個以上の[[図形文字]]を1個の[[図形]]として表示することを示すのに使います。
[[パラメタ値]] GCC-Ps の値により、次の2通りの表現が可能です。
=GCC-two = CSI "0" %x20.5F 2( graphic-character )
=GCC-sequence = CSI "1" %x20.5F 1*( graphic-character ) CSI "2" %x20.5F
GCC は、合成する図形の要素の相対的な大きさ及び位置関係を
明示するものではありません。2個の要素が[[半角]]で横に並んでいても
構いません。例えば[[日本語]]の[[テキスト]]では、一対の文字を
普通の漢字1文字分の大きさを占めるように横に並べて表現することがある。
(以上 [[JISX0211]]-1994 8.3.55 を参考にした。)
ってことは、 LATIN CAPITAL LETTER A WITH GRAVE ACCENT
の[[図形記号]]を表現するのにも、 LIGATURE MM のを表現するのにも、
GCC を使える、しかもその違いを明示できないってことですか。
辛いなあ。
[[JISX0202]]:1998 6.3.3 参考3 は[Q[文字自身の仕様に関係なく]]
GCC が使えるとしています。ここで文字の仕様とは[[基底文字]]か
[[結合文字]]かということですから、
CSI "0" %x20.5F <LATIN CAPITAL LETTER A> <COMBINING ACUTE ACCENT>
や CSI "0" %x20.5F <COMBINING ACUTE ACCENT> <LATIN CAPITAL LETTER A>
のような列があり得るということです。
その解釈については特に述べられていませんが、普通に考えると
どちらも <LATIN CAPITAL LETTER A WITH ACUTE ACCENT>
が出てきて欲しいところです。 (または不正な列とみなすか。)
たぶんこの辺を決めるのはその文字を定義する文字集合規格だと
思います。でもそんなの定義してる規格なんてないよねぇ。
[1]
[[ISO/IEC 4873]] 附属書C ([[参考]]) は
[CODE(charname)@en[GCC]]
の使い方を解説していました。
[2]
[CODE(charname)@en[GCC]]
は新規の[[図形記号]]ではありませんから、
新しい符号化図形文字ではなく、
[[文字レパートリー]]に[[文字]]を追加することにもなりません。
[SRC[>>13]]
[4]
[[ISO/IEC 4873]]
は第2版で[[重ね打ち式文字合成]]を使うこととしていましたが、
第3版ではそれを取りやめて
[CODE(charname)@en[GCC]]
方式を採用しました。
[SEE[ [[重ね打ち式文字合成]] ]]
- [13]
[[Standard ECMA-43]]
[DFN[[CITE[8-Bit Coded Character Set Structure and Rules]]]],
3[SUP[rd]] Edition – December 1991,
Reprinted in electronic form in January 1999,
[TIME[2014-10-28T04:43:07.000Z]], [TIME[2020-10-07T07:14:26.929Z]] <https://www.ecma-international.org/publications/files/ECMA-ST/Ecma-043.pdf#page=27>
[3] 附属書Cには、
[CODE(charname)@en[GCC]]
[CODE[P]]
[CODE[t]]
[CODE[s]]
が
「Pts」
を表すという例が示されていました。
[SRC[>>13]]
説明がなくわかりにくいのですが、
[[合字]]の
「₧」
を表すのでしょうか。
[5]
結局この方式がどの程度使われたのか不明です。