-
Notifications
You must be signed in to change notification settings - Fork 4
/
136.txt
110 lines (97 loc) · 2.73 KB
/
136.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
* 仕様書
[REFS[
- [1] [CITE[The Unicode Standard, Version 13.0 - ch03.pdf]], [TIME[2020-03-09T17:53:34.000Z]], [TIME[2020-12-31T08:45:19.650Z]] <https://www.unicode.org/versions/latest/ch03.pdf#G50313>
]REFS]
* 結合クラス
[2]
[[Unicode符号点]]は、
[DFN[[F[[RUBYB[[[[RUBY[結合][けつごう]]クラス][結合クラス]]][combining class]]]]]]
([[特性][文字特性]] [DFN[[CODE[Canonical_Combining_Class]]]], [DFN[[CODE[ccc]]]])
を持ちます。
[F[結合クラス]]は、
[[正準順序付けアルゴリズム]]で[[結合マーク]]の[[正準等価性]]の決定に使う
[ [N[0]], [N[254]] ]
の[[数値]]です。
[SRC[>>1 D104]]
[3]
[CODE[Canonical_Combining_Class]]
は、
[[UCD]]
の
[CODE[UnicodeData.txt]]
で定義されます。
[DFN[[CODE[DerivedCombiningClass.txt]]]]
にも収録されています。
[SRC[>>1 D104]]
[4]
データファイルに明記されていないときの既定値は、
[N[0]]
です。
[SRC[>>1 D104]]
- [5]
[CODE[ccc]]
が
[N[0]]
以外なのは、
[[結合マーク]]だけです。
[SRC[>>1 D104]]
-- [6]
[CODE[ccc]]
が非 [N[0]]
のほとんどの[[結合マーク]]は、
[[nonspacing mark]]
です。
[SRC[>>1 D104]]
- [7]
[[nonspacing mark]]
には、
[CODE[ccc]]
が非 [N[0]]
では''ない''ものもあります。
[SRC[>>1 D104]]
- [10]
[CODE[ccc]] = [N[0]]
の[[結合文字]]には、
例えば
[CODE(charname)@en[CGJ]]
があります。
[REFS[
- [8]
[CODE[Canonical_Combining_Class]] ごとの[[符号点]]の一覧
<https://chars.suikawiki.org/set#:~:text=$unicode:Canonical_Combining_Class:>
-- [9]
[CODE[ccc]] = [N[0]]
の[[符号点]]の一覧
<https://chars.suikawiki.org/set/%24unicode%3ACanonical_Combining_Class%3A0>
]REFS]
-*-*-
[11]
[DFN[[RUBYB[[RUBY[固定位置][こていいち]]クラス][fixed position class]]]]は、
[[結合クラス]]の[[部分集合]]で、
範囲
[ [N[10]], [N[199]] ]
の[[数値]]です。
[SRC[>>1 D105]]
[12]
[[固定位置クラス]]は、
[[ヘブライ文字]]、
[[アラビア文字]]、
[[シリア文字]]、
[[テルグ文字]]、
[[タイ文字]]、
[[ラオス文字]]、
[[チベット文字]]の少数の[[結合マーク]]のみに適用され、
[[grapheme base]]
に対して固定された位置に出現するものを表しています。
適用対象となる[[結合文字]]には
[[Arabic vowel point]]
や
[[Indic matras]]
のような[[母音記号]]の一部が含まれますが、
すべてではありません。
[SRC[>>1 D105]]
[13]
[[固定位置クラス]]は、
[[正規化形]]の正式な標準化に先立つ開発の初期段階に由来する歴史的遺物とされます。
[SRC[>>1 D105]]
* メモ