/
395.txt
112 lines (71 loc) · 3.62 KB
/
395.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
[REFS[
- [11] [CITE@en[U+200D ZERO WIDTH JOINER () - Charinfo]]
( ([TIME[2016-08-29 14:17:58 +09:00]]))
<https://chars.suikawiki.org/char/ZWJ>
]REFS]
* 仕様書
[REFS[
- [18] [CITE[The Unicode Standard, Version 13.0 - ch23.pdf]], [TIME[2020-03-09T17:53:52.000Z]], [TIME[2020-12-09T10:59:29.820Z]] <https://www.unicode.org/versions/latest/ch23.pdf#G15334>
- [12] [CITE[[[The Unicode Standard]], Version 12.0 - ch23.pdf]] ([TIME[2019-03-02 07:15:46 +09:00]]) <https://www.unicode.org/versions/latest/ch23.pdf#G23126>
]REFS]
* 意味
[SEE[ [[続け字]] ]]
[8] [CODE(char)[[[U+200D]]]] [CODE(charname)@en[[[ZERO WIDTH JOINER]]]] は、
[[インド系諸文字]]において [[consonant-conjuct context]] ([[virama]] の直後)
にあって当該 [[conjunct]] の表示を制御します。 [SRC[>>1]]
[15] 定義上[[結合文字列]]に含まれます。
-*-*-
[20]
[[ANSEL]] の [[C1制御文字]] [CODE(charname)@en[JOINER]]
は
[[Unicode]] の [CODE(charname)@en[ZWJ]]
に対応付けられています。
* 導出特性値
[9] この[[符号位置]]の[[導出特性値]]は [[CONTEXTJ]] です。
* 文脈的規則
** 仕様書
- [1] [CITE@en[RFC 5892 - The Unicode Code Points and Internationalized Domain Names for Applications (IDNA)]]
<http://tools.ietf.org/html/rfc5892#appendix-A.2>
** 適用範囲
[2] この[[文脈的規則]]は、[[登録]]の際に利用されます。
[3] この[[文脈的規則]]は、 [[lookup]] の際に利用されます [SRC[>>1]]。
** 定義
[7] この[[文脈的規則]]の結果は、次のものと同じです [SRC[>>1]]。
= [4] 一つ前の[[符号位置]]がなければ、[[未定義]]を返して停止します
= [5] そうでなく、一つ前の[[符号位置]]の [[Canonical_Combining_Class]] が [[Virama]] であれば、[[真]]を返して停止します
= [6] そうでなければ、[[偽]]を返して停止します
* 漢字の記述
[SEE[ [[CJK統合漢字合字]] ]]
* レンダリング
[SEE[ [[続け字]] ]]
[24] [[縦書き]]については[[CJK統合漢字合字]]も参照。
[23] [CITE@ja-jp[OpenType development (LEGACY INFORMATION) - Typography | Microsoft Docs]], [[nihar]], [TIME[2022-08-27T06:51:43.000Z]] <https://docs.microsoft.com/ja-jp/typography/develop/otdevinfo#suggested-glyphs-for-complex-scripts>
[25] [CITE@en[26487 - ZWJ (U+200D) format control should NOT be rendered with its own glyph - chromium]], [TIME[2023-11-11T03:09:05.000Z]] <https://bugs.chromium.org/p/chromium/issues/detail?id=26487>
* 関連
[10] 逆を表す [CODE(charname)@en[[[ZERO WIDTH NON-JOINER]]]] もあります。
[17]
[CODE(charname)@en[ZWSP]]
とは違って
[[word break]]
や
[[line break]]
には影響しません。
[SRC[>>18]]
[16]
[CODE(charname)@en[CGJ]] とは挙動が違います。
[19]
文脈を提供する文字という機能は
[CODE(charname)@en[LRM]],
[CODE(charname)@en[RLM]],
[CODE(charname)@en[ALM]]
と似ています。
[SEE[ [[bidirectional ordering controls]] ]]
* 歴史
[21] [[ISIRI 3342]]
[22] [CITE[2011-08-six-years-of-persian-domain-names.pdf]], [TIME[2018-03-04T20:08:20.000Z]], [TIME[2022-05-14T03:26:47.602Z]] <https://persian-computing.org/archives/IRNIC/2011-08-six-years-of-persian-domain-names.pdf>
[14] [CITE[Emoji ZWJ Sequences Catalog]]
([TIME[2016-06-15 08:29:35 +09:00]])
<http://www.unicode.org/emoji/charts/emoji-zwj-sequences.html>
[13] [CITE@en[Editorial: remove ZERO WIDTH JOINER characters]]
([[ricea]]著, [TIME[2016-12-05 13:13:48 +09:00]])
<https://github.com/whatwg/streams/commit/c58d42aa731cd494c522c90e6eeefd66cbc25b3b>