/
696.txt
79 lines (55 loc) · 2.56 KB
/
696.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
[1] [DFN[[RUBY[符号化済文字][ふごうかずみもじ][(en)coded character]]]]は、
[[符号化文字集合]]における ([[符号化]]された) [[文字]]です。
* 仕様書
[REFS[
- [35] [CITE[[[The Unicode Standard]], Version 13.0 - ch03.pdf]], [TIME[2020-03-09T17:53:34.000Z]], [TIME[2020-12-20T02:08:18.239Z]] <https://www.unicode.org/versions/latest/ch03.pdf#G2212>
]REFS]
* 符号化
[12]
[[文字コード]]規格に[[文字]]を割り当てることを[DFN[[RUBY[符号化][ふごうか][encode]]]]といいます。
[13]
[[文字]]視点 ([[符号化済文字]]に''なる''こと)、
または[[文字コード]]規格開発者視点 ([[符号化済文字]]に''する''こと)
の用語でしょうか。
[[文字コード]]関連規格や、それに関係する文書でよく見かけます。
[14]
一般の技術者や、[[文字コード]]関連以外の多くの技術仕様では、
[[符号化]]は[[文字]] (やその他のもの) を[[バイト列]]として表現する変換・保存・送信のための操作のことを指して言うことが多いようですから、
意味にずれがあります。
* 符号化済文字
[8]
[DFN[[RUBY[符号化済文字][ふごうかずみもじ][encoded character]]]]
([DFN[coded character]])
は、
[[抽象文字]]と[[符号点]]の関連付け ([[写像]]) です。
[SRC[>>35 D11]]
[9]
非公式には、
[[抽象文字]]に[[割当済符号点]]を一緒にしたものと考えることもできます。
[SRC[>>35 D11]]
;; [10] [[ISO/IEC 10646]] ではむしろこちらが
[[coded character]]
の本義だったようです。
語義からもそちらが自然な解釈です。
[11]
1つの[[抽象文字]]が、複数種類の[[符号点]]や[[符号点]]の列で表現し得ることがあります。
[SEE[ [[重複符号化]] ]]
* 割当済文字
[7]
[[割当済文字]]は、[[ブロック]]に属します [SRC[>>35 D10b]]。
[SEE[ [[ブロック]] ]]
* 歴史
[2]
>
: 符号化文字 (coded character):
[[符号化表現]]をもつ[[文字]]。
([[JIS X 0221]]‐1:2001 4.8)
[3]
>
A character together with its coded representation. <ISOIEC10646>
;; [CITE@en[RFC 3536 - Terminology Used in Internationalization in the IETF]] ([TIME[2011-01-29 02:14:52 +09:00]] 版) <http://tools.ietf.org/html/rfc3536#page-5>
[4] [CITE@en[RFC 6365 - Terminology Used in Internationalization in the IETF]]
([TIME[2011-09-10 19:11:51 +09:00]] 版)
<http://tools.ietf.org/html/rfc6365#page-6>
[6] [[特性 (UCD)]]
[5] [[包摂規準]]