-
Notifications
You must be signed in to change notification settings - Fork 4
/
637.txt
365 lines (249 loc) · 14.4 KB
/
637.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
[22] [[Unicode]] の[DFN[[RUBYB[私用域]@en[private use area]]]]は、
[[Unicode Standard]] で特定の[[意味]]が規定されず、
[[利用者]]等が用途を定めることができる[[符号位置]]群です。
* 用法
[7] 他の[[文字コード]]との[[変換表]]で対応関係が規定されている場合、
実装者が内部的に用いる場合、
実装者が規定して[[利用者]]に提供する場合、
[[フォント]]が規定して[[利用者]]に提供する場合、
[[利用者]]が自ら規定して用いる場合があります。
[12] その性質上、[[相互運用性]]はまったく期待できません。
書き捨ての[[文書]]など例外的な場合を除き、使うべきではありません。
また他の誰がどのような用途で用いているかわかりませんから、
内部処理用にも使うべきではありません。
* 非文字
[62] 内部処理専用の[[符号位置]]として[[非文字]]があります。
* 関連
[23] [[Unicode]] 以前の[[文字コード]]やその実装にも、
[[外字]]、[[EUDC]]、[[自由領域]]、
[[DRCS]]
といった呼称で同様の[[符号位置]]・[[ビット組合せ]]が用意されていたり、
[[空き領域]]を実装が勝手に使ったりしていました。
[36] [SEE[ [[Unicodeにない文字]] ]]
* 歴史
[FIG(quote)[ [42] [[JIS X 0221]]‐1:2001
> 10. 私用の群、面及び領域
> 10.1 私用文字
> この規格群では、私用文字にはいかなる制限も加えない。
私用文字は、利用者定義の[[文字]]を備えるのに使用できる。
例えば、これは、[[漢字]]の[[用字]]の利用者には一般的な要件となる。
> 備考 私用文字の意味のある[[交換]]のためには、
この規格群とは別に、送受者間の合意が必要となる。
> 私用文字は、動的に再定義可能な文字の適用業務に使用できる。
> 備考 動的に再定義可能な文字の意味のある交換のためには、
この規格群とは別に、送受者間の合意が必要となる。
この規格群は、動的に再定義可能な文字の定義又は設定の技法を規定しない。
[Q[動的に再定義可能な文字]]というのは、 [[JIS X 0202]]
で言う[[動的再指定可能文字]]のことです。
> 10.2 私用文字の符号位置
> [[群]] [CODE[60]]〜[CODE[7F]] の32個の[[符号位置]]は、
私用とする。
> 群 [CODE[00]] の[[面]] [CODE[0F]] 及び面 [CODE[10]]
並びに面 [CODE[E0]]〜[CODE[FF]] の32個の面の符号位置は、
私用とする。
> [[基本多言語面]]の6400個の符号位置 [CODE[E000]]〜[CODE[F8FF]]
は、私用とする。
> これらの符号位置の内容は、この規格群では規定しない
(10.1 参照)。
]FIG]
[43]
同じ [[JIS X 0221]]‐1:2001 の 11. 備考には、
> この規格で規定する文字の[[名前]]及び符号位置を、この規格群の将来の改正で変更する意図はない。
...
と書いてありますけど、私用文字はその[Q[意図]]の範囲外なのでしょう。
(私用文字は符号位置を規定するけど内容 (文字) は規定しないから?)
* 利用例
[26] [[文字符号化]] [[x-user-defined]] は、
[ [[U+F780]], [[U+F7FF]] ] を [ [N[0x80]], [N[0xFF]] ] と対応付けています。
[1]
[CITE[Emacs VietThai environment]] <http://www.m17n.org/vietthai/forEmacs.html>
> As the proposal for VietThai script to the Unicode is still in progress, we use the Private Use Area for VietThai characters (U+F000..U+F07E). A VietThai font encoded accordingly is also available in the package.
[2] [CITE[Special filenames]]
( ([TIME[2011-03-01 18:26:29 +09:00]] 版))
<http://www.cygwin.com/cygwin-ug-net/using-specialnames.html>
[3] [CITE@en[Private Use (Unicode) - Wikipedia, the free encyclopedia]]
( ([TIME[2012-03-04 20:44:51 +09:00]] 版))
<http://en.wikipedia.org/wiki/Private_Use_(Unicode)#Example_code_point_U.2BF8FF>
[4] [CITE@en[Bug 16862 – Indexes: GB18030 and Microsoft encodings should support PUA code points]]
( ([TIME[2013-10-27 03:50:39 +09:00]] 版))
<https://www.w3.org/Bugs/Public/show_bug.cgi?id=16862>
[5] [CITE@en[Character Model for the World Wide Web 1.0: Fundamentals]]
( ([TIME[2005-02-15 14:24:00 +09:00]] 版))
<http://www.w3.org/TR/charmod/#sec-PrivateUse>
[9] [CITE[JsonWireProtocol - selenium - A description of the protocol used by WebDriver to communicate with remote instances - Browser automation framework - Google Project Hosting]]
( ([TIME[2014-10-30 06:29:12 +09:00]] 版))
<https://code.google.com/p/selenium/wiki/JsonWireProtocol#/session/:sessionId/element/:id/value>
[10] [CITE@ja[5-1a. 錦明朝かな(明朝体フォント)]]
( ([TIME[2014-04-19 11:30:08 +09:00]] 版))
<http://www.akenotsuki.com/eyeben/font/nishiki_kana.html#knownissue>
[11] [CITE@en[WebDriver]]
( ([TIME[2014-11-07 11:12:19 +09:00]] 版))
<https://dvcs.w3.org/hg/webdriver/raw-file/default/webdriver-spec.html#character-types>
[13] ([TIME[2005-04-05 10:04:12 +09:00]] 版)
<http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CORPCHAR.TXT>
[FIG(quote)[
[FIGCAPTION[
[15] [CITE@en[w3c/smufl]]
([TIME[2015-08-31 11:42:29 +09:00]] 版)
<https://github.com/w3c/smufl>
]FIGCAPTION]
> SMuFL is a specification that provides a standard way of mapping the thousands of musical symbols required by conventional music notation into the Private Use Area in Unicode’s Basic Multilingual Plane for a single (format-independent) font.
]FIG]
[FIG(quote)[
[FIGCAPTION[
[16] ([TIME[2010-09-30 17:02:10 +09:00]] 版)
<http://www.arib.or.jp/english/html/overview/doc/2-STD-B24v5_1-1p3.pdf#page=156>
]FIGCAPTION]
> DRCS の文字は、基本多言語面の私用領域に対応付ける。
> 私用領域の利用にあたっては、DRCS は EC 区 00 点から順次用いることとする。
]FIG]
[17]
[[アイコンフォント]]
[FIG(quote)[
[FIGCAPTION[
[18] [CITE[FORUM21]]
([TIME[2006-03-08 17:20:56 +09:00]] 版)
<http://www.forum21.jp/contents/contents6-15.html>
]FIGCAPTION]
> バットは920で、プロ選手のなかでも重い方なんですよ。
]FIG]
[19] [CITE@en[WebKit on Twitter: "The Pay JS code has landed in open source. https://t.co/AJfKFtdKxy"]]
([TIME[2016-06-26 12:48:01 +09:00]])
<https://twitter.com/webkit/status/746441587811508227>
[FIG(quote)[
[FIGCAPTION[
[20] [CITE@en[Basic message formatting | Slack]]
([[Slack]]著, [TIME[2016-07-13 00:57:54 +09:00]])
<https://api.slack.com/docs/message-formatting>
]FIGCAPTION]
> The Slack message server and API handle conversion from several binary emoji formats - the Unicode Unified format (used by OSX 10.7+ and iOS 6+), the Softbank format (used by iOS 5) and the Google format (used by some Android devices). These Unicode code points will be converted into their colon-format equivalents.
]FIG]
[21] [CITE@en[RFC 1345 - Character Mnemonics and Character Sets]]
([TIME[2016-07-13 09:31:02 +09:00]])
<https://tools.ietf.org/html/rfc1345#page-40>
[FIG(quote)[
[FIGCAPTION[
[24] [CITE@en[XForms 2.0 - XForms Users Community Group]]
([TIME[2016-12-11 09:41:21 +09:00]])
<https://www.w3.org/community/xformsusers/wiki/XForms_2.0#External_JSON_values>
]FIGCAPTION]
> The content of a string is copied across. Escaped characters are transformed as necessary; characters and escapes that have no equivalent XML character (\b, \f, and characters of the form \uxxxx less than \u0020, except for \u0009, \u000A, and \u000D) are transformed by adding \uE000 to them.
]FIG]
[25] [CITE@en[Remove the last 14 characters PUA of GB18030-2005 · Issue #27 · whatwg/encoding]]
([TIME[2016-12-20 20:28:47 +09:00]])
<https://github.com/whatwg/encoding/issues/27>
[FIG(quote)[
[FIGCAPTION[
[27] [CITE[Bogus Shift_JIS]]
([TIME[2017-05-03 16:11:15 +09:00]])
<https://hsivonen.com/test/moz/bogus_shift_jis.htm>
]FIGCAPTION]
> IE6 had the following behaviors:
> The bytes 0xFD, 0xFE and 0xFF decode to U+F8F1, U+F8F2 and U+F8F3, respectively.
]FIG]
[28] [CITE@en[remove Gecko quirks from shift_jis]]
([[annevk]]著, [TIME[2012-04-09 17:25:02 +09:00]])
<https://github.com/whatwg/encoding/commit/651f672ee988702da03f56ad8bdfda00b51a21ea>
[29] [CITE@en[bug 6180 – EUDC (外字) が表示されない]]
( ([TIME[2014-12-19 18:17:50 +09:00]] 版))
<http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=6180>
[30] [CITE@en[399369 – Disable font fallback when a character is in the private use areas]]
( ([TIME[2014-12-19 18:18:16 +09:00]] 版))
<https://bugzilla.mozilla.org/show_bug.cgi?id=399369>
[31] [CITE@en[Comments on XML Part 1 from Japanese experts]]
([[Murata Makoto]]著, [TIME[1997-05-28 10:48:56 +09:00]])
<https://lists.w3.org/Archives/Public/w3c-sgml-wg/1997May/0612.html>
[FIG(quote)[
[FIGCAPTION[
[35] [CITE@en[Character Description Language - Wenlin Guide]]
([TIME[2017-04-12 00:30:51 +09:00]])
<http://guide.wenlininstitute.org/wenlin4.3/Character_Description_Language>
]FIGCAPTION]
> Wenlin Variation Sequences depend on Wenlin CDL font support: Wenlin uses a whole plane of Private-Use Area (PUA) characters (U+F0000..U+FFFFD), to define its own Private-Use Variation Selectors (PVS). Wenlin uses these PVS to define Wenlin’s own Private Variation Sequences, used to manage glyph variation in the CDL Database.
]FIG]
[FIG(quote)[
[FIGCAPTION[
[37] [CITE[文字情報技術促進協議会]]
([TIME[2019-02-08 11:59:59 +09:00]])
<https://citpc.jp/tools/downloads/font>
]FIGCAPTION]
> 【CITPC私用文字マッピングテーブルの仕様概要】
> PUPの領域のうちU+101000-U+104FFFを、本目的のための符号位置の割り当てに用いることとし、ここへ割り当てた符号位置を「暫定私用コード」とする。
> マッピングテーブルpup_mapping.txtは、MJ文字情報一覧表において、「対応するUCS」に同一の値を持つMJ文字図形名が複数存在する物(それらを区別するためにはIVSが必要となる物)、および、「対応するUCS」に値のなかったもの、ISO/IEC 10646に於ける符号化が完了していないものについて、MJ文字図形名と暫定私用コードのUCS符号位置との関係を示した物である。 なお、IPAmjPUPフォントは、IPAmj明朝フォントの符号位置に加えて、pup_mapping.txt に示した暫定私用コードの符号位置を追加実装したものである。
]FIG]
[38] [CITE@ja[昔のハングル - ウィキペディア、我々はすべての百科事典]]
([TIME[2019-02-17 10:16:41 +09:00]])
<https://ko.wikipedia.org/wiki/%EC%98%9B%ED%95%9C%EA%B8%80>
[FIG(quote)[
[FIGCAPTION[
[39] [CITE@ja[古ハングル - Wikipedia]]
([TIME[2019-02-18 12:19:36 +09:00]])
<https://ja.wikipedia.org/wiki/%E5%8F%A4%E3%83%8F%E3%83%B3%E3%82%B0%E3%83%AB>
]FIGCAPTION]
> ᄒᆞᆫ
]FIG]
[40] [CITE@ja[私用領域をのぞく : ウェブロギスティック雑記]]
([TIME[2019-03-10 21:32:38 +09:00]])
<http://blog.livedoor.jp/itomata/archives/4630030.html>
[41] [CITE@en[BabelStone Fonts : BabelStone Han PUA]]
([TIME[2019-05-22 02:39:01 +09:00]])
<http://www.babelstone.co.uk/Fonts/PUA.html>
[32]
[CITE[[[ConScript Unicode Registry]]]]
[33] [CITE[にしき的フォント - TYPVS LITTERARVM NISICIAE]]
([TIME[2020-09-09T12:53:21.000Z]], [TIME[2020-09-11T06:05:46.375Z]])
<http://hwm3.gyao.ne.jp/shiroi-niwatori/nishiki-teki.htm>
[45] [[EACC]]
[46]
蒙古文字 [SEE[ [[縦書き]] ]]
[47] [CITE[Koin変体仮名]]
([TIME[2020-06-19T10:58:38.000Z]], [TIME[2020-10-19T07:19:19.871Z]])
<http://www10.plala.or.jp/koin/koinhentaigana.html>
[50] [[KPS 9566]]
[51] [CITE@en-GB[CNS 11643 and Big5 comparison tables - HarJIT's Website]]
([TIME[2020-09-30T22:18:32.000Z]], [TIME[2020-10-26T02:59:44.149Z]])
<https://harjit.moe/cns-conc.html>
[FIG(quote)[
[FIGCAPTION[
[52] [CITE@ja[日本語で書いている 「」(福の旧字)]]
([[黒字看板]], [TIME[2020-11-09T03:38:56.000Z]], [TIME[2020-11-09T03:39:08.992Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-202.html>
]FIGCAPTION]
> 「」と書いてあります。「」は、「福」の旧字です。
]FIG]
[53] 「福」を意図したらしい [CODE[U+E259]]
[54] [CITE@ja[日本語で書いている 「」(清の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:28:51.000Z]], [TIME[2020-11-09T12:28:54.189Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-131.html>
[55] [CITE@ja[日本語で書いている 「」(精の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:29:26.000Z]], [TIME[2020-11-09T12:29:28.296Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-124.html>
[56] [CITE@ja[日本語で書いている 「」(黒の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:31:03.000Z]], [TIME[2020-11-09T12:31:04.359Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-115.html>
[57] [CITE@ja[日本語で書いている 「」(都の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:32:16.000Z]], [TIME[2020-11-09T12:32:18.070Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-104.html>
[FIG(quote)[
[FIGCAPTION[
[58] [CITE@ja[日本語で書いている 「靜」(静の異体字)]]
([[黒字看板]], [TIME[2020-11-09T12:34:43.000Z]], [TIME[2020-11-09T12:35:09.613Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-79.html>
]FIGCAPTION]
> 旧字なら、「」+「爭」で「靜」。
]FIG]
[59] [CITE@ja[GlyphWiki:フォント生成 - GlyphWiki]]
([TIME[2020-11-12T02:26:05.000Z]])
<https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e7%94%9f%e6%88%90#i13>
[61] [CITE@ja[GlyphWiki:フォント対応状況 - GlyphWiki]]
([TIME[2020-11-12T02:27:46.000Z]])
<https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e5%af%be%e5%bf%9c%e7%8a%b6%e6%b3%81>
[63] [CITE@en-us[Unicode Character Encoding Stability Policy]]
( ([TIME[2013-06-27 23:43:16 +09:00]] 版))
<http://www.unicode.org/policies/stability_policy.html#Property_Value>
[6] [CITE@ja[第2の外字ファイル | フォント・外字エディタ TTEdit]]
([TIME[2020-01-22T23:56:39.000Z]], [TIME[2020-11-13T08:58:50.275Z]])
<https://opentype.jp/gaijino2.htm>
[8] [CITE@ja[甲骨文字フォント]]
([TIME[2011-09-07T14:54:41.000Z]], [TIME[2020-11-16T03:06:30.824Z]])
<http://kanji-database.sourceforge.net/fonts/koukotsu/index.html>