/
637.txt
872 lines (653 loc) · 31.8 KB
/
637.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
[22] [[Unicode]] の[DFN[[RUBYB[私用域]@en[private use area]]]]は、
[[Unicode Standard]] で特定の[[意味]]が規定されず、
[[利用者]]等が用途を定めることができる[[符号位置]]群です。
* 代替
[93]
[[私用文字]]は、
[[相互運用性]]に問題があるため、使うべきではありません (>>12)。
[[文字化け]]の[[巣窟]]です。
[94]
[[外字]]の[[情報交換]]には、
[[私用文字]]を使わない方法を用いるべきです。
[SEE[ [[外字]] ]]
* 仕様書
[REFS[
- [123] [CITE[[[The Unicode Standard]], Version 13.0 - ch02.pdf]], [TIME[2020-03-09T17:53:32.000Z]], [TIME[2020-12-20T08:35:03.323Z]] <https://www.unicode.org/versions/latest/ch02.pdf#G14527>
- [121] [CITE[[[The Unicode Standard]], Version 13.0 - ch03.pdf]], [TIME[2020-03-09T17:53:34.000Z]], [TIME[2020-12-20T02:08:18.239Z]] <https://www.unicode.org/versions/latest/ch03.pdf#G2212>
- [44]
[CITE[[[The Unicode Standard]], Version 13.0 - ch23.pdf]], [TIME[2020-03-09T17:53:52.000Z]], [TIME[2020-12-17T05:54:04.634Z]] <https://www.unicode.org/versions/latest/ch23.pdf#G19184>
]REFS]
* 意味
[122]
[DFN[[RUBY[私用][しよう][Private-Use]]]]は、
[[符号点型]]の1つです。
[SRC[>>121 D10a]]
[[General Category]] [CODE[Co]]
と同義です。
[SRC[>>123]]
[77]
[DFN[[RUBYB[私用文字][private-use character]]]]は、
割り当てられた
[[Unicode符号位置]]であって、
その解釈は
[CITE[The Unicode Standard]]
では規定されず、
[[当事者間の私的な合意]]によって決定されるものです。
[SRC[>>44]]
;; [112] 「割り当てられた」というのは[[未割当]]の[[符号位置]]に対するものです。
[[非文字]]も[[未割当]]扱いです。
[7] 他の[[文字コード]]との[[変換表]]で対応関係が規定されている場合、
実装者が内部的に用いる場合、
実装者が規定して[[利用者]]に提供する場合、
[[フォント]]が規定して[[利用者]]に提供する場合、
[[利用者]]が自ら規定して用いる場合があります。
[78]
[[私用文字]]は、よく [[end-user defined character]] ([[EUDC]])
として使われます。
[SRC[>>44]]
[[外字エディタ]]のような一般の[[利用者]]が[[外字]]を定義できる仕組みが用意されていることがあります。
[79]
[[プラットフォーム]]や[[アプリケーション]]や[[フォント]]の開発者が、
予め定めた独自の割当の[[文字]]が[[私用文字]]として提供されていることがあります。
* 符号点
[76]
[[Unicode]]
の[DFN[[RUBYB[私用域][Private Use Area]]]] ([DFN[PUA]])
は、
主、
副A、
副Bの
3つの領域から構成されます。
[REFS[
- [124]
[[符号点型]]
[CODE[Private-Use]]
の[[符号点]]の一覧
<https://chars.suikawiki.org/set/%24unicode%3Aprivate-use>
- [48] [[Private Use]]
の[[符号点]]の一覧
<https://chars.suikawiki.org/set/%24unicode%3APrivate_Use>
-- [75] [[Private Use Area]]
[[ブロック]]
<https://chars.suikawiki.org/set/%24unicode%3ABlock:Private_Use_Area>
-- [49] [[Supplementary Private Use Area-A]]
[[ブロック]]
<https://chars.suikawiki.org/set/%24unicode%3ABlock%3ASupplementary_Private_Use_Area-A>
-- [64] [[Supplementary Private Use Area-B]]
[[ブロック]]
<https://chars.suikawiki.org/set/%24unicode%3ABlock%3ASupplementary_Private_Use_Area-B>
]REFS]
-*-*-
[65]
[DFN[primary Private Use Area]]
は、
[DFN[[CODE[U+E000]]]] - [DFN[[CODE[U+F8FF]]]]
の6400個の[RUBYB[私用文字][private-use character]]です。
[SRC[>>44]]
[66]
[DFN[primary Private Use Area]]
は、
[CODE[U+F8FF]]
から始まり[[符号位置]]が小さくなっていく
[[corporate use subarea]]
と、
[CODE[U+E000]]
から始まり[[符号位置]]が大きくなっていく
[[end-user subarea]]
に二分されます。
[SRC[>>44]]
[70]
この分割は、
[[プラットフォーム]]で定義された[[私用文字]]と[[末端利用者]]が定義する[[私用文字]]との衝突の可能性を減らすための慣行で、
[[規定]]ではありません。
分割点は定義されておらず、
衝突の回避の手法も実装と[[末端利用者]]依存とされています。
あくまで便法として提案されたものに過ぎないため、
この区分を採用しなくても構いません。
[SRC[>>44]]
[67]
[DFN[corporate use subarea]]
は、
システム事業者やソフトウェア開発者が内部用に[[私用文字]]を予約したいとき、
[RUBYB[好ましい][preferred]]領域です。
完全に内部用で[[末端利用者]]には見えないもの、
例えば操作の指示のようなものに使っても構いませんし、
事業者規定の文字の割当として出版して[[応用]]や[[末端利用者]]の利用に供しても構いません。
[SRC[>>44]]
;; [68]
ただし情報交換可能でない内部用の指示の類には[[非文字]]を使うのが[RUBYB[好ましい][preferred]]です。
[SRC[>>44]]
[69]
[DFN[end-user subarea]]
は、
[[末端利用者]]が[[文字]]を定義したり、
[[末端利用者]][[アプリケーション]]が[[文字]]を割り当てていくための領域として使ったりする想定です。
[SRC[>>44]]
-*-*-
[73]
[DFN[Supplementary Private Use Area-A]]
は
[DFN[[CODE[U+F0000]]]] - [DFN[[CODE[U+FFFFD]]]]、
[DFN[Supplementary Private Use Area-B]]
は
[DFN[[CODE[U+100000]]]] - [DFN[[CODE[U+10FFFD]]]]
で、
合計131068個の[[私用文字]]です。
[[primary PUA]]
で足りない時に使えます。
[SRC[>>44]]
[74]
[[私用文字]]としての用法は
[[primary PUA]]
も両
[[supplementary PUA]]
もまったく同じです。
[[supplementary PUA]]
には
corporate use,
end-user
の区分はありません。
[82]
[DFN[第15面]] [CODE[U+F0000]] - [CODE[U+FFFFF]],
[DFN[第16面]] [CODE[U+100000]] - [CODE[U+10FFFF]]
は、[[非文字]] [CODE[U+FFFFE]], [CODE[U+FFFFF]],
[CODE[U+10FFFE]], [CODE[U+10FFFF]]
を除き、すべて[[私用文字]]に割り当てられています。
この2つの[[面][字面]]を[DFN[[RUBYB[私用面][Private Use Plane]]]]
([DFN[PUP]])
と呼ぶことがあります。
* 特性
[89]
[[私用域]]の[[符号位置]]にも、
他の[[符号位置]]と同じように[[特性][文字特性]]値が決められています。
[90]
[[Unicode]]
の多くの[[アルゴリズム]]は、
[CODE[General_Category]]
やそれから[[派生]]した[[特性]]を参照しています。
[[私用文字]]に関するその[[特性]]値は、
特に禁じた場合を除き、
[[私的な同意]]に基づき上書きして設定できます。
[SRC[>>44]]
[91]
その他の[[特性][文字特性]]についても、
[[正規化]]に関係するものを除き、
[[UCD]]
で定められた[[特性]]値は[[既定値]]であって、
[[参考]]とします。
この[[既定値]]は、
典型的な用例に基づき決められたもので、
[[私的な同意]]なき場合の一貫した挙動を定めることと、
一般的な利用を簡単化することを意図したものであります。
実装は、その[[私用]]に関する要件に従い適宜変更・上書きして構いません。
[SRC[>>44]]
[EG[
[92]
[[私的な同意]]に基づき[[大文字と小文字の関係][case mapping]]を設定したり、
[[結合文字]]として使うことにしたりできます。
[SRC[>>44]]
]EG]
[100]
[[NFC]]
など
[[Unicode]]
で規定された[[正規化]]は、
[[私用文字]]を変化させません。
[[私的な同意]]があってもこの挙動を変化させてはなりません。
(もちろん独自の[[正規化]]手法を採用する場合はこの限りではありません。)
[SRC[>>44]]
-*-*-
[101]
[[特性値]]をどの程度変更しても良いかについて、
[CITE[The Unicode Standard]]
は特に言及していません。
しかし
[[Unicode]]
で規定される各[[アルゴリズム]]や、
[[特性値]]を参照するそれ以外の[[仕様書]]の[[規定]]、
[[特性値]]を参照する[[アプリケーション]]固有の挙動などは、
必ずしもあらゆる[[特性値]]の組み合わせを扱えるわけではありません。
他のどの
[[Unicode文字]]でも起こり得ない組み合わせに対する挙動は想定されていない可能性があります。
仕様上は想定されていても、実装上は除去して最適化されていることがあり得ます。
[102]
とりわけ、
他の[[特性値]]から[[導出]]されるいくつかの[[特性値]]を扱う[[アルゴリズム]]は、
各[[特性値]]の一貫性を前提にしているかもしれません。
[[導出]]は [[Unicode]] の[[仕様書]]上の概念に過ぎず、
実装上は一方から他方が計算されるとは限りません [SEE[ [[特性][文字特性]] ]]。
[103]
[[特性][文字特性]]は既に相当数規定されている上に、
[[Unicode]]
の改正のたびにどんどん追加されています。
[[私用文字]]のそれぞれについて、
すべての[[特性]]を適切な値に保ち続けるのは困難です。
[104]
そう考えると、
[[私用文字]]の定義の時に[[特性]]を1つ1つ設定していく方法より、
予め用意した[[特性値]]の組み合わせの中から適当なものを1つ選択する方法の方が、
現実的な実装手段ではないでしょうか。
「予め用意した[[特性値]]の組み合わせ」
も、
新たに独自に用意するよりは、
既存の
[[Unicode符号位置]]を1つ選ぶことで記述するとした方が簡単そうです。
既存のどの
[[Unicode符号位置]]とも[[特性][文字特性]]が一致しない[[私用文字]]を使いたい可能性は、
それほど高くないでしょうから、
多くの利用はカバーできそうです。
[105]
例えば[[アルファベット]]系の[[外字]]なら「[CODE[A]]」、
[[漢字]]系の[[外字]]なら「[CODE[一]]」
のように性質の似た既存の[[文字]]を選ぶ形にすればいいということです。
[106]
ただしこの手法でも、
[[大文字]]・[[小文字]]の変換の[[特性値]]や
[[Unihan]] 系の[[特性値]]など、
すべての[[特性値]]を丸々コピーするわけにはいきません。
-*-*-
[108]
[[アプリケーション]]によっては、
[[相互運用性]]のため、
[[私用文字]]が使えたとしても[[特性値]]の変更までは認めない、
または特定の場面では[[特性値]]の変更を関知しないような制限があるかもしれません。
[109]
例えば[[正規表現]]の [CODE[\p]] は[[特性値]]によって[[文字]]の[[一致]]を判定します。
[[ネットワーク]]で配布する条件記述ファイル中に含める[[正規表現]]で、
[[一致]]するか否かが変わると[[相互運用性]]に支障が出るまら、
必ず [[UCD]] の[[特性値]]通りに動作すると定めるべきでしょう。
[110] 逆に、テキスト編集アプリケーションで、
選択した[[文字列]]の[[大文字]]を[[小文字]]に変換する[[ボタン]]なら、
[[相互運用性]]には支障がなさそうですから、
[[利用者]]の便宜を優先するのが良さそうです。
-*-*-
[107]
[[Unicode]]
は[[符号位置]]に[[私用文字]]として独自の[[文字]]を割り当てる方法を採っていますが、
[[マーク付け言語]]や[[プロトコル]]に依存した、
[[Unicode符号位置]]以外の方法で[[外字]]を表現・交換することもあります
[SEE[ [[外字]] ]]。
そのような[[外字]]も、
[[Unicode]]
の[[私用文字]]と同様に、
自然に扱うためには適切な[[特性値]]の情報が与えられていなければなりません。
[111]
それに対応した交換形式は
[CITE[[[Missing Characters in XML]]]]
くらいしか見たことがありません。
しかしこの提案はほとんど使われていないようです。
[113]
関連して[[非文字]]の場合については、[[非文字]]参照。
* 安定性
[80]
[[Unicode]]
の[[私用文字]]の[[符号位置]]は、
恒久的に[[私用]]に割り当てられています。
[SRC[>>44]]
[81]
[[Unicode Consortium]]
が特定の標準の文字の割当を承認したり文書化したりすることはありません。
[SRC[>>44]]
[87]
[[私用文字]]としての利用実績が、
[[Unicode]]
への[[文字]]の追加の如何やその技法の決定に直接影響を及ぼすことはありません。
[SRC[>>44]]
;; [88] [[Unicode]] へ[[文字]]の追加を提案する人達が、
[[フォント]]や[[国内規格]]の
[[PUA]]
に提案する[[文字]]を並べて事前に使っていることは珍しくありません。
しかしそれが
[[PUA]]
内の[[符号位置]]のまま標準化されることはあり得ませんし、
別に追加されることになったとしても[[文字]]の配列順が変更されることはよくあります。
[HISTORY[
[84]
かつて
[[ISO/IEC 10646]]
は
[CODE[U-60000000]] - [CODE[U-7FFFFFFF]],
[CODE[U-00E00000]] - [CODE[U-00FFFFFF]]
も[[私用]]としていました。
[85]
この領域を使っていた実装もありました。
[86]
ところがこの領域は
[[Unicode]]
では表せないということで、ばっさり消し去ってなかったことにされました。
]HISTORY]
* 文脈
[119]
任意の
[[Unicode文字]]を受け付ける[[プロトコル]]や[[マーク付け言語]]や[[データ形式]]は、
[[私用文字]]の利用にも特に制限は設けていません。
[120]
[[XMLの名前]]のように、
[[識別子]]系の構文は[[私用文字]]を認めないことが多いようです。
[125] なぜか [[IDS]] でも利用が認められています。
* 処理
[114]
[[私用文字]]を特別に扱わず、ただの[[符号位置]]として扱う実装も少なくありません。
実は多くの処理はそれでいいのかもしれません。
[115]
[[プラットフォーム]]によっては
[[EUDC]]
の仕組みが組み込まれています。
[[アプリケーション]]はただの[[符号位置]]と扱うだけで、
[[利用者]]が[[プラットフォーム]]を介して定義した[[外字]]を使うことができます。
[116]
多くの[[プロトコル]]や[[マーク付け言語]]は、
[[私用文字]]に対して特別な扱いを設けていません。
意図したものにせよ、そうでないにせよ、
現実に[[私用文字]]はそれなりに使われ、
それなりに流通しています。
従って入出力時に[[私用文字]]だからという理由で除去したり
[CODE[U+FFFD]]
に置換したりするのは、
データの破壊につながります。
[117]
[[適合性検査器]]や [[lint]] のような検査ツールの類は、
[[私用文字]]を検出して警告するべきでしょう。
[118]
データの互換性と[[相互運用性]]のため、
[[フォント]]が明示的に指定され[[埋め込まれ][フォント埋め込み]]ている場合を除いて、
[[私用文字]]は常に[[未割当符号位置]]のように表示し、
なるべく入力させなくする方が安全かもしれません。
* 相互運用性
[12] [[私用文字]]は、
その性質上、[[相互運用性]]はまったく期待できません。
書き捨ての[[文書]]など例外的な場合を除き、使うべきではありません。
また他の誰がどのような用途で用いているかわかりませんから、
内部処理用にも使うべきではありません。
[71]
たとえ
[[corporate use subarea]]
であっても、
異なる事業者の定義した[[私用文字]]の相互の衝突の回避の方法は用意されていません。
どの事業者の定義を採用したか記述する方法も用意されていません。
[72] [[利用者]]間の[[私用文字]]の相互の衝突の回避の方法は用意されていません。
[[私用文字]]の定義を記述し交換する標準的な方法もありません。
[95]
同じ[[プラットフォーム]]であっても、
違う[[フォント]]に切り替えるだけで、
[[私用文字]]は[[文字化け]]してしまう可能性があります。
[96]
[[フォント]]依存の[[私用文字]]は、
[[フォント名]]を指定できる[[ワープロ]]などでは保持できますが、
同じ[[フォント]]を持たない別のシステムでは[[文字化け]]します。
[97]
[[PDF]]
として保存する場合は、
[[フォント]]を[[埋め込む]]なら同じ[[私用文字]]が再現されるはずです。
埋め込みしないなら[[私用文字]]を使ってはいけません。
[98]
[[Web]]
では
[[Web Fonts]]
を使えば[[私用文字]]を利用できます。
取り回しに難がありますから、できれば避けるべきです。
[[Web Fonts]]
を使えないときは使うべきではありません。
[99]
[[私用文字]]の一貫した扱いのためには、
[[グリフ]]データの他に、
[[特性][文字特性]]も共有する必要があります。
しかし
[CITE[The Unicode Standard]]
はその手段を定義していません。
[SRC[>>44]]
他に一般的な手法もありません。
特定の[[アプリケーション]]だけで使える仕組みは探せばあるかもしれませんが、
可搬性はありません。
* 関連
[23] [[Unicode]] 以前の[[文字コード]]やその実装にも、
[[外字]]、[[EUDC]]、[[自由領域]]、
[[DRCS]]
といった呼称で同様の[[符号位置]]・[[ビット組合せ]]が用意されていたり、
[[空き領域]]を実装が勝手に使ったりしていました。
[36] [SEE[ [[Unicodeにない文字]] ]]
[34]
[[UTF-16]]
において
[[PUP]]
に使う
[[high-surrogate code points]]
は、
[[private-use high-surrogate code points]]
と呼ばれています。
[62] 内部処理専用の[[符号位置]]として[[非文字]]があります。
* 歴史
[83]
>
:私用面 (private use planes):
この[[符号化文字集合]]中の[[面]]であって、
この規格群で[[文字]]を規定しない面 (10. 参照)。
([[JIS X 0221]]‐1:2001 4.31)
[FIG(quote)[ [42] [[JIS X 0221]]‐1:2001
> 10. 私用の群、面及び領域
> 10.1 私用文字
> この規格群では、私用文字にはいかなる制限も加えない。
私用文字は、利用者定義の[[文字]]を備えるのに使用できる。
例えば、これは、[[漢字]]の[[用字]]の利用者には一般的な要件となる。
> 備考 私用文字の意味のある[[交換]]のためには、
この規格群とは別に、送受者間の合意が必要となる。
> 私用文字は、動的に再定義可能な文字の適用業務に使用できる。
> 備考 動的に再定義可能な文字の意味のある交換のためには、
この規格群とは別に、送受者間の合意が必要となる。
この規格群は、動的に再定義可能な文字の定義又は設定の技法を規定しない。
[Q[動的に再定義可能な文字]]というのは、 [[JIS X 0202]]
で言う[[動的再指定可能文字]]のことです。
> 10.2 私用文字の符号位置
> [[群]] [CODE[60]]〜[CODE[7F]] の32個の[[符号位置]]は、
私用とする。
> 群 [CODE[00]] の[[面]] [CODE[0F]] 及び面 [CODE[10]]
並びに面 [CODE[E0]]〜[CODE[FF]] の32個の面の符号位置は、
私用とする。
> [[基本多言語面]]の6400個の符号位置 [CODE[E000]]〜[CODE[F8FF]]
は、私用とする。
> これらの符号位置の内容は、この規格群では規定しない
(10.1 参照)。
]FIG]
[43]
同じ [[JIS X 0221]]‐1:2001 の 11. 備考には、
> この規格で規定する文字の[[名前]]及び符号位置を、この規格群の将来の改正で変更する意図はない。
...
と書いてありますけど、私用文字はその[Q[意図]]の範囲外なのでしょう。
(私用文字は符号位置を規定するけど内容 (文字) は規定しないから?)
* 利用例
[26] [[文字符号化]] [[x-user-defined]] は、
[ [[U+F780]], [[U+F7FF]] ] を [ [N[0x80]], [N[0xFF]] ] と対応付けています。
[1]
[CITE[Emacs VietThai environment]] <http://www.m17n.org/vietthai/forEmacs.html>
> As the proposal for VietThai script to the Unicode is still in progress, we use the Private Use Area for VietThai characters (U+F000..U+F07E). A VietThai font encoded accordingly is also available in the package.
[2] [CITE[Special filenames]]
( ([TIME[2011-03-01 18:26:29 +09:00]] 版))
<http://www.cygwin.com/cygwin-ug-net/using-specialnames.html>
[3] [CITE@en[Private Use (Unicode) - Wikipedia, the free encyclopedia]]
( ([TIME[2012-03-04 20:44:51 +09:00]] 版))
<http://en.wikipedia.org/wiki/Private_Use_(Unicode)#Example_code_point_U.2BF8FF>
[4] [CITE@en[Bug 16862 – Indexes: GB18030 and Microsoft encodings should support PUA code points]]
( ([TIME[2013-10-27 03:50:39 +09:00]] 版))
<https://www.w3.org/Bugs/Public/show_bug.cgi?id=16862>
[5] [CITE@en[Character Model for the World Wide Web 1.0: Fundamentals]]
( ([TIME[2005-02-15 14:24:00 +09:00]] 版))
<http://www.w3.org/TR/charmod/#sec-PrivateUse>
[9] [CITE[JsonWireProtocol - selenium - A description of the protocol used by WebDriver to communicate with remote instances - Browser automation framework - Google Project Hosting]]
( ([TIME[2014-10-30 06:29:12 +09:00]] 版))
<https://code.google.com/p/selenium/wiki/JsonWireProtocol#/session/:sessionId/element/:id/value>
[10] [CITE@ja[5-1a. 錦明朝かな(明朝体フォント)]]
( ([TIME[2014-04-19 11:30:08 +09:00]] 版))
<http://www.akenotsuki.com/eyeben/font/nishiki_kana.html#knownissue>
[11] [CITE@en[WebDriver]]
( ([TIME[2014-11-07 11:12:19 +09:00]] 版))
<https://dvcs.w3.org/hg/webdriver/raw-file/default/webdriver-spec.html#character-types>
[13] ([TIME[2005-04-05 10:04:12 +09:00]] 版)
<http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CORPCHAR.TXT>
[FIG(quote)[
[FIGCAPTION[
[15] [CITE@en[w3c/smufl]]
([TIME[2015-08-31 11:42:29 +09:00]] 版)
<https://github.com/w3c/smufl>
]FIGCAPTION]
> SMuFL is a specification that provides a standard way of mapping the thousands of musical symbols required by conventional music notation into the Private Use Area in Unicode’s Basic Multilingual Plane for a single (format-independent) font.
]FIG]
[FIG(quote)[
[FIGCAPTION[
[16] ([TIME[2010-09-30 17:02:10 +09:00]] 版)
<http://www.arib.or.jp/english/html/overview/doc/2-STD-B24v5_1-1p3.pdf#page=156>
]FIGCAPTION]
> DRCS の文字は、基本多言語面の私用領域に対応付ける。
> 私用領域の利用にあたっては、DRCS は EC 区 00 点から順次用いることとする。
]FIG]
[17]
[[アイコンフォント]]
[FIG(quote)[
[FIGCAPTION[
[18] [CITE[FORUM21]]
([TIME[2006-03-08 17:20:56 +09:00]] 版)
<http://www.forum21.jp/contents/contents6-15.html>
]FIGCAPTION]
> バットは920で、プロ選手のなかでも重い方なんですよ。
]FIG]
[19] [CITE@en[WebKit on Twitter: "The Pay JS code has landed in open source. https://t.co/AJfKFtdKxy"]]
([TIME[2016-06-26 12:48:01 +09:00]])
<https://twitter.com/webkit/status/746441587811508227>
[FIG(quote)[
[FIGCAPTION[
[20] [CITE@en[Basic message formatting | Slack]]
([[Slack]]著, [TIME[2016-07-13 00:57:54 +09:00]])
<https://api.slack.com/docs/message-formatting>
]FIGCAPTION]
> The Slack message server and API handle conversion from several binary emoji formats - the Unicode Unified format (used by OSX 10.7+ and iOS 6+), the Softbank format (used by iOS 5) and the Google format (used by some Android devices). These Unicode code points will be converted into their colon-format equivalents.
]FIG]
[21] [CITE@en[RFC 1345 - Character Mnemonics and Character Sets]]
([TIME[2016-07-13 09:31:02 +09:00]])
<https://tools.ietf.org/html/rfc1345#page-40>
[FIG(quote)[
[FIGCAPTION[
[24] [CITE@en[XForms 2.0 - XForms Users Community Group]]
([TIME[2016-12-11 09:41:21 +09:00]])
<https://www.w3.org/community/xformsusers/wiki/XForms_2.0#External_JSON_values>
]FIGCAPTION]
> The content of a string is copied across. Escaped characters are transformed as necessary; characters and escapes that have no equivalent XML character (\b, \f, and characters of the form \uxxxx less than \u0020, except for \u0009, \u000A, and \u000D) are transformed by adding \uE000 to them.
]FIG]
[25] [CITE@en[Remove the last 14 characters PUA of GB18030-2005 · Issue #27 · whatwg/encoding]]
([TIME[2016-12-20 20:28:47 +09:00]])
<https://github.com/whatwg/encoding/issues/27>
[FIG(quote)[
[FIGCAPTION[
[27] [CITE[Bogus Shift_JIS]]
([TIME[2017-05-03 16:11:15 +09:00]])
<https://hsivonen.com/test/moz/bogus_shift_jis.htm>
]FIGCAPTION]
> IE6 had the following behaviors:
> The bytes 0xFD, 0xFE and 0xFF decode to U+F8F1, U+F8F2 and U+F8F3, respectively.
]FIG]
[28] [CITE@en[remove Gecko quirks from shift_jis]]
([[annevk]]著, [TIME[2012-04-09 17:25:02 +09:00]])
<https://github.com/whatwg/encoding/commit/651f672ee988702da03f56ad8bdfda00b51a21ea>
[29] [CITE@en[bug 6180 – EUDC (外字) が表示されない]]
( ([TIME[2014-12-19 18:17:50 +09:00]] 版))
<http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=6180>
[30] [CITE@en[399369 – Disable font fallback when a character is in the private use areas]]
( ([TIME[2014-12-19 18:18:16 +09:00]] 版))
<https://bugzilla.mozilla.org/show_bug.cgi?id=399369>
[31] [CITE@en[Comments on XML Part 1 from Japanese experts]]
([[Murata Makoto]]著, [TIME[1997-05-28 10:48:56 +09:00]])
<https://lists.w3.org/Archives/Public/w3c-sgml-wg/1997May/0612.html>
[FIG(quote)[
[FIGCAPTION[
[35] [CITE@en[Character Description Language - Wenlin Guide]]
([TIME[2017-04-12 00:30:51 +09:00]])
<http://guide.wenlininstitute.org/wenlin4.3/Character_Description_Language>
]FIGCAPTION]
> Wenlin Variation Sequences depend on Wenlin CDL font support: Wenlin uses a whole plane of Private-Use Area (PUA) characters (U+F0000..U+FFFFD), to define its own Private-Use Variation Selectors (PVS). Wenlin uses these PVS to define Wenlin’s own Private Variation Sequences, used to manage glyph variation in the CDL Database.
]FIG]
[FIG(quote)[
[FIGCAPTION[
[37] [CITE[文字情報技術促進協議会]]
([TIME[2019-02-08 11:59:59 +09:00]])
<https://citpc.jp/tools/downloads/font>
]FIGCAPTION]
> 【CITPC私用文字マッピングテーブルの仕様概要】
> PUPの領域のうちU+101000-U+104FFFを、本目的のための符号位置の割り当てに用いることとし、ここへ割り当てた符号位置を「暫定私用コード」とする。
> マッピングテーブルpup_mapping.txtは、MJ文字情報一覧表において、「対応するUCS」に同一の値を持つMJ文字図形名が複数存在する物(それらを区別するためにはIVSが必要となる物)、および、「対応するUCS」に値のなかったもの、ISO/IEC 10646に於ける符号化が完了していないものについて、MJ文字図形名と暫定私用コードのUCS符号位置との関係を示した物である。 なお、IPAmjPUPフォントは、IPAmj明朝フォントの符号位置に加えて、pup_mapping.txt に示した暫定私用コードの符号位置を追加実装したものである。
]FIG]
[38] [CITE@ja[昔のハングル - ウィキペディア、我々はすべての百科事典]]
([TIME[2019-02-17 10:16:41 +09:00]])
<https://ko.wikipedia.org/wiki/%EC%98%9B%ED%95%9C%EA%B8%80>
[FIG(quote)[
[FIGCAPTION[
[39] [CITE@ja[古ハングル - Wikipedia]]
([TIME[2019-02-18 12:19:36 +09:00]])
<https://ja.wikipedia.org/wiki/%E5%8F%A4%E3%83%8F%E3%83%B3%E3%82%B0%E3%83%AB>
]FIGCAPTION]
> ᄒᆞᆫ
]FIG]
[14] [CITE@ja[資料室 '''['''コンピュータと朝鮮語のための覚え書き''']''']], [TIME[2020-12-07T07:42:34.000Z]] <https://porocise.sakura.ne.jp/wiki/archive>
[40] [CITE@ja[私用領域をのぞく : ウェブロギスティック雑記]]
([TIME[2019-03-10 21:32:38 +09:00]])
<http://blog.livedoor.jp/itomata/archives/4630030.html>
[41] [CITE@en[BabelStone Fonts : BabelStone Han PUA]]
([TIME[2019-05-22 02:39:01 +09:00]])
<http://www.babelstone.co.uk/Fonts/PUA.html>
[32]
[CITE[[[ConScript Unicode Registry]]]]
[33] [CITE[にしき的フォント - TYPVS LITTERARVM NISICIAE]]
([TIME[2020-09-09T12:53:21.000Z]], [TIME[2020-09-11T06:05:46.375Z]])
<http://hwm3.gyao.ne.jp/shiroi-niwatori/nishiki-teki.htm>
[45] [[EACC]]
[46]
蒙古文字 [SEE[ [[縦書き]] ]]
[47] [CITE[Koin変体仮名]]
([TIME[2020-06-19T10:58:38.000Z]], [TIME[2020-10-19T07:19:19.871Z]])
<http://www10.plala.or.jp/koin/koinhentaigana.html>
[50] [[KPS 9566]]
[51] [CITE@en-GB[CNS 11643 and Big5 comparison tables - HarJIT's Website]]
([TIME[2020-09-30T22:18:32.000Z]], [TIME[2020-10-26T02:59:44.149Z]])
<https://harjit.moe/cns-conc.html>
[FIG(quote)[
[FIGCAPTION[
[52] [CITE@ja[日本語で書いている 「」(福の旧字)]]
([[黒字看板]], [TIME[2020-11-09T03:38:56.000Z]], [TIME[2020-11-09T03:39:08.992Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-202.html>
]FIGCAPTION]
> 「」と書いてあります。「」は、「福」の旧字です。
]FIG]
[53] 「福」を意図したらしい [CODE[U+E259]]
[54] [CITE@ja[日本語で書いている 「」(清の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:28:51.000Z]], [TIME[2020-11-09T12:28:54.189Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-131.html>
[55] [CITE@ja[日本語で書いている 「」(精の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:29:26.000Z]], [TIME[2020-11-09T12:29:28.296Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-124.html>
[56] [CITE@ja[日本語で書いている 「」(黒の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:31:03.000Z]], [TIME[2020-11-09T12:31:04.359Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-115.html>
[57] [CITE@ja[日本語で書いている 「」(都の旧字)]]
([[黒字看板]], [TIME[2020-11-09T12:32:16.000Z]], [TIME[2020-11-09T12:32:18.070Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-104.html>
[FIG(quote)[
[FIGCAPTION[
[58] [CITE@ja[日本語で書いている 「靜」(静の異体字)]]
([[黒字看板]], [TIME[2020-11-09T12:34:43.000Z]], [TIME[2020-11-09T12:35:09.613Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-79.html>
]FIGCAPTION]
> 旧字なら、「」+「爭」で「靜」。
]FIG]
[59] [CITE@ja[GlyphWiki:フォント生成 - GlyphWiki]]
([TIME[2020-11-12T02:26:05.000Z]])
<https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e7%94%9f%e6%88%90#i13>
[61] [CITE@ja[GlyphWiki:フォント対応状況 - GlyphWiki]]
([TIME[2020-11-12T02:27:46.000Z]])
<https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e5%af%be%e5%bf%9c%e7%8a%b6%e6%b3%81>
[63] [CITE@en-us[Unicode Character Encoding Stability Policy]]
( ([TIME[2013-06-27 23:43:16 +09:00]] 版))
<http://www.unicode.org/policies/stability_policy.html#Property_Value>
[6] [CITE@ja[第2の外字ファイル | フォント・外字エディタ TTEdit]]
([TIME[2020-01-22T23:56:39.000Z]], [TIME[2020-11-13T08:58:50.275Z]])
<https://opentype.jp/gaijino2.htm>
[8] [CITE@ja[甲骨文字フォント]]
([TIME[2011-09-07T14:54:41.000Z]], [TIME[2020-11-16T03:06:30.824Z]])
<http://kanji-database.sourceforge.net/fonts/koukotsu/index.html>
[126] [CITE@ja[Nasuフォント ver2014.0925 の合成用濁点・半濁点 - itouhiroはてなブログ]], [TIME[2020-12-27T12:15:17.000Z]] <http://itouhiro.hatenablog.com/entry/20140925/font>