-
Notifications
You must be signed in to change notification settings - Fork 4
/
496.txt
276 lines (208 loc) · 12.1 KB
/
496.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
* フォント依存の符号化機構
[FIG(short list)[ [1] [[プロトコル]]
- [[外字]]
-- [[自由領域]]
-- [[DRCS]]
-- [[EUDC]]
-- [[PUA]]
- [CODE[<font face>]]
- [CODE[font-family]]
- [CODE[x-user-defined]]
- [[symbol encoding]]
- [[OTF Windows NT compatibility mapping]]
- [[PDF]]
- [[Windows-1252]]
]FIG]
* 実例
[FIG(short list)[ [2] [[フォント]]
- [[Symbol]]
- [[Wingdings]]
- [[シフトGB]]
- [[Shift-KS]]
- [[今昔文字鏡]]
- [[GT書体]]
- [[アイコンフォント]]
-- [[Font Awesome]]
- [[合字フォント]]
- [[バーコードフォント]]
- [[楽譜]]
- [[アーヴ文字]]
- [[甲骨文字]]
- [[漢字庫]]
- [[Unicode非互換割当]]
]FIG]
* Windows symbol encoding
[17]
[[OpenType]]
の
[CODE[platformID]] [N[3]] ([[Windows]])
[CODE[encodingID]] [N[0]] ([[Symbol]])
[SRC[>>16]]
は
[DFN[symbol encoding]]
を表します。
[18]
[[symbol encoding]]
は、
[[Unicode]] その他の[[標準]]の[[符号化][文字符号化]]が対応していない[RUBYB[任意の装飾や記号][arbitrary ornaments or symbols]]の[[フォント]]に使います。
[SRC[>>16]]
[19]
通常は
[CODE[cmap]]
[CODE[format]] [N[4]]
[[部分表]]で、
[[符号位置]] [N[0xF020]] から始まる224個[[以下]]の[[図形文字]]を割り当てて使います。
[SRC[>>16]]
[20]
[[symbol encoding]]
は
[[Unicode符号化]]ではないものの、
[N[0xF020]]
からの領域は
[[PUA]]
に相当するものである [SRC[>>16]]、
と説明されています。
;; [24] つまり [ [CODE[U+F020]], [CODE[U+F0FF]] ] の領域です。
[21]
[[応用]]によっては[[遺物]]的な用法では[RUBYB[記号文字][symbol character]]を[[単一バイト符号化]]で表し、
[N[0x20]]
を[[フォント]]の [CODE[OS/2]] [[表][OpenType表]]の [F[[CODE[usFirstCharIndex]]]]
に[[写像]]して使っていました。
[SRC[>>16]]
;;
[22] と [CITE[[[OpenType]]]] [[仕様書]]の [[symbol encoding]]
の項で説明されているのですが、これが [[symbol encoding]]
の原初の用法を意味しているのか、
[[symbol encoding]] 成立前の慣習を説明しているのか、不明瞭です。
[23]
新しい[[フォント]]では、
[[Unicode]] にない[RUBYB[記号][symbol]]や[RUBYB[文字][character]]は
[[Unicode [CODE[cmap]]部分表]]の [[PUA]] [[符号点]]で符号化する[RUBYB[べきです][should]]。
[SRC[>>16]]
つまり [[symbol encoding]] は使用するべきではないということのようです。
[REFS[
-
[16]
[CITE@ja-jp[[[cmap]] - Character To Glyph Index Mapping Table (OpenType 1.9) - Typography | Microsoft Docs]], [[PeterCon]], [TIME[2022-09-04T04:18:58.000Z]] <https://docs.microsoft.com/ja-jp/typography/opentype/spec/cmap>
]REFS]
- [142]
[CITE@ja-jp[Recommendations for [[OpenType]] Fonts (OpenType 1.9) - Typography | Microsoft Docs]], [[PeterCon]], [TIME[2022-06-16T13:18:34.000Z]] <https://docs.microsoft.com/ja-jp/typography/opentype/spec/recom#SymbolFonts>
* メモ
- [13]
[CITE@en-GB[Using FONT FACE to extend repertoire?]] ([TIME[2006-07-13 00:17:01 +09:00]] 版) <http://ppewww.physics.gla.ac.uk/~flavell/charset/fontface-harmful.html>
-- 消滅確認 [TIME[2020-03-04T05:43:10.600Z]]
- [15] [CITE[絵文字フォントと特殊文字[簡単タグ集] ]] ([TIME[2008-06-27 14:32:52 +09:00]] 版) <http://www3.ocn.ne.jp/~uri-o313/yumesato/tag/1/font-style2.htm>
-- 消滅確認 [TIME[2020-03-04T05:43:04.000Z]]
-- [CITE[絵文字フォントと特殊文字[簡単タグ集] ]], [TIME[2020-03-04 14:42:44 +09:00]] <https://web.archive.org/web/20120315225931/http://www3.ocn.ne.jp/~uri-o313/yumesato/tag/1/font-style2.htm>
[6] [CITE@en[1054817 – Icon fonts don't work when "allow pages to choose their own fonts" is unchecked]]
( ([TIME[2014-08-18 02:20:12 +09:00]] 版))
<https://bugzilla.mozilla.org/show_bug.cgi?id=1054817>
[8] [CITE@en[789788 – Not allowing pages to choose their own fonts breaks with icon fonts]]
( ([TIME[2014-08-19 05:33:45 +09:00]] 版))
<https://bugzilla.mozilla.org/show_bug.cgi?id=789788>
[67] [CITE[Issue 3766 - chromium - Symbol and Wingdings fonts are not handled properly - An open-source browser project to help move the web forward. - Google Project Hosting]]
( ([TIME[2012-12-16 15:15:25 +09:00]] 版))
<http://code.google.com/p/chromium/issues/detail?id=3766>
[3] [CITE@ja[フリー素材|真宗大谷派 名古屋教区第30組]], [TIME[2011-07-12 11:14:32 +09:00]] <http://www.nagoya30.net/free/cakra.html>
>wingdingsという絵文字用のフォントには、法輪に似た(船の舵かも?)文字が入っていますので、これを使用すると、簡単に法輪のイメージを作ることができます。
><span style="font-family:wingdings; color:#xxxxxx; font-size:○○px">]</span>という文字列をHTMLソースに書き加えればよいです。フォントサイズや色などのスタイルは好みに設定してください。
[4]
この例示が [[Windows]] の [[Chrome]] では正しく[[法輪]]らしきもので表示されるものの、
前後の [CODE[ ]] が四角い[[中点]]として表示されます
([[Wingdings]] の[[グリフ]]なしのデフォルト?)。
同じ環境の
[[Firefox]]
では、
[[フォント]]指定が適用されないらしく、
「]」のまま表示されます。
[CODE[ ]]
もただしく[[空白]]として表示されます。
[TIME[2020-03-04T06:02:28.100Z]]
[FIG(quote)[
[FIGCAPTION[
[10] [CITE[IROIRO 2000a]]
([TIME[2018-05-19 22:33:50 +09:00]])
<https://web.archive.org/web/20010714194835/http://www.asahi-net.or.jp:80/~ez3k-msym/iroiro00a.htm>
]FIGCAPTION]
> Listo de Esperanto Tiparoj にエスペラント用の(というより ISO8859-3 の)フォントがある。 しかし, Windows に ISO8859-3 用の NLS ファイルがない(?) ためか, script としては 8859-1 と 8859-9 しかサポートしていないようだ。 変わりに UCS の 00A0-00FF の領域に手を入れて, 例えば 00E6 は (ae でなく) c^ にさしかえてある。
> このフォントを使ったページに, Esperanto for English Speakers (Thomas Eccardt) があるが, c^ のかわりに æ 実体参照を使っているのはあまりうれしくない。
]FIG]
[FIG(quote)[
[FIGCAPTION[
[9] [CITE@ja[Antenna House によるXSL拡張仕様]]
([TIME[2015-05-29T04:41:14.000Z]], [TIME[2020-10-28T07:48:00.515Z]])
<https://www.antenna.co.jp/XML/axf-extension/axf-extension.htm#axf%3Asoft-hyphen-treatment>
]FIGCAPTION]
> 通常、SOFT HYPHEN (U+00AD) は、行分割しなかったときは表示せず、行分割した場合は表示される。しかし、この処理では、絵文字のようなフォントを使用した場合、U+00AD に割り当てられているグリフが印字されない場合が発生してしまう。axf:soft-hyphen-treatment プロパティを使用することで、この問題を回避することができる。
]FIG]
[7] [CITE[GT書体フォントダウンロード]]
([TIME[2005-02-04T03:36:54.000Z]], [TIME[2020-10-28T12:04:04.868Z]])
<http://www.l.u-tokyo.ac.jp/GT/downloads.html>
[FIG(quote)[
[FIGCAPTION[
[5] [CITE@ja[日本語で書いている ギリシャ語です3]]
([[黒字看板]], [TIME[2020-11-09T03:21:53.000Z]], [TIME[2020-11-09T03:22:18.511Z]])
<http://kurojikanbandesu.blog102.fc2.com/blog-entry-111.html>
]FIGCAPTION]
> 「Ω(オーム)クリーンショップ」と書いてあります。この"オーム"は、ギリシャ文字としてパソコンに入っている文字。
> Ω この"オーム"は、抵抗値を表す単位としてのオーム。
> W この"オーム"は、fontを"symbol"というギリシャ文字のものに指定したものです。[SNIP[]]
> それぞれが違う形ですね。
]FIG]
[FIG(quote)[
[FIGCAPTION[
[11] [CITE@ja[墨点字フォント]]
([TIME[2019-08-08T04:05:51.000Z]], [TIME[2021-05-11T08:40:57.817Z]])
<http://www.lighthouse.or.jp/tecti/tecti/br-font.html>
]FIGCAPTION]
> 「あいうえお」と書いて、その部分を「ゴシックにする」ときと同じように、 「点字線付フォント」または「点字線なしフォント」に指定します。
> すると、その部分が6点の点字の「あいうえお」で表示され、 そのまま墨点字を含んだ文書がプリントできます。
]FIG]
[12] [CITE@en[chardetng: A More Compact Character Encoding Detector for the Legacy Web]]
([[Henri Sivonen]], [TIME[2020-06-08T16:23:51.000Z]], [TIME[2021-10-15T03:19:30.133Z]])
<https://hsivonen.fi/chardetng/#fonts>
[14] [CITE@en[910187 - Armenian localization should not use armscii-8 as the fallback encoding; should use windows-1252]], [TIME[2022-05-14T03:54:01.000Z]] <https://bugzilla.mozilla.org/show_bug.cgi?id=910187>
[25]
[TIME[2021-04-06T01:35:55.000Z]], [TIME[2022-09-14T04:07:57.133Z]] <http://t-editor.sakura.ne.jp/situmon.html>
-
[27]
[CITE[Thai Keymapped YKの詳細情報 : Vector ソフトを探す!]], [TIME[2022-10-11T03:33:55.000Z]] <http://www.vector.co.jp/soft/data/writing/se019766.html>
-[26] [CITE[thai-yk <=> Unicode]], [TIME[2003-02-10T17:16:27.000Z]], [TIME[2022-10-11T03:33:43.317Z]] <https://ha1.seikyou.ne.jp/home/akairingosaita/hangul/thai-yk.htm>
[28]
[CITE[Japanese Windows and hangul]], [TIME[2009-12-02T16:07:09.000Z]], [TIME[2022-10-11T05:31:42.507Z]] <https://ha1.seikyou.ne.jp/home/akairingosaita/hangul/hangul02.htm>
>"Yamada Language Center"で配布されている"Sorawin.ttf"は、
なんと1byte文字のフォントです。
初声、中声、終声を重ね打ちしてハングルを表示します。
欧文フォントの裏フォント(外字フォント)形式であり、
通常のハングルフォントとの互換性はありません。
[29]
[CITE@en[(PDF) Wrecked Indian Fonts: A Problem for Digitalization of Indic Documents]], [TIME[2022-07-05T16:17:07.000Z]], [TIME[2022-10-15T07:09:20.750Z]] <https://www.researchgate.net/publication/280496031_Wrecked_Indian_Fonts_A_Problem_for_Digitalization_of_Indic_Documents>
[30] [CITE@ja[墨点字フォント]], [TIME[2022-10-25T13:36:16.000Z]], [TIME[2003-08-09T03:23:46.269Z]] <https://web.archive.org/web/20030809032324/http://www.eonet.ne.jp/~tecti/tecti/br-font.html>
[31] [CITE@ja[点訳校正委員会報告]], [TIME[2014-04-16T07:20:02.000Z]], [TIME[2022-10-25T13:36:36.466Z]] <http://www.shichocenter.kagoshima.kagoshima.jp/tennyaku_kosei.bak>
>
[PRE[
※日本ライトハウス作成の墨点字フォントを使用しています。
文中の墨点字部分が墨点字で表記されない場合は、
http://www.eonet.ne.jp/~tecti/tecti/br-font.html
から墨点字フォントをダウンロードして、インストールしてください。
]PRE]
[32] >>31 このページには [[PUA]] も使われてます。他の系統の[[点字]]外字でしょうか。
[33]
[TIME[2022-11-08T09:05:00.800Z]]
<https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=65448&item_no=1&attribute_id=1&file_no=1>
>[SNIP[]]コンピュータの時代に入って,タイプライタ鍵盤
上の図形は,今度は符号表上に移し替えられた.ASCII
文字集合はおおむねタイプライタの文字集合を継承して
いるから,どんな鍵盤配列をモデルにするにせよ,この
符号化方式を採用することの利点は英語版ソフトの上で
の実現が容易なことである.この結果,簡便なローカラ
イズ方法として多くのローカルベンダが採用するところ
となったが,同時に,タイプライタ時代の鍵盤配列の混
乱がそのままコンピュータ上の文字符号にも継承される
というマイナス効果ももたらすこととなった.フォント
開発者には符号表を作っているという意識は希薄であり,
ある者はこうして作られた符号を accidental internal
code と呼んだ.筆者らもヒンディー語だけでも 20 種類,
タミル語については 17 種類のこうした符号化方式を確
認しているが,実際にはさらに多数が存在しているであ
ろう.[SNIP[]]