-
Notifications
You must be signed in to change notification settings - Fork 4
/
700.txt
183 lines (132 loc) · 8.29 KB
/
700.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
[1] [DFN[ラテン文字]]は、[[英語]]、[[独語]]をはじめとする[[西欧]]の[[言語]]の[[表記]]に主として用いられる[[用字系]]です。
代表的な[[アルファベット]]であり、単に「[[アルファベット]]」と呼ばれることもあります。
また、[[ローマ字]]と呼ばれることもあります。
* 文字
[FIG(short list)[ [12] [[ラテン文字]]の分類
- [[基本ラテン文字]]
- [[ASCII大文字]]
- [[ASCII小文字]]
- [[数式用英数字]]
- [[大文字と小文字]]
-- [[small caps]]
- [[通貨記号]]
]FIG]
[FIG(short list)[ [13] [[異体字]]、[[合字]]、[[ダイアクリティカルマーク]]付き[[ラテン文字]]
- Ââ Āā á à ắ ằ ầ ẩ ɑ ɑ̃ ὰ ά [SUP[a]]
- ç
- Đđ
- Êê Ēē é è ê ệ ɛ̃ ὲ έ
- Îî Īī
- Ôô Ōō ò ô ố ö ờ [SUP[o]]
- œ̃
- Ûû Ūū û ư ủ
- ɔ̃
]FIG]
* 文脈
[FIG(short list)[ [9] [[ラテン文字]]の用途
- [[英語]]
- [[仏語]]
- [[独語]]
- [[スペイン語]]
- [[ポルトガル語]]
- [[越南語]]
-- [[Chữ Quốc Ngữ]]
- [[日本語ローマ字]]
- [[アイヌ語ローマ字]]
- [[中文ローマ字]]
- [[中国語]]俗語 [SRC[>>8]]
- [[朝鮮語ローマ字]]
- [[ノジ文字]]転写
- [[発音記号]]
- [[数式]]
- [[化学式]]
- 各種[[プログラミング言語]]
- 各種[[プロトコル要素]]
- [[連番]]
- [[字形類似の形状の記述]]
- [[バイエル符号]]
- [[楽譜]]
- [[数学記号]]
]FIG]
* ダイアクリティカルマーク付きラテン文字
[10]
[[基本ラテン文字]]でない[[ラテン文字]]を、
[DFN[拡張ラテン文字]],
[DFN[改造ラテン文字]],
[DFN[ダイアクリティカルマーク付きラテン文字]],
[DFN[アクセント付きラテン文字]]などといいます。
[11]
厳密に言えば[[ダイアクリティカルマーク]] ≒ [[アクセント記号]]を付けた[[ラテン文字]]以外にも[[基本ラテン文字]]でない[[ラテン文字]]がいくつかあります。
[18]
>>17 では[[越南語ラテン文字表記]]に使われるものを「改造ラテン文字」と説明しています。
[REFS[
- [14] [CITE@ja[新潟大学学術リポジトリ]], [TIME[2022-05-29T01:38:58.000Z]] <https://niigata-u.repo.nii.ac.jp/records/6957>
-- [17] [CITE[[L[ベント・ティエン「アンナン国の歴史」簡紹[BR[]]―情報の流通と保存の観点から―]],
[[[L[蓮田隆志]]]],
[TIME[2013-04-05]]
]REFS]
[23]
[CITE[n441.pdf]], [TIME[1998-12-16T12:29:08.000Z]], [TIME[2023-10-24T01:52:06.574Z]] <http://std.dkuug.dk/jtc1/sc2/wg3/docs/n441.pdf>
[24] [[AJ1]]
* ラテン文字とそうでない文字の境界
[SEE[ [[アルファベット]] ]]
* 字形設計
[19] [CITE@ja-jp[Character design standards - Uppercase for Latin 1 - Typography | Microsoft Docs]], [[alib-ms]], [TIME[2022-08-27T03:38:14.000Z]] <https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/uppercase>
[20] [CITE@ja-jp[Character design standards - Lowercase for Latin 1 - Typography | Microsoft Docs]], [[alib-ms]], [TIME[2022-08-27T03:39:21.000Z]] <https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/lowercase>
[21] [CITE@ja-jp[Character design standards - Symbol characters for Latin 1 - Typography | Microsoft Docs]], [[alib-ms]], [TIME[2022-08-27T04:01:58.000Z]] <https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/symbols>
* フォント
** 文字画像データ
[22] [CITE@ja[Tesseractなどで使用できる手書き文字データセット]], [TIME[2023-07-15T12:39:57.000Z]] <https://zenn.dev/tfukumori/articles/515b3b39808085#(3)-emnist%253A-%25E8%258B%25B1%25E5%25AD%2597%25E3%2580%2581%25E3%2581%258A%25E3%2582%2588%25E3%2581%25B3%25E6%2595%25B0%25E5%25AD%2597%25E3%2581%25AE%25E6%2589%258B%25E6%259B%25B8%25E3%2581%258D%25E6%2596%2587%25E5%25AD%2597%25E3%2583%2587%25E3%2583%25BC%25E3%2582%25BF%25E3%2582%25BB%25E3%2583%2583%25E3%2583%2588>
* ラテン文字化した言語における外来語
- [26]
[CITE@ja[XユーザーのYTさん: 「ベトナム語のヨーロッパ地図 クォックグーというローマ字表記法を使うので原語に忠実な表記ができるのだけど、中国の影響も受けているので古くから知られている国は漢越語読みで呼び名が固定されている。 https://t.co/sD9bZJOur1」 / X]], [TIME[午前7:41 · 2024年7月10日][2024-07-09T22:41:15.000Z]], [TIME[2024-07-16T02:27:18.000Z]] <https://x.com/GENGOLANGUAGE/status/1810806449557361118/photo/1>
-- [25]
[CITE@ja[XユーザーのYTさん: 「原語読みの地名 Belarus, Ukraina, Bulgaria, Romania... 漢越語読みの地名 Pháp(法), Đức(徳), Tây Ban Nha(西班牙)... ベトナム語読みの地名 Mát-xcơ-va(モスクワ), Cô-pen-ha-gen(コペンハーゲン ), Béc-lin(ベルリン)...」 / X]], [TIME[午前7:51 · 2024年7月10日][2024-07-09T22:51:38.000Z]], [TIME[2024-07-16T02:27:18.000Z]] <https://x.com/GENGOLANGUAGE/status/1810809063862849875>
[27]
[[国語国字問題]]で[[ローマ字]]化論者が[[外来語]]について色々言っているが、実際にやるとこういうカオスが出現するんだな。
* メモ
[2]
> "Latin characters" is a not-precise term for characters
historically related to ancient Greek script and currently used
throughout the world. <NONE>
> The base Latin characters make up the ASCII repertoire and have
been augmented by many single and multiple diacritics and quite a
few other characters. ISO/IEC 10646 encodes the Latin characters
in the ranges U+0020..U+024F, U+1E00..U+1EFF, and other ranges.
;; [CITE@en[RFC 3536 - Terminology Used in Internationalization in the IETF]] ([TIME[2011-01-29 02:14:52 +09:00]] 版) <http://tools.ietf.org/html/rfc3536#page-23>
[3] [CITE@en[RFC 6365 - Terminology Used in Internationalization in the IETF]]
([TIME[2011-09-10 19:11:51 +09:00]] 版)
<http://tools.ietf.org/html/rfc6365#page-34>
[4] [CITE@en[Requirements for Latin Text Layout and Pagination]]
( ([TIME[2014-03-12 18:34:50 +09:00]] 版))
<http://www.w3.org/TR/2014/WD-dpub-latinreq-20140313/>
[5] [CITE@en[Requirements for Latin Text Layout and Pagination]]
( ([TIME[2014-03-12 18:37:00 +09:00]] 版))
<http://w3c.github.io/dpub-pagination/>
[6] [CITE@en[Requirements for Latin Text Layout and Pagination]]
( ([TIME[2014-09-30 16:43:43 +09:00]] 版))
<http://www.w3.org/TR/2014/WD-dpub-latinreq-20140930/>
[FIG(quote)[
[FIGCAPTION[
[8] [CITE@ja[北京語 - Wikipedia]]
([TIME[2017-06-20 17:54:25 +09:00]])
<https://ja.wikipedia.org/wiki/%E5%8C%97%E4%BA%AC%E8%AA%9E>
]FIGCAPTION]
> 漢字に当てはめられないスラングなどもあり、現代においてはアルファベットで表記されるのが普通である。
]FIG]
[FIG(quote)[
[FIGCAPTION[
[7] [CITE@ja[文字セット及び文字数について | 多言語フォント | モリサワのフォント | 株式会社モリサワ]]
([TIME[2020-10-18T09:17:15.000Z]])
<https://www.morisawa.co.jp/fonts/multilingual/character-set/>
]FIGCAPTION]
> Pro
> (100言語をサポートする独自規格) PE
> (ラテン文字、キリル文字、ギリシャ文字、ベトナム語用文字をカバーする独自規格)
]FIG]
[15] [CITE@ja[teradaさんはTwitterを使っています 「幕末にやってきた外国人が落書きしていったらしい。 書き写した日本人にはアルファベットがこう見えたのだろうか。 ヨミ始め、ヨミ終わりなどと書いてあるので、左から右に読むことは知っていたようだが。 https://t.co/NhVfee1Whk」 / Twitter]]
(午後0:45 · 2021年4月16日 [TZ[+09:00]], [TIME[2021-04-19T05:30:29.000Z]])
<https://twitter.com/terada50397416/status/1382902830457974784>
[16] [CITE@ja[名苗瑞輝さんはTwitterを使っています 「高校生の頃、手書きでCOBOLやってたんだけど、その時に教わった書き方がまだ癖になってる で、このOやDに横線、IとUは小文字、という書き方はどこ発祥の作法なのか今更気になった https://t.co/va3AUgBwq0」 / Twitter]]
([TIME[2021-09-17T04:47:49.000Z]], [TIME[2021-09-17T05:01:39.471Z]])
<https://twitter.com/NanaeMizuki/status/1436915637889089536>