/
701.txt
809 lines (607 loc) · 40 KB
/
701.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
[1] [DFN[ローマ字]]は、[[ラテン文字]]の別称、あるいは転じて[[日本語]]の[[ラテン文字]]への[[転写法]]の総称です。
;; [7] [[日本語]]表記以外の用法については、[[ラテン文字]]を参照。
* ローマ字の表記法
[6]
[FIG(short list)[
- [[ヘボン式]]
- [[訓令式]]
]FIG]
[136] [CITE[The Unicode Standard]] は[[文字の名前]]に[[訓令式]]を使っています。
[[長音]]は使わず逐次[[翻字]]しています。
* 実装状況
[103]
いろいろな[[プログラミング言語]]の[[ライブラリー]]や[[モジュール]]として[[仮名]]から[[ローマ字]]への変換や[[ローマ字]]から[[仮名]]への変換が実装されています。
[[プログラミング言語]]の標準機能として組み込まれていることはあまり無いようです。
[104]
実装方法はぜんぜんばらばらのようです。
[[ローマ字]]への順方向の変換のみとするものが多く、
逆方向への変換も実装しているものもあります。
[[仮名]]や[[ローマ字]]以外の入力が与えられた時、
素通しするものもあれば、[[空文字列]]やエラーを返すものもあります。
想定外として異常な出力を返すものもあります。
[[平仮名]]を扱うもの、[[片仮名]]を扱うもの、両方扱うものがあり、
[[大文字]]を扱うもの、[[小文字]]を扱うもの、両方扱うものがあります。
[[全角英数字]]や[[半角カナ]]を扱うもの、
[[濁点]]や[[アクセント]]の[[結合文字]]を扱うもの、扱わないものといろいろあります。
[[記号]]類も適宜変換するもの、しないものがあります。
[105]
[[ローマ字]]への順方向変換では[[ヘボン式]]とするものが多いですが、
[[訓令式]]とするものもあり、
オプションで選べるものもあります。
逆方向変換はどの方法も対応するものがほとんどです。
一般的な表記で使わない仮名の並びや[[ラテン文字]]の並びを与えた時、
それらしき変換結果を返すものもあれば、
特に対応していないものもあります。
奇抜な変換結果を返すものや、
クラッシュなどの異常動作をするものもあります。
全般的に想定外の入力に対する動作に弱い印象があります。
一般的な用途ではそのような入力はなく支障ないのかもしれませんが、
おかしな出力ならともかく、
異常動作するということは[[セキュリティー]]上の問題となる場合もあります。
[106]
設定により変換方法を指定できる場合については、
[[長音]]表記の方法を選んだり、
パスポート式を指定したりできることが多いようです。
[[ヘボン式]]、[[訓令式]]以外にいろいろな人や団体が新方式を提案しているようですが、
そうしたものが実装されていることはまずありません。
[107]
一般的な表記を与えた時の結果は、
ほとんどの実装で共通していて、安定しているといえます。
[[ヘボン式]]・[[訓令式]]の違いがあるものは、その2種類いずれかになることがほとんどで、
比較的安定しています。
ただし、
[[長音]]が絡む場合と[[撥音]]の処理は多種多様で、
複雑だとおかしな結果を返すものもあります。
[108]
[[仮名]]への逆変換で区切りの「'」を認識できる実装は多いですが、
「-」を区切りと認識する実装はそれほどなく、「ー」に変換する実装があったりします。
「|」などを音節区切りに使っている実装があります。
[116]
[[半角]]、[[全角]]の[[正規化]]や[[ラテン文字]]の[[大文字]]・[[小文字]]、
[[平仮名]]・[[片仮名]]の変換など、
[[ローマ字]]と直接関係ない処理を同時に適用する実装が少なからずあります。
おそらく実装の都合上の前処理として行っているのでしょうが、
一般的な表記でない入力を与えたときにそれが出力にあらわれてしまうようです。
** 変換法の検出
[109]
ある[[ローマ字]]への順方向変換または[[仮名]]への逆方向変換の実装
[VAR[Φ]] ([VAR[string]]) の挙動を調べる方法を考えます。
出力は入力 [VAR[string]] のみから決まり、時間変化などは無いものとします。
[111]
ある長さ以下の入力に対する出力は、考え得る入力をすべて与えれば調べることができます。
ただあり得る文字は ([[仮名]]や[[ラテン文字]]など処理が実装されていそうなものに限定したとしても)
まず100は下りませんから、組み合わせが膨大になり、
長い入力をすべて与えることができません。
全組み合わせで試せるのは長さ2くらいで、長さ3ですぐに厳しくなります。
長さ3以上は特別な処理が実装されていそうなものを選んで試すことになります。
完全な挙動を知ることはできなくなりますが、やむを得ません。
具体的には、
例示で取り上げられているもの、
頻出語、
子音 + 半母音 + 母音の組み合わせ、
これらに小書き文字や長音を組み合わせたもの、
他の実装で特別な挙動が見られたものなどを入力として用意します。
[113]
さて、
[[仮名]]や[[ローマ字]]の一般的な理解から、
[VAR[Φ]] ([VAR[入力]]) は[VAR[入力]]を細かく分割し、
それぞれに [VAR[Φ]] を適用し、
その結果を順に連結した結果となることが想定されます。
例えば「あい」の順方向変換は、「あ」「い」に分割し、
「a」「i」を得て、「ai」を出力します。
しかし
「きゃ」は「kya」になるなど、
どこまでも分解していけるということはありません。
[110]
こうした前提を踏まえて、
[VAR[出力]] = [VAR[Φ]] ([VAR[入力]])
の
([VAR[入力]], [VAR[出力]])
の組を多数得て、
そこから変換規則を抽出します。
[114]
長さ1の[VAR[入力]]に対する出力 [VAR[Φ]] ([VAR[入力]])
が[VAR[入力]]と異なるなら、
([VAR[入力]] → [VAR[Φ]] ([VAR[入力]])) を変換表に追加します。
[115]
長さ [VAR[n]] の[VAR[入力]]に対する出力 [VAR[Φ]] ([VAR[入力]]) が[VAR[入力]]と異なるなら、
[VAR[入力]]を長さ [VAR[l]] と長さ [VAR[m]] ([VAR[l]] + [VAR[m]] = [VAR[n]])
の2つの文字列[VAR[入力[SUB[[VAR[l]]]]]],
[VAR[入力[SUB[[VAR[m]]]]]]に分割し、
それぞれに [VAR[Φ]] を適用して連結した出力
[VAR[Φ]] ([VAR[入力[SUB[[VAR[l]]]]]]) + [VAR[Φ]] ([VAR[入力[SUB[[VAR[m]]]]]])
が元の出力
[VAR[Φ]] ([VAR[入力]])
と一致するか調べます。
分割方法は [VAR[n]]-1 通りありますが、
いずれとも一致しないなら、
この ([VAR[入力]] → [VAR[Φ]] ([VAR[入力]]))
を変換表に追加します。
[112]
この変換表が、件の実装を近似的に表したものとなります。
[VAR[l]] + [VAR[m]] = [VAR[n]] に分割する方法が一意に決まるとは限らないのと、
長い文字列の処理が部分文字列に対する処理の結合だけではない場合
(例えば「ー」の任意個数の連続に対する処理が含まれる場合)
などこの方法で規則を抽出できないケースがあるので、完全な再現ではありませんが、
[VAR[Φ]] でどのような処理がなされるかおおよそ掴むことはできます。
* バリエーション
** ラテン文字への変換
[91]
「かあ」や「かー」のような[[母音]]の連続や[[長音]]は
「ka」、「kaa」、「kâ」
のようにいろいろな実装があります。
[92] 「ぼお」や「ぼう」や「ぼー」のような[[母音]]の連続や[[長音]]は
「bo」、「boo」、「bou」、「boh」、「bô」
のようにいろいろな実装があります。
[93]
「し」を「shi」とする実装と「si」とする実装があります。
一部のみ「si」となる実装があります (不具合か)。
[83]
「ん」+ m/p/b を「n」とする実装と「m」とする実装があります。
[142]
[[ヘボン式]]的美しさなら「んま」を「mma」のように変換したいですが、
「んま」と「っま」の書き分けのため、
「んま」は「nma」とする方が妥当でしょうか。
「m'ma」とすることもできそうですが、そのような実装は見つけられません。
[86]
「っん」や「っな」行を「nn」とする実装や、
未対応で「っn」とする実装があります。
[141]
「nna」
は
「んな」
とも
「っな」
とも
「んあ」
とも解せてしまいます。
その書き分けを考えていない実装が多いようです。
曖昧なく解釈させるため、
「んな」は「n'na」、
「んあ」は「n'a」
と綴るべきでしょう。
(に、ぬ、ね、のも同様。)
[89] 「っま」行や「っば」行に対応していない実装があります。
[87]
「っあ」行を「a」などとする実装があります。
(子音の繰り返しとして実装しているところ、
子音がなく何も繰り返されないのでしょうか。)
[82]
他の方法で変換できないぁ行が含まれるとき、
「xa」などと表す実装、
「a」など大書き仮名の表現で置き換える実装があります。
また「らぁ」を「ra」のように表し「ら」と区別できなくなる実装があります。
[85]
[[拗音]]の処理がおかしく、
「きゃ」が「kya」でなく「kixya」のようになる実装があります。
[88]
他の方法で変換できない「ー」を削除する実装があります。
[90]
「んあ」などの区別に必要な「'」を挿入する実装としない実装があります。
[84]
次のものに対応する実装と、未対応の実装があります。
- 他の方法で変換できない「ゃ」「ゅ」「ょ」: 「xya」「xyu」「xyo」
[81]
入力に[[ラテン文字]]の列が含まれる時、他の[[ラテン文字]]の列に置き換わってしまう実装があります。
[[仮名]]から[[ラテン文字]]への変換の実装上の便宜で採っている方法がそうなっているのでしょうが、
適切な実装方法とは思えません。
** 仮名への変換
[71]
「aa」を「ああ」とする実装と「あー」とする実装があります。
「aaa」を与えると「あああ」となったり、「あーあ」となったりします。
「aaaa」を与えると「ああああ」となったり、「あーあー」となったりします。
果たして後者のこのような実装が適切なのかどうか。
[72]
同じように「い」「う」「え」「お」が「ー」になる実装があります。
[94]
「-」を「ー」に変換する実装があります。
[95] 「^」を「ー」に変換する実装があります。
[96] 「^」や「¯」のついた合成済み[[ラテン文字]]を「ー」つきに変換する実装と、
未対応の実装があります。
[76] 「ti」「tu」を「ち」、「つ」とする実装と「てぃ」、「とぅ」とする実装があります。
[74] 「di」「du」を「ぢ」、「づ」とする実装と「でぃ」、「どぅ」とする実装があります。
[73]
「wi」「we」を「ゐ」、「ゑ」とする実装と「うぃ」、「うぇ」とする実装があります。
[75] 「la」-「lo」をら行とする実装とぁ行とする実装があります。
[77] 次のものに対応する実装と、未対応の実装があります。
- 「kyi」「kye」: 「きぃ」「きぇ」
- 「qa」「qi」「qe」「qo」: くぁ行
- 「kwa」: 「くぁ」 (「くゎ」の方が適当そうだが)
- 「kwi」「kwu」「kwe」「kwo」: 「くぃ」「くぅ」「くぇ」「くぉ」
- 「gwa」: 「ぐぁ」 (「ぐゎ」の方が適当そうだが)
- 「she」: 「しぇ」
- 「sye」: 「しぇ」
- 「je」: 「じぇ」
- 「jya」「jyi」「jyu」「jye」「jyo」: 「じゃ」「じぃ」「じゅ」「じぇ」「じょ」
- 「cya」「cyu」「cyo」: ちゃ行
- 「dyi」「dyu」「dye」「dyo」: 「ぢぃ」「ぢゅ」「ぢぇ」「ぢょ」
- 「thi」「thu」: 「てぃ」「てゅ」
- 「twu」: 「とぅ」
- 「dwu」: 「どぅ」
- 「nyi」「nye」: 「にぃ」「にぇ」
- 「fya」「fyi」「fyu」「fye」「fyo」: 「ふゃ」「ふぃ」「ふぇ」「ふょ」
- 「hyi」「hye」: 「ひぃ」「ひぇ」
- 「hwa」「hwi」「hwe」「hwo」: 「ふぁ」「ふぃ」「ふぇ」「ふぉ」
- 「bye」: 「びぇ」
- 「pyi」「pye」: 「ぴぃ」「ぴぇ」
- 「myi」「mye」: 「みぃ」「みぇ」
- 「ryi」「rye」: 「りぃ」「りぇ」
- 「whi」「whe」「who」: 「うぃ」「うぇ」「うぉ」
- 「wyi」「wye」: 「ゐ」「ゑ」
- 「vyu」: 「ゔゅ」
- 「lya」「lyi」「lyu」「lye」「lyo」: 「ゃ」「ぃ」「ゅ」「ぇ」「ょ」
- 「yi」: 「い」
- 「xwa」: 「ゎ」
- 「m」(単独): 「ん」
[78]
「n」は特殊な扱いが求められるためか、
「nn」が「ん」になる実装 ([[IME]] 方式) や、
「n」のまま残ってしまうケースがある壊れた実装など、
おかしなことが起こったりします。
[79]
「ca」など 「c」 (「chi」など以外) に対応していない実装であっても、
「cc」のように連続するときに「っc」とする実装と、
「cc」のままにする実装があります。
[80]
「xa」行を「ぁ」行とする実装に「xxa」行を与えると「っぁ」行になったりします。
* 仏語系日本語ローマ字
[146]
[CITE@ja[東京学芸大学リポジトリ]], [[NetCommons]], [TIME[2022-03-12T12:36:52.000Z]] <https://u-gakugei.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=27144&item_no=1&page_id=13&block_id=21>
* 長音表記
[119] [CITE[多言語解説整備を行うために 盛り込むべき必要事項を整理した スタイルマニュアル]]
([TIME[2019-04-04 13:03:53 +09:00]])
<https://www.mlit.go.jp/common/001281939.pdf>
>観光分野における執筆の場合、訪日外国人旅行者に解説文をより楽しんでいただけるよう、[B[マクロンは原則使用しない]]。ただし、「おお(oo)」「ゆう(uu)」などの長音を表す記号を短縮することで、区別がつかない単語の場合は、母音字の上に「-(長音符標)」をつけて表すことができる。
>※ボストン美術館や、メトロポリタン美術館、大英博物館等、学術的な文章には使用されているマクロン。しかし、長音符号は日本独自のもので、国際化されていないため、外国人に正しく理解されない可能性がある。
[120]
観光庁、こんな雑なガイドラインでいいんかい...
異国に来て見覚えがない記号があるのは普通なことで、その違和感よりも、
長音かどうか綴りを見てもわからないことのほうが、
意思疎通上大問題ではないのか。
「区別がつかない単語の場合は」という例外がある以上、
どのみち避けては通れないわけで。
[147]
[CITE[<4D6963726F736F667420506F776572506F696E74202D20817953455494C5817A81758ACF8CF597A78D918EC08CBB82C98CFC82AF82BD91BD8CBE8CEA91CE899E82CC89FC915081458BAD89BB82CC82BD82DF82CC834B834383688389834383938176> - 001029742.pdf]], [TIME[2014-03-05T05:25:17.000Z]], [TIME[2022-03-28T10:35:41.138Z]] <https://www.mlit.go.jp/common/001029742.pdf#page=17>
>長音は母音字の上に「-」(長音符標)をつけて表すことができる。
>長音が大文字の場合は母音字を並べることができる。
>(注)長音符号は日本独自のもので、国際化されていないため、外国人に理解され
ない可能性もある。長音符号の使用は事業者や自治体等で対応が異なる、も
しくは使用しない場合があるため表示にあたっては確認が必要。
[148] こっちはなんかどうしたらいいのかよくわからん書き方。
[149] [CITE[000120057.pdf]], [TIME[2021-05-26T06:44:14.000Z]], [TIME[2022-03-28T10:37:19.332Z]] <https://www.city.kushiro.lg.jp/common/000120057.pdf#page=17>
>※長音記号は日本独自のもので、外国人に理解されない可能性があるため、表記しな
い。
[150] このように完全に禁止している[[自治体]]まである。
[121]
[CITE[Wikipedia]]
によると[[マクロン]]は[[中国語]]を含む9種類の言語と[[日本語]]で使われているのだけれど、
この程度じゃ「国際化されていない」扱いなのね。
[122]
鉄道会社は駅名表示に[[マクロン]]を使っているから、訪日外国人は
「正しく理解されない可能性がある」
ものを見ている確率が高いよな。
[123]
「国際化されていない」
のが理由なら、
[CITE[Wikipedia]] によると[[フランス語]]など7言語の[[正書法]]で使うという[[サーカムフレックス]]方式ならいいのでは...
[151]
だいいち、日本独自なのがよくないなら、[[ローマ字]]表記された[[日本語]]すべて日本独自ではないか。
「外国人に理解されない可能性」がかなり高い。
[152]
[[発音]]に限っても、[[マクロン]]があってもなくても、
[[英語]]話者にすら正しく伝わらない可能性が高い。
伝わらないなら使っていけないなら、もう[[ローマ字]]表記やめるしかないじゃん?
[124]
日本語のローマ字表記の話で「国際化されていない」は意味不明すぎる。。。
[153]
そもそも論でいえば[[ローマ字]]表記を[[地方自治体]]ごとに決める必然性がわからん。
[[文化審議会]]が真面目にやらないからこんなことになるんだぞ。
せめて観光系の[[多言語表記ガイドライン]]は[[観光庁]]のガイドラインに従う、
でいいではないか。[[日本語]][[標準語]]の[[ローマ字]]表記に地域性なんて要るか? 要らんだろ。
地方のガイドラインは地域ごとの[[固有名詞]]の特殊事情の例外処理だけハンドリングしてればいいのに、
なぜ長音表記に独自性を出そうとするのか。
[FIG(quote)[
[FIGCAPTION[
[125] [CITE@ja[野生司香雪の生涯(略伝) | 野生司香雪 インドの仏伝壁画保全プロジェクト]]
([TIME[2020-03-07 20:54:42 +09:00]])
<https://nosu.info/kosetsu-nosu-and-indian-buddhist-biography/the-life-of-kosetsu-nosu/>
]FIGCAPTION]
> 「野生司」という苗字を何と呼ぶのでしょうか。よく聞かれます。
> 今では普通には「のうす、のおす」のいずれかで呼ばれているようですが、じつは「のーす」と呼ぶのが正解。これについては香雪の遺した資料等の神の上にカタカナで「ノース」と書いてあるものがありました。なんだろうと思っていましたが、香雪のお孫さんと話していると爺さんは「のーす」と伸ばすのが正しいと言っていたとのこと。ちなみにローマ字表記では nosu のoの上に横棒 ━ を載せています。
]FIG]
* 分離子
[154]
観光系の[[多言語表記ガイドライン]]は [CODE[']] ではなく [CODE[-]]
を区切りに使うことを求めているみたいです。なんでですかね?
* 方言用ローマ字
[160] [CITE@ja[ケセン語 - Wikipedia]], [TIME[2022-08-18T09:25:56.000Z]], [TIME[2022-08-21T14:54:49.578Z]] <https://ja.wikipedia.org/wiki/%E3%82%B1%E3%82%BB%E3%83%B3%E8%AA%9E#%E3%82%B1%E3%82%BB%E3%83%B3%E5%BC%8F%E3%83%AD%E3%83%BC%E3%83%9E%E5%AD%97>
* メモ
[2] [CITE@ja[意味不明ローマ字標識 英訳に NHKニュース]]
( ([TIME[2013-09-11 23:02:30 +09:00]] 版))
<http://www3.nhk.or.jp/news/html/20130912/k10014473161000.html>
[3] ( ([TIME[2013-06-28 08:48:02 +09:00]] 版))
<http://www.post.japanpost.jp/zipcode/dl/roman_shiyou.pdf>
[FIG(quote)[
[FIGCAPTION[
[4] ([TIME[2014-11-01 05:09:16 +09:00]] 版)
<https://cabforum.org/wp-content/uploads/EV-V1_5_2Libre.pdf#page=47>
]FIGCAPTION]
> The Revised Hepburn method of Romanization, as well as Kunrei-shiki and Nihon-shiki methods described in
> ISO 3602, are acceptable for Japanese Romanizations.
]FIG]
[FIG(quote)[
[FIGCAPTION[
[5] [CITE@ja[「外国人にわかりやすい地図表現検討会報告書」がとりまとまりました|国土地理院]]
([TIME[2016-01-08 18:55:48 +09:00]] 版)
<http://www.gsi.go.jp/kihonjohochousa/kihonjohochousa60014.html>
]FIGCAPTION]
> ローマ字表記から英語表記への変換方法を示しており、ローマ字表記のうち地形や種別を表す部分を英語に置き換える方式(置換方式)を基本としています。ただし、名称の構造上、置換方式が適用できない場合や適用しても日本人が元の日本語の地名を認識することが困難な場合があります。本ルールではそのような場合を明示した上で、ローマ字表記に地形や種別を表す英語を追加する方式(追加方式)も採用しています。
>
]FIG]
[8] [CITE[日本地名の羅馬字化]]
(地学雑誌 Vol. 43 (1931) No. 8 P 477-478, [TIME[2016-12-20 21:41:13 +09:00]])
<https://www.jstage.jst.go.jp/article/jgeography1889/43/8/43_8_477/_article/-char/ja/>
[9] [CITE[衆議院第81回請願委員会第6号 帝国議会会議録検索システム]]
([TIME[2014-12-01 18:36:43 +09:00]])
<http://teikokugikai-i.ndl.go.jp/SENTAKU/syugiin/081/0190/0811019000610301.html#page=22>
[FIG(quote)[
[FIGCAPTION[
[10] [CITE@ja[山田耕筰 - Wikipedia]]
([TIME[2017-12-25 20:57:52 +09:00]])
<https://ja.wikipedia.org/wiki/%E5%B1%B1%E7%94%B0%E8%80%95%E7%AD%B0>
]FIGCAPTION]
> サインには“Kósçak Yamada”という綴りを使っていた。
]FIG]
[11] [CITE@ja[ヘボン式のローマ字を変換するプログラム - Panda Noir]]
([TIME[2019-06-24 18:07:18 +09:00]])
<https://www.pandanoir.info/entry/2016/03/29/190000>
[12] [CITE@ja[ひらがなからローマ字への変換可能パターンを列挙するプログラムをつくった - Panda Noir]]
([TIME[2019-06-24 18:08:03 +09:00]])
<https://www.pandanoir.info/entry/2017/09/28/190000>
[13] [CITE@ja[ローマ字→平仮名の表 #javascript - c4se記:さっちゃんですよ☆]]
([TIME[2019-06-24 18:09:42 +09:00]])
<http://c4se.hatenablog.com/entry/20100210/1265741074>
[14] [CITE@ja[ローマ字→平仮名変換関数 #javascript - c4se記:さっちゃんですよ☆]]
([TIME[2019-06-24 18:09:50 +09:00]])
<http://c4se.hatenablog.com/entry/20100330/1269906760>
[15] [CITE@ja[ローマ字→ひらがな変換関数を三年ぶりに改善した - c4se記:さっちゃんですよ☆]]
([TIME[2019-06-24 18:10:22 +09:00]])
<http://c4se.hatenablog.com/entry/2013/05/16/060231>
[16] [CITE@en[kazuhikoarase/jaconv: 日本語文字変換ライブラリ (javascript)]]
([TIME[2019-06-24 18:11:32 +09:00]])
<https://github.com/kazuhikoarase/jaconv>
[17] [CITE@ja[欅樹雑記: 【Node.js】ひらがな→ローマ字変換]]
([TIME[2019-06-23 22:02:28 +09:00]])
<https://blog.zelkova.cc/2018/05/nodejs-hiragana-to-romaji.html>
[18] [CITE@ja-jp[ローマ字入力のつづり一覧表を確認してみよう]]
([TIME[2019-06-24 18:13:48 +09:00]])
<https://support.microsoft.com/ja-jp/help/883232>
[20] [CITE[カナ→ローマ字変換]]
([TIME[2010-02-19 22:16:11 +09:00]])
<https://hb2.seikyou.ne.jp/home/masa15/hp/pd-m7/roumaji.htm>
[21] [CITE@ja[KAKASI - 漢字→かな(ローマ字)変換プログラム]]
([[kakasi-dev@namazu.org (KAKASI project)]]著, [TIME[2014-03-18 16:11:03 +09:00]])
<http://kakasi.namazu.org/index.html.ja>
[22] [CITE@ja[ローマ字変換 - instant tools]]
([TIME[2019-06-24 18:18:22 +09:00]])
<https://tools.m-bsys.com/original_tooles/romaji.php>
[23] [CITE@ja[ローマ字のつづり方:文部科学省]]
([TIME[2018-09-08 20:04:50 +09:00]])
<http://www.mext.go.jp/b_menu/hakusho/nc/k19541209001/k19541209001.html>
[24] [CITE@ja[ヘボン式ローマ字|神奈川県パスポートセンター公式サイト]]
([[神奈川県パスポートセンター]]著, [TIME[2019-05-31 16:01:59 +09:00]])
<http://www.pref.kanagawa.jp/osirase/02/2315/hepburn.html>
[25] [CITE@ja[市名のローマ字表記について|宝塚市公式ホームページ よくある質問(FAQ)]]
([TIME[2019-06-24 17:44:52 +09:00]])
<http://www.city.takarazuka.hyogo.jp/faq/5000002/5000013/5000086/5000727.html>
[26] [[Migemo]]
[27] [CITE@ja[ICU4C C++ ローマ字→カタカナ、ひらがな変換 - janeyの日記]]
([TIME[2019-06-24 18:24:39 +09:00]])
<https://janey.hatenadiary.org/entry/20080205/1200645659>
[28] [CITE@ja[ICU でカタカナ → ローマ字変換をしてみた - 凹みTips]]
([TIME[2019-06-24 18:24:46 +09:00]])
<http://tips.hecomi.com/entry/20120131/1328019439>
- [19] [CITE[Lingua::JA::Hepburn::Passport - Hepburn Romanization using Japanese passport rules - metacpan.org]]
([TIME[2019-06-25 14:48:27 +09:00]])
<https://metacpan.org/pod/Lingua::JA::Hepburn::Passport>
-- [29] 既定モード
-- [46] [CODE[long_vowels_h]] モード
- [31] [CITE[Lingua::JA::Kana - Kata-Romaji related utilities - metacpan.org]]
([TIME[2019-06-25 14:51:39 +09:00]])
<https://metacpan.org/pod/Lingua::JA::Kana>
- [48] [CITE@en[benkasminbullock/Lingua-JA-Moji: Handle many kinds of Japanese characters]]
([TIME[2019-06-25 14:54:09 +09:00]])
<https://github.com/benkasminbullock/Lingua-JA-Moji>
-- [34] 既定値
-- [49] [CODE[style => passport]]
-- [50] [CODE[style => kunrei]]
-- [51] [CODE[style => hepburn]]
-- [52] [CODE[style => common]]
-- [53] [CODE[style => wapuro]]
-- [54] [CODE[use_m]]
-- [55] [CODE[ve_type => macron]]
-- [56] [CODE[ve_type => passport]]
-- [57] [CODE[ve_type => none]]
-- [58] [CODE[ve_type => wapuro]]
-- [59] [CODE[wo]]
-- [60] [CODE[wapuro => 1]]
-- [61] [CODE[ime => 1]]
- [30] [CITE@ja['''['''Perl''']''' Lingua::*::Romanize::* 日中韓/ローマ字変換モジュール]]
([TIME[2019-03-31 08:56:55 +09:00]])
<http://www.kawa.net/works/perl/romanize/romanize.html>
-- [32] [CITE[Lingua-JA-Romanize-Japanese-0.23 - Romanization of Japanese language with JUMAN - metacpan.org]]
([TIME[2008-01-20 19:32:09 +09:00]])
<https://metacpan.org/release/Lingua-JA-Romanize-Japanese>
-- [47] [CITE@ja[Japanese Alphabet - 日本語(漢字かな混じり文)にローマ字ルビ]] ([TIME[2019-03-31 08:49:10 +09:00]]) <http://www.kawa.net/works/ajax/romanize/japanese.html>
[33] [CITE[ローマ字かな変換ライブラリ]]
([TIME[2019-06-25 14:53:06 +09:00]])
<http://www.pitecan.com/OpenPOBox/romakana/index.html>
[35] [CITE@ja[かなローマ字変換 | k.daibaの日記 | スラド]]
([TIME[2019-06-25 14:54:30 +09:00]])
<https://srad.jp/~k.daiba/journal/183891/>
[36] [CITE[ヘボン式ローマ字変換アドインの詳細情報 : Vector ソフトを探す!]]
([TIME[2019-06-25 14:55:36 +09:00]])
<https://www.vector.co.jp/soft/data/business/se493167.html>
[37] [CITE[ヘボン式ローマ字綴方表]]
([TIME[2019-05-30 10:21:28 +09:00]])
<https://www.ezairyu.mofa.go.jp/passport/hebon.html>
[38] [CITE@ja[公益社団法人 日本ローマ字会]]
([TIME[2017-08-01 10:26:02 +09:00]])
<http://www.roomazi.org/>
[39] [CITE@ja[公益社団法人 日本ローマ字会]]
([TIME[2016-03-13 20:44:25 +09:00]])
<http://www.roomazi.org/99.html>
[40] [CITE[カナモジカイ(公式サイト)]]
([TIME[2019-01-06 17:17:43 +09:00]])
<http://www.kanamozi.org/>
[41] [CITE[岩瀬順一の「新日本式ローマ字の原理」]]
([TIME[2008-01-13 02:03:54 +09:00]])
<http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki2.html>
[42] [CITE[岩瀬順一の「新日本式ローマ字について」]]
([TIME[2008-01-13 02:03:52 +09:00]])
<http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki.html>
[43] [CITE@ja[岩瀬順一の「新日本式ローマ字について(補)」]]
([TIME[2012-02-23 02:22:05 +09:00]])
<http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki3.html>
[44] [CITE@ja[公益財団法人 日本のローマ字社 / Nippon-no-Rômazi-Sya]]
([TIME[2019-06-30 12:01:57 +09:00]])
<http://www.age.ne.jp/x/nrs/>
[45] [CITE[音声認識のための読み表記, Main | IPSJ/ITSCJ]]
([TIME[2018-07-25 11:09:44 +09:00]])
<https://www.itscj.ipsj.or.jp/ipsj-ts/02-04/main.html>
[62] [CITE@en[makimoto/romaji: Romaji-Kana transliterator]]
([TIME[2019-07-03 17:57:23 +09:00]])
<https://github.com/makimoto/romaji>
[63] [CITE@en[isy/miyabi]]
([TIME[2019-07-03 17:58:27 +09:00]])
<https://github.com/isy/miyabi>
- [64] [CITE[Ruby/Romkan: a Romaji/Kana conversion library for Ruby]]
([TIME[2016-05-08 06:31:05 +09:00]])
<http://0xcc.net/ruby-romkan/>
-- [97] + to_hepburn
-- [98] + to_kunrei
[65] [CITE@en[takedah/hepburn-romanization]]
([TIME[2019-07-03 18:00:26 +09:00]])
<https://github.com/takedah/hepburn-romanization>
[66] [CITE@en[ymrl/romankana]]
([TIME[2019-07-03 18:01:27 +09:00]])
<https://github.com/ymrl/romankana>
[67] [CITE[kana-roman converter/ruby]]
([TIME[2012-09-15 15:40:25 +09:00]])
<http://www.math.kobe-u.ac.jp/HOME/kodama/tips-ruby-kana-rom.html>
[68] [CITE@en[Romaji to Hiragana and Katakana converter]]
([TIME[2018-05-15 06:06:04 +09:00]])
<http://whiteagle.net/>
[69] [CITE@en[msikma/kanaconv: Converts hiragana and katakana to rōmaji according to Modified Hepburn transliteration rules.]]
([TIME[2019-07-06 11:29:03 +09:00]])
<https://github.com/msikma/kanaconv>
[70] [CITE@ja[コラム統計計算文法考]]
([TIME[2019-01-25 00:17:02 +09:00]])
<http://jgrammar.life.coocan.jp/ja/index.htm>
[99] [CITE[日本語のローマ字表記の推奨形式 ]]
(東京大学教養学部英語部会/教養教育開発機構 [TIME[2014-03-20 16:55:05 +09:00]])
<http://park.itc.u-tokyo.ac.jp/eigo/UT-Komaba-Nihongo-no-romaji-hyoki-v1.pdf>
[100] [CITE@ja[内閣訓令第三号 ローマ字のつづり方]]
([TIME[2006-02-12 05:34:00 +09:00]])
<http://xembho.s59.xrea.com/siryoo/naikaku_kunrei_d3g.html>
[101] [CITE@ja[内閣告示第一号 ローマ字のつづり方]]
([TIME[2006-02-12 05:34:00 +09:00]])
<http://xembho.s59.xrea.com/siryoo/naikaku_kokuzi.html>
[102] [CITE@ja[道路標識のローマ字(ヘボン式) の綴り方 | KICTEC]]
([TIME[2019-08-11 14:50:05 +09:00]])
<http://www.kictec.co.jp/varieties-road-sign/hebon-romaji.php/>
[117] [CITE@ja[ローマ字入力 - Wikipedia]]
([TIME[2019-08-25 15:09:15 +09:00]])
<https://ja.wikipedia.org/wiki/%E3%83%AD%E3%83%BC%E3%83%9E%E5%AD%97%E5%85%A5%E5%8A%9B>
[118]
[[京都市]]の[[地名]]「堀川玄以」 (ほりかわげんい)。
道路標識のローマ字は
「Horikawagen-i」。
[TIME[2019-12-10T08:22:42.700Z]]
<https://goo.gl/maps/UHx2E4GvkGXujKjm6>
実はよく見るとローマ字部分に修正跡がある。 [[Google Maps]]
の[[ストリートビュー]]によると Aug 2016 より後は gen-i
だけど、
Mar 2015
までは
「Horikawageni」
だった。
<https://goo.gl/maps/JfZHXqUMxr7dhc3VA>
[126]
[[Yandex]] の地図 [[API]] で[[日本]]を表示するとき [CODE[lang=en]]
を指定すると、
[[ロシア語]] ([[キリル文字]]) を[[ラテン文字]]に転写したらしい珍妙な[[ローマ字]]がでてきます。
「わ」が「Ва」になって「va」 になるような。
[127] [CITE@ja[「駅名の英語表記」はなぜこうもバラバラなのか | 実践!伝わる英語トレーニング | 東洋経済オンライン | 経済ニュースの新基準]]
([TIME[2020-06-21 12:17:48 +09:00]])
<https://toyokeizai.net/articles/-/357621>
[128] ([TIME[2020-05-26 23:19:01 +09:00]])
<https://www.gsi.go.jp/common/000024858.pdf>
[129] [CITE@ja[「ナンブ」のヘボン式綴りは | iidaの日記 | スラド]]
([TIME[2020-07-01 17:28:05 +09:00]])
<https://srad.jp/~iida/journal/640072/>
[130] [CITE@ja[群馬県 - 群馬(ぐんま)のローマ字表記について]]
([TIME[2020-07-01 17:28:49 +09:00]])
<https://www.pref.gunma.jp/04/c3610022.html>
[FIG(quote)[
[FIGCAPTION[
[131] [CITE[立花理香の「とりあえず生(放送)」(とりあえず生(スタッフ)) - ニコニコチャンネル:バラエティ]]
([TIME[2020-08-21 10:02:41 +09:00]])
<https://ch.nicovideo.jp/toriaezunama>
]FIGCAPTION]
> RICCA TACHIBANA OFFICIAL CHANNEL
]FIG]
[132] ([TIME[2016-03-22T18:06:02.000Z]], [TIME[2020-10-13T01:27:53.529Z]])
<https://www.loc.gov/catdir/cpso/romanization/japanese.pdf>
[FIG(quote)[
[FIGCAPTION[
[133] [CITE[○青梅市公文規程]]
([TIME[2020-09-29T12:56:37.000Z]], [TIME[2020-10-17T09:43:06.265Z]])
<https://www.city.ome.tokyo.jp/d1w_reiki/34990221000200000000/34990221000200000000/print.html>
]FIGCAPTION]
>
> 6 青梅市名等の英語表記
> (1) 青梅の表記
> 「Ome」とする。ただし、「OME」と表記することも許容の範囲とする。
]FIG]
[134] [CITE@ja[入れ違い地方公共団体名集 | iidaの日記 | スラド]]
([TIME[2021-02-26T02:32:52.000Z]])
<https://srad.jp/~iida/journal/645485/>
[135] [CITE@ja[「イッヌ」ってローマ字入力だとものすごく入力しにくいけどみんなどうやって出してるの? - Togetter]]
([TIME[2021-03-29T01:39:50.000Z]])
<https://togetter.com/li/1689168>
[137] [CITE@ja[治田 洗礫さんはTwitterを使っています 「ワイスホルン。英語表記がどうなっているのか気になって、国土地理院の「多言語表記の地図」を見てみた。WeisshornではなくWaisuhorun。一方で、南アルプス市はArupusuではなくAlps。安曇野市アルプスもAlps。でも、登別市カルルス町はKarlsではなくてKarurusu。どう考えたらよいのか・・・(続) https://t.co/A3W2Y6ieKZ」 / Twitter]]
(午後6:56 · 2021年5月29日 [TZ[+09:00]], [TIME[2021-05-30T03:03:30.000Z]])
<https://twitter.com/Harita_arayshi/status/1398578904701358082>
[138] [CITE@ja[カルトッフェルンさんはTwitterを使っています 「@Harita_arayshi こんなのもありますね。 独逸語っぽく書いてますね(Englishレイヤなのに)。ウムラウト表現は無い(できない?)ですが。ホントにドイツ語なら2単語隙間明けずに1単語になってそうな気もします。 発音もドイツ語なら"ランド"でなく"ラント"になるでしょうから独英合成地名なんですかね。 https://t.co/Swiip6uBlK」 / Twitter]]
(午前10:16 · 2021年5月30日 [TZ[+09:00]], [TIME[2021-05-30T03:03:31.000Z]])
<https://twitter.com/geo_anything/status/1398810555796770822>
[139] [CITE@ja[ニッポンゴ - 国立国会図書館デジタルコレクション]], [[情報局 編輯]], [TIME[1942][year:1942]], [TIME[2021-06-18T03:24:44.000Z]] <http://dl.ndl.go.jp/info:ndljp/pid/1085931/4>
片仮名表音仮名遣い + 「ー」
ローマ字訓令式に近いが[[拗音]]の一部に jo、リャ行に rya と lya を併記など
[140] [CITE@ja[想像地図の人 (珍百景とウラマヨに出た人)さんはTwitterを使っています 「形態素境界がある場合でも、広島県の「河内」という地名はコーチと発音されるようですね(ローマ字もKōchiです)。すなわち、高知と同じ発音。形態素境界を跨ぐ場合でも、使用頻度や語源意識の強さによっては、長音への変化もあり得るのかもしれませんね。」 / Twitter]]
(午前8:30 · 2021年7月19日 [TZ[+09:00]], [TIME[2021-07-19T03:21:02.000Z]])
<https://twitter.com/koridentetsu/status/1416903288302178304>
[143] [CITE[Arte da lingoa de Iapam - bub_gb_NwnUAAAAMAAJ.pdf]], [TIME[2014-12-25T07:08:59.000Z]], [TIME[2021-09-09T03:20:53.445Z]] <https://ia802704.us.archive.org/21/items/bub_gb_NwnUAAAAMAAJ/bub_gb_NwnUAAAAMAAJ.pdf#page=124>
#page=367
[144] [CITE@ja[教育ローマ字 – 日本語の研究と日本語教育のためのローマ字]], [TIME[2021-10-29T10:10:42.000Z]], [TIME[2021-10-29T10:13:36.202Z]] <https://spokenjapanese.wordpress.com/>
[145] [CITE@ja[ローマ字文の研究 - 国立国会図書館デジタルコレクション]], [[田丸卓郎]], [TIME[大正9][year:1920]], [TIME[2021-11-11T11:20:04.000Z]] <http://dl.ndl.go.jp/info:ndljp/pid/943138/2>
[155] [CITE[UT_Komaba_Nihongo_no_romaji_hyoki_v1a - UT-Komaba-Nihongo-no-romaji-hyoki-v1.pdf]], [TIME[2014-03-20T07:55:05.000Z]], [TIME[2022-03-29T10:19:57.741Z]] <https://park.itc.u-tokyo.ac.jp/eigo/UT-Komaba-Nihongo-no-romaji-hyoki-v1.pdf>
[156] [CITE[<4D6963726F736F667420576F7264202D2088C482505F926E96BC939982CC89708CEA955C8B4C8AEE8F808151955C8E8695742E646F6378> - 000138865.pdf]], [TIME[2021-11-29T14:31:32.000Z]], [TIME[2022-03-29T10:24:19.861Z]] <https://www.gsi.go.jp/common/000138865.pdf>
[157] [CITE@ja[ローマ字で「ティ」「ディ」をどう書くか -ある日本語の文章をすべてロ- 日本語 | 教えて!goo]], [TIME[2022-04-01T09:22:51.000Z]] <https://oshiete.goo.ne.jp/qa/2294397.html>
[158] [CITE[p406.pdf]], [TIME[2022-05-13T12:56:07.000Z]] <https://catalog.lib.kyushu-u.ac.jp/opac_download_md/1474891/p406.pdf#page=63>
[159] [CITE@ja[ローマ字は訓令式かヘボン式か 国語課題小委で検討へ | 教育新聞]]
([[wp_sawada]], [TIME[2022-06-22T01:57:26.000Z]])
<https://www.kyobun.co.jp/news/20220620_05/>
-[162] [CITE[「99式」日本語のローマ字表記方式(要約)]], [TIME[2022-10-31T08:47:24.000Z]], [TIME[2004-08-12T10:47:14.664Z]] <https://web.archive.org/web/20040812104701fw_/http://www.roomazi.org/99sikisum.html>
-[161] [CITE[「99式」日本語のローマ字表記方式(詳細)]], [TIME[2022-10-31T08:45:44.000Z]], [TIME[2004-08-12T18:18:08.076Z]] <https://web.archive.org/web/20040812181735/http://www.roomazi.org/99siki.html>
-[163] [CITE[Wayback Machine]], [TIME[2022-10-31T09:55:24.000Z]] <https://web.archive.org/web/20130817011121/http://www.halcat.com/roomazi/kaizu-siki/riron1f.html>
-[164] [CITE[Wayback Machine]], [TIME[2022-10-31T09:56:28.000Z]] <https://web.archive.org/web/20150815095206/http://halcat.com/roomazi/kaizu-siki/namae1f.html>
[165] [CITE[Wayback Machine]], [TIME[2022-10-31T09:57:32.000Z]] <https://web.archive.org/web/20150209075808/http://halcat.com/roomazi/iroiro1f.html>
[166] [CITE@ja[■ローマ字資料室]], [[海津知緒(KAIZU Haruo)]], [TIME[2022-10-31T09:58:51.000Z]], [TIME[2015-08-15T12:44:23.916Z]] <https://web.archive.org/web/20150815124002/http://halcat.com/roomazi/doc/index.html>
- [167] [CITE[岩瀬順一の「新日本式ローマ字について」]], [TIME[2008-01-12T17:03:52.000Z]], [TIME[2022-10-31T10:03:44.655Z]] <http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki.html>
-- [168] [CITE[岩瀬順一の「新日本式ローマ字の原理」]], [TIME[2008-01-12T17:03:54.000Z]], [TIME[2022-10-31T10:04:00.450Z]] <http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki2.html>
-- [169] [CITE@ja[岩瀬順一の「新日本式ローマ字について(補)」]], [TIME[2012-02-22T17:22:05.000Z]], [TIME[2022-10-31T10:04:21.646Z]] <http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki3.html>
-- [170] [CITE@ja[岩瀬順一の「新日本式ローマ字と『外来語の表記』」]], [TIME[2022-09-11T03:18:00.000Z]], [TIME[2022-10-31T10:04:30.714Z]] <http://www5a.biglobe.ne.jp/~iwase47/sinnihonsiki4.html>
- [171] [CITE[岩瀬順一の「日本語のわかち書きについて」]], [TIME[2010-12-23T16:06:55.000Z]], [TIME[2022-10-31T10:04:44.225Z]] <http://www5a.biglobe.ne.jp/~iwase47/wakacigaki.html>
- [172] [CITE[93761401_02.pdf]], [TIME[2022-09-08T07:00:01.000Z]], [TIME[2022-10-31T10:06:29.759Z]] <https://www.bunka.go.jp/seisaku/bunkashingikai/kokugo/kokugo_kadai/iinkai_53/pdf/93761401_02.pdf>