/
556.txt
3648 lines (2977 loc) · 137 KB
/
556.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
[1]
[[書字方向]]によって[[グリフを選ぶ][グリフの選択]]必要がある[[文字]]もあります。
* 日本語
[4]
[[長音]]を表す
「[[ー]]」
と、その[[異体字]]の
「[[〜]]」、
「[[→]]」
は、
[[左横書き]]では横線右向き、
[[縦書き]]では縦線下向きです。
[[異体字]]は近年のもので、
現代では特殊な場面でしか使われない[[右横書き]]の用例があるか不明ですが、
論理的には横線左向きとなるべきで、
[[鏡像化]]が必要です。
(「[[ー]]」
は左右対称にも見えますが、
[[フォント]]設計次第で[[グリフ]]を変える必要が出てきます。)
[458] [[長音記号]]も参照。
[336] 他に [CODE[!]], [CODE[?]], [CODE[;]], [CODE[,]], [CODE[、]]
あたりも[[鏡像化]]する可能性があります。
[CODE[ゝ]] や [CODE[〱]] もでしょうか (どうやって?)。
[CODE[。]], [[小書き仮名]]などは[[アキ]]の調整が必要な場合もあるかもしれません。
[339]
[[小書き仮名]]が[[左横書き]]用に左下に寄せた設計の[[フォント]]のとき、
[[右横書き]]では右下に寄せるよう変更する必要があります。
([[鏡像化]]ではありません。)
[340]
[[進行方向書き]]の実例を見ると、[[ー]]や[[小書き仮名]]は左右どちら向きでも違和感がないような[[書体]]設計になっているようです。
[[左横書き]]用をそのまま使っているっぽい事例もいくつか。
[315]
[[縦書き]]の[[踊り字]]が[[横書き]]で使いづらいためもあってか、
現代の日本では
「いろ[SUP[2]]」、
「いろ[SUP[×2]]」、
「いろ[SUP[②]]」、
「それ[SUP[2゙]]」
といった[[上付き]]の[[小書き]]で反復を表す表現が使われています。
ただし一部で使われる[[スラング]]のような扱いで、
公的な場面に現れるには至っていません。
こうした表現は[[左横書き]]に特化していて、
逆に[[縦書き]]での表現方法に難があります。
[423] [CITE[貯蓄債券の広告]], [TIME[2020-10-18T02:16:00.000Z]], [TIME[2020-11-09T10:35:26.870Z]] <http://tokyowanyosai.com/soft/shakai/pr-saiken.html>
昭和17年2月の原文「[R[二月二十一日[MIRRORED(rtl)[➡]]三月四日]]」
[[Webページ]]の翻刻「二月二十一日→三月四日」
[433] [CITE@ja[第139回 「菩薩」の略字―現代の抄物書き | 漢字の現在(笹原 宏之) | 三省堂 ことばのコラム]], [TIME[2020-11-23T02:17:08.000Z]] <https://dictionary.sanseido-publ.co.jp/column/kanji_genzai139>
[434] [CITE@ja[第140回 中学生の文字 | 漢字の現在(笹原 宏之) | 三省堂 ことばのコラム]], [TIME[2020-11-23T02:24:33.000Z]] <https://dictionary.sanseido-publ.co.jp/column/kanji_genzai140>
>「縦書き・横書き?」という生徒さんの書き込みもあった。なるほど縦書きにはどことなく「歳」が似合うため、大人でもそういう人がいる。
[436]
[[仮名]]や[[漢字]]の後に「↑」「↓」
「⤴」「⤵」「↗」「↘」
などの矢印を使い、
「[L[[[こ↑こ↓]]]]」
のように[[高低アクセント]]を記述する方法があります。
もっぱら[[左横書き]]で使われます。
[[上縦書き]]や[[右横書き]]で表示されるとき、
どうなるべきか明らかではありません。
[437] [CITE[246dfa655aeb95cb82f093e2a484d5bd.jpeg (300×600)]] ([TIME[2020-11-20 15:50:38 +09:00]]) <https://ads.nicovideo.jp/assets/images/24/246dfa655aeb95cb82f093e2a484d5bd.jpeg>
広告画像
>
[LEFTBOX[
総合戦力
3.99K⭡̣[ASIS[⭡̣][上に長い]]
]LEFTBOX]
この上向き矢印は「up」 「上昇」 の意味。上向きであることに意味がある。
[456] [CITE@ja[からあげのるつぼさんはTwitterを使っています 「そう簡単に変わらないゾ #現場猫 https://t.co/FHvG3PReCz」 / Twitter]], 午前8:15 · 2020年12月26日 [TZ[+09:00]], [TIME[2020-12-27T08:12:16.000Z]] <https://twitter.com/karaage_rutsubo/status/1342610060451540992/photo/1>
漫画台詞「[V[[YOKO[w]][YOKO[w]][YOKO[w]]]]」
[461] [CITE@ja[アクセント記号解説]], [TIME[2019-06-20T14:53:59.000Z]], [TIME[2021-10-29T10:31:10.834Z]] <http://www.akenotsuki.com/kyookotoba/kisoaccent.html>
>
縦書きの時は90度右回転させた◐→◓・◑→◒)を使って表記します。
[483]
[[近代]]から[[平成時代]]初期頃まで、
[[数値]]は[[縦書き]]では[[漢数字]]、
[[横書き]]では[[欧州数字]] ([[漢数字]]でもよい)
という使い分けが定着していました。
[[横書き]]で[[英字]]を使っても、
[[縦書き]]では[[カタカナ]]にするのが好ましいとも言われていました。
[WEAK[([[単位記号]]の[[組み文字]]が[[カタカナ]]表記なのは、[[縦書き]]で[[カタカナ]]表記に開いた結果長くなりすぎてスペースを取る & 読みにくくなるという事情もある。)]]
[[21世紀]]に入る頃から[[縦書き]]でも[[英数字]]がよく使われるようになり、
[[書字方向]]の違いよりも[[媒体]]のポリシーや個人の好みによる選択に寄ってきています。
[484]
この[[縦書き]]向け、[[横書き]]向けの書き換えは膨大な[[辞書]]データや[[自然言語解析]]
[WEAK[(例えば「一石二鳥」や「九十九折」は[[欧州数字]]に置き換えられません。「四十九日」を置き換えていいのかはわかりません。)]]
なく機械的に実現するのは難しく、
[[縦書き字形]]、[[横書き字形]]の切り替えとは別次元の機構で扱う必要があります。
** 句読法
[103]
[[日本政府]]の[[文部省]]の文書として、
[CITE[[[くぎり符號の使ひ方]]]],
[CITE[[[くりかへし符號の使ひ方]]]]
がありました。
昭和21年に公表され、
少なくても昭和38年に一度再出版されており、
後者は前者を再録したに過ぎないのですが、
前者が[[縦書き]]、
後者が[[左横書き]]で、
[[字形]]もそれに合わせて変わったり、変わらなかったりしていました。
[319]
「――」
や
「……」
については[[組合せて使う文字]]参照。
[421]
[[括弧付き文字]]は、[[縦書き]]でも[[縦中横]]で書かれます。
[SEE[ [[括弧付き文字]] ]]
[422] [[右横書き]]用括弧の事例 [SEE[ [[「]], [[引用符]], [[括弧]] ]]
[424]
[[アラビア語]]では[[鏡像化]]される
「?」
ですが、
[[日本語]]では[[左横書き]]と同じ字形が使われた事例がありました。
[SEE[ [[?]] ]]
** 書字方向と字形設計
[239]
[[日本]]では[[幕末]]以来、
[[縦書き]]で使われてきた[[日本語文字]]と[[欧米]]由来の[[横書き]]の調和に様々な提案がなされてきました。
その中には、
[[横書き]]前提の[[新字]] (まったく新しい[[用字系]]) を開発したものや、
[[横書き]]向きに[[仮名]]や[[漢字]]を大胆に改造したものもありました。
[SEE[ [[日本語近代化]] ]]
[240]
大胆な提案はいずれも受け入れられることなく消えていきました。
現在では[[書体]]設計時に[[左横書き]]前提のバランス調整をする程度となっています。
[102]
<https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=1306&item_no=1&attribute_id=43&file_no=1>
[431] 「ー」の[[縦書き]]用、[[横書き]]用を間違えて使った (または未分化の時代の)
看板や書籍の事例:
[REFS[
- [429] [CITE@ja[案外楽しいかもしれないビル文字の世界 - 文字の裏通り]], [TIME[2020-11-19T04:58:21.000Z]] <https://mojiura.hatenadiary.org/entry/20071110/p1>
- [430] [CITE@ja[縦書き用の音引き、横書き用の音引き - 文字の裏通り]], [TIME[2020-11-19T04:58:50.000Z]] <https://mojiura.hatenadiary.org/entry/20090412/p3>
- [432] [CITE@ja[縦の音引きを横にして使う - しろもじメモランダム]], [TIME[2020-11-19T06:31:46.000Z]] <https://shiromoji.hatenablog.jp/entry/20081114/1226674434>
]REFS]
[435] [CITE@ja[第141回 中2世代の「02娘01」 | 漢字の現在(笹原 宏之) | 三省堂 ことばのコラム]], [TIME[2020-11-23T02:25:51.000Z]] <https://dictionary.sanseido-publ.co.jp/column/kanji_genzai141>
>「事」のはね方など書風、字形
* 中文
** 中華人民共和国
[77] [[中文]]の[[句読点]]の用法を[[規定]]する
[[GB/T 15834-1995]]
には、原則の[[横書き]]の[[規定]]の他に、
[[縦書き]]について次のようにありました。
>
[LEFTBOX[
6 直行文稿与横行文稿使用标点符号不同。
6.1 句号、问号、叹号、顿号、分号和冒号放在字下偏右。
6.2 破折号、省略号、连接号和间隔号放在字下居中。
6.3 引号改用双引号“[R[[TATE[『]][TATE[』]]]]”和单引号“[R[[TATE[「]][TATE[」]]]]”。
6.4 着重号标在字的右侧,专名号和浪线式书名号标在字的左侧。
]LEFTBOX]
[78]
[[引用符]]だけ[[字形]]がまったく異なるので明示されていますが、
その他の位置の変更、向きの変更は文章の説明しかありませんでした。
[79]
[[GB/T 15834-2011]]
では[[句読点]]の種類が増えた分の[[規定]]が増えていますが、
[[字形]]は [TATE[(]]、[TATE[)]]
が追加されたのみで、他は文章の説明でした。
-*-*-
[80]
[[中文]]の[[数]]の表記法を[[規定]]する
[[GB/T 15835-1995]]
には、原則の[[横書き]]の[[規定]]の他に、
[[縦書き]]で
「顺时针方向转90度」
する旨の[[規定]]がありました。
実際[[時計回り]]に90°回転した[[英数字]]が混じった文例がありました。
この[[規定]]の本題から外れますが、例示には
「:」、「,」、「。」の[[縦書き]]字形が示されていました。
[81]
[[GB/T 15835-2011]]
にも同様の規定がありましたが、
なぜか例示から「:」は削られていました。
[82]
[[GB/T 17961-2000]]
には[[横書き]]と[[縦書き]]の例文があって、
[[縦書き]]の[[句読点]]の実例として
「,」と「。」が含まれていました。
[83]
[[GB/T 17961-2010]]
には関係する[[文字]]のリストが追加されていましたが、
[[横書き]]のみ示されていました。
例文は別のものに変わっており、
[[縦書き]]の[[句読点]]として
「、」、
「,」、
「;」、
「。」
が含まれていました。
** CLREQ
[147]
[[CLREQ]]
は[[横書き]]と[[縦書き]]、
[[中国大陸]]、[[台湾]]、[[香港]]で[[句読点]]を書く位置が違う点を説明していました。
[[括弧]]や横線類と[[書字方向]]についても説明していました。
[SRC[>>146]]
[145]
[[CLREQ]]
は
[[Unicode]]
の[[縦書き]]用[[符号位置]]は使うべきではなく、
他の仕組みで[[字形]]を置き換えるべきとしていました。
[SRC[>>146]]
[149]
[[CLLRQ]]
の文字クラス表には、
[[時計回り]]に90°[[回転][回転 (書字方向)]]するべき[[文字]]が示されていました。
[SRC[>>148]]
([[句読点]]のように位置が変わるものはこれに含まれていませんでした。)
[REFS[
- [143] [CITE@en[Requirements for Chinese Text Layout中文排版需求]], [TIME[2020-10-15T04:59:44.000Z]], [TIME[2020-10-18T07:14:08.078Z]] <https://w3c.github.io/clreq/#writing_modes>
- [146] [CITE@en[Requirements for Chinese Text Layout中文排版需求]], [TIME[2020-10-15T04:59:44.000Z]], [TIME[2020-10-18T07:26:35.423Z]] <https://w3c.github.io/clreq/#line_composition_rules_for_punctuation_marks>
- [148] [CITE@en[Requirements for Chinese Text Layout中文排版需求]], [TIME[2020-10-15T04:59:44.000Z]], [TIME[2020-10-18T07:31:01.446Z]] <https://w3c.github.io/clreq/#tables_of_chinese_punctuation_marks>
]REFS]
** 注音字母
[153]
[[注音字母]]の
「ㄧ」
は、
元々[[縦書き]]で横線、
[[横書き]]で縦線でしたが、
現在では主としてどちらでも横線が使われているそうです。
[SRC[>>152, >>155, >>154]]
[156]
[[フォント]]によって横線が表示されたり、縦線が表示されたりします。
[157]
[CITE[Wikipedia]]
は[[画像]]を使ったり [SRC[>>154]]、
[[漢字]]の
「一」と「丨」を使ったり [SRC[>>155]]、
[[記号]]の「ㄧ」
を使ったり [SRC[>>152]]
して[[書き分け][縦書きエミュレーション]]ようとしているようです。
[468]
[[台湾原住民]]の[[言語]]の表記では専ら縦線字形が使われるそうです。
[SRC[>>467]]
[462]
「ㄧ」から派生した
「ㆪ」
「ㆳ」
は、
[[Unicode]]
ではなぜか別の[[文字]]として扱われています。
[REFS[
- [152]
[CITE@ja[[[注音符号]] - Wikipedia]], [TIME[2020-10-17T10:44:13.000Z]], [TIME[2020-10-18T07:44:44.113Z]] <https://ja.wikipedia.org/wiki/%E6%B3%A8%E9%9F%B3%E7%AC%A6%E5%8F%B7#cite_note-10>
- [155] [CITE@zh[[[注音符號]] - 维基百科,自由的百科全书]], [TIME[2020-10-04T07:47:15.000Z]], [TIME[2020-10-18T07:55:53.343Z]] <https://zh.wikipedia.org/wiki/%E6%B3%A8%E9%9F%B3%E7%AC%A6%E8%99%9F#%E5%AF%AB%E6%B3%95>
- [154] [CITE@zh[[[ㄧ]] - 维基百科,自由的百科全书]], [TIME[2020-10-04T07:49:54.000Z]], [TIME[2020-10-18T07:55:24.608Z]] <https://zh.wikipedia.org/wiki/%E3%84%A7>
-
[467]
[CITE@ja[QvarieさんはTwitterを使っています: 「[[注音符号]]I《ㄧ》は、ユニコードでは縦書きの《一》の字形に統一されたのですが、台湾🇹🇼の各民族における言語の注音符号表記ではラテン文字の《I》に合わせて常に縦向きの《丨》で書かれるので、台湾華語本来のものと別字としてユニコード採用があってほしいです。https://t.co/9QME6YIumM」 / Twitter]], 午後8:33 · 2022年8月11日 [TZ[+09:00]], [TIME[2022-08-21T14:46:26.000Z]] <https://twitter.com/qvarie/status/1557691660095848449>
]REFS]
** 爻
[134]
[[爻]]は、
[[縦]]に並べて使われます。
2つ並べて[[四象]]、
3つ並べて[[八卦]]、
6つ並べて[[六十四卦]]となります。
[135]
普通、[[八卦]]がおおむね[[漢字]]1文字程度で表示されます。
[136]
伝統的には単独の記号として使ったり、[[縦書き]]の[[漢字]]文中で使ったりしてきました。
記号的に使う場合、
[[銭]]に円形に配置するなど、
場面や宗教的意味に応じた書き方がされてきました。
[137]
現在では[[左横書き]]文中で、縦配置のままの字形で使うことが多くなっているようです。
[138]
[[Unicode]]
は1つから6つまでの全組み合わせをそれぞれ単独の[[文字]]として割り当てています。
([[Unicode]] はこういうのを複数の[[符号位置]]の組合せにしたがりがちですが、
[[爻]]はそうしなかったようです。)
例示字形はすべて縦配置のままです。
[[六十四卦]]も1文字分のスペースに詰め込まれています。
[CODE[[[Vertical_Orientation]]=[[U]]]]
で、[[縦書き]]でもそのままの[[正立]]字形とされます。
[REFS[
- [139] [CITE@ja[[[易]]の基礎(2) 易卦の構造]], [TIME[2020-10-18T04:00:48.000Z]] <http://anecs.ifortune.net/fortune/eki/kiso/kiso002.htm>
]REFS]
[140] このサイト (初出は[[メルマガ]]) は、
[[Unicode]]
に割り当てられる前に書かれたもので、
記号による代用表記を使っていました。
複数行を使う[[縦書き]]表記 (遠目に見ると [[Unicode]]
の例示字形と同じ) と、
「:::|||」
のような[[左横書き]]表記を使っていました。
このような横書き字形が一般的なものかどうかは不明です。
** 算木
[352]
[[算木数字]]と[[蘇州号碼]]には縦式と横式の2種類の[[字形]]があります。
[[桁]]ごとに違えて使い、
[[横書き]]、[[縦書き]]とはあまり関係しないようです。
[470]
[[Big5]],
[[CNS 11643]],
[[Unicode]]
が縦横区別して[[符号化]]しています。
[469]
[[フォント]]によっては [CODE[GSUB]] の [CODE[camp]]
[[機能][フォント機能]]を使って[[文字コード]]や[[書字方向]]と関係なく前後関係から[[グリフ]]の縦横を変化させます。
* 蒙古文字、満州文字
@@
[[MLREQ]]
@@
[[Unicode蒙古文字]]、[[パスパ文字]]
* ハングル
[151]
[[KLREQ]]
は、
[[横書き]]では [CODE[,]]、[CODE[.]]
を使い、
[[縦書き]]では [CODE[、]]、[CODE[。]]
を使うとしていました。
[SRC[>>150]]
[REFS[
- [150] [CITE@en[Requirements for Hangul Text Layout and Typography : 한국어 텍스트 레이아웃 및 타이포그래피를 위한 요구사항]], [TIME[2020-08-27T02:04:58.000Z]], [TIME[2020-10-18T07:42:13.714Z]] <https://w3c.github.io/klreq/#fonts-horizvertpunct>
- [158] [CITE@en[Requirements for Hangul Text Layout and Typography : 한국어 텍스트 레이아웃 및 타이포그래피를 위한 요구사항]], [TIME[2020-08-27T02:04:58.000Z]], [TIME[2020-10-18T08:00:19.712Z]] <https://w3c.github.io/klreq/#hangulromanmix>
- [159] [CITE@en[Requirements for Hangul Text Layout and Typography : 한국어 텍스트 레이아웃 및 타이포그래피를 위한 요구사항]], [TIME[2020-08-27T02:04:58.000Z]], [TIME[2020-10-18T08:02:04.415Z]] <https://w3c.github.io/klreq/#punc-process>
]REFS]
* 中東系文字
[110]
[[疑問符]]は[[アラビア文字]]と[[ヘブライ文字]]で向きが違います。
[SEE[ [[?]] ]]
[161] [[正立]]された[[縦書き]]、[[孤立形]]で縦に並べる例 [SRC[>>160]]
[REFS[
- [160] [CITE@en[Text Layout Requirements for the Arabic Script]], [TIME[2020-09-08T10:52:27.000Z]], [TIME[2020-10-18T08:07:07.725Z]] <https://w3c.github.io/alreq/#h_vertical_upright>
]REFS]
[162] [[アラビア文字]]と混在して使われる[[数式]]における[[鏡像化]]
[REFS[
- [163] [CITE@en[Arabic mathematical notation]], [TIME[2017-10-02T10:31:39.000Z]], [TIME[2020-10-18T08:10:55.580Z]] <https://www.w3.org/TR/arabic-math/#Mirroring>
]REFS]
* アルファベット系文字
[107]
[[ヒエログリフ]]は[[書字方向]]が自由でした。
[[生物]]の[[頭]]が[[書字方向]]を表すように[[字形]]が変化して使われていました。
[SRC[>>106, >>108]]
[109]
[[古代ギリシャ文字]]は[[牛耕式]]で書かれ、
[[書字方向]]によって[[鏡像化]]していました。
[SRC[>>108]]
[425]
通常の[[左横書き]]で装飾上用いられる[[合字]]は、
1文字ずつ[[正立]]させて[[縦書き]]するときは使いません。
例えば「[L[office]]」を[[縦書き]]すると
「[V[[YOKO[o]][YOKO[f]][YOKO[f]][YOKO[i]][YOKO[c]][YOKO[e]]]]」
になり、「ffi」は[[合字]]化されません。
([[前後の文字と続けて書かれる][続け字]]のが普通の[[アラビア文字]]ですら、
1文字単位に分離して縦に並べられます。)
[426]
[[ローマ数字]]は例外で、
[[縦中横]]で[[合字]]化されることが多いようです。
[[日本語]]文中では例えば「[V[Ⅲ その他]]」のように[[箇条書き]]の記号として[[縦書き]]でもよく使われますが、
分解して縦に並べたり、寝かせたりすることはまずありません。
([[フォント]]依存で「[V[[YOKO[III]] その他]]」
と分離した字形になることはありますが、[[縦中横]]にはされます。)
[REFS[
- [106] [CITE@ja[[[縦書き]]と[[横書き]] - Wikipedia]], [TIME[2020-10-02T08:18:29.000Z]], [TIME[2020-10-17T06:35:40.963Z]] <https://ja.wikipedia.org/wiki/%E7%B8%A6%E6%9B%B8%E3%81%8D%E3%81%A8%E6%A8%AA%E6%9B%B8%E3%81%8D#%E3%83%92%E3%82%A8%E3%83%AD%E3%82%B0%E3%83%AA%E3%83%95%E3%81%AB%E3%81%8A%E3%81%91%E3%82%8B%E7%B8%A6%E6%9B%B8%E3%81%8D%E3%81%A8%E6%A8%AA%E6%9B%B8%E3%81%8D>
- [108] [CITE@ja[[[鏡文字]] - Wikipedia]], [TIME[2020-10-13T11:13:35.000Z]], [TIME[2020-10-17T06:42:40.175Z]] <https://ja.wikipedia.org/wiki/%E9%8F%A1%E6%96%87%E5%AD%97>
]REFS]
* 数式・科学的記法
[459]
「℃」などは1文字扱いの[[合字]]で広く実装されています。
[[横書き]]でも[[縦書き]]でも、この字形のまま[[正立]]させます。
[460]
[[縦書き]]で、「°」をその前の数字とまとめて[[縦中横]]し、
「C」を次の文字として[[正立]]させる例もあります。
[SEE[ [[℃]] ]]
* 文字コード
[476]
[[書字方向]]とそれによって生じる違いを[[文字コード]]、
[[文書形式]] ([[マーク付け]]、[[スタイル付け]]等)、
[[フォント]]のどの層でどう扱うかべきは難問で、試行錯誤が繰り返されてきました。
[SEE[ [[書字方向モデル]] ]]
[477]
[[現代]]においては[[書字方向]]の違いだけから生じる[[字形]]の違いは[[文字コード]]層では扱わないとする原則が確立されています
(が例外も多々あります)。
** 文字の名前と書字方向
[220]
[[Unicode]]
では[[括弧]]類には [CODE[LEFT]] や [CODE[RIGHT]]
のような[[文字の名前]]が与えられています。
しかしこれらは開き括弧、閉じ括弧を意味し、
[[書字方向]]に関わらず方向ではなく意味で使うとされています
[SRC[>>2, >>13]]。
[480]
[[ISO/IEC 10646]] の 19 によれば、[[文字名称]]の
[CODE(charname)[LEFT]] や [CODE(charname)[RIGHT]]
は、 ([[鏡像文字]]の場合) 「左向き」、「右向き」
ではなく「開き」、「閉じ」を意味するのだそうです。
[481]
[[ISO/IEC 10646]] と統合する前の [[Unicode 1.0]] では[[文字の名前]]も
[CODE(charname)[OPEN]] とか [CODE(charname)[CLOSE]]
だったのに。
なぜ悪い方に揃えたのか。
** 例示字形の書字方向
[252]
[[文字コード]]の[[仕様書]]の本文や[[符号表]]に使われる[[文字]]の表示は、
[[仕様書]]が通常[[横書き]]されることもあってか、
[[横書き]]の[[字形]]とすることが多いようです。
[253]
[[JIS]]
も[[左横書き]]用字形を基本に、
適宜[[縦書き]]字形を補う形を採っています (>>22)。
[[文字コード]]規格だけでなく、
[[フォント]]でも同じです (>>38)。
@@
[[Unicodeの蒙古文字]]
[255]
[[Unicode]] は、
[[符号表]]で[[横書き]]用の字形を使っています。
[SRC[>>254]]
[256]
[[Unicode 7.0]]
から、
[[符号表]]の
[[Mongolian]]
と
[[Phags-pa]]
は[[横書き]]文に埋め込まれて使う、
[[時計回りに90°回転]]した[[字形]]に改められました。
それまでは通常の[[縦書き字形]]でした。
[SRC[>>254]]
[257]
[[Unicode]]
で[[縦書き]]の表示方法を表す
[CODE[Vertical_Orientation]]
[[特性]]の値は、
この[[横書き]]用の字形を基準に定められています。
この[[符号表]]の形式は、
[[OpenType]]
のような近年の[[レンダリング][文字のレンダリング]]システムとも一貫していて実装しやすい形である
[SRC[>>254]]
とされています。
-*-*-
[369]
[CODE[U+101D0]] - [CODE[U+101FF]]
の
[[Phaistos Disc Symbols]]
は、
原典が[[円盤に渦巻状に書][渦巻書き]]かれた[[古代文字]]で、
敢えて言えば[[右横書き]]に当たります。
しかし研究書で[[左横書き]]文中に記述することが多い便宜上、
[[Unicode]]
では[[左横書き]]扱いになっています。
[[符号表]]の[[字形]]も、
[[鏡像化]]した[[左横書き]]用のもので、
原典とは逆になっています。
[SRC[>>368]]
[CODE[Bidi_Mirrored]]
は[[偽]]ですが、
[[右横書き]]で表示させるときは[[鏡像化グリフ]]にする必要があります。
[371]
[CODE[U+10300]] - [CODE[U+1032F]]
の
[[Old Italic]]
は、
[[左横書き]]でも[[右横書き]]でも書かれました。
[[符号表]]の[[字形]]は[[左横書き]]用のものです。
[SRC[>>370]]
[CODE[Bidi_Mirrored]]
は[[偽]]ですが、
[[右横書き]]で表示させるときは[[鏡像化グリフ]]にする必要があります。
[374]
[CODE[U+1680]] - [CODE[U+169F]]
の
[[Ogham]]
は、
原典の石碑では[[下から上の縦書きで左下から右上へと書かれました][左下縦書き]]が、
研究書などで[[ラテン文字]]に混ぜて[[左横書き]]されます。
[SRC[>>373]]
[[符号表]]は[[左横書き]]字形を示しています [SRC[>>375]]。
[CODE[Vertical_Orientation]] は
[CODE[R]]
です。
[REFS[
- [370] [CITE[The Unicode Standard, Version 13.0 - ch08.pdf]], [TIME[2020-03-09T17:53:38.000Z]], [TIME[2020-10-24T07:58:47.669Z]] <http://www.unicode.org/versions/Unicode13.0.0/ch08.pdf#page=10>
- [373] [CITE[The Unicode Standard, Version 13.0 - ch08.pdf]], [TIME[2020-03-09T17:53:38.000Z]], [TIME[2020-10-24T07:58:47.669Z]] <http://www.unicode.org/versions/Unicode13.0.0/ch08.pdf#page=21>
- [375] [CITE[The Unicode Standard, Version 13.0 - U1680.pdf]], [TIME[2020-03-02T22:41:06.000Z]], [TIME[2020-10-24T08:12:04.304Z]] <https://unicode.org/charts/PDF/U1680.pdf>
]REFS]
** 書字方向専用の符号位置
[246]
古くからある[[文字コード]]には、
特定の[[書字方向]]用の[[文字]]が[[符号化]]されていました。
一部は
[[Unicode]]
に取り込まれて現在まで残っています。
(古い製品に実装されていても [[Unicode]] にはないものもいろいろあります。)
[FIG(short list)[ [15] [[縦書き]]専用[[符号位置]]のある[[文字コード]]
- [[MacJapanese]]
- [[Big5]]
- [[CNS 11643]]
- [[GB 12345]]
- [[GBK]]
- [[GB 18030]]
- [[Unicode]]
- [[GB 8045]]
- [[KPS 9566-97]]
- [[JIS X 0213]]
- [[JEF漢字コード体系]]
]FIG]
[463]
古い [[Mule]] には
「Right-to-Left ASCII」
がありました。
[SEE[ [[Fp]], [[書字方向モデル]] ]]
[457]
[[Google検索]]では、
[[縦書き]]の
[[PDF]]
の検索結果に[[縦書き]]用の字形の括弧類が含まれる事例が大量にでてきます。
[[OCR]]
によるものでしょうか。
それとも
[[PDF]]
の内部の文字の表現に由来するものでしょうか。
-*-*-
[76]
[[GB 12345]]
は
[[GB 2312]]
にない[[縦書き]]の[[文字]]を追加していました。
追加の説明にその旨がありましたが、
それ以外にどう使うものか説明はありませんでした。
[[括弧類]]は[[横書き]]用が左、右という名前で、
[[縦書き]]用が上、下という名前でした。
それ以外の記号類は[[横書き]]用に特に説明はなく、
[[縦書き]]用にはその旨が名前にかかれていました。
[247]
[[中華人民共和国]]では原則的には[[簡体字]]と[[左横書き]]が使われています。
[[簡体字]]の[[漢字コード]]である [[GB 2312]]
は、明言されていませんが、
[[左横書き]]を前提とした[[漢字コード]]だったのでしょう。
[[繁体字]]が必要になる場面を想定したとき、[[縦書き]]の記号も必要だということで、
[[GB 2312]]
由来の[[左横書き]]用の記号とは別に[[縦書き]]用を
[[GB 12345]]
にだけ追加したのでしょう。
[84]
[[CNS 11643]]
は[[横書き]]用と[[縦書き]]用の[[文字]]を符号化していました。
[[横書き]]用と離れたところに[[縦書き]]用を並べていた
[[JIS X 0208]] の非標準の各社の拡張や
[[GB 12345]]
とは違って、
[[CNS 11643]]
は順番に並べていました。例えば括弧なら、
左括弧、右括弧、上括弧、下括弧のように並べられていました。
ただし
[[CNS 11643]]
は[[符号位置]]と[[字形]]例を示しただけで、
各[[文字]]の説明はほとんどありませんでした。
[414]
[[KPS 9566-97]]
は、
1区に[[句読点]]を[[横書き]]用と[[縦書き]]用の2組符号化していました。
[[朝鮮民主主義人民共和国]]関係者は、
この[[縦書き]]は
[[JIS X 0208]]
にもあるものだと主張していました [SRC[>>415]]。
(ただし実際には [[JIS]] は1つの[[区点位置]]で[[横書き]]と[[縦書き]]を表しており、
根拠として示されたのはその[[縦書き例示字形]]でした。)
[416]
[[KPS 9566-97]]
は、
[[句点]]と[[閉じ括弧]]が一体化した[[合字]]も2つ[[符号化]]していました。
[[横書き]]と[[縦書き]]を区別するなら、
他に[[縦書き]]用もあって然るべきですが、
なぜかありませんでした。
[[横書き]]でしか使わないものなのでしょうか。
[REFS[
- [415] [CITE[01349-N2374-DPRK-AddSymbols.pdf]], [TIME[2001-09-25T06:16:00.000Z]], [TIME[2020-10-26T06:04:54.617Z]] <http://www.unicode.org/L2/L2001/01349-N2374-DPRK-AddSymbols.pdf>
]REFS]
-*-*-
[248]
[[JIS X 0201]] や [[JIS X 0208]]
には[[横書き]]用、[[縦書き]]用と決められた[[文字]]はありませんでした。
初版の [[JIS X 0208-1978]] からそうだったのかはわかりませんが、
[[JIS X 0208:1997]]
には[[横書き]]用の[[例示字形]]と、
[[縦書き例示字形]]が示されていました (>>22)。
[[左横書き]]だけでなく[[縦書き]]もよく使われている[[日本]]の[[漢字コード]]が[[縦書き]]専用の[[文字]]を用意しなかったのは、
[[書字方向]]を[[文字コード]]レイヤーで扱うべきでないという考えによるものだったのでしょう。
[249]
ただ実用上それでは不便なこともあったようで、
[[JIS X 0208]] の[[文字]]を[[左横書き]]用とみなし、
非標準の拡張で[[縦書き]]用の[[文字]]を割り当てることもありました。
また1文字分のスペースに複数の文字を縦横に並べて詰め込む[[組み文字]]も、
非標準の拡張として広く使われていましたが、
実用性より理論を重視したのか [[JIS]]
は長らく無視してきました。
[25]
[[JIS X 0213:2000]]
の制定時の[[公開レビュー]]公開資料
[CITE[非漢字類の選定について]],
[TIME[1998年11月6日][1998-11-06]]版によると、
候補に[[縦書き]]用の[[字形]]が大量に収集されましたが、
>縦書きの用途を想定した縦書き用連数字のように,組版の機能を利用することで実現可
能なものについては,基本的に,追加候補としないこととした。
... という理由で収録されなかったそうです。
[[縦書き]]文中で[[縦中横]]的に数字や[[ラテン文字]]の[[単位]]記号を横に並べるため1文字扱いとしたものや、
[[縦書き]]の[[新聞]]などでよく使われる[[片仮名]]の[[単位]]の[[組み文字]]などが、
独自の拡張や[[外字]]として広く使われていました。
例外的に
「[[㍉]]」
などの[[NEC特殊文字]]だけは互換性のため[[標準化]]されました。
[[Windows]]
などに実装され、
[[左横書き]]字形と[[縦書き]]字形が使われていたので、
[[JIS X 0213:2000]]
もその両方を例示していました。
[[縦書き]]専用という形にはなっていませんでした。
;; [478] 「組版の機能」について、 [[JIS X 0213]] の制定と同時期に
(似たメンバーにより) [[JIS X 4051]] が改定されました。
[250]
[[JIS X 0213]]
は[[縦書き]]専用の[[文字]]は[[規定]]していませんでしたが、
[[縦書き]]用[[例示字形]]''のみ''を示した[[文字]] ([[踊り字]]) がいくつかありました
(>>27)。
[452]
[[MacJapanese]]
は[[縦書き字形]]を別の[[区点位置]]に割り当てていましたが、
[[Unicode]]
に相当する文字が存在しないものもありました。
そこで
[[Apple]]
は[[私用文字]]として[[異体選択子]]的なものを独自に定義し、
独自の[[異体列]]的なものに対応付けていました。
[SEE[ [[variant tag]] ]]
-*-*-
[251]
[[右横書き]]の[[アラビア文字]]や[[ヘブライ文字]]を使うに当たり、
[[左横書き]]の[[ラテン文字]]や[[算用数字]]との混在を踏まえ、
現在では [[bidi]]
アルゴリズムを前提とした[[論理順]]が使われますが、
当初はすべて[[左横書き]]による[[表示順]]も使われました。
その場合[[鏡像化]]もなく、
すべて[[左横書き]]用の文字として扱われました。
現在でも
[CODE[ISO-8859-8]]
の処理にその名残りを留めています。
[105]
[[ヘブライ文字]]の[[アレフ]]は、
[[Unicode]]
では常用の[[右横書き]]の
「א」
と、
[[数学記号]]の[[左横書き]]の
「ℵ」
で[[重複符号化]]されています。
本来同じ[[文字]]のはずですが、
用法の違いから[[グリフ]]も違っていることがあります。
[[鏡像化]]はなく、[[書字方向]]由来の違いではありません。
[335]
[[CJK]]
以外の[[端末エミュレーション]]で[[縦書き]]に使った記号として、
[CODE[U+23B4]]
[CODE(charname)@en[TOP SQUARE BRACKET]],
[CODE[U+23B5]]
[CODE(charname)@en[BOTTOM SQUARE BRACKET]],
[CODE[U+23B6]]
[CODE(charname)@en[BOTTOM SQUARE BRACKET OVER TOP SQUARE BRACKET]]
があります [SRC[>>332]]。
最初の2つは
[[CJK]]
用として別に[[縦書き]]の[[符号位置]]があるにも関わらず、
なぜか別に[[符号化]]されています。
[[符号表]]には[[縦書き]]字形が示されており、
[CODE[Vertical_Orientation]]
は
[CODE[R]]
なので、
[[縦書き]]環境では逆に横向きになります。
[338]
[[数式]]で適当な幅に引き伸ばして使う水平の[[括弧]]として、
[CODE[U+23DC]] - [CODE[U+23E1]]
があります
[SRC[>>332]]。
別に同じような[[縦書き]]の[[符号位置]]があるにも関わらず、
別に[[符号化]]されています。
[[符号表]]には[[縦書き]]字形が示されており、
[CODE[Vertical_Orientation]]
は
[CODE[R]]
なので、
[[縦書き]]環境では逆に横向きになります。
[343]
[CODE[U+FE10]] - [CODE[U+FE19]]
に
Vertical Forms
として[[縦書き]]用の[[符号位置]]があります [SRC[>>342]]。
[CODE[U+FE30]] - [CODE[U+FE44]], [CODE[U+FE47]], [CODE[U+FE48]]
にもあります [SRC[>>346]]。
前者は [[GB 18030]],
後者は [[CNS 11643]]
との互換性のためとされています [SRC[>>14]]。
いずれも
[CODE[<vertical>]]
な[[互換分解]]で通常の[[符号位置]]に変換されます
[SRC[>>342, >>346]]。
[CODE[[[Vertical_Orientation]]=[[U]]]]
で、
[[横書き]]でも[[縦書き]]でも同じ字形となります。
なお[[句読点]]の例示字形は [CODE[:]] や [CODE[?]]
も含め右寄せ[[小書き]]の[[中文]]式です。
[[互換等価]]とされるのは通常の[[句読点]]ですが、
それとは別に[[符号表]]には
[CODE(charname)@en[SMALL]] 形の[[文字]]へ参照が記述されています。
[347]
[CODE[U+FE45]] [CODE(charname)@en[SESAME DOT]],
[CODE[U+FE46]] [CODE(charname)@en[WHITE SESAME DOT]]
の
[[Unicode]] [[符号表]]には
「sesame dots are used beside vertical text for
emphasis」
とあります
[SRC[>>346]]。
特別に[[縦書き]]に限定されてはいませんが、
[[縦書き]]での利用を想定しているようです。
[[JIS X 0213:2000]]
にも同名の文字がありますが、
そちらでは特に[[縦書き]]限定の字形とはされていません。
[CITE[Unicode Standard]]
は、
「、」と関係しているがただの[[縦書き]]字形ではなく、
機能が違うので分けたとあります [SRC[>>14]]。
なお 「、」の [[Standardized Variants]]
に同形のものがあります (>>350)。
;; [479] 確かに[[ゴマ]]型[[傍点]]は[[縦書き]]で主に使われますが、
[[横書き]]の用例がないわけでもありません。
[SEE[ [[傍点]] ]]
[354]
[CODE[U+3190]] - [CODE[U+319F]]
に[[漢文]]用の[[文字]]があります [SRC[>>353]]。
[[返り点]]が一通り用意されていますが、
使い方が謎であまり利用されていないとみられます。
- [355]
[CODE[U+3190]] [CODE(charname)@en[IDEOGRAPHIC ANNOTATION LINKING MARK]]
は、
「tateten」
と説明があり、上下の[[漢字]]をひとまとめにすることを表す[[訓点]]を意味するようです。
[[例示字形]]は上半中央付近の短い縦線です。
[CODE[[[Vertical_Orientation]]=[[U]]]]
です。
[[互換分解]]はなぜかありません。
[CODE[<vertical>]] [CODE(charname)@en[HYPHEN]]
辺りになっていても良さそうなものですが。
- [356]
[CODE[U+3191]] [CODE(charname)@en[IDEOGRAPHIC ANNOTATION REVERSE MARK]]
は、
「kaeriten re」
と説明があり、[[レ点]]を表すようです。
[[例示字形]]は上半やや左寄りの「レ」の字型ですが、
[[片仮名]]の「レ」の例示字形とはやや異なるように見えます。
[CODE[[[Vertical_Orientation]]=[[U]]]]
です。
[[互換分解]]はありません。
- [357] [CODE[U+3192]] - [CODE[U+319F]]
は、
[[返り点]]の[[漢字]]を意味するようです。
[[例示字形]]は右上寄りの小書きの[[漢字]]です。
[CODE[[[Vertical_Orientation]]=[[U]]]]
です。
[[互換分解]]は
[CODE[<super>]]
で元の[[漢字]]になり、
[[上付き]]という扱いになっているようです。
[[上付き]] ([[superscript]])
に見えるのは、
[[横書き]]視点なのでしょうか。
;; [358] 実際の[[フォント]]は大書きの字形にしているものもあります。
[325]
[CODE[,]]
は[[鏡像化]]されませんが、
[CODE[U+060C]]
[CODE(charname)@en[ARABIC COMMA]]
として中央大書きの[[コンマ]]を180°回転した字形が別に符号化されています
[SRC[>>323]]。
[326]
[CODE[;]]
は[[鏡像化]]されませんが、
[CODE[U+061B]]
[CODE(charname)@en[ARABIC SEMICOLON]]
として180°回転した字形が別に符号化されています
[SRC[>>323]]。
他に左右反転させた
[CODE[U+204F]] [CODE(charname)@en[REVERSED SEMICOLON]],
同じく180°回転した
[CODE[U+2E35]] [CODE(charname)@en[TURNED SEMICOLON]]
が用意されています。
[327]
[CODE[?]]
は[[鏡像化]]されませんが、
[CODE[U+061F]]
[CODE(charname)@en[ARABIC QUESTION MARK]]
として左右反転させた字形が別に符号化されています
[SRC[>>323]]。
同じ字形の
[CODE[U+2E2E]] [CODE(charname)@en[REVERSED QUESTION MARK]],