/
951.txt
111 lines (96 loc) · 4.83 KB
/
951.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
[1] 【[[符号化文字集合]]】 [[北朝鮮]]の基本符号化文字集合規格。
[2] 初版は KPS 9566:1997,
“Code of the Korean Graphic Character Set for
Information Interchange”。 [DFN[[[ISO-IR]] 202]]
([[[VAR[F]]][終端バイト]] := [CODE[4/14]] ([SAMP(char)[N]]))。
* 文字集合
[6] 分類は [[ISO‐IR 202]] によります。
[FIG(list)[
-1‐1〜12‐94 (0-2121〜0-2A7E) (非漢字)
-- 一般図形文字
--- 句読点, 括弧, 数学・論理記号, 単位, その他の図形記号
--- 341文字
--- 括弧などは縦書き・横書きを分離
--- [13] 4‐72〜4‐77 : 固有名詞表記用の朝鮮文字
--- 12‐1・12‐2 : 朝鮮労働党の記号
--- [[ISO/IEC10646]]‐1:2000 に含まれない文字多数
(Amd.2 でおおむね救済予定)
--- ごく一部のみ JIS X 0208 と同じ並び順
-- 数字
--- アラビア数字の 0 〜 9, 羅馬数字の I 〜 X, i 〜 x の合計
30文字
--- アラビア数字は JIS X 0208 などと同じ[[区点位置]]
-- ラテン字母
---A 〜 Z, a 〜 z の計52文字
---全て JIS X 0208 などと同じ区点位置にあります。
--朝鮮字母 (Korean Alphabet)
---65文字
---末尾の10文字は KS X 1001 などに含まれていないもの
(組合せ時の位置による字形差)
--- KS X 1001 とは基本的に順序が異なる
--キリル字母
---A 〜 Я, a 〜 яの計66文字
---JIS X 0208 などと同じ配列順
--希臘字母
---A 〜 Ω, α 〜 ωの計48文字
---JIS X 0208 などと同じ配列順
--丸付き文字・数字
---朝鮮文字14文字, 朝鮮音節14文字, 番号 1 〜 30 の丸付き
--分数, 上付き・下付き数字
---分数10字, 上付き・下付き数字それぞれ 1 〜 0
---分数は縦に並ぶものと斜めに並ぶものが分離されており、実質5種類
--罫線素片
---68文字
---KS X 1001 と同じ順で、前半は JIS X 0208 とも同じ順序
--日本文字
---平仮名83文字, 片仮名86文字
---JIS X 0208 などと同じ並び順です。
---GB 2312-80 などと同様、長音符号などは含まれず
-16‐1〜44‐47 (0-3021〜0-4C4F)
--朝鮮音節 (2679文字)
--KS X 1001 などとは全く異なる配列順
-45‐1〜94‐47 (0-4D21〜0-7E4F)
--朝鮮漢字 (4653文字)
--KS X 1001 などとは全く異なる配列順
--Unihan.txt によるとすべて [[CJK統合漢字]] (本体)
に含まれる
-15‐1〜94, 44‐48〜44‐94, 94‐48〜94‐94
--計188位置
--利用者定義位置
--「この図形文字集合に含まれない文字や記号を定義しても良い。利用者により定義された文字や記号は局部的にのみ使用でき、情報交換用途に用いることはできない。」
-その他の区点位置
--389位置
--文字が割り当てられていないこれらの位置は使用禁止
]FIG]
* メモ
- [3] 2000年版もあるという噂だけど不明。
- [4] 文字集合の構成的には [[KSX1001]] [[完成型]]によく似ているものの、互換性は全くない。
- [5] ''한글 부호계에 관련된 정보 (Information regarding Hangeul Code)'' <http://hangeul.pnu.edu/hangeul/code/hcode.html>: KPS と KS X 1001 と [[UCS]] の変換表など。 [WEAK[(情報源: [[JTC1/SC2/WG2]] N 2564)]]
- [8] [CITE@ja[KPS 9566 - Wikipedia]]
([TIME[2009-10-12 10:09:48 +09:00]] 版)
<http://ja.wikipedia.org/wiki/KPS_9566>
[7] >>6 [[KPS10721]] なんかには [[CJK互換漢字]]にさえ入れてもらえないのがある一方で 9566 ってほんとに全部はいってるの?
[14] >>13 [DFN[将軍様専用文字]]
[9] [CITE[課題 33466]]
([TIME[2010-01-28 00:58:07 +09:00]] 版)
<http://www.openoffice.org/issues/show_bug.cgi?id=33466>
[10] [CITE@ja[KPS 9566-97 - CyberLibrarian]]
( ([TIME[2014-09-12 13:59:46 +09:00]] 版))
<http://www.asahi-net.or.jp/~ax2s-kmtn/ref/kps9566-97.html>
[11] [CITE@ja-jp[KPS 9566 ‐ 通信用語の基礎知識]]
( ([TIME[2014-12-23 19:53:09 +09:00]] 版))
<http://www.wdic.org/w/WDIC/KPS%209566>
[12] [CITE@en[Issue 33466 – Conversion tables between KPS 9566-2003(N. Korean) & Unicode]]
( ([TIME[2014-12-23 19:55:44 +09:00]] 版))
<https://issues.apache.org/ooo/show_bug.cgi?id=33466>
[15] 将軍様専用の[[符号位置]]を割り当ててもらえなかった [[Unicode]]
でどうしているかというと:
[FIG(quote)[
[FIGCAPTION[
[16] [CITE[조선의 소리]] ([TIME[2018-01-20 01:14:04 +09:00]]) <http://vok.rep.kp/CBC/index.php?CHANNEL=2&lang=>
]FIGCAPTION]
>
[PRE(HTML code)[
<td class="great_body_txtB"><span style="FONT-SIZE: 13px">《<nobr><span style="font-size: 14px; line-height: 24px; font-weight:bold;">김정일</span></nobr>동지략전》 1장(1942.2-1964.3) 5. 사상리론활동 -경제리론과 철학 연구를 주체적으로-</span></td>
]PRE]
]FIG]