Skip to content

HTTPS clone URL

Subversion checkout URL

You can clone with HTTPS or Subversion.

Download ZIP
Newer
Older
100644 208 lines (127 sloc) 6.222 kb
642fd4e @jhi Uncurliff.
jhi authored
1 If you read this file _as_is_, just ignore the funny characters you
2 see. It is written in the POD format (see perlpod manpage) which is
3 specially designed to be readable as is.
4
5 This file is in Korean encoded in EUC-KR.
6
7 이 문서를 perldoc을 써서 보지 않고 직접 보는 경우에는 각 부분의
8 역할을 표시하기 위해 쓰인 =head, =item, 'L' 등은 무시하십시오.
9 이 문서는 따로 perldoc을 쓰지 않고 보더라도 읽는데 별 지장이
10 없는 POD 형식으로 짜여 있습니다. 더 자세한 것은 perlpod
11 매뉴얼을 참고하십시오.
12
a5921eb @eserte PATCH: Add =encoding directive to non-latin READMEs
eserte authored
13 =encoding euc-kr
642fd4e @jhi Uncurliff.
jhi authored
14
15 =head1 NAME
16
17 perlko - Perl과 한국어 인코딩
18
19 =head1 DESCRIPTION
20
21 Perl의 세계에 오신 것을 환영합니다 !
22
23
24 Perl은 5.8.0판부터 유니코드/ISO 10646에 대한 광범위한 지원을 합니다.
25 유니코드 지원의 일환으로 한중일을 비롯한 세계 각국에서
26 유니코드 이전에 쓰고 있었고 지금도 널리 쓰이고 있는 수많은 인코딩을
27 지원합니다. 유니코드는 전 세계에서 쓰이는 모든 언어를 위한 표기 체계 -
28 유럽의 라틴 알파벳, 키릴 알파벳, 그리스 알파벳, 인도와 동남 아시아의
29 브라미 계열 스크립트, 아랍 문자, 히브리 문자, 한중일의 한자, 한국어의 한글,
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
30 일본어의 가나, 북미 인디안의 표기 체계 등-를 수용하는 것을 목표로 하고
642fd4e @jhi Uncurliff.
jhi authored
31 있기 때문에 기존에 쓰이던 각 언어 및 국가 그리고 운영 체계에 고유한
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
32 문자 집합과 인코딩에 쓸 수 있는 모든 글자는 물론이고 기존 문자 집합에서
33 지원하고 있지 않던 아주 많은 글자를 포함하고 있습니다.
642fd4e @jhi Uncurliff.
jhi authored
34
35
36 Perl은 내부적으로 유니코드를 문자 표현을 위해 사용합니다. 보다 구체적으로
37 말하면 Perl 스크립트 안에서 UTF-8 문자열을 쓸 수 있고,
38 각종 함수와 연산자(예를 들어, 정규식, index, substr)가 바이트 단위
39 대신 유니코드 글자 단위로 동작합니다. (더 자세한 것은
40 perlunicode 매뉴얼을 참고하십시오.) 유니코드가 널리 보급되기 전에
41 널리 쓰이고 있었고, 여전히 널리 쓰이고 있는 각국/각 언어별 인코딩으로
42 입출력을 하고 이들 인코딩으로 된 데이터와 문서를 다루는 것을 돕기 위해
43 'Encode'가 쓰였습니다. 무엇보다 'Encode'를 써서 수많은 인코딩 사이의
44 변환을 쉽게 할 수 있습니다.
45
46 'Encode'는 다음과 같은 한국어 인코딩을 지원합니다.
47
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
48 =over 4
49
50 =item euc-kr
51
52 US-ASCII와 KS X 1001을 같이 쓰는 멀티바이트 인코딩 (흔히 완성형이라고
53 불림.) KS X 2901과 RFC 1557 참고.
54
55 =item cp949
56
57 MS-Windows 9x/ME에서 쓰이는 확장 완성형. euc-kr에 8,822자의
58 한글 음절을 더한 것임. alias는 uhc, windows-949, x-windows-949,
59 ks_c_5601-1987. 맨 마지막 이름은 적절하지 않은 이름이지만, Microsoft
60 제품에서 CP949의 의미로 쓰이고 있음.
61
62 =item johab
63
64 KS X 1001:1998 부록 3에서 규정한 조합형. 문자 레퍼토리는 cp949와
65 마찬가지로 US-ASCII와 KS X 1001에 8,822자의 한글 음절을 더한 것임.
66 인코딩 방식은 전혀 다름.
67
68 =item iso-2022-kr
69
70 RFC 1557에서 규정한 한국어 인터넷 메일 교환용 인코딩으로 US-ASCII와
71 KS X 1001을 레퍼토리로 하는 점에서 euc-kr과 같지만 인코딩 방식이 다름.
72 1997-8년 경까지 쓰였으나 더 이상 메일 교환에 쓰이지 않음.
73
74 =item ksc5601-raw
75
76 KS X 1001(KS C 5601)을 GL(즉, MSB를 0으로 한 경우) 에 놓았을 때의
77 인코딩. US-ASCII와 결합하지 않고 단독으로 쓰이는 일은 X11 등에서 글꼴
78 인코딩 (ksc5601.1987-0. '0'은 GL을 의미함.)으로 쓰이는 것을 제외하고는
79 거의 없음. KS C 5601은 1997년 KS X 1001로 이름을 바꾸었음. 1998년에는 두
80 글자 (유로화 부호와 등록 상표 부호)가 더해졌음.
81
82 =back
83
84 몇 가지 사용 예제를 아래에 보입니다.
642fd4e @jhi Uncurliff.
jhi authored
85
86 예를 들어, euc-kr 인코딩으로 된 파일을 UTF-8로 변환하려면 다음과
87 같이 하면 됩니다.
88
89
90 perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8
91
92 역변환은 다음과 같이 할 수 있습니다.
93
94 perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr
95
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
96 이런 변환을 좀더 편리하게 할 수 있도록 Encode 모듈을 써서
642fd4e @jhi Uncurliff.
jhi authored
97 순수하게 Perl로만 쓰인 piconv가 Perl에 들어 있습니다.
98 그 이름에서 알 수 있듯이 piconv는 Unix에 있는 iconv를
99 모델로 한 것입니다. 그 사용법은 아래와 같습니다.
100
101 piconv -f euc-kr -t utf8 < file.euckr > file.utf8
102 piconv -f utf8 -t euc-kr < file.utf8 > file.euckr
103
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
104 또, 'PerlIO::encoding' 모듈을 써서 한국어 인코딩을 쓰면서 글자 단위
642fd4e @jhi Uncurliff.
jhi authored
105 (바이트 단위가 아니라) 처리를 쉽게 할 수 있습니다.
106
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
107 #!/path/to/perl
642fd4e @jhi Uncurliff.
jhi authored
108
109 use encoding 'euc-kr', STDIN => 'euc-kr',
110 STDOUT-> 'euc-kr', STDERR=>'euc-kr';
111
112 print length("가나"); # 2 (큰 따옴표는 글자 단위 처리를 지시)
113 print length('가나'); # 4 (작은 따옴표는 바이트 단위 처리를 지시)
114 print index("한강, 대동강", "염"); # -1 ('염'이 없음)
115 print index('한강, 대동강', '염'); # 7 (8번째와 9번째 바이트가 '염'의
116 코드값과 일치함.)
117
118
119 =head2 더 자세히 알고 싶으면...
120
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
121 Perl을 설치하면 대단히 자세한 문서가 같이 따라 오며, 이 문서를 통해
642fd4e @jhi Uncurliff.
jhi authored
122 Perl 전반 뿐 아니라 유니코드 지원, Encode의 사용법 등에 많은 것을
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
123 배울 수 있습니다. 아직 이 문서는 현재 모두 영어로 쓰여 있습니다.
642fd4e @jhi Uncurliff.
jhi authored
124
125
126 =head2 Perl 관련 자료
127
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
128 위에서 언급한 문서 외에도 다음과 같은 자료가 있습니다. 이 목록은 결코
129 완전한 것이 아니고 일부 대표적인 것만 모은 것입니다.
130
642fd4e @jhi Uncurliff.
jhi authored
131 =over 4
132
133 =item L<http://www.perl.com/>
134
135 O'Reilly의 Perl 웹 페이지
136
137 =item L<http://www.cpan.org/>
138
139 Comprehensive Perl Archive Network
140
141 =item L<http://lists.perl.org/>
142
143 Perl 메일링 리스트. 많은 리스트 가운데
144 perl-unicode에서 'Encode'에 대해 논의함.
145
146 =back
147
148 =head2 Perl을 더 깊게 공부하는데 도움을 줄 수 있는 한국어 관련 사이트
149
150 =over 4
151
152 =item L<http://www.perl.or.kr/>
153
154 Perl 한국 사용자 모임
155
156 =item L<news:han.comp.lang.perl/>
157
158 한국어 Perl 뉴스 그룹
159
464a08e @acme Fix some broken URLs found by Porting/checkURL.pl
acme authored
160 =item L<http://www.hanb.co.kr/search/searchResult.html?keyword=perl>
818c4ca @jhi pod cleanups.
jhi authored
161
642fd4e @jhi Uncurliff.
jhi authored
162 O'Reilly에서 나온 한국어 Perl 서적 목록
163
164 =item L<http://www.perlschool.net/>
165
166 Perl 기초 강좌 및 소스, 최근 동향, 관련 해외 사이트 링크
167
168 =item L<http://www.perl.co.kr>
169
170 Perl에 관련된 CGI, DB, 연동 등에 대한 정보 및 뉴스 제공
171
172 =back
173
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
174 =head2 유니코드 및 한국어 인코딩 관련 자료
642fd4e @jhi Uncurliff.
jhi authored
175
176 =over 4
177
178 =item L<http://www.unicode.org/>
179
180 유니코드 컨소시엄.
181
182 =item L<http://std.dkuug.dk/JTC1/SC2/WG2>
183
184 기본적으로 Unicode와 같은 ISO 표준인 ISO/IEC 10646 UCS(Universal
185 Character Set)을 만드는 ISO/IEC JTC1/SC2/WG2의 웹 페이지.
186
818c4ca @jhi pod cleanups.
jhi authored
187 =item L<http://www.cl.cam.ac.uk/~mgk25/unicode.html>
642fd4e @jhi Uncurliff.
jhi authored
188
189 유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ)
190
99746d7 @mstevens [perl #82526] Fix kldp links.
mstevens authored
191 =item L<http://wiki.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html>
642fd4e @jhi Uncurliff.
jhi authored
192
193 유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ)의 한국어 번역
194
195 =back
196
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
197 =head1 SEE ALSO
198
199 L<Encode>, L<Encode::KR>, L<encoding>, L<perluniintro>, L<perlunicode>
200
201
642fd4e @jhi Uncurliff.
jhi authored
202 =head1 AUTHORS
203
204 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
97cef9f @jhi README.ko update from Jungshik Shin.
jhi authored
205 신정식 E<lt>jshin@mailaps.orgE<gt>
642fd4e @jhi Uncurliff.
jhi authored
206
207 =cut
Something went wrong with that request. Please try again.