Guess - a character set detection library.

guess は文字コードの自動判別ライブラリである libguess-1.0 を common lisp 向けにポーティングしたものです.

LISPUSER Common Lisp と日本語と文字コードの onjo さんがポーティングしたライブラリを libguess v1.0 向けに修正し、日本語以外の文字コードの判別ができるようにしています.

Installation

quicklisp の path が通っているところにライブラリを落とす.

git clone git://github.com/zqwell/guess.git
quicklispでライブラリをロード.

(ql:quickload :guess)

Usage

サンプルコード

文字コードを変換するために事前に iconv をインストールしておきます.

(ql:quickload :iconv)

iconv関数:

(iconv:iconv 変換元の文字コード変換後の文字コード byte配列) => 変換後のbyte配列

日本語の文字コードを判別する

CL-USER> (guess:CES-GUESS-FROM-VECTOR (string-to-octets "明日は明日の風が吹く") :jp)
:UTF-8

CL-USER> (guess:CES-GUESS-FROM-VECTOR (iconv:iconv :utf-8 :iso-2022-jp (string-to-octets "明日は明日の風が吹く")) :jp)
:JIS

CL-USER> (guess:CES-GUESS-FROM-VECTOR (iconv:iconv :utf-8 :euc-jp (string-to-octets "明日は明日の風が吹く")) :jp)
:EUC-JP

CL-USER> (guess:CES-GUESS-FROM-VECTOR (iconv:iconv :utf-8 :sjis (string-to-octets "明日は明日の風が吹く")) :jp)
:SJIS

韓国語の文字コードを判別する

CL-USER> (guess:CES-GUESS-FROM-VECTOR (string-to-octets "내일은 내일 바람이 분다") :kr)
:UTF-8

CL-USER> (guess:CES-GUESS-FROM-VECTOR (iconv:iconv :utf-8 :euc-kr (string-to-octets "내일은 내일 바람이 분다")) :kr)
:EUC-KR

CL-USER> (guess:CES-GUESS-FROM-VECTOR (iconv:iconv :utf-8 :johab (string-to-octets "내일은 내일 바람이 분다")) :kr)
:JOHAB

提供関数詳細

ces-guess-from-vector vector scheme => detected-encoding

Arguments and Values:

vector---判別する文字列をbyte配列に変換したもの
scheme---識別する言語圏
日本語圏以外にも下記をサポートしています.
- :jp -- japanese
- :tw -- taiwanese
- :cn -- chinese
- :kr -- korean
- :ru -- russian
- :ar -- arabic
- :tr -- turkish
- :gr -- greek
- :hw -- hebrew
- :pl -- polish
- :bl -- baltic
detected-encoding---自動判別した文字コード

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
src		src
t		t
.gitignore		.gitignore
README.markdown		README.markdown
guess-test.asd		guess-test.asd
guess.asd		guess.asd

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Guess - a character set detection library.

Installation

Usage

サンプルコード

日本語の文字コードを判別する

韓国語の文字コードを判別する

提供関数詳細

Arguments and Values:

About

Releases

Packages

Languages

zqwell/guess

Folders and files

Latest commit

History

Repository files navigation

Guess - a character set detection library.

Installation

Usage

サンプルコード

日本語の文字コードを判別する

韓国語の文字コードを判別する

提供関数詳細

Arguments and Values:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages