말뭉치 기반 한글 형태소 분석기입니다.
elasticsearch, solr analyzer 지원, python 지원
Lucene : 7.4.0
Elasticsearch : 6.4.0
Rouzeta에서 사용 된 수정된 세종 코퍼스입니다.
https://ithub.korean.go.kr/user/member/memberPdsReferenceManager.do
체언 사전만 사용
[1] 신준철, 옥철영 (2012). 기분석 부분 어절 사전을 활용한 한국어 형태소 분석기. 정보과학회논문지 : 소프트웨어 및 응용, 39(5), 415-424.
[2] http://blog.mikemccandless.com/2010/12/using-finite-state-transducers-in.html
[3] https://shleekr.github.io/