-
-
Notifications
You must be signed in to change notification settings - Fork 63
Junsoo Shin edited this page Feb 9, 2019
·
6 revisions
public Komoran(DEFAULT_MODEL modelType)
- Komoran 생성자로 기본적으로 제공되는 2가지 모델 중 하나를 선택해야합니다.
- DEFAULT_MODEL
- DEFAULT_MODEL.LIGHT (Editor's pick)
- 세종코퍼스로 학습된 모델입니다.
- 일반적인 도메인에서 사용할 때 추천되는 모델입니다.
- FULL 모델에 비해서 고유명사에 대한 인식 성능이 떨어집니다.
- 고유명사는 사용자 사전에 단어 추가를 통해서 보완 가능합니다.
- DEFAULT_MODEL.FULL
- 세종코퍼스에 위키피디아의 타이틀을 고유명사로 추가하여 학습된 모델입니다.
- 고유명사가 중요하게 활용되는 도메인에서 추천되는 모델입니다.
- LIGHT 모델에 비해서 고유명사를 과인식 합니다.
- 기본적으로 제공되는 트레이닝 데이터 튜닝으로 고유명사의 과인식을 완화할 수 있습니다.
- DEFAULT_MODEL.LIGHT (Editor's pick)
public Komoran(String modelPath)
- Komoran 생성자로 학습된 모델의 path를 선택해야합니다.
- Komoran에서 제공되는 trainer를 통해 학습된 모델을 필요로 합니다. (추후 제공 예정)
public void setFWDic(String filename)
- 형태소 분석 시 기분석 사전을 적용합니다.
public void setUserDic(String userDic)
public KomoranResult analyze(String sentence)
public List<KomoranResult> analyze(List<String> sentences, int thread)
public List<String> getNouns()
public List<String> getMorphesByTags(String... str)
public List<String> getMorphesByTags(Collection<String> targetPosCollection)
public String getPlainText()
public List<Token> getTokenList()
public List<Pair<String, String>> getList()
Copyright © 2019 Shineware
- Getting started : 10 sec to KOMORAN (준비 중)
- 사용자 매뉴얼
- Analysis using Java (준비 중)
- Analysis using Spark (준비 중)
- Analysis using Terminal (준비 중)