Skip to content
Junsoo Shin edited this page Feb 9, 2019 · 6 revisions

Core API

public Komoran(DEFAULT_MODEL modelType)

  • Komoran 생성자로 기본적으로 제공되는 2가지 모델 중 하나를 선택해야합니다.
  • DEFAULT_MODEL
    • DEFAULT_MODEL.LIGHT (Editor's pick)
      • 세종코퍼스로 학습된 모델입니다.
      • 일반적인 도메인에서 사용할 때 추천되는 모델입니다.
      • FULL 모델에 비해서 고유명사에 대한 인식 성능이 떨어집니다.
      • 고유명사는 사용자 사전에 단어 추가를 통해서 보완 가능합니다.
    • DEFAULT_MODEL.FULL
      • 세종코퍼스에 위키피디아의 타이틀을 고유명사로 추가하여 학습된 모델입니다.
      • 고유명사가 중요하게 활용되는 도메인에서 추천되는 모델입니다.
      • LIGHT 모델에 비해서 고유명사를 과인식 합니다.
      • 기본적으로 제공되는 트레이닝 데이터 튜닝으로 고유명사의 과인식을 완화할 수 있습니다.

public Komoran(String modelPath)

  • Komoran 생성자로 학습된 모델의 path를 선택해야합니다.
  • Komoran에서 제공되는 trainer를 통해 학습된 모델을 필요로 합니다. (추후 제공 예정)

public void setFWDic(String filename)

  • 형태소 분석 시 기분석 사전을 적용합니다.

public void setUserDic(String userDic)

public KomoranResult analyze(String sentence)

public List<KomoranResult> analyze(List<String> sentences, int thread)

KomoranResult API

public List<String> getNouns()

public List<String> getMorphesByTags(String... str)

public List<String> getMorphesByTags(Collection<String> targetPosCollection)

public String getPlainText()

public List<Token> getTokenList()

public List<Pair<String, String>> getList()

Documentation

References

Examples

  • Analysis using Java (준비 중)
  • Analysis using Spark (준비 중)
  • Analysis using Terminal (준비 중)
Clone this wiki locally