Skip to content
Junghwan Park edited this page Feb 26, 2019 · 3 revisions

DEFAULT_MODEL.LIGHTDEFAULT_MODEL.FULL의 차이가 무엇인가요?

  • LIGHT 모델(DEFAULT_MODEL.LIGHT)은 일반적으로 사용되는 문장들을 학습한 모델로 다양한 분야에서 사용하실 수 있는 기본 모델입니다.
  • FULL 모델(DEFAULT_MODEL.FULL)은 LIGHT 모델에 위키피디아의 타이틀을 NNP(고유명사)로 포함해서 학습한 것이며 그러므로 LIGHT 모델보다 상대적으로 용량이 큽니다.
  • 형태소 분석기의 결과가 그대로 서비스에 노출되는 어플리케이션이 아니라면 LIGHT 모델을 권장해 드립니다.

setFWDDicsetUserDic은 무엇인가요?

  • setFWDDic은 파일 형태의 기분석 사전을 형태소 분석기에 적재하는 메소드입니다. 기분석 사전은 일종의 cache입니다. 어절 단위로 기분석 사전을 lookup하여 값이 있는 경우에만 형태소 분석 단계를 거치지 않고 lookup 된 값이 그대로 분석 결과에 반영됩니다.
  • setUserDic은 사용자 사전을 형태소 분석기에 적재하는 메소드입니다. 사용자 사전에 포함된 형태소들은 형태소 분석 단계에서 가장 높은 우선순위가 부여됩니다. 사용자 사전에 포함된 형태소가 분석 대상 문장 내에서 문법적인 위치만 일치한다면 사용자가 지정한 품사로 분석됩니다. 사이드 이펙트가 발생할 수 있으니 주의하여 사용하셔야 합니다.

Documentation

References

Examples

  • Analysis using Java (준비 중)
  • Analysis using Spark (준비 중)
  • Analysis using Terminal (준비 중)
Clone this wiki locally