# 꼬꼬마 형태소 분석기 사용

In [9]:
from konlpy.tag import Kkma

In [10]:
# 꼬꼬마 형태소 분석기 객체 생성
kkma = Kkma()
text = "아버지가 방에 들어갑니다."

In [11]:
# 형태소 추출
morphs = kkma.morphs(text)
print(text)

아버지가 방에 들어갑니다.


In [12]:
# 형태소와 품사 태그 추출
pos = kkma.pos(text)
print(text)

아버지가 방에 들어갑니다.


In [14]:
# 명사만 추출
nouns = kkma.nouns(text)
print(nouns)

['아버지', '방']


In [15]:
# 문장 분리
sentences = "오늘 날씨는 어떄요? 내일은 덥다던데."
s = kkma.sentences(sentences)
print(s)

['오늘 날씨는 어 떄요?', '내일은 덥다 던데.']


# Komoran 형태소 분석기 사용

In [16]:
from konlpy.tag import Komoran

In [17]:
# 코모란 형태소 분석기 객체 생성
komoran = Komoran()
text = "아버지가 방에 들어갑니다."

In [18]:
# 형태소 추출
morphs = komoran.morphs(text)
print(morphs)

['아버지', '가', '방', '에', '들어가', 'ㅂ니다', '.']


In [19]:
# 형태소와 품사 태그 추출
pos = komoran.pos(text)
print(pos)

[('아버지', 'NNG'), ('가', 'JKS'), ('방', 'NNG'), ('에', 'JKB'), ('들어가', 'VV'), ('ㅂ니다', 'EF'), ('.', 'SF')]


In [20]:
# 명사만 추출
nouns = komoran.nouns(text)
print(nouns)

['아버지', '방']


# Okt 형태소 분석기 사용

In [1]:
from konlpy.tag import Okt

In [2]:
# Okt 형태소 분석기 객체 생성
okt = Okt()
text = "아버지가 방에 들어갑니다."

In [3]:
# 형태소 추출
morphs = okt.morphs(text)
print(morphs)

['아버지', '가', '방', '에', '들어갑니다', '.']


In [4]:
# 형태소와 품사 태그 추출
pos = okt.pos(text)
print(text)

아버지가 방에 들어갑니다.


In [5]:
# 명사만 추출
nouns = okt.nouns(text)
print(text)

아버지가 방에 들어갑니다.


In [6]:
# 정규화, 어구 추출
text = "오늘 날씨가 좋아욬ㅋㅋ"
print(okt.normalize(text))
print(okt.phrases(text))

오늘 날씨가 좋아요ㅋㅋ
['오늘', '오늘 날씨', '좋아욬', '날씨']


# 미등록 단어 형태소 분석

In [7]:
from konlpy.tag import Komoran

komoran = Komoran()
text = "우리 챗봇은 엔엘피를 좋아해."
pos = komoran.pos(text)
print(pos)

[('우리', 'NP'), ('챗봇은', 'NA'), ('엔', 'NNB'), ('엘', 'NNP'), ('피', 'NNG'), ('를', 'JKO'), ('좋아하', 'VV'), ('아', 'EF'), ('.', 'SF')]


# 사용자 단어 사전 형태소 분석

In [8]:
from konlpy.tag import Komoran
komoran = Komoran(userdic='./user_dic.tsv')
text = "우리 챗봇은 엔엘피를 좋아해."
pos = komoran.pos(text)
print(pos)

[('우리', 'NP'), ('챗봇은', 'NA'), ('엔', 'NNB'), ('엘', 'NNP'), ('피', 'NNG'), ('를', 'JKO'), ('좋아하', 'VV'), ('아', 'EF'), ('.', 'SF')]


In [36]:
from konlpy.tag import Komoran

#komoran = Komoran(userdic='./user_dic.tsv')
komoran = Komoran(userdic='./Chatbot/data/user2.dic')
#text = "우리 챗봇은 엔엘피를 좋아해."x
text = "우리 챗봇은 엔와이피를 뉴진스를 좋아해."
pos = komoran.pos(text)
print(pos)

[('우리', 'NP'), ('챗봇은', 'NA'), ('엔', 'NNB'), ('와이', 'NNP'), ('피', 'NNG'), ('를', 'JKO'), ('뉴진스를', 'NA'), ('좋아하', 'VV'), ('아', 'EF'), ('.', 'SF')]


In [37]:
from konlpy.tag import Komoran

#komoran = Komoran(userdic='./user_dic.tsv')
komoran = Komoran(userdic='./Chatbot/data/tt.dic')
#text = "우리 챗봇은 엔엘피를 좋아해."
text = "들국화와 산울림 중 최고의 그룹은 누구일까"
text1 = "들국화는 국화꽃과 다를까?"
pos = komoran.pos(text)
pos1 = komoran.pos(text1)
print(pos)
print(pos1)

[('들국화', 'NNP'), ('와', 'JC'), ('산울림', 'NNP'), ('중', 'NNB'), ('최고', 'NNG'), ('의', 'JKG'), ('그룹', 'NNG'), ('은', 'JX'), ('누구', 'NP'), ('이', 'VCP'), ('ㄹ까', 'EC')]
[('들국화', 'NNP'), ('는', 'JX'), ('국화꽃', 'NNG'), ('과', 'JC'), ('다르', 'VA'), ('ㄹ까', 'EF'), ('?', 'SF')]
