In [64]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [65]:
from konlpy.tag import Kkma, Komoran, Hannanum, Okt

In [66]:
kkma = Kkma()
kom = Komoran()
han = Hannanum()
okt = Okt()

In [51]:
text = '아버지가 방에 들어가신다'

In [6]:
kkma.morphs(text)

['아버지', '가', '방', '에', '들어가', '시', 'ㄴ다']

In [9]:
kom.morphs(text)

['아버지', '가', '방', '에', '들어가', '시', 'ㄴ다']

In [10]:
han.morphs(text)

['아버지', '가', '방', '에', '들', '어', '가', '시ㄴ다']

In [11]:
okt.morphs(text)

['아버지', '가', '방', '에', '들어가신다']

In [12]:
text = '아버지가방에들어가신다'

In [13]:
print(kkma.morphs(text))
print(kom.morphs(text))
print(han.morphs(text))
print(okt.morphs(text))

['아버지', '가방', '에', '들어가', '시', 'ㄴ다']
['아버지', '가방', '에', '들어가', '시', 'ㄴ다']
['아버지가방에들어가', '이', '시ㄴ다']
['아버지', '가방', '에', '들어가신다']


In [15]:
text = '개나리가 피러있는 동산에 누워있고 싶다'

print(kkma.nouns(text))
print(kom.nouns(text))
print(han.nouns(text))
print(okt.nouns(text))

['개나리', '동산']
['개나리', '동산']
['개나리', '피러있', '동산']
['개나리', '동산']


In [16]:
print(kkma.morphs(text))
print(kom.morphs(text))
print(han.morphs(text))
print(okt.morphs(text))

['개나리', '가', '피', '러', '있', '는', '동산', '에', '눕', '어', '있', '고', '싶', '다']
['개나리', '가', '피', '러', '있', '는', '동산', '에', '눕', '어', '있', '고', '싶', '다']
['개나리', '가', '피러있', '는', '동산', '에', '눕', '어', '있', '고', '싶', '다']
['개나리', '가', '피러', '있는', '동산', '에', '누워있고', '싶다']


In [17]:
text = '개나리가피어있는동산에누워잇고싶다'

print(kkma.nouns(text))
print(kom.nouns(text))
print(han.nouns(text))
print(okt.nouns(text))

['동산', '개나리']
['개나리', '동산']
['개나리가피어있는동산에누워잇고싶다']
['개나리', '동산']


In [18]:
print(kkma.morphs(text))
print(kom.morphs(text))
print(han.morphs(text))
print(okt.morphs(text))

['개나리', '가', '피', '어', '있', '는', '동산', '에', '눕', '어', '잇', '고', '싶', '다']
['개나리', '가', '피', '어', '있', '는', '동산', '에', '눕', '어', '잇', '고', '싶', '다']
['개나리가피어있는동산에누워잇고싶다']
['개나리', '가', '피어있는', '동산', '에', '누워', '잇고싶다']


In [19]:
text = 'ㄱㅐㄴㅏㄹㅣ가피어있는동산에누워있고싶다'

print(kkma.morphs(text))
print(kom.morphs(text))
print(han.morphs(text))
print(okt.morphs(text))

['ㄱ', 'ㅐ', 'ㄴ', 'ㅏ', 'ㄹ', 'ㅣ', '가피', '어', '어', '있', '는', '동산', '에', '눕', '어', '있', '고', '싶', '다']
['개나리', '가', '피', '어', '있', '는', '동산', '에', '눕', '어', '있', '고', '싶', '다']
['ㄱㅐㄴㅏㄹㅣ가피어있는동산에누워있고싶다']
['ㄱㅐㄴㅏㄹㅣ', '가', '피어있는', '동산', '에', '누워있고싶다']


In [None]:
text = """
대통령직인수위원회가 7일 정부조직 개편을 새 정부 출범 이후 진행하겠다는 뜻을 밝혔다. 이에 따라 인수위는 현행 정부조직 체계에 기반해 조각을 추진한다. 여성가족부 장관 후보자도 우선 지명한다.
안철수 인수위원장은 이날 서울 종로구 통의동 인수위원회에서 기자회견을 열고 “정부조직개편 문제는 인수위 기간 중 조급하게 결정해 추진하기보다는, 최근 국내외 경제 문제, 그리고 외교안보의 엄중한 상황을 고려해 민생 안정과 외교안보 등 당면한 국정현안 집중이 바람직하다고 판단했다”고 말했다.
안 위원장은 “따라서 조각도 현행 정부조직체계 기반해서 추진하기로 결정했다”고 말했다. 안 위원장은 “정부조직개편은 야당은 물론 각계 각층의 다양한 견해가 있을 수 있어, 새 정부는 시급한 민생현안을 최우선으로 챙기며 국정 운영 경험을 바탕으로 공청회 등으로 다양한 의견을 수렴하겠다”고 말했다.
안 위원장은 여성가족부 폐지에 대해 “여가부 장관도 조각에서 발표할 예정”이라고 말했다.
"""

In [26]:
%%time
kkma.pos(text)

Wall time: 65.8 ms


[('ㄱ', 'NNG'),
 ('ㅐ', 'UN'),
 ('ㄴ', 'JX'),
 ('ㅏ', 'UN'),
 ('ㄹ', 'JKO'),
 ('ㅣ', 'UN'),
 ('가피', 'NNG'),
 ('어', 'VV'),
 ('어', 'ECS'),
 ('있', 'VXV'),
 ('는', 'ETD'),
 ('동산', 'NNG'),
 ('에', 'JKM'),
 ('눕', 'VV'),
 ('어', 'ECS'),
 ('있', 'VV'),
 ('고', 'ECE'),
 ('싶', 'VXA'),
 ('다', 'EFN')]

In [27]:
%%time
kom.pos(text)

Wall time: 997 µs


[('개나리', 'NNP'),
 ('가', 'JKS'),
 ('피', 'VV'),
 ('어', 'EC'),
 ('있', 'VX'),
 ('는', 'ETM'),
 ('동산', 'NNP'),
 ('에', 'JKB'),
 ('눕', 'VV'),
 ('어', 'EC'),
 ('있', 'VX'),
 ('고', 'EC'),
 ('싶', 'VX'),
 ('다', 'EC')]

In [28]:
%%time
han.pos(text)

Wall time: 7.98 ms


[('ㄱㅐㄴㅏㄹㅣ가피어있는동산에누워있고싶다', 'N')]

In [29]:
okt.pos(text)

[('ㄱㅐㄴㅏㄹㅣ', 'KoreanParticle'),
 ('가', 'Verb'),
 ('피어있는', 'Verb'),
 ('동산', 'Noun'),
 ('에', 'Josa'),
 ('누워있고싶다', 'Verb')]

In [30]:
# Mecab

In [57]:
import MeCab
mecab = MeCab.Tagger()
out = mecab.parse("오늘은 맑은 날씨이다.")
print(out)

ModuleNotFoundError: No module named '_MeCab'