### 한국어 형태소 분석
- konlpy 패키지 활용
    - 내부에 5가지 형태소 분석 패티지 포함
    - 5가지 형태소 분석기 사용법 동일, 쉬움 (ex) sklearn

In [2]:
from konlpy.tag import *

- 다양한 형태소 분석기
---

In [21]:
text = """
누구와 먹고 살지?
 - 나랑 먹고 살지
누구의 손을 잡지?
 - 나랑 손을 잡지

지금은 아니되오.
아직은 할 수 없어.
 - 어서 내 손을 잡아.
 
 - 함께 가자
 - 혼인하자
"""

In [22]:
# 한나눔 형태소 분석기
han = Hannanum()

In [28]:
# 형태소 분석
print(han.morphs(text))

# 명사 추출
print(han.nouns(text))

# 품사 태깅
print(han.pos(text))

['누구', '와', '먹', '고', '살', '지', '?', '-', '나', '랑', '먹', '고', '살', '지', '누구', '의', '손', '을', '잡', '지', '?', '-', '나', '랑', '손', '을', '잡지', '지금', '은', '아니되', '오', '.', '아직', '은', '하', 'ㄹ', '수', '없', '어', '.', '-', '어서', '내', '어', '손', '을', '잡', '어', '.', '-', '함께', '가', '자', '-', '혼인하자']
['누구', '나', '누구', '손', '나', '손', '잡지', '지금', '수', '손', '혼인하자']
[('누구', 'N'), ('와', 'J'), ('먹', 'P'), ('고', 'E'), ('살', 'P'), ('지', 'E'), ('?', 'S'), ('-', 'S'), ('나', 'N'), ('랑', 'J'), ('먹', 'P'), ('고', 'E'), ('살', 'P'), ('지', 'E'), ('누구', 'N'), ('의', 'J'), ('손', 'N'), ('을', 'J'), ('잡', 'P'), ('지', 'E'), ('?', 'S'), ('-', 'S'), ('나', 'N'), ('랑', 'J'), ('손', 'N'), ('을', 'J'), ('잡지', 'N'), ('지금', 'N'), ('은', 'J'), ('아니되', 'P'), ('오', 'E'), ('.', 'S'), ('아직', 'M'), ('은', 'J'), ('하', 'P'), ('ㄹ', 'E'), ('수', 'N'), ('없', 'P'), ('어', 'E'), ('.', 'S'), ('-', 'S'), ('어서', 'M'), ('내', 'P'), ('어', 'E'), ('손', 'N'), ('을', 'J'), ('잡', 'P'), ('어', 'E'), ('.', 'S'), ('-', 'S'), ('함께', 'M'), ('가', 'P'), ('자', 'E'), ('-

In [26]:
# 꼬꼬마 형태소 분석기
kkma = Kkma()

In [27]:
# 형태소 분석
print(kkma.morphs(text))

# 명사만 추출
print(kkma.nouns(text))

# 품사 태깅
print(kkma.pos(text))

['누구', '와', '먹', '고', '살', 'ㄹ지', '?', '-', '나랑', '먹', '고', '살', 'ㄹ지', '누구', '의', '손', '을', '잡', '지', '?', '-', '나랑', '손', '을', '잡', '지', '지금', '은', '알', '니', '되', '오', '.', '아직', '은', '하', 'ㄹ', '수', '없', '어', '.', '-', '어', '어서', '내', '손', '을', '잡', '아', '.', '-', '함께', '가자', '-', '혼인', '하', '자']
['누구', '손', '지금', '수', '내', '가자', '혼인']
[('누구', 'NP'), ('와', 'JKM'), ('먹', 'VV'), ('고', 'ECE'), ('살', 'VV'), ('ㄹ지', 'ECD'), ('?', 'SF'), ('-', 'SW'), ('나랑', 'MAG'), ('먹', 'VV'), ('고', 'ECE'), ('살', 'VV'), ('ㄹ지', 'ECD'), ('누구', 'NP'), ('의', 'JKG'), ('손', 'NNG'), ('을', 'JKO'), ('잡', 'VV'), ('지', 'ECD'), ('?', 'SF'), ('-', 'SW'), ('나랑', 'MAG'), ('손', 'NNG'), ('을', 'JKO'), ('잡', 'VV'), ('지', 'ECD'), ('지금', 'NNG'), ('은', 'JX'), ('알', 'VV'), ('니', 'ECD'), ('되', 'VV'), ('오', 'EFN'), ('.', 'SF'), ('아직', 'MAG'), ('은', 'JX'), ('하', 'VV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('없', 'VA'), ('어', 'ECD'), ('.', 'SF'), ('-', 'SW'), ('어', 'VV'), ('어서', 'ECD'), ('내', 'NP'), ('손', 'NNG'), ('을', 'JKO'), ('잡', 'VV'), ('아'

In [29]:
# 코모란 형태소 분석기
komo = Komoran()    # java 가 없다는 예외가 뜸

In [36]:
# # 형태소 분석
# print(komo.morphs(text))

# # 명사만 추출
# print(komo.nouns(text))

# # 품사 태깅
# print(komo.pos(text))

In [33]:
# Okt 형태소 분석기
okt = Okt()

In [34]:
# 형태소 분석
print(okt.morphs(text))

# 명사 추출
print(okt.nouns(text))

# 품사 태깅
print(okt.pos(text))

['\n', '누구', '와', '먹고', '살', '지', '?', '\n ', '-', '나', '랑', '먹고', '살', '지', '\n', '누구', '의', '손', '을', '잡지', '?', '\n ', '-', '나', '랑', '손', '을', '잡지', '\n\n', '지금', '은', '아니되', '오', '.', '\n', '아직', '은', '할', '수', '없어', '.', '\n ', '-', '어서', '내', '손', '을', '잡아', '.', '\n \n ', '-', '함께', '가자', '\n ', '-', '혼인', '하자', '\n']
['누구', '살', '나', '살', '누구', '손', '잡지', '나', '손', '잡지', '지금', '오', '은', '수', '어서', '내', '손', '혼인']
[('\n', 'Foreign'), ('누구', 'Noun'), ('와', 'Josa'), ('먹고', 'Verb'), ('살', 'Noun'), ('지', 'Josa'), ('?', 'Punctuation'), ('\n ', 'Foreign'), ('-', 'Punctuation'), ('나', 'Noun'), ('랑', 'Josa'), ('먹고', 'Verb'), ('살', 'Noun'), ('지', 'Josa'), ('\n', 'Foreign'), ('누구', 'Noun'), ('의', 'Josa'), ('손', 'Noun'), ('을', 'Josa'), ('잡지', 'Noun'), ('?', 'Punctuation'), ('\n ', 'Foreign'), ('-', 'Punctuation'), ('나', 'Noun'), ('랑', 'Josa'), ('손', 'Noun'), ('을', 'Josa'), ('잡지', 'Noun'), ('\n\n', 'Foreign'), ('지금', 'Noun'), ('은', 'Josa'), ('아니되', 'Adjective'), ('오', 'Noun'), ('.', 'Punct