### 꼬꼬마 형태소 분석기 (konlpy.tag Kkma)

In [1]:
from konlpy.tag import Kkma

#### Kkma 함수설명
- morphs<br>
    : 입력한 문장은 형태소 단위로 토크나이징. 토크나이징된 형태소들은 리스트 형태로 반환

- nouns<br>
    : 입력한 문장은 품사가 명사인 토큰만 추출
    
- pos<br>
    : 입력한 문장에서 형태소를 추출한 뒤 품사 태깅 한다. 추출된 형태소와 그 형태소의 품사가 튜플 형태로 묶여서 
      리스트로 반환
      
- sentences<br>
    : 인자로 입력한 여러 문장 분리하는 역할 해준다. 분리된 문장은 리스트 형태로 반환

In [5]:
kkma = Kkma()

text = "아버지가 방에 들어갑니다."

# 형태소 추출
morphs = kkma.morphs(text)
print(morphs)

# 형태소와 품사 태그 추출
pos = kkma.pos(text)
print(pos)

# 명사만 추출
nouns = kkma.nouns(text)
print(nouns)

# 문장 분리
sentences = "오늘 날씨는 어때요? 내일은 덥다던데."
s = kkma.sentences(sentences)
print(s)

['아버지', '가', '방', '에', '들어가', 'ㅂ니다', '.']
[('아버지', 'NNG'), ('가', 'JKS'), ('방', 'NNG'), ('에', 'JKM'), ('들어가', 'VV'), ('ㅂ니다', 'EFN'), ('.', 'SF')]
['아버지', '방']
['오늘 날씨는 어 때요?', '내일은 덥다 던데.']


#### kkma 품사 태그
NNG    일반명사<BR>
JKE    주격 조사<BR>
JKM    부사격 조사<BR>
VV     동사<BR>
EFN    평서형 종결 어미<BR>
SF     마침표, 물음표, 느낌표<BR>

### 코모란 형태소 분석기 (Komoran)

In [6]:
from konlpy.tag import Komoran

In [8]:
komoran = Komoran()

text = "아버지가 방에 들어갑니다."

# 형태소 추출
morphs = komoran.morphs(text)
print(morphs)

# 형태소와 품사 태그 추출
pos = komoran.pos(text)
print(pos)

# 명사만 추출
nouns = komoran.nouns(text)
print(nouns)

['아버지', '가', '방', '에', '들어가', 'ㅂ니다', '.']
[('아버지', 'NNG'), ('가', 'JKS'), ('방', 'NNG'), ('에', 'JKB'), ('들어가', 'VV'), ('ㅂ니다', 'EF'), ('.', 'SF')]
['아버지', '방']


#### Komoran 품사 태그
NNG    일반명사<BR>
JKS    주격 조사<BR>
JKB    부사격 조사<BR>
VV     동사<BR>
EF     종결 어미<BR>
SF     마침표, 물음표, 느낌표<BR>

### Okt 형태소 분석기

In [9]:
from konlpy.tag import Okt

In [10]:
okt = Okt()

text = "아버지가 방에 들어갑니다."

# 형태소 추출
morphs = okt.morphs(text)
print(morphs)

# 형태소와 품사 태그 추출
pos = okt.pos(text)
print(pos)

# 명사만 추출
nouns = okt.nouns(text)
print(pos)

# 정규화, 어구 추출
text = "오늘, 날씨가 좋아요ㅋㅋ"
print(okt.normalize(text))
print(okt.phrases(text))

['아버지', '가', '방', '에', '들어갑니다', '.']
[('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어갑니다', 'Verb'), ('.', 'Punctuation')]
[('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어갑니다', 'Verb'), ('.', 'Punctuation')]
오늘, 날씨가 좋아요ㅋㅋ
['오늘', '날씨']


#### Komoran 품사 태그
Noun    명사<br>
Josa    조사<br>
Verb    동사<br>
Adjective    형용사<br>
Punctuation    구두점<br>

### 미등록 단어 형태소 분석

In [11]:
from konlpy.tag import Komoran

komoran = Komoran()
text = "우리 챗봇은 엔엘피를 좋아해."
pos = komoran.pos(text)
print(pos)

[('우리', 'NP'), ('챗봇은', 'NA'), ('엔', 'NNB'), ('엘', 'NNP'), ('피', 'NNG'), ('를', 'JKO'), ('좋아하', 'VV'), ('아', 'EF'), ('.', 'SF')]


### 사용자 단어 형태소 분석

In [12]:
from konlpy.tag import Komoran

komoran = Komoran(userdic='./user_dic.tsv')
text = "우리 챗봇은 엔엘피를 좋아해."
pos = komoran.pos(text)
print(pos)

[('우리', 'NP'), ('챗봇은', 'NA'), ('엔엘피', 'NNG'), ('를', 'JKO'), ('좋아하', 'VV'), ('아', 'EF'), ('.', 'SF')]
