#### 한국어 형태소 분석
- konlpy 패키지 활동
    - 내부에 5가지 형태소 분석 패키지 포함
    - 5가지 형태소 분석기 사용법 동일, 쉬움

[1] 모듈 로딩 <hr>


In [1]:
from konlpy.tag import *

[2] 다양한 형태소 분석기 활용 <hr>

In [2]:
### 한나눔 형태소 분석기
han = Hannanum()

text = '크리스마스가 이제 2달 남았군. 오늘 날씨가 화창하니 너무 좋다!'
text1 = '아버지가방에들어가신다'

In [3]:
### 형태소 분리
result = han.morphs(text)
result1 = han.morphs(text1)

print(result)
print(result1)

['크리스마스', '가', '이제', '2달', '남', '아군', '.', '오늘', '날씨', '가', '화창', '하', '니', '너무', '좋', '다', '!']
['아버지가방에들어가', '이', '시ㄴ다']


In [4]:
### 명사만 추출
result = han. nouns(text)

print(result)

['크리스마스', '2달', '오늘', '날씨', '화창']


In [5]:
### 품사태깅 추출 분리 ==> 형태소 분리 후 품사 태깅 처리
result = han.pos(text)

print(result)

[('크리스마스', 'N'), ('가', 'J'), ('이제', 'M'), ('2달', 'N'), ('남', 'P'), ('아군', 'E'), ('.', 'S'), ('오늘', 'N'), ('날씨', 'N'), ('가', 'J'), ('화창', 'N'), ('하', 'X'), ('니', 'E'), ('너무', 'M'), ('좋', 'P'), ('다', 'E'), ('!', 'S')]


- - -

In [6]:
### 꼬꼬마 형태소 분석기
kkma = Kkma()

In [7]:
### 형태소 분석
print(kkma.morphs(text))
print(kkma.morphs(text1))

['크리스마스', '가', '이제', '2', '달', '남', '았', '군', '.', '오늘', '날씨', '가', '화창', '하', '니', '너무', '좋', '다', '!']
['아버지', '가방', '에', '들어가', '시', 'ㄴ다']


In [8]:
### 명사만 추출
print(kkma.nouns(text))

['크리스마스', '이제', '2', '2달', '달', '오늘', '날씨']


In [9]:
### 품사태깅 후 분리
print(kkma.pos(text))

[('크리스마스', 'NNG'), ('가', 'JKS'), ('이제', 'NNG'), ('2', 'NR'), ('달', 'NNG'), ('남', 'VV'), ('았', 'EPT'), ('군', 'EFI'), ('.', 'SF'), ('오늘', 'NNG'), ('날씨', 'NNG'), ('가', 'JKS'), ('화창', 'XR'), ('하', 'XSA'), ('니', 'ECD'), ('너무', 'MAG'), ('좋', 'VA'), ('다', 'EFN'), ('!', 'SF')]


- 각자 사용하는 단어 박스도 다르고 학습방법도 다르고 나눈 방법도 다르다

- - -

In [10]:
#### 코모한 형태소 분석기
komo= Komoran()

In [11]:
### 형태소 분석
print(komo.morphs(text))
print(komo.morphs(text1))

['크리스마스', '가', '이제', '2', '달', '남', '았', '군', '.', '오늘', '날씨', '가', '화창', '하', '니', '너무', '좋', '다', '!']
['아버지', '가방', '에', '들어가', '시', 'ㄴ다']


In [12]:
### 명사만 추출
print(komo.nouns(text))

['크리스마스', '달', '오늘', '날씨']


In [13]:
### 품사태깅 후 분리
print(komo.pos(text))

[('크리스마스', 'NNP'), ('가', 'JKS'), ('이제', 'MAG'), ('2', 'SN'), ('달', 'NNG'), ('남', 'VV'), ('았', 'EP'), ('군', 'EF'), ('.', 'SF'), ('오늘', 'NNG'), ('날씨', 'NNG'), ('가', 'JKS'), ('화창', 'XR'), ('하', 'XSA'), ('니', 'EC'), ('너무', 'MAG'), ('좋', 'VA'), ('다', 'EF'), ('!', 'SF')]


- - -

In [14]:
#### OKT 형태소 분석기
okt = Okt()

In [15]:
print(okt.morphs(text))
print(okt.nouns(text))
print(okt.pos(text))

['크리스마스', '가', '이제', '2', '달', '남았군', '.', '오늘', '날씨', '가', '화창하니', '너무', '좋다', '!']
['크리스마스', '이제', '달', '오늘', '날씨']
[('크리스마스', 'Noun'), ('가', 'Josa'), ('이제', 'Noun'), ('2', 'Number'), ('달', 'Noun'), ('남았군', 'Verb'), ('.', 'Punctuation'), ('오늘', 'Noun'), ('날씨', 'Noun'), ('가', 'Josa'), ('화창하니', 'Adjective'), ('너무', 'Adverb'), ('좋다', 'Adjective'), ('!', 'Punctuation')]


In [16]:
#### Mecab 형태소 분석기 ==> 이제 윈도우 운영체제에는 지원X 

In [19]:
def testset(moduel, text):    
    print(moduel.morphs(text))
    print(moduel.nouns(text))
    print(moduel.pos(text))

In [18]:
testset(okt,text)

['크리스마스', '가', '이제', '2', '달', '남았군', '.', '오늘', '날씨', '가', '화창하니', '너무', '좋다', '!']
['크리스마스', '이제', '달', '오늘', '날씨']
[('크리스마스', 'Noun'), ('가', 'Josa'), ('이제', 'Noun'), ('2', 'Number'), ('달', 'Noun'), ('남았군', 'Verb'), ('.', 'Punctuation'), ('오늘', 'Noun'), ('날씨', 'Noun'), ('가', 'Josa'), ('화창하니', 'Adjective'), ('너무', 'Adverb'), ('좋다', 'Adjective'), ('!', 'Punctuation')]
