## 품사달기
- https://konlpy.org/ko/stable/api/konlpy.tag/

In [38]:
sentence_list = ['아버지가방에들어가신다'
                ,'나는 밥을 먹는다.'
                , '하늘을 나는 자동차'
                , '아이폰 기다리다 지쳐 애플공홈에서 언락폰질러버렸다 6+ 128기가실버ㅋ' ]

'''
설명:
    분석할 예제 문장을 리스트로 저장합니다.
    문장들은 간단한 표현부터 긴 비격식적 표현까지 다양합니다.
'''

### Okt

In [39]:
from konlpy.tag import Okt
okt = Okt()

'''
2.1 Okt 객체 생성

Okt란?
    Open Korean Text의 약자로, 한글 형태소 분석기입니다.
    형태소 분석, 품사 태깅, 명사 추출 등의 기능을 제공합니다.
'''

In [40]:
pos_list = okt.morphs(sentence_list[0])
pos_list

'''
2.2 형태소 분석

설명:
    morphs() 메서드는 문장을 형태소 단위로 나눕니다.
    예: ['아버지', '가', '방', '에', '들어가신다']
'''

['아버지', '가방', '에', '들어가신다']

In [41]:
# 품사 확인
okt.pos(sentence_list[0])
# pos_tag_list = okt.pos(sentence_list[1])
# pos_tag_list

'''
2.3 품사 태깅

설명:
    pos() 메서드는 형태소를 추출하면서 동시에 품사 태깅을 수행합니다.
    예: [('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어가신다', 'Verb')]
    각 단어에 대해 어떤 품사인지 함께 표시됩니다.
'''

[('아버지', 'Noun'), ('가방', 'Noun'), ('에', 'Josa'), ('들어가신다', 'Verb')]

In [42]:
# 품사 원형 복원
okt.pos(sentence_list[0], stem = True)

'''
2.4 품사 원형 복원

설명:
    stem=True 옵션을 사용하면, 동사와 형용사의 어간(기본형)을 복원합니다.
    예: [('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어가다', 'Verb')]
    기본형 복원은 언어 분석에 유용합니다.
'''

[('아버지', 'Noun'), ('가방', 'Noun'), ('에', 'Josa'), ('들어가다', 'Verb')]

In [43]:
# 명사만 모임
okt.nouns(sentence_list[3])

'''
2.5 명사 추출

설명:
    nouns() 메서드는 문장에서 명사만 추출합니다.
    예: ['아이폰', '기다리다', '지쳐', '애플', '공홈', '언락', '폰질러버렸다', '128', '기가', '실버']
'''

['아이폰', '애플', '공홈', '락폰', '기', '실버']

In [44]:
# 명사외에 특정 품사 모임 만들기
sentences = ' '.join(sentence_list)
len(sentences)
# sentence_pos = okt.pos(sentences)
sentence_pos = okt.pos(sentences, stem = True)

# verb_list = []
# for word, pos in sentence_pos :
#     if pos == 'Verb':
#         verb_list.append(word)
#     pass

verb_list = [word for word, pos in sentence_pos if pos == 'Verb']
verb_list

'''
2.6 특정 품사만 추출

설명:
    문장들을 하나로 합칩니다.
    pos()로 품사를 태깅합니다.  
    반복문을 사용해 태깅된 품사 중에서 동사(Verb)만 추출합니다.
    예: ['들어가다', '먹다', '나다', '기다리다', '지치다', '질르다']
'''

['들어가다', '먹다', '기다리다', '지치다', '지르다', '버리다']

### Mecab

In [45]:
from mecab import MeCab
mecab = MeCab()

'''
Mecab이란?
    한글에 특화된 형태소 분석기로, 속도가 빠르고 정확도가 높습니다.
    Mecab은 Konlpy 라이브러리를 통해 사용할 수 있습니다.
'''

In [46]:
mecab.morphs(sentence_list[0])

'''
3.2 형태소 분석
morphs() 메서드는 문장을 형태소 단위로 나눕니다.
예: ['아버지', '가', '방', '에', '들어가', '신다']
'''

['아버지', '가', '방', '에', '들어가', '신다']

In [47]:
# mecab.pos(sentence_list[0])
mecab.pos(sentence_list[1])

'''
3.3 품사 태깅
    pos() 메서드는 형태소를 추출하면서 품사 태깅을 수행합니다.
    예: [('나', 'NP'), ('는', 'JX'), ('밥', 'NNG'), ('을', 'JKO'), ('먹', 'VV'), ('는다', 'EF'), ('.', 'SF')]
'''

[('나', 'NP'),
 ('는', 'JX'),
 ('밥', 'NNG'),
 ('을', 'JKO'),
 ('먹', 'VV'),
 ('는다', 'EF'),
 ('.', 'SF')]

In [48]:
mecab.nouns(sentence_list[3])
'''
3.4 명사 추출
설명:
    nouns() 메서드는 문장에서 명사만 추출합니다.
    예: ['아이폰', '애플', '공홈', '언락', '폰', '128', '기가', '실버']
'''

['아이폰', '애플', '공홈', '언락', '폰', '기', '실버']