---
# 📁 Hyun's Code collection (KoNLPy) 
---

### <h3 align="right">🥇 Authored by <strong>Hyun</strong></h3>

# ✏️  What is **KoNLPy**?

- KoNLP는 형태소를 분석하고 품사를 태깅해주는 라이브러리다.
- 형태소를 비롯해 다양한 언어적 속성의 구조를 파악하고 형태소의 뜻과 문맥을 고려하여 그것에 마크업을 해준다.
- [KoNLPy Homepage](https://konlpy-ko.readthedocs.io/ko/v0.5.1/#)
- [How to install KoNLPy](https://konlpy-ko.readthedocs.io/ko/v0.5.1/install/)
- [Korean descriptive tags Comparison table](https://docs.google.com/spreadsheets/d1OGAjUvalBuX-oZvZ_-9tEfYD2gQe7hTGsgUpiiBSXI8/edit#gid=0)

<h3> KoNLPy의 내장된 분석기 종류 </h3>

1. Hannanum
2. Kkma
3. Okt (Twitter)
4. Komoran
5. Mecab (Mac에서만 지원해줌)

- 분석기마다 로딩시간과 실행시간이 다르다.
- 동일한 문장이라도 분석기에 따라 품사 태깅하는 결과가 다르다.
- KoNLPy의 분석기 중에서 사용할 것을 불러와서 인스턴스로 만들어준다.

# ✏️ Import Libraries

In [None]:
import konlpy
from konlpy.tag import Okt
from konlpy.tag import Mecab

# ✏️ Methods and Examples

- **konlpy .tag .Kkma ( )**
- **konlpy .tag .Okt ( )**
- **konlpy .tag .Hannanum ( )**
- **konlpy .tag .Komoran ( )**


- **.morphs ( phrase )**: phrase의 형태소를 분석하기
- **.pos ( phrase , norm = False , stem = False )**: phrase의 단어를 품사에 태깅하기
  - norm: True로 설정하면 오류나 실수를 수정한다. e.g 사릉해 -> 사랑해
  - stem: True로 설정하면 어근화시켜서 단어의 기본형으로 변환한다. e.g 되나요 -> 되다
- **.nouns( phrase )**: phrase의 형태소 중에서 명사만 추출
- **.phrases ( phrase )**: phrase에서 phrase를 추출

### 📔 Examples (Constitution of Korea)

In [None]:
# Import data
from konlpy.corpus import kolaw
from konlpy.corpus import kobill

In [None]:
# konlpy 예제
## 예제1
# 우선 분석기를 인스턴스로 만들어주기
kkma=konlpy.tag.Kkma()
okt=konlpy.tag.Okt()
han=konlpy.tag.Hannanum()
komo = konlpy.tag.Komoran()

# 해봅시다
kolaw.fileids()

korealaw = kolaw.open('constitution.txt').read()
korealaw

# 품사 태깅
pos_korealaw = okt.pos(korealaw)
pos_korealaw

#품사가 명사인 단어들만 추리기
nouns=[]

for each_tuple in pos_korealaw:
        if each_tuple[1]=="Noun":
            nouns.append(each_tuple[0])

#명사 빈도수 확인하기
import collections
from collections import Counter
Counter(nouns).most_common(100)        