### 한국어 형태소 분석기 Spacy
- 빠른 속도와 정확도가 높은 형태소 분석기
- 설치 2단계
    - 형태소 분석기 설치
    - 언어별 모델 설치

In [25]:
import spacy
from IPython.display import SVG

In [2]:
# Korean lang model
KO_MODEL = 'ko_core_news_sm'

In [3]:
nlp = spacy.load(KO_MODEL)

In [8]:
text = '내일 스터디는 기대가 됩니다.'
doc = nlp(text)

for token in doc:
    # 표제어, 단어 품사, 자세한 품사, 불용어 여부
    print(f"{token.text:6} {token.lemma_:6} {token.pos_:6} {token.tag_:6} {token.is_stop:6}")

내일     내일     NOUN   ncn         0
스터디는   스터디+는  ADV    nq+jca      0
기대가    기대+가   NOUN   ncpa+jcs      0
됩니다    되+ㅂ니다  VERB   pvg+ef      0
.      .      PUNCT  sf          0


In [27]:
text = """
누구와 먹고 살지
나와 먹고 살지

누구의 손을 잡지
나의 손을 잡지

아직은 아니되오
지금은 할 수 없어

어서 내 손을 잡아
함께 가자

혼인하자
"""
doc = nlp(text)

for token in doc:
    if token.tag_ != '_SP':
        print(f"{token.text:6}  {token.lemma_:6}    {token.pos_:6}  {token.tag_:6}  {token.is_stop:1}")

누구와     누구+와      CCONJ   npp+jct  0
먹고      먹+고       SCONJ   pvg+ecs  0
살지      살+지       VERB    pvg+etm  0
나와      나오+아      SCONJ   npp+jct  0
먹고      먹+고       SCONJ   pvg+ecc  0
살지      살+지       VERB    pvg+etm  0
누구의     누구+의      PRON    npp+jcm  0
손을      손+을       NOUN    ncn+jco  0
잡지      잡지        VERB    pvg+etm  0
나의      나+의       PRON    npp+jcm  0
손을      손+을       NOUN    ncn+jco  0
잡지      잡지        NOUN    ncn     0
아직은     아직+은      NOUN    npp+jxt  0
아니되오    아니되+오     VERB    ncn+jp+ef  0
지금은     지금+은      NOUN    ncn+jxt  0
할       하+ㄹ       VERB    pvg+etm  0
수       수         NOUN    nbn     1
없어      없+어       SCONJ   paa+ecs  0
어서      어서        PRON    npp+jco  0
내       내         PRON    npp     0
손을      손+을       NOUN    ncn+jco  0
잡아      잡+아       VERB    pvg+ecx  0
함께      함께        ADV     mag     0
가자      가자        NOUN    ncn     0
혼인하자    혼인+하+자    SCONJ   ncpa+jp+ecs  0


In [17]:
my_tokens = []

for token in doc:
    if (not token.is_stop) and (token.pos_!='SPACE'):
        my_tokens.append(token)

In [18]:
my_tokens

[누구와,
 먹고,
 살지,
 나와,
 먹고,
 살지,
 누구의,
 손을,
 잡지,
 나의,
 손을,
 잡지,
 아직은,
 아니되오,
 지금은,
 할,
 없어,
 어서,
 내,
 손을,
 잡아,
 함께,
 가자,
 혼인하자]

- for token in doc: 에서 볼 수 있는 속성들
---
- .text: 저장된 텍스트
- .lemma_: 표제어 속성
- .pos_: 품사 속성
- .tag_: 상세 품사 속성
- .is_stop: 불용어 여부 속성
- .is_punct: 구두점 여부 속성

In [23]:
text = """
놀자 놀자 마저 놀자
긴밤 건너 내가 왔어
두 눈 밝게 뜨고
길고 하얀 기억쥐고

문 앞까지 다다른
흉내쟁이가
내가 왔어
내가 돌아 왔어

에헤야히야
즐겁게 놀아보자
에헤야히야
혀 위에서 놀자

이 목소리는
지나칠 수 없을 테니
어서 그 문을 열어줘
"""
doc = nlp(text)

for token in doc:
    if token.tag_ != '_SP':
        print(f"{token.text:6}  {token.lemma_:6}    {token.pos_:6}  {token.tag_:6}  {token.is_stop:1}")

놀자      놀자        SCONJ   pvg+ecs  0
놀자      놀자        AUX     pvg+ecx+px+etm  0
마저      마저        NOUN    ncn     0
놀자      놀자        VERB    pvg+etm  0
긴밤      긴+밤       ADV     ncpa    0
건너      건너+어      SCONJ   pvg+ecs  0
내가      내+가       PRON    npp+jcs  0
왔어      왔어        NOUN    pvg+etm  0
두       두         NUM     nnc     1
눈       눈         NOUN    ncn     0
밝게      밝+게       SCONJ   paa+ecs  0
뜨고      뜨+고       CCONJ   pvg+ecc  0
길고      길+고       CCONJ   paa+ecc  0
하얀      하얗+ㄴ      ADJ     paa+etm  0
기억쥐고    기억쥐고      ADV     ncn+ncn+xsn+jp+etm  0
문       문         NOUN    ncn     0
앞까지     앞까+지      NOUN    ncn+jcm  0
다다른     다다른       VERB    paa+etm  0
흉내쟁이가   흉내쟁이+가    CCONJ   nq+jct  0
내가      내+가       PRON    npp+jcs  0
왔어      왔어        VERB    pvg+etm  0
내가      내+가       PRON    npp+jcs  0
돌아      돌아        SCONJ   pvg+ecs  0
왔어      오+았+어     NOUN    pvg+etm  0
에헤야히야   에헤야+히야    PROPN   ncn+jcj  0
즐겁게     즐겁+게      SCONJ   paa+ecs  0
놀아보자    놀아+보자     ADV     

In [24]:
text = """
나비 여럿 날아간다 구름바다 넘실댄다
땀방울 튀어가매 멀리멀리 노닌다
바람 하나 파도 되어 나무 하나 사이에 끼고
온 천하 제 것인양 촐싹대면서 퍼런 하늘로 간다

너른 벌은 강을 끼고
작은 강은 숲을 끼고
겹겹이 쌓이며 휘돌아 춤을 춘다
새 한 마리 날에 취해 뻐꾹 뻐꾹
주사를 벌이다가 남은 이슬을 낚아채고서 간다

쇳빛 하늘 우중충하다 잎새들 서로 엉켜가니
논벼들은 다 고개 드매 서로 밀치며 쓰러지니
먹구름 떼가 몰려오고 바람이 포악해져가고
빗방울 후둑 떨어지고 천둥번개가 내리쳐온다

하얀 불이여 내 안에 깃드오
세상에 흐르는 저 물길처럼
들바람이여 나를 태워주오
이 몸이 한 줌 흙이 되도록

구름 사이 햇살 하나 고개 밀어 내비친다
얼룩진 바위들은 다물던 입을 연다
물안개가 질 즈음에 젖은 풀잎이 고개 든다
소나기 더 몰려와 폭포 위에서 맹렬히 퍼붓는다

비가 내려 홍수난다 햇살 내려 가뭄난다
하늘의 창날은 결국엔 무디노라
잿빛 하늘 시드노니 태풍이 온다
물난리 벌어지며 모두 쓸려가 민둥산으로 간다

한 백년은 일 년과 같고 한 일년은 하루와 같고
하루가 지금 끝나가매 동산에 무지개가 뜨니
잔해들 모두 거두고서 노을 아래서 만나리라
아침을 여는 빛은 지금 저녁을 향해 날아가노라

하얀 불이여 내 안에 깃드오
세상에 흐르는 저 물길처럼
들바람이여 나를 태워주오
이 몸이 한 줌 흙이 되도록

하늘의 빛에 태어나고
하늘의 삶을 살아가고
땅의 온기에 뼈를 묻어 지노라

새 아침이 환히 열리면
나는 한 명의 사람으로서
태어나리라
"""
doc = nlp(text)

for token in doc:
    if token.tag_ != '_SP':
        print(f"{token.text:6}  {token.lemma_:6}    {token.pos_:6}  {token.tag_:6}  {token.is_stop:1}")

나비      나+비       VERB    pvg+etm  0
여럿      여럿        NUM     nnc     0
날아간다    날아간+다     NOUN    ncn+jco  0
구름바다    구+름바+다    ADV     ncpa+ncpa+jca  0
넘실댄다    넘실댄+다     VERB    pvg+etm  0
땀방울     땀방+울      ADV     ncn+jca  0
튀어가매    튀+어+가+매    CCONJ   ncpa+xsn+jp+ecc  0
멀리멀리    멀+리+멀+리    VERB    px+ef+jcr  0
노닌다     +노+닌다     CCONJ   ncpa+xsv+ecc  0
바람      바람        NOUN    ncn     0
하나      하나        NUM     nnc     1
파도      파+도       NOUN    pvg+ecx  0
되어      되+어       SCONJ   pvg+ecs  0
나무      나무        NOUN    ncn     0
하나      하나        NUM     nnc     1
사이에     사이+에      ADV     ncn+jca  0
끼고      끼+고       VERB    pvg+ef  0
온       오+ㄴ       VERB    px+etm  0
천하      천하        NOUN    ncn     0
제       제         PRON    mma     0
것인양     것+인양      ADV     nbn+jca  0
촐싹대면서   촐싹대면+서    NOUN    ncn+jco  0
퍼런      퍼+런       SCONJ   pvg+ecs  0
하늘로     하늘+로      ADV     ncn+jca  0
간다      가+ㄴ다      VERB    pvg+etm  0
너른      너른        NOUN    ncn     0
벌은      벌+은       VERB   

In [28]:
SVG(spacy.displacy.render(doc))

<IPython.core.display.SVG object>