In [1]:
import pandas as pd
from konlpy.tag import Mecab
from konlpy.tag import Kkma
from konlpy.tag import Komoran
from konlpy.tag import Okt
from konlpy.tag import Hannanum

In [2]:
text = """텀블벅 펀딩 1812% 달성의 화제작!
전자책 최초 4주 연속 종합 1위 베스트!


만들어진 꿈을 살 수 있는 상점이 있다면?
꾸고 싶은 꿈은 살 수 있다면 사람들은 어떤 꿈을 고를까? 《달러구트 꿈 백화점》은 ‘무의식에서만 존재하는 꿈을 정말 사고 팔 수 있을까?’라는 기발한 질문에 답을 찾아가는 판타지 소설이다. 꿈을 통해 그리움과 상처를 치유하는 이야기를 꿈을 만드는 사람, 파는 사람, 사는 사람 각각의 관점에서 풀어냈다.


여기는 잠들어야만 입장할 수 있는 ‘달러구트 꿈 백화점’입니다.
잠들어야만 입장할 수 있는 독특한 마을. 그곳에 들어온 잠든 손님들에게 가장 인기 있는 곳은, 온갖 꿈을 한데 모아 판매하는 ‘달러구트의 꿈 백화점’이다. 긴 잠을 자는 사람들은 물론이고, 짧은 낮잠을 자는 사람들과 동물들로 매일매일 대성황을 이룬다.
범상치 않은 혈통의 주인장 ‘달러구트’, 그리고 그의 최측근에서 일하게 된 신참 직원 ‘페니’, 꿈을 만드는 제작자 ‘아가넵 코코’, 그리고 베일에 둘러싸인 비고 마이어스…등 ‘꿈 제작자’들과 저마다의 사연을 가지고 찾아오는 ‘손님’들의 비밀스런 에피소드를 담았다."""

# Mecab

In [3]:
mecab = Mecab()

In [4]:
mecab.tagset

{'EC': '연결 어미',
 'EF': '종결 어미',
 'EP': '선어말어미',
 'ETM': '관형형 전성 어미',
 'ETN': '명사형 전성 어미',
 'IC': '감탄사',
 'JC': '접속 조사',
 'JKB': '부사격 조사',
 'JKC': '보격 조사',
 'JKG': '관형격 조사',
 'JKO': '목적격 조사',
 'JKQ': '인용격 조사',
 'JKS': '주격 조사',
 'JKV': '호격 조사',
 'JX': '보조사',
 'MAG': '일반 부사',
 'MAJ': '접속 부사',
 'MM': '관형사',
 'NNB': '의존 명사',
 'NNBC': '단위를 나타내는 명사',
 'NNG': '일반 명사',
 'NNP': '고유 명사',
 'NP': '대명사',
 'NR': '수사',
 'SC': '구분자 , · / :',
 'SE': '줄임표 …',
 'SF': '마침표, 물음표, 느낌표',
 'SH': '한자',
 'SL': '외국어',
 'SN': '숫자',
 'SSC': '닫는 괄호 ), ]',
 'SSO': '여는 괄호 (, [',
 'SY': '기타 기호',
 'VA': '형용사',
 'VCN': '부정 지정사',
 'VCP': '긍정 지정사',
 'VV': '동사',
 'VX': '보조 용언',
 'XPN': '체언 접두사',
 'XR': '어근',
 'XSA': '형용사 파생 접미사',
 'XSN': '명사파생 접미사',
 'XSV': '동사 파생 접미사'}

In [5]:
token = mecab.pos(text)
token

[('텀블벅', 'NNP'),
 ('펀딩', 'NNP'),
 ('1812', 'SN'),
 ('%', 'SY'),
 ('달성', 'NNG'),
 ('의', 'JKG'),
 ('화제작', 'NNG'),
 ('!', 'SY'),
 ('전자책', 'NNG'),
 ('최초', 'NNG'),
 ('4', 'SN'),
 ('주', 'NNBC'),
 ('연속', 'NNG'),
 ('종합', 'NNG'),
 ('1', 'SN'),
 ('위', 'NNBC'),
 ('베스트', 'NNG'),
 ('!', 'SF'),
 ('만들', 'VV'),
 ('어', 'EC'),
 ('진', 'VX+ETM'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('살', 'VV+ETM'),
 ('수', 'NNB'),
 ('있', 'VV'),
 ('는', 'ETM'),
 ('상점', 'NNG'),
 ('이', 'JKS'),
 ('있', 'VA'),
 ('다면', 'EF'),
 ('?', 'SF'),
 ('꾸', 'VV'),
 ('고', 'EC'),
 ('싶', 'VX'),
 ('은', 'ETM'),
 ('꿈', 'NNG'),
 ('은', 'JX'),
 ('살', 'VV+ETM'),
 ('수', 'NNB'),
 ('있', 'VV'),
 ('다면', 'EC'),
 ('사람', 'NNG'),
 ('들', 'XSN'),
 ('은', 'JX'),
 ('어떤', 'MM'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('고를까', 'VV+EF'),
 ('?', 'SF'),
 ('《', 'SY'),
 ('달러', 'NNP'),
 ('구트', 'NNP'),
 ('꿈', 'NNG'),
 ('백화점', 'NNG'),
 ('》', 'SY'),
 ('은', 'JX'),
 ('‘', 'SY'),
 ('무', 'XPN'),
 ('의식', 'NNG'),
 ('에서', 'JKB'),
 ('만', 'JX'),
 ('존재', 'NNG'),
 ('하', 'XSV'),
 ('는', 'ETM'),
 ('꿈', 

In [6]:
TAG_NORMAL = {'NNG', 'NNP', 'XR'}

df = pd.DataFrame(token, columns=['word', 'tag'])
print(list(df[df['tag'].isin(TAG_NORMAL)]['word']))

['텀블벅', '펀딩', '달성', '화제작', '전자책', '최초', '연속', '종합', '베스트', '꿈', '상점', '꿈', '사람', '꿈', '달러', '구트', '꿈', '백화점', '의식', '존재', '꿈', '사고', '기발', '질문', '답', '판타지', '소설', '꿈', '그리움', '상처', '치유', '이야기', '꿈', '사람', '사람', '사람', '각각', '관점', '입장', '달러', '구트', '꿈', '백화점', '입장', '독특', '마을', '손님', '인기', '곳', '꿈', '판매', '달러', '구트', '꿈', '백화점', '잠', '사람', '물론', '낮잠', '사람', '동물', '대성황', '범상', '혈통', '주인장', '달러', '구트', '측근', '일', '신참', '직원', '페니', '꿈', '제작자', '아가', '넵', '코코', '베일', '비고', '마이어스', '꿈', '제작자', '저마다', '사연', '손님', '비밀', '에피소드']


# Kkma

In [7]:
kkma = Kkma()

In [8]:
kkma.tagset

{'EC': '연결 어미',
 'ECD': '의존적 연결 어미',
 'ECE': '대등 연결 어미',
 'ECS': '보조적 연결 어미',
 'EF': '종결 어미',
 'EFA': '청유형 종결 어미',
 'EFI': '감탄형 종결 어미',
 'EFN': '평서형 종결 어미',
 'EFO': '명령형 종결 어미',
 'EFQ': '의문형 종결 어미',
 'EFR': '존칭형 종결 어미',
 'EP': '선어말 어미',
 'EPH': '존칭 선어말 어미',
 'EPP': '공손 선어말 어미',
 'EPT': '시제 선어말 어미',
 'ET': '전성 어미',
 'ETD': '관형형 전성 어미',
 'ETN': '명사형 전성 어미',
 'IC': '감탄사',
 'JC': '접속 조사',
 'JK': '조사',
 'JKC': '보격 조사',
 'JKG': '관형격 조사',
 'JKI': '호격 조사',
 'JKM': '부사격 조사',
 'JKO': '목적격 조사',
 'JKQ': '인용격 조사',
 'JKS': '주격 조사',
 'JX': '보조사',
 'MA': '부사',
 'MAC': '접속 부사',
 'MAG': '일반 부사',
 'MD': '관형사',
 'MDN': '수 관형사',
 'MDT': '일반 관형사',
 'NN': '명사',
 'NNB': '일반 의존 명사',
 'NNG': '보통명사',
 'NNM': '단위 의존 명사',
 'NNP': '고유명사',
 'NP': '대명사',
 'NR': '수사',
 'OH': '한자',
 'OL': '외국어',
 'ON': '숫자',
 'SE': '줄임표',
 'SF': '마침표, 물음표, 느낌표',
 'SO': '붙임표(물결,숨김,빠짐)',
 'SP': '쉼표,가운뎃점,콜론,빗금',
 'SS': '따옴표,괄호표,줄표',
 'SW': '기타기호 (논리수학기호,화폐기호)',
 'UN': '명사추정범주',
 'VA': '형용사',
 'VC': '지정사',
 'VCN': "부정 지정사, 형용사 '아니다'",
 'VC

In [9]:
token = kkma.pos(text)
token

[('텀', 'NNB'),
 ('블', 'VV'),
 ('ㄹ', 'ETD'),
 ('벅', 'UN'),
 ('펀', 'NNB'),
 ('딩', 'UN'),
 ('1812', 'NR'),
 ('%', 'SW'),
 ('달성', 'NNG'),
 ('의', 'JKG'),
 ('화제작', 'NNG'),
 ('!', 'SF'),
 ('전자책', 'NNG'),
 ('최초', 'NNG'),
 ('4', 'NR'),
 ('주', 'NNM'),
 ('연속', 'NNG'),
 ('종합', 'NNG'),
 ('1', 'NR'),
 ('위', 'NNM'),
 ('베스트', 'NNG'),
 ('!', 'SF'),
 ('만들', 'VV'),
 ('어', 'ECD'),
 ('지', 'VXV'),
 ('ㄴ', 'ETD'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('사', 'VV'),
 ('ㄹ', 'ETD'),
 ('수', 'NNB'),
 ('있', 'VV'),
 ('는', 'ETD'),
 ('상점', 'NNG'),
 ('이', 'JKS'),
 ('있', 'VA'),
 ('다면', 'ECE'),
 ('?', 'SF'),
 ('꾸', 'VV'),
 ('고', 'ECE'),
 ('싶', 'VXA'),
 ('은', 'ETD'),
 ('꿈', 'NNG'),
 ('은', 'JX'),
 ('살', 'VV'),
 ('ㄹ', 'ETD'),
 ('수', 'NNB'),
 ('있', 'VA'),
 ('다면', 'ECE'),
 ('사람', 'NNG'),
 ('들', 'XSN'),
 ('은', 'JX'),
 ('어떤', 'MDT'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('고르', 'VV'),
 ('ㄹ까', 'EFQ'),
 ('?', 'SF'),
 ('《', 'SS'),
 ('달러', 'NNG'),
 ('구트', 'UN'),
 ('꿈', 'NNG'),
 ('백화점', 'NNG'),
 ('》', 'SS'),
 ('은', 'NNG'),
 ('‘', 'SS'),
 ('무의식', '

In [10]:
TAG_NORMAL = {'NNG', 'NNP', 'UN', 'XR'}

df = pd.DataFrame(token, columns=['word', 'tag'])
print(list(df[df['tag'].isin(TAG_NORMAL)]['word']))

['벅', '딩', '달성', '화제작', '전자책', '최초', '연속', '종합', '베스트', '꿈', '상점', '꿈', '사람', '꿈', '달러', '구트', '꿈', '백화점', '은', '무의식', '존재', '꿈', '기발', '질문', '답', '판타지', '소설', '꿈', '그리움', '상처', '치유', '이야기', '꿈', '사람', '파', '사람', '사람', '각각', '관점', '입장', '달러', '구트', '꿈', '백화점', '입장', '독특', '마을', '손님', '인기', '곳', '꿈', '한데', '모아', '판매', '달러', '구트', '꿈', '백화점', '잠', '사람', '물론', '낮잠', '사람', '동', '로', '매일', '대성황', '범상', '혈통', '주인장', '달러', '구트', '측근', '신참', '직원', '페니', '꿈', '제작자', '아가', '코', '코', '베일', '비고', '마이', '어스', '꿈', '제작자', '들', '저마다', '사연', '손님', '들', '비밀', '에피소드']


# Komoran

In [11]:
komoran = Komoran()

In [12]:
komoran.tagset

{'EC': '연결 어미',
 'EF': '종결 어미',
 'EP': '선어말어미',
 'ETM': '관형형 전성 어미',
 'ETN': '명사형 전성 어미',
 'IC': '감탄사',
 'JC': '접속 조사',
 'JKB': '부사격 조사',
 'JKC': '보격 조사',
 'JKG': '관형격 조사',
 'JKO': '목적격 조사',
 'JKQ': '인용격 조사',
 'JKS': '주격 조사',
 'JKV': '호격 조사',
 'JX': '보조사',
 'MAG': '일반 부사',
 'MAJ': '접속 부사',
 'MM': '관형사',
 'NA': '분석불능범주',
 'NF': '명사추정범주',
 'NNB': '의존 명사',
 'NNG': '일반 명사',
 'NNP': '고유 명사',
 'NP': '대명사',
 'NR': '수사',
 'NV': '용언추정범주',
 'SE': '줄임표',
 'SF': '마침표, 물음표, 느낌표',
 'SH': '한자',
 'SL': '외국어',
 'SN': '숫자',
 'SO': '붙임표(물결,숨김,빠짐)',
 'SP': '쉼표,가운뎃점,콜론,빗금',
 'SS': '따옴표,괄호표,줄표',
 'SW': '기타기호 (논리수학기호,화폐기호)',
 'VA': '형용사',
 'VCN': '부정 지정사',
 'VCP': '긍정 지정사',
 'VV': '동사',
 'VX': '보조 용언',
 'XPN': '체언 접두사',
 'XR': '어근',
 'XSA': '형용사 파생 접미사',
 'XSN': '명사파생 접미사',
 'XSV': '동사 파생 접미사'}

In [13]:
token = komoran.pos(text)
token

[('텀블벅', 'NNP'),
 ('푸', 'VV'),
 ('어', 'EC'),
 ('ㄴ', 'JX'),
 ('딩', 'MAG'),
 ('1812', 'SN'),
 ('%', 'SW'),
 ('달성', 'NNP'),
 ('의', 'JKG'),
 ('화제작', 'NNG'),
 ('!', 'SF'),
 ('전자책', 'NNP'),
 ('최초', 'NNG'),
 ('4', 'SN'),
 ('주', 'NNB'),
 ('연속', 'NNP'),
 ('종합', 'NNG'),
 ('1', 'SN'),
 ('위', 'NNB'),
 ('베스트', 'NNP'),
 ('!', 'SF'),
 ('만들', 'VV'),
 ('어', 'EC'),
 ('지', 'VX'),
 ('ㄴ', 'ETM'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('살', 'VV'),
 ('ㄹ', 'ETM'),
 ('수', 'NNB'),
 ('있', 'VV'),
 ('는', 'ETM'),
 ('상점', 'NNG'),
 ('이', 'JKS'),
 ('있', 'VX'),
 ('다면', 'EF'),
 ('?', 'SF'),
 ('꾸', 'VV'),
 ('고', 'EC'),
 ('싶', 'VX'),
 ('은', 'ETM'),
 ('꿈', 'NNG'),
 ('은', 'JX'),
 ('살', 'VV'),
 ('ㄹ', 'ETM'),
 ('수', 'NNB'),
 ('있', 'VV'),
 ('다면', 'EC'),
 ('사람', 'NNG'),
 ('들', 'XSN'),
 ('은', 'JX'),
 ('어떤', 'MM'),
 ('꿈', 'NNG'),
 ('을', 'JKO'),
 ('고르', 'VV'),
 ('ㄹ까', 'EF'),
 ('?', 'SF'),
 ('《', 'SS'),
 ('달러', 'NNB'),
 ('이', 'VCP'),
 ('구', 'EC'),
 ('트', 'VV'),
 ('꿈', 'NNG'),
 ('백화점', 'NNP'),
 ('》', 'SS'),
 ('은', 'JX'),
 ('‘', 'SS'),
 ('무

In [14]:
TAG_NORMAL = {'NA', 'NF', 'NNG', 'NNP', 'XR'}

df = pd.DataFrame(token, columns=['word', 'tag'])
print(list(df[df['tag'].isin(TAG_NORMAL)]['word']))

['텀블벅', '달성', '화제작', '전자책', '최초', '연속', '종합', '베스트', '꿈', '상점', '꿈', '사람', '꿈', '꿈', '백화점', '무의식', '존재', '꿈', '사고', '기발', '질문', '답', '판타지 소설', '꿈', '그리움', '상처', '치유', '이야기', '꿈', '사람', '사람', '사람', '각각', '관점', '입장', '꿈', '백화점', '입장', '독특', '마을', '손님', '인기', '곳', '꿈', '모아', '판매', '‘달러구트의', '꿈', '백화점', '잠', '사람', '물론', '낮잠', '사람', '동물', '성황', '범상', '혈통', '주인장', '측근', '일', '신참', '직원', '페니', '꿈', '제작자', '‘아가넵', '코코', '베일', '비고', '마이어스', '꿈', '제작자', '사연', '손님', '비밀', '에피소드']


# Hannanum

In [15]:
hannanum = Hannanum()

In [16]:
hannanum.tagset

{'E': '어미',
 'EC': '연결 어미',
 'EF': '종결 어미',
 'EP': '선어말어미',
 'ET': '전성 어미',
 'F': '외국어',
 'I': '독립언',
 'II': '감탄사',
 'J': '관계언',
 'JC': '격조사',
 'JP': '서술격 조사',
 'JX': '보조사',
 'M': '수식언',
 'MA': '부사',
 'MM': '관형사',
 'N': '체언',
 'NB': '의존명사',
 'NC': '보통명사',
 'NN': '수사',
 'NP': '대명사',
 'NQ': '고유명사',
 'P': '용언',
 'PA': '형용사',
 'PV': '동사',
 'PX': '보조 용언',
 'S': '기호',
 'X': '접사',
 'XP': '접두사',
 'XS': '접미사'}

In [17]:
token = hannanum.pos(text)
token

[('텀블벅', 'N'),
 ('펀딩', 'N'),
 ('1812', 'N'),
 ('%', 'S'),
 ('달성', 'N'),
 ('의', 'J'),
 ('화제작', 'N'),
 ('!', 'S'),
 ('전자책', 'N'),
 ('최초', 'N'),
 ('4주', 'N'),
 ('연속', 'N'),
 ('종합', 'N'),
 ('1위', 'N'),
 ('베스트', 'N'),
 ('!', 'S'),
 ('만들', 'P'),
 ('어', 'E'),
 ('지', 'P'),
 ('ㄴ', 'E'),
 ('꿈', 'N'),
 ('을', 'J'),
 ('사', 'P'),
 ('ㄹ', 'E'),
 ('수', 'N'),
 ('있', 'P'),
 ('는', 'E'),
 ('상점', 'N'),
 ('이', 'J'),
 ('있', 'P'),
 ('다면', 'E'),
 ('?', 'S'),
 ('꾸', 'P'),
 ('고', 'E'),
 ('싶', 'P'),
 ('은', 'E'),
 ('꿈', 'N'),
 ('은', 'J'),
 ('사', 'P'),
 ('ㄹ', 'E'),
 ('수', 'N'),
 ('있', 'P'),
 ('다면', 'E'),
 ('사람', 'N'),
 ('들', 'X'),
 ('은', 'J'),
 ('어떤', 'M'),
 ('꿈', 'N'),
 ('을', 'J'),
 ('고르', 'P'),
 ('ㄹ까', 'E'),
 ('?', 'S'),
 ('《달러구트', 'N'),
 ('꾸', 'P'),
 ('ㅁ', 'E'),
 ('백화점》', 'N'),
 ('은', 'J'),
 ('‘무의식에서만', 'N'),
 ('존재', 'N'),
 ('하', 'X'),
 ('는', 'E'),
 ('꿈', 'N'),
 ('을', 'J'),
 ('정말', 'M'),
 ('사', 'P'),
 ('고', 'E'),
 ('팔', 'P'),
 ('ㄹ', 'E'),
 ('수', 'N'),
 ('있', 'P'),
 ('을까', 'E'),
 ('?', 'S'),
 ('’라', 'N'),
 ('는', '

In [18]:
TAG_NORMAL = {'N'}

df = pd.DataFrame(token, columns=['word', 'tag'])
print(list(df[df['tag'].isin(TAG_NORMAL)]['word']))

['텀블벅', '펀딩', '1812', '달성', '화제작', '전자책', '최초', '4주', '연속', '종합', '1위', '베스트', '꿈', '수', '상점', '꿈', '수', '사람', '꿈', '《달러구트', '백화점》', '‘무의식에서만', '존재', '꿈', '수', '’라', '기발한', '질문', '답', '판타지', '소설', '꿈', '그리움', '상처', '치유', '이야기', '꿈', '사람', '사람', '사람', '각각', '관점', '여기', '입장', '수', '‘달러구트', '백화점’입니', '입장', '수', '독특', '마을', '그곳', '손님들', '인기', '곳', '꿈', '판매', '‘달러구트', '백화점’', '잠', '사람', '물론', '낮잠', '사람들', '동물들', '대성황', '범상치', '혈통', '주인장', '‘달러구트’,', '그', '최측근', '일', '신참', '직원', '‘페니’,', '꿈', '제작자', '‘아가넵', '코코’,', '베일', '비', '마이어스…등', '‘꿈', '제작자’들', '저마다', '사연', '‘손님’들', '비밀', '에피소드']


# Okt

In [19]:
okt = Okt()

In [20]:
token = okt.pos(text)
token

[('텀블벅', 'Noun'),
 ('펀딩', 'Noun'),
 ('1812%', 'Number'),
 ('달성', 'Noun'),
 ('의', 'Josa'),
 ('화', 'Noun'),
 ('제작', 'Noun'),
 ('!', 'Punctuation'),
 ('\n', 'Foreign'),
 ('전자책', 'Noun'),
 ('최초', 'Noun'),
 ('4', 'Number'),
 ('주', 'Noun'),
 ('연속', 'Noun'),
 ('종합', 'Noun'),
 ('1', 'Number'),
 ('위', 'Noun'),
 ('베스트', 'Noun'),
 ('!', 'Punctuation'),
 ('\n\n\n', 'Foreign'),
 ('만들어진', 'Verb'),
 ('꿈', 'Noun'),
 ('을', 'Josa'),
 ('살', 'Noun'),
 ('수', 'Noun'),
 ('있는', 'Adjective'),
 ('상점', 'Noun'),
 ('이', 'Josa'),
 ('있다면', 'Adjective'),
 ('?', 'Punctuation'),
 ('\n', 'Foreign'),
 ('꾸고', 'Verb'),
 ('싶은', 'Verb'),
 ('꿈', 'Noun'),
 ('은', 'Josa'),
 ('살', 'Noun'),
 ('수', 'Noun'),
 ('있다면', 'Adjective'),
 ('사람', 'Noun'),
 ('들', 'Suffix'),
 ('은', 'Josa'),
 ('어떤', 'Adjective'),
 ('꿈', 'Noun'),
 ('을', 'Josa'),
 ('고를까', 'Verb'),
 ('?', 'Punctuation'),
 ('《', 'Foreign'),
 ('달러', 'Noun'),
 ('구트', 'Noun'),
 ('꿈', 'Noun'),
 ('백화점', 'Noun'),
 ('》', 'Foreign'),
 ('은', 'Noun'),
 ('‘', 'Foreign'),
 ('무의식', 'Noun'),
 (

In [21]:
token = okt.pos(text, stem=True)
token

[('텀블벅', 'Noun'),
 ('펀딩', 'Noun'),
 ('1812%', 'Number'),
 ('달성', 'Noun'),
 ('의', 'Josa'),
 ('화', 'Noun'),
 ('제작', 'Noun'),
 ('!', 'Punctuation'),
 ('\n', 'Foreign'),
 ('전자책', 'Noun'),
 ('최초', 'Noun'),
 ('4', 'Number'),
 ('주', 'Noun'),
 ('연속', 'Noun'),
 ('종합', 'Noun'),
 ('1', 'Number'),
 ('위', 'Noun'),
 ('베스트', 'Noun'),
 ('!', 'Punctuation'),
 ('\n\n\n', 'Foreign'),
 ('만들어지다', 'Verb'),
 ('꿈', 'Noun'),
 ('을', 'Josa'),
 ('살', 'Noun'),
 ('수', 'Noun'),
 ('있다', 'Adjective'),
 ('상점', 'Noun'),
 ('이', 'Josa'),
 ('있다', 'Adjective'),
 ('?', 'Punctuation'),
 ('\n', 'Foreign'),
 ('꾸다', 'Verb'),
 ('싶다', 'Verb'),
 ('꿈', 'Noun'),
 ('은', 'Josa'),
 ('살', 'Noun'),
 ('수', 'Noun'),
 ('있다', 'Adjective'),
 ('사람', 'Noun'),
 ('들', 'Suffix'),
 ('은', 'Josa'),
 ('어떻다', 'Adjective'),
 ('꿈', 'Noun'),
 ('을', 'Josa'),
 ('고르다', 'Verb'),
 ('?', 'Punctuation'),
 ('《', 'Foreign'),
 ('달러', 'Noun'),
 ('구트', 'Noun'),
 ('꿈', 'Noun'),
 ('백화점', 'Noun'),
 ('》', 'Foreign'),
 ('은', 'Noun'),
 ('‘', 'Foreign'),
 ('무의식', 'Noun'),
 (

In [22]:
df = pd.DataFrame(token, columns=['word', 'tag'])

In [23]:
print(list(df[df['tag'] == 'Adjective']['word']))

['있다', '있다', '있다', '어떻다', '있다', '기발하다', '있다', '이다', '있다', '독특하다', '있다', '짧다', '비밀스럽다']


In [24]:
print(list(df[df['tag'] == 'Verb']['word']))

['만들어지다', '꾸다', '싶다', '고르다', '하다', '찾아가다', '하다', '만들다', '팔다', '살다', '풀다', '내다', '여기다', '잠들다', '하다', '잠들다', '하다', '들어오다', '잠들다', '모으다', '하다', '기다', '자다', '자다', '이루다', '않다', '하다', '되다', '만들다', '둘러싸이다', '들다', '찾아오다', '들다', '담다']


In [25]:
print(list(df[df['tag'] == 'Noun']['word']))

['텀블벅', '펀딩', '달성', '화', '제작', '전자책', '최초', '주', '연속', '종합', '위', '베스트', '꿈', '살', '수', '상점', '꿈', '살', '수', '사람', '꿈', '달러', '구트', '꿈', '백화점', '은', '무의식', '존재', '꿈', '정말', '사고', '팔', '수', '질문', '답', '판타지', '소설', '꿈', '통해', '그리움', '상처', '치유', '이야기', '꿈', '사람', '사람', '사람', '각각', '관점', '입장', '수', '달러', '구트', '꿈', '백화점', '입장', '수', '마을', '곳', '손님', '가장', '인기', '곳', '온갖', '꿈', '판매', '달러', '구트', '꿈', '백화점', '잠', '사람', '낮잠', '사람', '동물', '매일', '성황', '범', '상치', '혈통', '주인', '달러', '구트', '그', '최측근', '일', '신참', '직원', '페니', '꿈', '제작자', '아가', '넵', '코코', '베일', '비고', '마이', '어스', '등', '꿈', '제작자', '저', '사연', '가지', '손님', '에피소드']
