[박현우] 간단한 클러스터링 예제
========================

이 노트북에서는 클러스터링을 하는 방식을 간단하게 다뤄봅니다.

In [1]:
%matplotlib inline
from IPython.display import display, HTML

import matplotlib
krfont = {'family' : 'nanumgothic', 'weight' : 'bold', 'size'   : 10}
matplotlib.rc('font', **krfont)

In [2]:
import numpy as np
import pandas as pd
from tqdm import tqdm_notebook as tqdm

In [3]:
from multiprocessing import Pool
import multiprocessing

cores = multiprocessing.cpu_count()

In [4]:
chosun_data = pd.read_pickle("chosun_news.df")

1. Corpus 로딩하기
---------------------

In [5]:
from konlpy.tag import Mecab, Hannanum, Twitter
mecab = Mecab()
hannanum = Hannanum()
twitter = Twitter()

In [45]:
import re, hanja
import numba

def tokenizeText(text):
    text = ' '.join(hanja.split_hanja(text))
    text = hanja.translate(text, 'substitution')
    return mecab.morphs(text)

print(tokenizeText('[사설] 美가 증거 내밀자 수사 나선 中 이중 플레이'))

['[', '사설', ']', '미', '가', '증거', '내밀', '자', '수사', '나선', '중', '이중', '플레이']


In [46]:
import logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.WARNING)

In [47]:
from gensim import corpora

In [48]:
words = []
# using mecab
with Pool(cores) as p:
    words = list(tqdm(p.imap(tokenizeText, chosun_data['title']), total=len(chosun_data)))
# words = [tokenizeText(text) for text in tqdm(chosun_data['content'])]
dictionary = corpora.Dictionary(words)




2. Doc2Vec를 이용한 문서->벡터 변환
------------------------------

In [49]:
counts = {}
for sentence in tqdm(words):
    for word in sentence:
        counts[word] = counts.get(word, 0) + 1




In [50]:
counts['의']

7791

In [51]:
import gensim
from gensim.models.word2vec import Word2Vec, Text8Corpus
from collections import OrderedDict
import itertools

In [52]:
import random

sentences = [gensim.models.doc2vec.LabeledSentence(
        words=words, tags=[i])
        for i, words in enumerate(words)]
tmp = [(i, sentence) for i, sentence in enumerate(sentences)]
random.shuffle(tmp)
train_set = [x[1] for x in tmp[:len(tmp) * 3 // 10]]

In [53]:
w2v_model = Word2Vec(size=64, workers=cores)
w2v_model.build_vocab(words)

In [54]:
w2v_model.train(words)

1835044

In [55]:
w2v_model.similarity('이명박', '대통령')

0.68442629424775003

* paragraph2vec의 알고리즘에서 word2vec를 쓴다.
* Word2Vec은 전체 뉴스에 대해서 하는게 어떤가. 너무 word/content 갯수가 적지 않은가.
* 전처리 과정이 필요한가?

3. sklearn을 이용한 Agglomerative Clustering
------------------------------------------

In [56]:
def vectorizeWords(ws):
    vsum = np.zeros(64)
    fsum = 0.0
    for w in ws:
        if w in w2v_model.vocab:
            f = counts[w]
            if f == 0:
                print(w)
            fsum += 1 / f
            vsum += w2v_model[w] / f
    if fsum < 0.001:
        return np.zeros(64)
    else:
        return vsum / fsum

In [57]:
vectorizeWords(['사설', '미', '증거', '수사', '나선', '중', '이중', '플레이'])

array([-0.0462473 ,  0.01750928, -0.04175988, -0.09447964,  0.11195441,
       -0.15582331,  0.02205649,  0.12746236, -0.04428291, -0.15164726,
        0.10268498, -0.11308526, -0.05921292,  0.09842206, -0.05529129,
       -0.0151269 , -0.07233634,  0.04110032,  0.03676123,  0.05464866,
        0.16633733,  0.07994697,  0.20016701, -0.04838737, -0.02707192,
        0.07987369,  0.11909217,  0.10016239, -0.01708355,  0.01228863,
       -0.18029985, -0.06363225,  0.0827971 ,  0.13032045, -0.08850109,
        0.06418935, -0.05346495,  0.01459601,  0.19059832,  0.11049549,
       -0.08590515, -0.22287377,  0.09977736,  0.10014536, -0.1881095 ,
       -0.02897716,  0.13450139,  0.01518178,  0.03325992,  0.17482849,
       -0.18535069,  0.03411149,  0.07225417, -0.10198789,  0.00993744,
       -0.07259177, -0.04323257,  0.15358721, -0.02899736,  0.02143741,
        0.06557437,  0.01528938, -0.06396108,  0.10954947])

In [58]:
content_vectors = []
for i, sentence in enumerate(tqdm(sentences)):
    v = vectorizeWords(sentence.words)
    content_vectors.append(v)
content_vectors = np.asarray(content_vectors)




In [59]:
from sklearn.cluster import AgglomerativeClustering, DBSCAN, KMeans, SpectralClustering, MeanShift
from spherecluster import SphericalKMeans

In [60]:
cluster_num = 50
# cluster_model = AgglomerativeClustering(n_clusters=cluster_num, linkage="average", affinity='cosine')
# cluster_model = DBSCAN(eps=.30, min_samples=3, metric='cosine', algorithm='brute')
# cluster_model = KMeans(n_clusters=cluster_num)
cluster_model = SphericalKMeans(n_clusters=cluster_num)
# cluster_model = SpectralClustering(n_clusters=cluster_num, affinity='cosine')
# cluster_model = MeanShift(n_jobs=cores)
cluster_model.fit(content_vectors)

cluster_num = len(set(cluster_model.labels_)) - (1 if -1 in cluster_model.labels_ else 0)
print('# of clusters : %d' % cluster_num)
if -1 in cluster_model.labels_:
    noiseNum = np.sum(cluster_model.labels_ == -1)
    totNum = len(content_vectors)
    print('Noise : %d/%d (%.2f%%)' % (noiseNum, totNum, noiseNum / totNum * 100))

# of clusters : 50


In [61]:
cluster_data = []
for cluster_index in range(cluster_num):
    cluster_data.append(chosun_data[cluster_model.labels_ == cluster_index])

In [62]:
cluster_model.cluster_centers_[0]

array([-0.08885995, -0.02858291, -0.06318207, -0.15403497,  0.18674366,
       -0.14204662, -0.01356459,  0.18621448, -0.05422292, -0.15237655,
        0.17264603, -0.11197643, -0.05810412,  0.12914328, -0.04980899,
        0.00574086, -0.05751289,  0.03186012, -0.02751128,  0.0565769 ,
        0.21821891,  0.09075829,  0.25345403, -0.00063967,  0.01146435,
        0.05274861,  0.21249931,  0.1627496 , -0.05932244,  0.00759457,
       -0.14604796, -0.10461886,  0.0333114 ,  0.18465229, -0.13408277,
        0.0895292 , -0.14225566, -0.02120585,  0.2384859 ,  0.1565302 ,
       -0.07917801, -0.27122549,  0.14312742,  0.1747153 , -0.18191067,
       -0.08814703,  0.16891394,  0.039767  ,  0.03557536,  0.22206328,
       -0.12491282,  0.07363712,  0.08502989, -0.1599461 , -0.0014001 ,
       -0.04598263, -0.05407105,  0.16127243, -0.03758598,  0.08545754,
        0.07001866,  0.03577074, -0.11444906,  0.12352018])

In [63]:
for i in range(cluster_num):
    print('Cluster #%d' % i)
    
    display(list(filter(
                lambda x: counts[x[0]] < 100,
                w2v_model.most_similar(
                    positive=[cluster_model.cluster_centers_[i]],
                    topn=10))))
    display(cluster_data[i][['category', 'title']].sample(10))

Cluster #0


[('심판', 0.9881048202514648),
 ('막말', 0.9871180653572083),
 ('탓', 0.9863877892494202),
 ('설득', 0.9855608940124512),
 ('경고', 0.981814980506897),
 ('뜻', 0.9804854393005371),
 ('좌우', 0.979576051235199),
 ('다른', 0.979257345199585),
 ('용납', 0.9791616201400757)]

Unnamed: 0,category,title
5150,사설ㆍ칼럼 > 내부칼럼 > 사설,[사설] 그래도 우 수석 감싸는 靑과 친박들 지금 제정신인가
37559,정치,"유인태 ""文선배와 저 포함""… 문희상 ""허허, 거 참"""
8167,정치,"우상호 ""우병우·검찰 개혁 더 이상 지켜만 볼 수 없다"" 박지원 ""朴대통령이 계속 ..."
25930,스포츠ㆍ연예 > 스포츠 > 야구 > 프로야구,"그러니까, 홈런 친 저 선수가 누구냐고요"
19588,사설ㆍ칼럼 > 내부칼럼,[권대열 칼럼] 親朴·非朴 왜 싸우는지 알고나 싸우나
47221,국제 > 미국ㆍ중남미,"""오바마가 일본에 위안부 합의 물밑 압박했다"""
57105,정치,박원순과 손잡으려… 朴공약 끌어안는 文대표
51853,정치 > 국회ㆍ정당,"그간 참았다는 듯… 野주류, 안철수 비판 쏟아내"
25115,정치 > 국회ㆍ정당,"非朴 ""최경환 삭발하라"" 親朴 ""김무성 야반도주"""
14547,사설ㆍ칼럼 > 내부칼럼 > 사설,[사설] '격차 해소' 위해 기득권과 싸우겠다는 安 대표


Cluster #1


[('배출', 0.9953632354736328),
 ('한우', 0.9949995875358582),
 ('트럭', 0.99355149269104),
 ('터진', 0.993334174156189),
 ('오염', 0.9929325580596924),
 ('복원', 0.9928935766220093),
 ('주가', 0.9924120306968689),
 ('기관장', 0.9922081232070923),
 ('사무실', 0.9920132160186768),
 ('홈', 0.9919726848602295)]

Unnamed: 0,category,title
1085,국제 > 아시아,[월드 톡톡] '지카' 확산 싱가포르 비상태세… 물웅덩이 방치하면 16만원 벌금
65950,경제,돌아온 유커·'블프' 효과… 살아나는 내수
62046,문화 > 전시ㆍ공연 > 공연,"한국 현대무용의 산파, 40년 전 작품 재현한다"
37814,정치 > 나눔 통일,"""통일에 한발 더"" 덕수고 총동창회, 500만원 전달"
44519,사회 > 인물 > 사람들,오삼균 국제정보대학협의회 의장
40060,국제,"[글로벌 콕콕] IS, 4세 꼬마 시켜서 4명 탄 차량 폭파 외"
53943,사회 > 인물 > 사람들,"탈북 출신 대졸 공채 첫 은행원들 ""통일시대 北 금융산업 중심 돼야죠"""
43331,사회 > 전국뉴스 > 제주,"중국 어선 1200척, 서귀포 해상 포위?"
11696,사회 > 인물 > 사람들,태국 대학입시에 한국어 채택… 1등 공신은?
44729,문화,2천년전 中동전 '貨泉'… 光州에서 무더기 출토


Cluster #2


[('광복', 0.9195242524147034), ('성적표', 0.9084739685058594)]

Unnamed: 0,category,title
7486,사회 > 날씨,[오늘의 날씨] 2016년 8월 5일
54653,사회 > 날씨,[오늘의 날씨] 2015년 12월 1일
20697,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2016년 5월 20일
1644,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2016년 9월 8일
22419,사회 > 날씨,[오늘의 날씨] 2016년 5월 11일
34644,사회 > 날씨,[오늘의 날씨] 2016년 3월 10일
11359,사회 > 날씨,[오늘의 날씨] 2016년 7월 12일
2093,사회 > 날씨,[오늘의 날씨] 2016년 9월 6일
122979,사회 > 날씨,[오늘의 날씨] 2016년 9월 30일
16941,사회 > 날씨,[오늘의 날씨] 2016년 6월 10일


Cluster #3


[('세평', 0.9326833486557007),
 ('맛있', 0.9186140894889832),
 ('한시', 0.9163631200790405),
 ('칠', 0.8893556594848633),
 ('양손', 0.8863326907157898)]

Unnamed: 0,category,title
122746,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 공시(公試)
15895,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 회한(悔恨)
62434,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 야합(野合)
50177,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 경도(傾倒)
836,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 홍해(紅海)
15641,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 초지일관(初志一貫)
11561,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 간격(間隔)
60159,문화,"[삼시세평(三視世評)] 걸었노라, 먹었노라, 연트럴파크"
974,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 신사(紳士)
4752,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 연명(延命)


Cluster #4


[('노동부', 0.9231353998184204),
 ('챔피언십', 0.921420693397522),
 ('도산', 0.919098973274231),
 ('조찬', 0.9188902378082275),
 ('교통부', 0.9185395240783691),
 ('열린', 0.9041615724563599)]

Unnamed: 0,category,title
36960,스포츠ㆍ연예 > 스포츠 > 종합,[스포츠 브리핑] 대한육상연맹 회장에 오동진 외
43323,사회 > 인물 > 부음,[부음] 강재위 별세 외
68469,사회 > 인물 > 부음,[부음] 강의식 별세 외
40502,사회 > 인물 > 부음,[부음] 김명수씨 별세 외
33908,사회 > 인물 > 부음,[부음] 김용길씨 별세 외
9914,사회 > 인물 > 부음,[부음] 김기환 별세 외
11684,사회 > 인물 > 부음,[부음] 김기순 별세 외
38685,사회 > 인물 > 부음,[부음] 강순자씨 별세 외
49693,사회 > 인물 > 부음,[부음] 김만선씨 별세 외
48596,사회 > 인물 > 부음,[부음] 김관호 삼화 회장 별세 외


Cluster #5


[('탄력', 0.9949396848678589),
 ('로봇', 0.9939169883728027),
 ('이메일', 0.9931246042251587),
 ('깬', 0.9930123686790466),
 ('거제', 0.9926040172576904),
 ('추', 0.9922823905944824),
 ('루', 0.9922467470169067),
 ('몸살', 0.9922303557395935),
 ('티', 0.9920598268508911),
 ('메르스', 0.9918960332870483)]

Unnamed: 0,category,title
498,문화 > 생활ㆍ여성 > 패션,밀리터리·치노… 실험적인 테마로 이 가을 패션 '마침표'
11916,사회 > 법원ㆍ검찰ㆍ경찰,진경준 차명계좌 뭉칫돈 오가… 돈세탁 했나
37473,사회 > 교육ㆍ시험 > 맛있는 공부 plus+,"진로 탐색 과정, 속도보다 방향이 중요해요"
580,경제 > 증권ㆍ금융,남아도는 은행 점포… 카페·오피스텔로 '변신'
36591,사회 > 인물 > 사람들,홍석현 '빌딩 브리지스 어워드' 수상
67904,사회 > 의료ㆍ보건,보건 당국 늑장 대처… 어린이 결핵 시약 동났다
42913,사회 > 인물 > 사람들,김종필 前 총리 '자랑스러운 육사인賞'
1055,스포츠ㆍ연예 > 엔터테인먼트 > 연예 > 음악 > 대중음악,"노란 물결의 외침 ""젝키 짱!"""
7693,사회 > 카드뉴스,"[카드뉴스] 소녀상을 위해, 일본과 맞서는 호주인 목사"
55588,스포츠ㆍ연예 > 스포츠 > 골프,[팝콘타임] 44년간 20만타 모두 숫자로 남긴 골프광


Cluster #6


[('침목', 0.950928807258606),
 ('염원', 0.9356826543807983),
 ('마중물', 0.8862489461898804),
 ('경원선', 0.8724907636642456),
 ('국부', 0.8570243716239929),
 ('장터', 0.8565588593482971)]

Unnamed: 0,category,title
6899,정치 > 나눔 통일,통일나눔펀드에 동참하세요
50229,정치 > 나눔 통일,"새에덴교회 1만6800명, 통일나눔 동참"
62718,정치 > 나눔 통일,통일염원 담긴 女高 복도의 '모금함'
7515,정치 > 나눔 통일,통일나눔펀드에 동참하세요
3718,정치 > 나눔 통일,통일나눔펀드에 동참하세요
69765,사회 > 우리이웃,"[더 나은 미래] ""뛰뛰빵빵~기부 문화 동참하세요"""
23990,정치 > 나눔 통일,통일나눔펀드에 동참하세요
26564,정치 > 나눔 통일,통일나눔펀드에 동참하세요
11734,정치 > 나눔 통일,통일나눔펀드에 동참하세요
28002,정치 > 나눔 통일,통일나눔펀드에 동참하세요


Cluster #7


[('옷', 0.9264137744903564),
 ('절망', 0.9187771081924438),
 ('제복', 0.9105050563812256),
 ('뛰어들', 0.9031517505645752),
 ('퍼지', 0.8922324776649475),
 ('자다', 0.8849401473999023)]

Unnamed: 0,category,title
17593,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 양어깨에 걸리다
20041,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 선동하다
26338,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 절도를 지키다
25383,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~이 임박하다
32382,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 정밀하게 검사하다
3280,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 큰대자로 누워 자다
32104,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 성명을 내다
36610,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 면허를 따다
48827,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 도와주다
43190,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 모래 먼지가 일다


Cluster #8


[('쓰레기', 0.9835757613182068),
 ('기상', 0.9831965565681458),
 ('라디오', 0.9824012517929077),
 ('파란', 0.9821838140487671),
 ('산타', 0.9819754362106323),
 ('뮤지컬', 0.9810968041419983),
 ('선수촌', 0.9809856414794922),
 ('번역가', 0.979934573173523),
 ('천일야화', 0.9783579111099243),
 ('할머니', 0.9779660105705261)]

Unnamed: 0,category,title
13957,사설ㆍ칼럼 > 외부칼럼 > 일사일언,[일사일언] 마을 기록자
26263,사설ㆍ칼럼 > 내부칼럼 > 조인원의 사진산책,[조인원의 사진산책] 생명을 해치고 행사를 망치는 카메라
48321,스포츠ㆍ연예 > 스포츠 > 종합,[팝콘타임] 탁구채 대신 '고사포' 잡은 중국 대표팀
59191,사설ㆍ칼럼 > 내부칼럼 > 박돈규의 극장傳,[박돈규의 극장傳] '땜빵'으로 출발한 배우 오달수의 인생경영
6112,스포츠ㆍ연예 > 스포츠 > 리우올림픽,[NEWS&VIEW] 절망을 모르는 뉴올림피언
65850,문화 > 북스,"[김시덕의 종횡무진 인문학] 고대 이스라엘 연구, 인류 문명을 위해 필요"
22180,문화,[왁자지껄 B급 사전] 빠지면 못 나와요~ 샤샤샤?
19398,사설ㆍ칼럼 > 외부칼럼 > 독자의견,[독자 마당] 어둡고 불안한 터널이 많다
32244,사설ㆍ칼럼 > 내부칼럼 > 류근일칼럼,[류근일 칼럼] 교양 있는 국민의 위대한 선택을
5896,정치 > 외교,"日本에는 딱 한마디… ""역사 직시, 미래 지향"""


Cluster #9


[('V', 0.9308866262435913),
 ('박영훈', 0.9272572994232178),
 ('흑', 0.9268786907196045),
 ('농심', 0.9244014620780945),
 ('피크', 0.9227466583251953),
 ('전자', 0.9202672243118286)]

Unnamed: 0,category,title
23862,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 눈부신 打開
45571,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 破竹之勢
51979,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 急流 속으로
68080,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 노림과 버팀
60364,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 朴 대 朴
54530,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 백의 獨舞臺
123173,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 一石三鳥
22316,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 마지막 決戰
35739,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 배와 배꼽
64259,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 探究心


Cluster #10


[('이영완', 0.9748206734657288),
 ('경제학', 0.9708617329597473),
 ('르네상스', 0.9660119414329529),
 ('창', 0.9655631184577942),
 ('의학', 0.9646199941635132),
 ('한현우', 0.962830662727356),
 ('질투', 0.9626568555831909),
 ('인문', 0.9624770283699036),
 ('인문학', 0.9613360166549683)]

Unnamed: 0,category,title
58711,사설ㆍ칼럼 > 외부칼럼 > 김대식 브레인,[김대식의 브레인 스토리] [161] 죽음과 인공지능
54319,문화,[어수웅의 르네상스人] M&A 관두고 대관령에 내려간 그녀
42835,사설ㆍ칼럼 > 내부칼럼 > 윤희영의 News English,[윤희영의 News English] 천진한 어린아이들의 민망한 질문들
17072,사설ㆍ칼럼 > 외부칼럼 > 김대식 브레인,[김대식의 브레인 스토리] [191] 모두가 트럼프인 우리나라
58970,사설ㆍ칼럼 > 내부칼럼 > 기자의 시각,[기자의 시각] 나라 밖의 별별 장관들
14909,사회,[박종인의 땅의 歷史] 탐진강에서 득량만으로 흐르는 문학의 향기
62797,스포츠ㆍ연예 > 스포츠 > 종합,[스포츠 브리핑] 체육기자상에 김성원·김진회 기자
7222,사설ㆍ칼럼 > 내부칼럼 > 만물상,[만물상] 대통령 사진사
36555,사설ㆍ칼럼 > 내부칼럼 > 박돈규의 극장傳,[박돈규의 극장傳] 햄릿이 배우 컴버배치에게 고마워할 일이다
11984,사설ㆍ칼럼 > 내부칼럼,"[2030 프리즘] 한국의 저력, 일본의 저력"


Cluster #11


[('절망', 0.8821383714675903),
 ('옷', 0.8713791370391846),
 ('제복', 0.866959810256958),
 ('자다', 0.8555768728256226),
 ('뛰어들', 0.8549460172653198),
 ('퍼지', 0.849696159362793)]

Unnamed: 0,category,title
35155,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 정선하다
13797,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 주파(완주)하다
11604,사회 > 카드뉴스,[카드뉴스] 당신도 멘탈 을(乙)?
29838,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~이 고작이다
14455,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 모조리 이기다
22425,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~이 먼저다
48623,사회 > 교육ㆍ시험 > 일본어,"[입에 착착 붙는 일본어] ~에 불과하다, ~에 지나지 않다"
51822,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~이 도처에 보이다
49928,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~이 지나가다
13355,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~에 맞지 않다


Cluster #12


[('성적표', 0.8826451301574707),
 ('페스티벌', 0.8767877817153931),
 ('경원선', 0.8742831945419312),
 ('리거', 0.8703847527503967)]

Unnamed: 0,category,title
43221,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2016년 1월 27일
54959,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 11월 30일
64414,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 10월 16일
22040,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2016년 5월 13일
51894,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 12월 14일
61036,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 10월 31일
69127,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 9월 24일
61651,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 10월 29일
56777,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 11월 21일
68298,정치 > 나눔 통일,[통일나눔펀드 참여 현황] 2015년 9월 30일


Cluster #13


[('매달', 0.9813985824584961),
 ('작년', 0.9810056686401367),
 ('61', 0.9808797836303711),
 ('껑충', 0.9797338247299194),
 ('승소', 0.9730113744735718),
 ('판매', 0.9724357724189758),
 ('최소', 0.9718186259269714),
 ('영업', 0.9712559580802917),
 ('300', 0.9705231189727783)]

Unnamed: 0,category,title
29577,사회,"노태우 장남 노재헌, 1달러짜리 1주씩 발행한 페이퍼 컴퍼니 3곳 설립"
67172,국제 > 아시아,"도금 가능한 주조단지, 19개기업 3000억원 투자"
778,문화,"1400년 세월 버틴 첨성대, 2㎝ 더 기울어져"
59598,정치 > 나눔 통일,"삼성카드 508명, 월급 0.1~0.3% 기부"
17461,경제,옐런 한마디에… 원달러 환율 20.9원 급락
43212,정치 > 나눔 통일,유진그룹 1844명 참여… 5000만원 기부
28799,스포츠ㆍ연예 > 엔터테인먼트 > 영화,[이번주 개봉영화 딱 10자평] '스틸 플라워' 외
25915,스포츠ㆍ연예 > 엔터테인먼트 > 영화 > 영화리뷰,[이번주 개봉영화 딱 10자평] '브루클린' 외
54056,스포츠ㆍ연예 > 스포츠 > 야구 > MLB > 코리안리거,"박병호, 1800만 달러의 사나이"
42440,경제,"한화, 올해 3조4000억 투자… 그룹 역대 최대"


Cluster #14


[('농사', 0.979719877243042),
 ('영혼', 0.9785622358322144),
 ('어른', 0.9774155020713806),
 ('유혹', 0.976672351360321),
 ('예쁜', 0.9765453338623047),
 ('미각', 0.9745528697967529),
 ('밥', 0.9745407104492188),
 ('풍경', 0.974208652973175),
 ('이름', 0.9740431308746338)]

Unnamed: 0,category,title
49865,문화 > 생활ㆍ여성 > 패션,"남자들이여, '분홍'을 입어라"
43365,사회 > 우리이웃,"[더 나은 미래] '장애'를 '기회'로… ""꿈꾸는 당신을 응원합니다"""
10292,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 먼저 가는 것들은 없다
16777,사회,"""낯선 한국에 바친 청춘 헛되지 않았다"""
23291,스포츠ㆍ연예 > 스포츠 > 야구 > 프로야구,"아빠, 저 아저씨들 야구하다 싸워요"
122902,사회 > 웹툰,[치삼 뉴스툰②] 지진희다! 지진희가 나타났다!
58715,사설ㆍ칼럼 > 외부칼럼 > 일사일언,[일사일언] 여행 가방 꾸리기
40574,경제 > 과학,아인슈타인의 수수께끼 '중력파'… 시공간 휘게 만드는 비밀 찾았나
68930,경제,[김대리의 뒷담화] '社內 실연' 비밀 고백했더니 떠벌여… 당신들 내 동료 맞습니까
62136,사회 > 교육ㆍ시험,집안 가난해도… 신문·책 읽으니 '개천용' 되더라


Cluster #15


[('체육', 0.9885315895080566),
 ('용역', 0.9878283739089966),
 ('젠', 0.9874504804611206),
 ('서울역', 0.9857074022293091),
 ('실크', 0.9842575788497925),
 ('대학교', 0.9838204979896545),
 ('캠퍼스', 0.9837024807929993),
 ('교육학', 0.9832884669303894),
 ('중심지', 0.9822924137115479),
 ('공학부', 0.9821397066116333)]

Unnamed: 0,category,title
25246,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,"박정환·이세돌, 잉씨배 준결 길목서 격돌"
16491,사회 > 전국뉴스 > 영남 > 부산뉴스,[로컬 뉴스] 부산 사상공단에 신발융합센터
52030,사회 > 교육ㆍ시험 > 맛있는 공부,겨울방학 '필리핀 영·수 몰입캠프' 46기 外
63105,사회 > 인물 > 인사,[인사] 문화체육관광부 외
44526,사회 > 전국뉴스 > 수도권 > 서울뉴스,"박원순 시장, 다보스포럼서 서울시 혁신 발표"
49239,사회 > 인물 > 부음,[부음] 김만수 대구신문 동부취재본부 부국장대우 별세 외
65007,국제,[글로벌 콕콕] '부에나 비스타' 美 백악관서 연주 외
61539,국제,"[글로벌 콕콕] 中자본, 英사립학교 잇단 인수 외"
68942,스포츠ㆍ연예 > 스포츠 > 종합,"[스포츠 브리핑] 男농구팀, 아시아선수권 요르단 격파 외"
48138,문화,[2016 신춘문예] 상식의 속도


Cluster #16


[('한시', 0.9846311807632446),
 ('시조', 0.9810360670089722),
 ('동시', 0.9496616125106812),
 ('양손', 0.9221735000610352),
 ('산사', 0.9112076759338379),
 ('달걀', 0.9058848023414612)]

Unnamed: 0,category,title
32720,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 나루터에서 배를 다투다
28582,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 아버지 소식
54654,사회 > 교육ㆍ시험 > 중국어,[신문으로 배우는 실용한자] 공방(攻防)
27878,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 동시] 따라와 따라와
46734,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 처가에서
56658,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 철원에서
61063,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 갑술년 가을
20532,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 꽃넋
6030,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 손배(損賠)
68396,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 한시] 추석


Cluster #17


[('봅시다', 0.8012608289718628),
 ('무엇', 0.7986645102500916),
 ('립스틱', 0.7967175841331482),
 ('정정', 0.796457827091217),
 ('겉', 0.7954176664352417),
 ('민망', 0.7865514755249023),
 ('스럽', 0.7838905453681946)]

Unnamed: 0,category,title
37485,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 얼버무리다
51244,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 맞선을 보다
8645,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 고자질하다
39173,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 본체만체하다
33027,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 병세가 위중하다
30221,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 그와는 상관없는 일이다
42123,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 원가가 높다
38038,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 주제넘게 말하다
28904,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 가출하다
20817,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 시간을 때우다


Cluster #18


[('밥', 0.9773996472358704),
 ('여기', 0.9762592315673828),
 ('소리', 0.9704843759536743),
 ('웃', 0.9690111875534058),
 ('모르', 0.9681610465049744),
 ('믿', 0.9667289853096008),
 ('너', 0.9664903879165649),
 ('봐', 0.9646485447883606)]

Unnamed: 0,category,title
63203,정치 > 나눔 통일,"""한국이 통일 소극적? 잘못된 생각이었다"""
46261,문화 > 전시ㆍ공연 > 전시,붓을 놓았더니… 그림이 보였다
21204,문화,"""한국에 훌륭한 작가 많아… 앞으로는 이런 일들이 낯설지 않을 것"""
26209,사회 > 카드뉴스,[카드뉴스] 트러블메이커를 잡는 이는 없었다
37405,문화 > 전시ㆍ공연 > 공연,"""1등 못하면 울던 나, 이젠 져도 받아들여"""
65192,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,'미래의 ★'을 찾습니다
17290,스포츠ㆍ연예 > 스포츠 > 축구 > 국가대표팀,"申의 한 수, 어디 둘까"
43,문화 > 더테이블,모락모락 솥밥… 밥만 먹어도 꿀맛
14955,nativeAD > 신세계,"정용진 ""친구와 함께 가는 길이 가장 즐거워"""
52631,문화 > 전시ㆍ공연 > 공연,"""얌전하면 랑랑이 아니죠"""


Cluster #19


[('29', 0.9437698721885681)]

Unnamed: 0,category,title
9094,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2016년 7월 25일
56464,사회 > 날씨,[오늘의 날씨] 2015년 11월 23일
13795,사회 > 날씨,[오늘의 날씨] 2016년 6월 28일
43924,사회 > 날씨,[오늘의 날씨] 2016년 1월 23일
43053,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2016년 1월 27일
31510,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2016년 3월 25일
58900,사회 > 카드뉴스,[카드뉴스] 11월 11일 세계가 부산을 향했습니다.
64029,스포츠ㆍ연예 > 스포츠 > 종합,[내일의 경기] 2015년 10월 18일
10577,사회 > 날씨,[오늘의 날씨] 2016년 7월 16일
58930,스포츠ㆍ연예 > 스포츠 > 종합,[오늘의 경기] 2015년 11월 11일


Cluster #20


[('It', 0.9845526814460754),
 ('That', 0.9765428900718689),
 ('Don', 0.9732495546340942),
 ('I', 0.9682589173316956),
 ('What', 0.9669052958488464),
 ('one', 0.9635307788848877),
 ('the', 0.9632136821746826),
 ('it', 0.9617078304290771),
 ('to', 0.9603339433670044)]

Unnamed: 0,category,title
47053,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] Just a thought
56494,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] My lips are sealed.
25386,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] peek behind the curtain
33034,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] make a fuss
661,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] cross one's mind
18368,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] I'll swing by after work.
46111,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] How should I know?
35162,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] willy-nilly
51252,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] That figures.
53485,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] play it by ear


Cluster #21


[('반기문', 0.9903106689453125),
 ('이정현', 0.9899962544441223),
 ('민생', 0.9877718687057495),
 ('현기환', 0.985853374004364),
 ('불출마', 0.9856241345405579),
 ('차기', 0.9848198890686035),
 ('박원순', 0.9844543933868408),
 ('금', 0.983954668045044),
 ('방어', 0.9838507771492004),
 ('측근', 0.9834879636764526)]

Unnamed: 0,category,title
17445,정치 > 국회ㆍ정당,"목청 커진 親朴… 복당 논의 연기, 黨대표도 의욕"
15167,사설ㆍ칼럼 > 내부칼럼 > 사설,"[사설] 대통령, 新공항 탈락 지역에 '반대급부 없다' 밝혀야"
54296,사설ㆍ칼럼 > 내부칼럼 > 경제포커스,[경제포커스] 벤처도 연륜으로 창업한다
34347,사설ㆍ칼럼 > 내부칼럼 > 팔면봉,"[팔면봉] 與 계파 내분, 공천 심사 중단 사태로 비화 외"
36669,사설ㆍ칼럼 > 내부칼럼 > 사설,"[사설] 이번엔 살생부 논란, 새누리 '공천 막장劇' 끝은 어디인가"
23010,정치 > 국회ㆍ정당,대선 후보들 염두에 뒀다는 더민주 원내副대표단
59737,국제,"[글로벌 콕콕] 칠레, 네루다 타살 가능성 첫 인정 외"
31312,사설ㆍ칼럼 > 내부칼럼 > 팔면봉,"[팔면봉] 金 대표와 親朴, 후보 등록 마감 직전에 공천 내분 일단 봉합 외"
999,정치,"與 ""국민 안심시킨 회동""… 더민주 ""대통령의 안보 강의"""
52245,경제,"崔 부총리 ""한국 경제, 세계적 경제위기서 선방"""


Cluster #22


[('종일', 0.9922356605529785),
 ('유족', 0.9909012317657471),
 ('절반', 0.9890409708023071),
 ('승객', 0.9890251159667969),
 ('보조금', 0.988727331161499),
 ('내수', 0.9876916408538818),
 ('완료', 0.9876750707626343),
 ('투', 0.9875768423080444),
 ('금리', 0.9874967336654663),
 ('채택', 0.9869321584701538)]

Unnamed: 0,category,title
6018,문화 > 북스,"""詩의 도시 대구, 시인만 700명 넘죠"""
1183,정치 > 북한,"이번 '北核' 서울서 터지면… 반경 4.5㎞ 초토화, 62만명 사망"
6828,스포츠ㆍ연예 > 스포츠 > 리우올림픽,28년간 우리만 이 金을 맛보다
122991,사회 > 법원ㆍ검찰ㆍ경찰,"검찰, 최근 2~3년 손대는 '기업 수사'마다 허탕"
30430,사회 > 국방,"국민 10명 중 7명 ""전쟁 나면 총 들겠다"""
7475,사회 > 교통ㆍ관광ㆍ항공,SRT 타고 부산 가면 KTX보다 14% 저렴
16562,사회 > 법원ㆍ검찰ㆍ경찰,"롯데, 수백억 얹어 신격호 땅 사줬다"
59816,정치,"긴급상황때 벙커에 모이는 시간… 백악관 5분, 청와대는 20분"
17289,스포츠ㆍ연예 > 스포츠 > 축구 > 국가대표팀,"""세계 축구와 격차 확인… 하루 이틀만엔 못 고쳐"""
42056,국제 > 아시아,말레이시아 총리 주변 또 40억달러 스캔들


Cluster #23


[('값', 0.9884068965911865),
 ('주인', 0.988240122795105),
 ('불만', 0.986859142780304),
 ('내전', 0.9866275787353516),
 ('한데', 0.9855899810791016),
 ('집권', 0.9851394295692444),
 ('미친', 0.9849996566772461),
 ('성격', 0.9844375252723694),
 ('의자', 0.9839177131652832)]

Unnamed: 0,category,title
9659,스포츠ㆍ연예 > 스포츠 > 리우올림픽,"러시아, 올림픽에 오나 못 오나… 리우 全종목 '패닉'"
8273,사회 > 의료ㆍ보건,"MRI 도입하려는 병원들 ""病床 꿔줘, 1개에 백만원 줄게"""
56386,스포츠ㆍ연예 > 스포츠 > 야구,"삼겹살 1000인분 먹고 한몸 야구, 기적을 만들다"
59272,사회 > 우리이웃,"[더 나은 미래] 이야기가 있는 모금… ""다음 글이 기다려져요"" 팬이 된 후원자"
5764,스포츠ㆍ연예 > 스포츠 > 리우올림픽,"""이럴거라고 했지?"" 볼트, 100m 3연패"
39142,사회 > 의료ㆍ보건,40대 이상은 일본 뇌염 사각지대… 백신 맞아야
11086,문화 > 더테이블,"남성 절반이 ""외도한 경험 있다""… 한국, 일본에 이어 세계 두번째로 섹스리스 부부 많아"
63627,사회 > 의료ㆍ보건,외출 후엔 콧속 씻고… 실내 습도는 60% 유지해야
46328,사회 > 우리이웃,[더 나은 미래] 나는 대한민국 1%입니다
3092,경제,6일간 쇼핑은 세번뿐… '짝퉁 파는 가게' 아예 없더라


Cluster #24


[('달러', 0.9766253232955933),
 ('5000', 0.9636297821998596),
 ('연', 0.9577937126159668),
 ('8000', 0.9494413733482361),
 ('3000', 0.9427536725997925),
 ('짜리', 0.9418603181838989),
 ('씩', 0.9415959119796753),
 ('年', 0.9414255619049072),
 ('매출', 0.9397006630897522)]

Unnamed: 0,category,title
45947,경제,9.2%
25911,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송 > 드라마,박신양의 60분 원맨쇼… 60초처럼 지나간다
31974,스포츠ㆍ연예 > 스포츠 > 종합,"연재의 찌그러진 후프, 보상금 7000원?"
41735,정치,화환 4 對 1
49357,경제 > 부동산,3.3㎡당 5억5500만원!
29869,사회 > 카드뉴스,"[카드뉴스] 20대는 4억, 70대는 8000만원?"
43485,정치 > 나눔 통일,'밴쿠버 조선' 168만원
64887,사회 > 카드뉴스,[카드뉴스] 1000억원짜리 인질극
9005,사회,100세 노인 3000명 넘어… 10년 만에 3배
67841,스포츠ㆍ연예 > 스포츠 > 야구 > 프로야구,한번만 더 훔치면 첫 40-40


Cluster #25


[('연구회', 0.9846329689025879),
 ('명예', 0.977763831615448),
 ('원로', 0.9732552766799927),
 ('한림', 0.9717571139335632),
 ('최태원', 0.9717384576797485),
 ('법학', 0.9715712070465088),
 ('이사장', 0.970470666885376),
 ('시상식', 0.9702968597412109),
 ('클럽', 0.9697276949882507),
 ('토론회', 0.9694700241088867)]

Unnamed: 0,category,title
60035,사회 > 인물 > 동정,[플라자] 한국정치정보학회 학술회의 개최 외
1685,사회 > 인물 > 동정,[플라자] 성결대 '대학-안양시 미래발전 포럼' 개최 외
37445,사회 > 인물 > 사람들,하동명 한국안전학회장
41853,사회 > 인물 > 부음,[부음] '상도동계 원로' 새누리 김명윤 상임고문 별세 외
65870,사회 > 인물 > 부음,[부음] 구한서 한서생체자기연구원장 별세 외
9359,사회 > 인물 > 사람들,박정부 다이소회장 '금탑산업훈장'
8630,사회 > 인물 > 부음,[부음] 곽호강 별세 외
59030,사회 > 인물 > 사람들,장재영 대표·이수천 이사장 동탑훈장
29640,사회 > 인물 > 인사,[인사] 행정자치부
14854,사회 > 인물 > 동정,[플라자] 한국과학기술한림원 제102회 한림원탁토론회 개최 외


Cluster #26


[('압승', 0.9889834523200989),
 ('충청', 0.9863054752349854),
 ('천정배', 0.9846793413162231),
 ('유엔', 0.9841219186782837),
 ('지역구', 0.9831110835075378),
 ('현역', 0.981370210647583),
 ('대결', 0.9810203313827515),
 ('방문', 0.9798911809921265),
 ('이정현', 0.9789702296257019),
 ('탈락', 0.9783840775489807)]

Unnamed: 0,category,title
25415,정치,親與 무소속들 복당… 주호영·이철규 남아
58234,경제 > 글로벌경제,中 위안화 '5대 국제통화'로
32464,정치 > 국회ㆍ정당,"4년전 20번까지 장악한 운동권, 비례 당선권서 사라져"
11400,정치,유승민엔 K-2·정진석엔 특사… 朴대통령의 '오찬 회동 선물'
28645,사회 > 인물 > 인사,[인사] 유세경 여론집중도조사위원회 위원장 외
29153,정치 > 국회ㆍ정당,문재인 호남 방문 놓고 2野 신경전
51861,정치 > 국회ㆍ정당,親盧의 반격… 비주류 70% 공천탈락說
17195,정치 > 정부ㆍ지자체,靑비서실장과 10명 수석 중 TK 6명·충청 3명
56302,정치 > 국회ㆍ정당,내년 총선 앞두고 '불모지' 호남 예산 챙기기 나선 與
22277,정치 > 국회ㆍ정당,與 당선자들 설문… 혁신위원장 1등에 김황식


Cluster #27


[('울산', 0.9938812255859375),
 ('면세점', 0.9914131760597229),
 ('첫날', 0.9912569522857666),
 ('승진', 0.9906572699546814),
 ('상가', 0.9899432063102722),
 ('체포', 0.9897373914718628),
 ('기관장', 0.9892033934593201),
 ('신세계', 0.9890806674957275),
 ('최근', 0.9888265132904053),
 ('특허', 0.9887667894363403)]

Unnamed: 0,category,title
26392,경제 > 부동산,단일 브랜드 기준 영남권 최대 규모
370,nativeAD > 기업뉴스,美 리프트도 진출… 자율주행車 선점 경쟁
11754,정치,"새누리도 홍보업체와 뒷거래… 선관위, 조동원 前본부장 고발"
47339,경제 > 부동산,세계 최대규모 바이오의약품 공장·80조원 투자 미단시티 등 배후 수요 탄탄한 분양형 호텔
26629,경제 > 유통ㆍ소비자,수능 만점자 14명 배출… 학과별 맞춤 입시 분석도
25865,경제,구글 1분기 실적 기대 이하… 주가 6% 하락
55567,정치 > 정부ㆍ지자체,"국토부 2차관 최정호, 권익위 부위원장 이상민"
14245,사회 > 법원ㆍ검찰ㆍ경찰,5년간 연비성적서 130건 조작… 폴크스바겐 한국 임원 첫 구속
1813,nativeAD > CJ,"CJ그룹, 하반기 신입사원 1700명 공개 채용"
60401,사설ㆍ칼럼 > 내부칼럼 > 만물상,[만물상] '금연 시설 1호' 국회


Cluster #28


[('시범', 0.9860907793045044),
 ('뜬다', 0.9819744229316711),
 ('연맹', 0.9795434474945068),
 ('결승', 0.9777881503105164),
 ('박정환', 0.9766611456871033),
 ('수원', 0.9766179919242859),
 ('여의도', 0.9755293130874634),
 ('멧돼지', 0.9751742482185364),
 ('항공기', 0.9743927717208862),
 ('SK', 0.9739224314689636)]

Unnamed: 0,category,title
23284,스포츠ㆍ연예 > 스포츠 > 종합,"[스포츠 브리핑] 클리블랜드, NBA 4강 PO 2연승 외"
32906,사설ㆍ칼럼 > 외부칼럼 > 시론ㆍ기고,[기고] 18세기 체스 두는 인형에서 21세기 알파고까지
68767,문화,[문화 소식] '보리밭' 작곡가 윤용하 50주기 음악회 외
27134,사회 > 교육ㆍ시험 > 맛있는 공부,"[맛있는 교육정보] 캠프코리아, 9월 학기 유학생 모집"
22444,사회 > 교육ㆍ시험,21세기는 '퍼스트 무버' 시대
11049,사설ㆍ칼럼 > 내부칼럼 > 만물상,[만물상] '9급 변호사'
27555,사회,올해의 샘터賞·샘물賞 선정
122714,문화 > 전시ㆍ공연 > 전시,[문화 소식] 10월 21일까지 '섬유미술 10인전'
54050,스포츠ㆍ연예 > 스포츠 > 종합,"[스포츠 브리핑] 수원 FC, 부산 아이파크 1대0으로 눌러 외"
47173,스포츠ㆍ연예 > 스포츠 > 종합,[스포츠 브리핑] 두산 니퍼트와 14억원 재계약 외


Cluster #29


[('지능', 0.9920169711112976),
 ('연이', 0.9908947348594666),
 ('요트', 0.9904236197471619),
 ('서민', 0.9896724224090576),
 ('이끈', 0.9887779951095581),
 ('청정', 0.988667368888855),
 ('창고', 0.9882193803787231),
 ('유머', 0.9882113933563232),
 ('냉전', 0.9878215789794922),
 ('고대', 0.9875915050506592)]

Unnamed: 0,category,title
49216,문화 > 북스,[세계의 베스트셀러-중국] 중국을 흔든 '음료 大王'… 中 현대사에 얽힌 그의 삶
27696,사회 > 인물 > 사람들,장석주 시인 '편운문학賞'
13918,사설ㆍ칼럼 > 외부칼럼 > 시론ㆍ기고,[시론] 英과 EU의 브렉시트 출구전략
20411,사회 > 교육ㆍ시험 > 맛있는 공부,[알립니다] 공부법 전문가 이병훈 동행 독일 이공계 팩토리투어 外
9925,사회 > 인물 > 사람들,지리산문학賞에 박지웅 시인
15182,사설ㆍ칼럼 > 내부칼럼 > 기자의 시각,[기자의 시각] 도박판 증시의 주역들
37133,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 호르몬 맞춤 건강 관리법
14770,사설ㆍ칼럼 > 내부칼럼,[객원기자 칼럼] 民辯의 잔인한 탈북자 인권 '쇼'
47702,사회 > 인물 > 사람들,최창운 한국원자력의학원장
17298,사설ㆍ칼럼 > 외부칼럼 > 발언대,"[발언대] 교원 성과급, 得보다 失이 크다"


Cluster #30


[('케이크', 0.9902708530426025),
 ('목숨', 0.9895225763320923),
 ('틀', 0.9889344573020935),
 ('그냥', 0.9871530532836914),
 ('덮', 0.9869543313980103),
 ('해당', 0.9862418174743652),
 ('뿌리', 0.9861772060394287),
 ('우린', 0.9861277341842651),
 ('덕', 0.9857510924339294),
 ('몰라', 0.9854095578193665)]

Unnamed: 0,category,title
29430,사회 > 카드뉴스,"[카드뉴스] ""내 머리 위로 폭탄을 퍼부어 주십시오"""
19667,사회 > 인물 > 사람들,"목포선 이난영 노래, 제주선 이중섭 연극"
19794,사회 > 카드뉴스,[카드뉴스] 그러라고 외국인 감독 뽑은 겁니다
16841,스포츠ㆍ연예 > 스포츠 > 골프 > 남자국내골프,짐싼 최진호·이수민
14437,사회 > 전국뉴스 > 강원,커피 내려 마시러 도서관 갑니다
12947,사회 > 인물 > 사람들,"[Why] ""우리 생애 최고의 순간, 아직 오지 않았다"
24056,스포츠ㆍ연예 > 스포츠 > 축구 > 해외파,"축구 유럽파, 다 어디 숨었니?"
35728,스포츠ㆍ연예 > 엔터테인먼트 > 영화,"백마탄 왕자는 없어, 인생은 내가 책임지는 거야"
42402,사회,"[Why] 얼지 않는 한강, 지구온난화 때문만은 아니다"
47133,사회 > 카드뉴스,[카드뉴스] 국가대표 외야수도 선수 이전에 한 아이의 '아빠'였다.


Cluster #31


[('열린', 0.9271509051322937),
 ('노동부', 0.9268769025802612),
 ('교통부', 0.9009383916854858),
 ('국무총리실', 0.8981869220733643),
 ('연구원', 0.8868207931518555)]

Unnamed: 0,category,title
19459,사회 > 인물 > 인사,[인사] 미래창조과학부 외
24812,사회 > 인물 > 인사,[인사] 미래창조과학부 외
6362,사회 > 인물 > 인사,[인사] 보건복지부 외
52660,사회 > 인물 > 인사,[인사] 건국대 외
56728,사회 > 인물 > 사람들,조경호 인사행정학회장
52420,사회 > 인물 > 인사,[인사] 인천국제공항공사
22688,사회 > 인물 > 인사,[인사] 국무총리실 외
36338,사회 > 인물 > 인사,[인사] 국무총리실 외
3525,사회 > 인물 > 인사,[인사] 미래창조과학부 외
34883,사회 > 인물 > 인사,[인사] 국무총리실 외


Cluster #32


[('미친', 0.9942178130149841),
 ('의자', 0.9929561614990234),
 ('살해', 0.9927442669868469),
 ('아픈', 0.9924566745758057),
 ('티', 0.9924141764640808),
 ('루', 0.9921119213104248),
 ('면역력', 0.9920459389686584),
 ('동영상', 0.9915087223052979),
 ('문화재', 0.9914752244949341),
 ('유입', 0.9913101196289062)]

Unnamed: 0,category,title
122688,사설ㆍ칼럼 > 내부칼럼 > 만물상,[만물상] 줬다 뺏는 기초연금
65500,국제 > 미국ㆍ중남미,美교실에 의자가 사라졌네요
42561,문화 > 생활ㆍ여성,새 레이저 가공 기술 적용… 섬세함을 뽐내다
41511,스포츠ㆍ연예 > 스포츠 > 축구 > 해외축구,스페인·獨축구 이어 이번엔 잉글랜드… 과르디올라의 '도장 깨기'
62380,사회 > 의료ㆍ보건,뼈 절제 없이 미세현미경으로 디스크 제거… 중증 환자도 하루만에 걷기 가능
20358,문화 > 전시ㆍ공연 > 공연,1인 多役에 노래까지… 바쁘다 바빠
20216,사회 > 환경ㆍ재해,미세먼지 숨막히는데… 경유버스 증가 부추기는 '거꾸로 정책'
24112,문화 > 생활ㆍ여성 > 패션,"디지털 시대, 아날로그 펜이 전하는 따뜻한 감성"
27102,사회 > 전국뉴스 > 강원,"설악도 빠졌다, 속초의 눈동자에"
59769,사회,"[Why] ""취준생 여러분, 미안합니다…"""


Cluster #33


[('화요일', 0.9929735660552979),
 ('일요일', 0.9905408620834351),
 ('토요일', 0.9887330532073975),
 ('수요일', 0.9886476397514343),
 ('금요일', 0.9847456216812134),
 ('목요일', 0.9813563823699951),
 ('월요일', 0.9798309803009033),
 ('29', 0.9699862599372864),
 ('신사', 0.9659380316734314),
 ('갑신', 0.9655584096908569)]

Unnamed: 0,category,title
25883,문화 > 오늘의 운세,[오늘의 운세] 4월 23일 토요일(음력 3월 17일 乙亥)
7691,문화 > 오늘의 운세,[오늘의 운세] 8월 4일 목요일(음력 7월 2일 戊午)
68603,문화 > 오늘의 운세,[오늘의 운세] 9월 27일 일요일(음력 8월 15일 丙午)
49368,문화 > 오늘의 운세,[오늘의 운세] 12월 27일 일요일(음력 11월 17일 丁丑)
54274,사고 > 바로잡습니다,[바로잡습니다] 30일자 A30면 '뉴스 속의 한국사' 코너
36226,문화 > 오늘의 운세,[오늘의 운세] 3월 3일 목요일(음력 1월 25일 甲申)
5715,문화 > 오늘의 운세,[오늘의 운세] 8월 17일 수요일(음력 7월 15일 辛未)
19790,문화 > 오늘의 운세,[오늘의 운세] 5월 26일 목요일(음력 4월 20일 戊申)
34058,문화 > 오늘의 운세,[오늘의 운세] 3월 14일 월요일(음력 2월 6일 乙未)
24234,문화 > 오늘의 운세,[오늘의 운세] 5월 2일 월요일(음력 3월 26일 甲申)


Cluster #34


[('살롱', 0.9900920391082764),
 ('톡톡', 0.9861571788787842),
 ('배상근', 0.980484127998352),
 ('조용헌', 0.9768741130828857),
 ('월드', 0.9733378291130066),
 ('핫', 0.9729169011116028),
 ('아트', 0.9699506163597107),
 ('코너', 0.9689141511917114),
 ('팝콘', 0.9685713648796082),
 ('프리즘', 0.9671213626861572)]

Unnamed: 0,category,title
24305,문화 > 북스,"[편집자 레터] 배우 김수미의 ""엄니, 엄니, 우리 엄니…"""
39772,사설ㆍ칼럼 > 내부칼럼 > 만물상,[만물상] 시루떡 판결문
43855,문화 > 북스 > 신간소개,[북카페] '량치차오(梁啓超) 평전' 외
4476,사설ㆍ칼럼 > 외부칼럼 > 정민의 세설신어,[정민의 世說新語] [380] 당심기인(當審其人)
9325,문화 > 북스 > 신간소개,[북카페] '심연' 외
20534,사설ㆍ칼럼 > 외부칼럼 > 우정아의 아트 스토리,[우정아의 아트 스토리] [156] 스마트폰에 강림한 성령
52863,사설ㆍ칼럼 > 외부칼럼 > 정민의 세설신어,[정민의 世說新語] [344] 감인세계(堪忍世界)
13916,사설ㆍ칼럼 > 외부칼럼 > 조용헌 살롱,[조용헌 살롱] [1046] 산토리니의 裨補
39099,사설ㆍ칼럼 > 외부칼럼 > 정민의 세설신어,[정민의 世說新語] [353] 조병추달 (操柄推達)
7735,사설ㆍ칼럼 > 외부칼럼 > 정민의 세설신어,[정민의 世說新語] [377] 용형삼등(用刑三等)


Cluster #35


[('후회', 0.9127518534660339),
 ('스럽', 0.9118160009384155),
 ('대로', 0.9073224067687988),
 ('같이', 0.907008707523346),
 ('해졌', 0.9065265655517578),
 ('무엇', 0.9063804149627686),
 ('아무', 0.9011412262916565),
 ('지나치', 0.9000519514083862)]

Unnamed: 0,category,title
48244,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 자기 스스로 괜찮다고 생각하다
50446,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 상대의 말과 안색을 살피다
123909,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 너무 빨리 결론 짓지 말아요
40515,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 발 뻗고 자다
38709,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 작은 이익을 탐내다
33717,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 거하게 먹다
7828,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 나오지 마세요 / 들어가세요
60064,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 정말 방법이 없다
44556,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 용모로 사람을 평가하다
19701,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 일반적으로


Cluster #36


[('주중', 0.9568579196929932),
 ('주말', 0.9554785490036011),
 ('록', 0.9452641010284424),
 ('얽힌', 0.9442105889320374),
 ('왕실', 0.939924955368042),
 ('VR', 0.9376075863838196),
 ('하이라이트', 0.9323234558105469),
 ('홀대', 0.9301750659942627),
 ('화제', 0.9297895431518555)]

Unnamed: 0,category,title
65783,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 남한과 북한의 여행 차이
34523,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 난장판 집에 경악하는 주은
53651,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송 > 예능,[TV조선 ch19] 늦둥이 아들 심부름 도전기
122585,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선] 배우 김수미의 인생이야기
43264,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 서정희 사생활·근황 공개
63898,사회 > 교육ㆍ시험 > 맛있는 공부,테마가 있는 교육여행 '조선에듀투어'
52084,스포츠ㆍ연예 > 스포츠 > 야구,"[Why] ""치어리더 일에 걸맞게 대우해주는 회사 사장님 될래요"""
60603,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 연예계 괴소문의 진실
55124,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 백색 가루의 다양한 비법
47991,스포츠ㆍ연예 > 엔터테인먼트 > TV/방송,[TV조선 ch19] 북한 상위 1% 엘리트의 삶


Cluster #37


[('한시', 0.9586609601974487),
 ('시조', 0.9186087846755981),
 ('또박또박', 0.8732824921607971),
 ('양손', 0.8685274720191956)]

Unnamed: 0,category,title
17701,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 써레
12674,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 슬하
20336,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 금붕어 길들이기
21574,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 봄밤
42007,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 홉스굴 부근
31131,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 춘신(春信)
46513,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 난(蘭)
45089,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 측행(仄行)
51993,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 딸아이의 능금
11470,사설ㆍ칼럼 > 외부칼럼 > 가슴으로 읽는…,[가슴으로 읽는 시] 시


Cluster #38


[('쓰레기', 0.9914085865020752),
 ('여권', 0.9909844994544983),
 ('코끼리', 0.990369439125061),
 ('성범죄자', 0.9896275997161865),
 ('바지', 0.9868490099906921),
 ('SNS', 0.986426591873169),
 ('청소기', 0.9863725900650024),
 ('셔츠', 0.9858072996139526),
 ('언어', 0.9853405356407166),
 ('탕', 0.9850879907608032)]

Unnamed: 0,category,title
62798,스포츠ㆍ연예 > 스포츠 > 종합,휠체어 타고 달려오는 '가을의 전설'
29118,사회 > 교육ㆍ시험 > 중국어,[매일매일 중국어 한마디] 물건을 여러 곳에서 비교하다
43191,사회 > 교육ㆍ시험 > 생활한자,[신문으로 배우는 실용한자] 해적(海賊)
24101,문화 > 생활ㆍ여성 > 패션,"남자의 패션, '스포티 럭셔리' 아이템으로 완성되다"
123847,문화 > 생활ㆍ여성,'패션 피플'의 계절… 나만의 슈트·트렌디 백으로 끝!
4120,사설ㆍ칼럼 > 외부칼럼 > 독자의견,[조선일보를 읽고] 거꾸로 가는 보건소 서비스
56110,사고 > 조선일보 사고,"[알립니다] 연시 이웃 사랑 전하세요"""
20361,문화,"[트렌드+] ""저만 불편한가요?"" 비난 부추기는 사람들"
64949,사고 > 조선일보 사고,[알립니다] 조선일보 문화교실이 대마도를 찾아갑니다
122814,문화,[Why] LP바 유감


Cluster #39


[('흑', 0.9768216609954834),
 ('강동윤', 0.9605154991149902),
 ('피크', 0.9555684924125671),
 ('박영훈', 0.9546114206314087),
 ('화학', 0.9541336894035339),
 ('사형', 0.9528404474258423),
 ('조성진', 0.9452848434448242),
 ('남향', 0.9404352903366089),
 ('승부수', 0.9369367361068726)]

Unnamed: 0,category,title
28370,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 白의 후회
37372,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 마음의 勝負
2735,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 초반 實驗
9846,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 번개 손
32873,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 主導權 경쟁
64510,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 불안한 平和
49010,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 초반 테스트
22620,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 흔들기
40889,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,"[제20회 LG배 조선일보 기왕전] 강동윤, 스무 번째 LG배 품에 안다"
49806,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 덫을 피한 飛虎


Cluster #40


[('이영완', 0.9753025770187378),
 ('사이언스', 0.9731051325798035),
 ('인문학', 0.9711945056915283),
 ('어린', 0.9703091382980347),
 ('경제학', 0.9693825840950012),
 ('문장', 0.9679992198944092),
 ('한현우', 0.9648638367652893),
 ('카페', 0.9626139402389526),
 ('플레이스', 0.9622843265533447),
 ('창', 0.9620374441146851)]

Unnamed: 0,category,title
67899,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [218] 초성 이어가기
17523,사설ㆍ칼럼 > 외부칼럼 > 최재천의 자연과 문화,[최재천의 자연과 문화] [370] 하람베
23920,"사회 > 두근두근 뇌 운동, 신문은 의사선생님","[두근두근 뇌 운동] [367] 열려라, 단어 창고"
36454,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [322] 초성 이어가기
41580,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [305] 얼굴 삼행시
10056,사설ㆍ칼럼 > 리스트칼럼 > 전문기자칼럼,[김철중의 생로병사] 게으른 자들을 위한 나름 '부지런한' 운동법
404,사설ㆍ칼럼 > 외부칼럼 > 조용헌 살롱,[조용헌 살롱] [1058] 동양철학 고택
9819,사설ㆍ칼럼 > 리스트칼럼 > 전문기자칼럼,[전문기자 칼럼] 종교인 말의 무게
58330,문화 > 북스 > 신간소개,[북카페] '변안열 평전' 외
13057,사설ㆍ칼럼 > 내부칼럼 > 기자의 시각,[기자의 시각] '하경정' 그만하라


Cluster #41


[('처형', 0.9942952394485474),
 ('우려', 0.9942759871482849),
 ('미친', 0.9928670525550842),
 ('합병', 0.9923083782196045),
 ('아르헨티나', 0.9918011426925659),
 ('경계', 0.9908534288406372),
 ('노숙', 0.9906021356582642),
 ('마약', 0.9900388717651367),
 ('역풍', 0.9894247055053711),
 ('유령', 0.9894155859947205)]

Unnamed: 0,category,title
25536,문화 > 전시ㆍ공연 > 공연,햄버거 가게서 단원 설득… 이 지휘자의 특별한 리더십
17487,사설ㆍ칼럼 > 내부칼럼 > 사설,"[사설] 박원순 시장, 구의역 사고 원인 근본 수술한 뒤 大權 행보하라"
53815,사설ㆍ칼럼 > 내부칼럼 > 사설,[사설] 司試 문제 하나 결정 못하는 정부
51640,사회 > 법원ㆍ검찰ㆍ경찰,中 '조희팔 측근' 강태용과 맞바꿀 自國 범죄자 요구했다
46982,사설ㆍ칼럼 > 내부칼럼 > 기자수첩,[기자수첩] 비서관 월급 상납 '덮고 가자'는 野최고위원들
67693,사회 > 의료ㆍ보건,반복적 분노 폭발은 질병… 알코올 중독·性범죄처럼 치료해야
55372,사설ㆍ칼럼 > 내부칼럼 > 태평로,[태평로] 땅 짚고 헤엄치려는 재벌과 관료
3973,국제 > 유럽,"佛최고법원, 부르키니 금지 중단令… 일부 市, 즉각 불복"
51299,정치,"""YS·DJ 불통이 IMF 못 막은 한 원인… 朴대통령이 野 설득해야 경제·노동법 ..."
28389,사설ㆍ칼럼 > 외부칼럼 > 발언대,[발언대] 담뱃갑 경고 그림은 금연 정책의 핵심이다


Cluster #42


[('슈트', 0.8355549573898315),
 ('제복', 0.8229562640190125),
 ('옷', 0.8224990367889404),
 ('절망', 0.8215451240539551),
 ('더하', 0.8095724582672119),
 ('자다', 0.8070077896118164)]

Unnamed: 0,category,title
50176,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 빈털터리가 되다
1722,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 얕잡아 보다
47049,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 허둥지둥 도망치다
25049,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 반분하다
2316,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~만에 만나다
15092,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~을 증축하다
26526,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] ~의 절정에 있다
12085,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 소질이 있다
48246,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 비스듬히 마주보는 곳에 있다
22241,사회 > 교육ㆍ시험 > 일본어,[입에 착착 붙는 일본어] 선견지명이 있다


Cluster #43


[('흑', 0.9679216146469116),
 ('박영훈', 0.9576043486595154),
 ('강동윤', 0.9548569917678833),
 ('피크', 0.9535328149795532),
 ('화학', 0.9504414796829224),
 ('V', 0.9432395696640015),
 ('조성진', 0.9343475699424744),
 ('물산', 0.9294070601463318),
 ('사형', 0.9275819063186646)]

Unnamed: 0,category,title
56371,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 초반 失着
30122,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 패싸움 3라운드
54528,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,구리 농심배 2연승 질주
23829,nativeAD > LG그룹,구본무의 '디자인 경영' 시그니처로 꽃피다
24944,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 21번째 잔치
1844,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 雄大한 구상
41087,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,제20회 LG배 조선일보 기왕전 결승 2국
63545,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 붙임수 行進
29452,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제20회 LG배 조선일보 기왕전] 백 불계승
18266,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,[제21회 LG배 조선일보 기왕전] 서반 設計


Cluster #44


[('It', 0.9923928380012512),
 ('That', 0.9918414950370789),
 ('Don', 0.9893622398376465),
 ('it', 0.9874016046524048),
 ('to', 0.9868175983428955),
 ('s', 0.9842992424964905),
 ('up', 0.9842166900634766),
 ('get', 0.9826686382293701),
 ('I', 0.9802959561347961),
 ('the', 0.9801508188247681)]

Unnamed: 0,category,title
25051,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] go into overdrive
31640,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] rub in one's nose
31859,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] cut to the chase
17597,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] We're on the same page.
15642,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] Don't make me pull it out of you
7833,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] Stop showing me up.
52966,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] out of this world
16551,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] until he gets back on his feet.
5293,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] I've got butterflies.
16097,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] You get back what you put in.


Cluster #45


[('리뷰', 0.9228874444961548),
 ('편지', 0.9071326851844788),
 ('자유인', 0.9071269035339355),
 ('ESSAY', 0.9064904451370239),
 ('김민철', 0.9057777523994446),
 ('책장', 0.9052385091781616)]

Unnamed: 0,category,title
17705,사설ㆍ칼럼 > 외부칼럼 > 일사일언,[일사일언] 대나무가 취한 날
6987,사회 > 카드뉴스,[카드뉴스] 미란이의 편지
30366,사설ㆍ칼럼 > 내부칼럼 > 태평로,[태평로] 敵은 밖에 있다
123031,사설ㆍ칼럼 > 내부칼럼 > 데스크에서,[데스크에서] 民意의 시간 차
27448,사설ㆍ칼럼 > 내부칼럼 > 태평로,[태평로] 개에게 책을 읽어주는 아이
43592,문화 > 전시ㆍ공연 > 공연,"[금주의 공연, 이유 있는 선택] '에머슨 스트링 콰르텟' 외"
7117,사설ㆍ칼럼 > 외부칼럼 > 일사일언,"[일사일언] 불어라, 솔바람"
67375,사설ㆍ칼럼 > 내부칼럼 > 편집장 레터,[Why] 포천 쿠키
22745,사회 > 우리이웃,[더 나은 미래] '더나은미래 프렌즈'
36564,사설ㆍ칼럼 > 내부칼럼 > 데스크에서,[데스크에서] 次惡 선택의 지겨움


Cluster #46


[('It', 0.9564688205718994),
 ('What', 0.9483944773674011),
 ('Don', 0.9440476894378662),
 ('one', 0.9407569169998169),
 ('That', 0.9379478096961975),
 ('I', 0.93154376745224),
 ('the', 0.9245834350585938)]

Unnamed: 0,category,title
61374,사회 > 교육ㆍ시험 > 일본어,[스피킹이 강해지는 일본어] 뒤치다꺼리를 하다
13042,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] comb through
64374,사회 > 교육ㆍ시험 > 중국어,[스피킹이 강해지는 중국어] 좋은 징조이다
69784,사회 > 교육ㆍ시험 > 일본어,[스피킹이 강해지는 일본어] ~을 틈타다
67938,사회 > 교육ㆍ시험 > 일본어,[스피킹이 강해지는 일본어] ~을 생략하다
30461,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] ruffle some feathers
28496,사회 > 교육ㆍ시험 > 영어,[스피킹이 강해지는 영어] tag along
65053,사회 > 교육ㆍ시험 > 일본어,[스피킹이 강해지는 일본어] ~을 소지하다
16710,문화,[Why] 나를 '올드보이'에 가두지 마세요
69431,사회 > 교육ㆍ시험 > 일본어,[스피킹이 강해지는 일본어] ~에 정진하다


Cluster #47


[('총격', 0.9928840398788452),
 ('최근', 0.9911510348320007),
 ('외국', 0.9910073280334473),
 ('주변', 0.990935206413269),
 ('무산', 0.9909236431121826),
 ('허용', 0.990688681602478),
 ('지자체', 0.9906672239303589),
 ('아르헨티나', 0.9905309677124023),
 ('광역', 0.9903801083564758),
 ('탈퇴', 0.9898937344551086)]

Unnamed: 0,category,title
59888,정치 > 국회ㆍ정당,"野 '호남民心 이탈' 서울로 北上… 영등포乙 1000명 ""내주 탈당"""
32486,정치 > 국회ㆍ정당,정무특보 지낸 현역 3人 '쓴잔'
7843,사회 > 법원ㆍ검찰ㆍ경찰,"검찰, MB정권 최고 실세 강만수 겨눴다"
42986,정치,대표직 내려놓고 양산으로 내려가는 문재인
429,사회 > 법원ㆍ검찰ㆍ경찰,"박준영 의원 선거조직 책임자, 政資법·공직선거법 위반 실형"
47002,국제 > 중동ㆍ아프리카,"이란 ""사우디가 예멘의 우리 대사관 폭격"" 주장"
54441,정치 > 나눔 통일,경영진이 제안하고 노조가 앞장선 기부
22312,nativeAD > 신한금융그룹,107가지 금융 업무되는 '화상 상담 ATM' 확대
14285,경제,"금융당국, 24시간 비상대응팀 가동… 조선·해운 ""눈앞이 캄캄"""
27595,정치 > 국회ㆍ정당,총선 참패 부른 새누리의 6가지 장면


Cluster #48


[('그때', 0.9670799970626831),
 ('꾸', 0.9617404937744141),
 ('바꿔', 0.9494377374649048),
 ('냄새', 0.935985803604126),
 ('달걀', 0.9333729147911072),
 ('맞추', 0.9296841621398926),
 ('웰', 0.9282727837562561),
 ('사다리', 0.9282389879226685),
 ('퍼즐', 0.9268965721130371),
 ('생선', 0.926008939743042)]

Unnamed: 0,category,title
5671,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [443] 바꿔 부르기
66661,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [221] 제목 외우기
6253,사회 > 리빙포인트,[리빙포인트] 발냄새 없애려면
5422,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [444] 암호로 바꿔 쓰기
43317,사회 > 리빙포인트,[리빙포인트] 오한 들 땐 목뒤에 파스를
33458,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [333] 사다리를 타자
55903,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [255] 칼럼 풀어읽기
13988,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [406] 강세 바꿔 읽기
33207,사회 > 리빙포인트,[리빙포인트] 운동화 찌든 때 쉽게 빼려면
27680,"사회 > 두근두근 뇌 운동, 신문은 의사선생님",[두근두근 뇌 운동] [354] 암호로 바꿔 쓰기


Cluster #49


[('예정', 0.992479681968689),
 ('단', 0.9906438589096069),
 ('최다', 0.9904974102973938),
 ('실적', 0.9899871945381165),
 ('영업', 0.9889582395553589),
 ('첫날', 0.9867038726806641),
 ('질주', 0.9860249757766724),
 ('테임즈', 0.9856252670288086),
 ('갤럭시', 0.985379695892334),
 ('확률', 0.9849423766136169)]

Unnamed: 0,category,title
54276,사고 > 바로잡습니다,"[바로잡습니다] 30일자 A19면 '60돌 자민당, 역사 검증 본부 출범' 기사 외"
19634,문화 > 전시ㆍ공연 > 전시,15번째 베네치아 비엔날레 건축전 28일 개막
54789,스포츠ㆍ연예 > 스포츠 > 축구 > 해외축구,11경기 연속 골 신기록 바디
54045,스포츠ㆍ연예 > 스포츠 > 농구 > 남자프로농구,"9351점, 김주성 농구 통산득점 3위"
45690,사회 > 법원ㆍ검찰ㆍ경찰,"[땅, 땅… 오늘의 판결] 워터파크 몰카범들 重刑… 징역 3년6개월~4년6개월"
34046,nativeAD > 삼성전자,세계 명견 콘테스트에 삼성 갤럭시S6·기어VR 전시 왜?
63309,사고 > 바로잡습니다,[바로잡습니다] 20일자 A39면 '차세대전투기' 사설 중
46224,스포츠ㆍ연예 > 스포츠 > 종합 > 바둑,"이세돌, 박정환에 명인전 2연승… 바둑왕전 1국도 승리"
3838,정치,1·2黨 대표가 동갑… '58년 개띠' 전성시대
27957,사회 > 날씨,오늘 전국에 황사 섞인 비


In [None]:
end = if # Intentionally left errornous