In [1]:
from datasets import load_from_disk
import pandas as pd

In [2]:
dataset = load_from_disk("../data/top40_movies_by_score")
dataset

Dataset({
    features: ['title', 'text', 'link_url'],
    num_rows: 40
})

In [6]:
movies = dataset.to_pandas()
movies

Unnamed: 0,title,text,link_url
0,범죄도시2,"가리봉동 소탕작전 후 4년 뒤, 금천서 강력반은 베트남으로 도주한 용의자를 인도받아...",https://movie.naver.com/movie/bi/mi/basic.nave...
1,씽2게더,대국민 오디션 이후 각자의 자리에서 꿈을 이루고 있는 버스터 문(매튜 맥커너히)과 ...,https://movie.naver.com/movie/bi/mi/basic.nave...
2,극장판 귀멸의 칼날: 무한열차편,혈귀로 변한 여동생 ‘네즈코’를 되돌리기 위해 귀살대가 된 ‘탄지로’! 어둠 속을...,https://movie.naver.com/movie/bi/mi/basic.nave...
3,극장판 주술회전 0,어릴 적 소꿉친구인 오리모토 리카를 교통사고로 눈앞에서 잃은 옷코츠 유타. “약속...,https://movie.naver.com/movie/bi/mi/basic.nave...
4,기적,오갈 수 있는 길은 기찻길밖에 없지만 정작 기차역은 없는 마을. 오늘부로 청와대에 ...,https://movie.naver.com/movie/bi/mi/basic.nave...
5,벤허,"서기 26년, 로마 제국 시대 ‘유다 벤허’(찰스 헤스톤)는 예루살렘의 제일 가는 ...",https://movie.naver.com/movie/bi/mi/basic.nave...
6,해피 투게더,홍콩을 떠나 지구 반대편 부에노스아이레스에 온 ‘보영’과 ‘아휘’ 이과수 폭포를 찾...,https://movie.naver.com/movie/bi/mi/basic.nave...
7,코다,24/7 함께 시간을 보내며 소리를 들을 수 없는 가족을 세상과 연결하는 코다 '루...,https://movie.naver.com/movie/bi/mi/basic.nave...
8,피의 연대기,"한 달에 한 번, 일 년에 12번, 살아가면서 적어도 400번… 귀찮은 ‘그날’의 ...",https://movie.naver.com/movie/bi/mi/basic.nave...
9,중경삼림,"1994년 홍콩, “내 사랑의 유통기한은 만 년으로 하고 싶다” 만우절의 이별 통...",https://movie.naver.com/movie/bi/mi/basic.nave...


In [5]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TextClassificationPipeline

model_name = "searle-j/kote_for_easygoing_people"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

pipe = TextClassificationPipeline(
        model=model,
        tokenizer=tokenizer,
        device=0, # gpu number, -1 if cpu used
        return_all_scores=True,
        # function_to_apply='sigmoid'
    )

In [14]:
for _, movie in movies.iterrows():
    # print(movie)
    title = movie['title']
    text = movie['text']
    link_url = movie['link_url']
    print(f"{title}\n{text}\n{link_url}")

    outputs = sorted(pipe(text)[0], key=lambda x: x['score'], reverse=True)
    for output in outputs[:5]: # index를 조절하면 top-k를 조절할 수 있습니다.
        print(output)
    print()

범죄도시2
가리봉동 소탕작전 후 4년 뒤, 금천서 강력반은 베트남으로 도주한 용의자를 인도받아 오라는 미션을 받는다. 괴물형사 ‘마석도’(마동석)와 ‘전일만’(최귀화) 반장은 현지 용의자에게서 수상함을 느끼고, 그의 뒤에 무자비한 악행을 벌이는 ‘강해상’(손석구)이 있음을 알게 된다. ‘마석도’와 금천서 강력반은 한국과 베트남을 오가며 역대급 범죄를 저지르는 ‘강해상’을 본격적으로 쫓기 시작하는데... 나쁜 놈들 잡는 데 국경 없다! 통쾌하고 화끈한 범죄 소탕 작전이 다시 펼쳐진다!
https://movie.naver.com/movie/bi/mi/basic.naver?code=192608
{'label': '비장함', 'score': 0.8467079997062683}
{'label': '기대감', 'score': 0.8027505278587341}
{'label': '없음', 'score': 0.5394870638847351}
{'label': '화남/분노', 'score': 0.48504215478897095}
{'label': '깨달음', 'score': 0.37267887592315674}

씽2게더
대국민 오디션 이후 각자의 자리에서 꿈을 이루고 있는 버스터 문(매튜 맥커너히)과 크루들에게 레드 쇼어 시티에서 전 세계가 주목하는 사상 최고의 쇼가 펼쳐진다는 소식이 들려오고 버스터 문과 크루들은 도전에 나선다.  그러나 최고의 스테이지에 서기 위한 경쟁은 이전과는 비교도 할 수 없을 만큼 치열하고, 버스터 문은 완벽한 라이브를 위해 종적을 감춘 레전드 뮤지션 클레이(보노)를 캐스팅하겠다는 파격 선언을 하는데!
https://movie.naver.com/movie/bi/mi/basic.naver?code=187320
{'label': '기대감', 'score': 0.9477946162223816}
{'label': '감동/감탄', 'score': 0.8789206743240356}
{'label': '신기함/관심', 'score': 0.7954108715