# 유사한 영화 추천 알고리즘

In [1]:
pip install tmdbv3api

Note: you may need to restart the kernel to use updated packages.


In [2]:
import pickle # 저장된 데이터를 불러오기 위함
from tmdbv3api import Movie, TMDb # TMDb API를 통해 영화 데이터를 가져오기 위해 필요한 모듈

In [3]:
# TMDb API를 설정하는 부분
movie = Movie() # TMDb API의 Movie 객체 생성
tmdb = TMDb() # TMDb 설정 객체 생성
tmdb.api_key = '0ee6a32fe14b93379e743072a6c9cf58' # 발급받은 TMDb API 키를 설정
tmdb.language = 'ko-KR' # API 응답 언어를 한국어로 설정

In [4]:
# 영화 추천을 처리하는 함수 정의(입력된 영화 제목에 기반하여 유사한 영화 목록을 추천하는 함수)
def get_recommendations(title):

    # 입력된 영화 제목으로 해당 영화의 인덱스 값을 찾음
    idx = movies[movies['title'] == title].index[0]
    
    # 코사인 유사도를 기준으로 영화와 다른 영화 간의 유사도를 계산한 값을 가져옴
    sim_scores = list(enumerate(cosine_sim[idx]))
    
    # 유사도를 기준으로 내림차순으로 정렬하여 유사한 영화 순서대로 나열
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    
    # 자기 자신(첫 번째 영화)을 제외하고 상위 10개의 유사한 영화를 선택
    sim_scores = sim_scores[1:11]
    
    # 추천 영화의 인덱스 리스트를 추출
    movie_indices = [i[0] for i in sim_scores]
    
    # 추천 영화의 포스터 이미지 URL과 영화 제목 리스트 생성
    images = [] 
    titles = [] 
    for i in movie_indices:
        id = movies['id'].iloc[i]  # 영화의 고유 ID를 가져옴
        details = movie.details(id)  # TMDb API를 사용해 영화의 상세 정보를 가져옴

        # 포스터 이미지 경로가 있는 경우 해당 경로를 완성하여 추가, 없는 경우 기본 이미지를 추가
        image_path = details['poster_path']
        if image_path:
            image_path = 'https://image.tmdb.org/t/p/w500' + image_path
        else:
            image_path = 'no_image.jpg'  # 이미지가 없는 경우 사용할 기본 이미지
        
        # 포스터 URL과 영화 제목을 리스트에 추가
        images.append(image_path)
        titles.append(details['title'])  # 언어 설정에 따라 한국어 제목이 반환됨

    return images, titles  # 영화 포스터와 제목 리스트 반환

In [5]:
# 데이터 준비
# 미리 저장된 영화 데이터와 코사인 유사도 행렬을 피클 파일에서 불러옴
movies = pickle.load(open('movies.pickle', 'rb'))  # movies.pickle 파일에서 영화 데이터 불러오기
cosine_sim = pickle.load(open('cosine_sim.pickle', 'rb'))  # cosine_sim.pickle 파일에서 코사인 유사도 행렬 불러오기

In [6]:
# 테스트할 영화 제목 설정 (사용자가 선호하는 영화 제목을 여기에 입력)
title = 'Up'  # 추천을 받고 싶은 영화 제목을 입력하세요

In [7]:
# 추천 영화 목록 가져오기
images, titles = get_recommendations(title)  # 입력한 영화에 대한 추천 영화 목록 가져오기

In [8]:
# 결과 출력
# 추천된 영화의 포스터와 제목을 출력함
for img, t in zip(images, titles):
    print(f"Title: {t}, Image: {img}")

Title: 몬스터 주식회사, Image: https://image.tmdb.org/t/p/w500/fnDLrtEoIrxTCWUvuurMzOzQGpQ.jpg
Title: 미트 더 디들스, Image: https://image.tmdb.org/t/p/w500/fJw73MvTkSdYloesTQSS1zi3IsL.jpg
Title: Alpha and Omega: The Legend of the Saw Tooth Cave, Image: https://image.tmdb.org/t/p/w500/rUgutlhSQabaKO5DPBE2Co8mlyF.jpg
Title: 엘사 앤 프레드, Image: https://image.tmdb.org/t/p/w500/yNzVwtlqOmPLVKD5zZIzAME9vYc.jpg
Title: 넛잡: 땅콩 도둑들, Image: https://image.tmdb.org/t/p/w500/xf3b4baesQzc3lCgYI4JCPOzRoL.jpg
Title: Running Forever, Image: https://image.tmdb.org/t/p/w500/u4KHwcZmNH0Vr6xpGvDKdkBTopg.jpg
Title: 찰리 브라운의 크리스마스, Image: https://image.tmdb.org/t/p/w500/vtaufTzJBMJAeziQA1eP4BLU24C.jpg
Title: 카 2, Image: https://image.tmdb.org/t/p/w500/azNYfwYnrdCVB3uzZaRl0JIx4N0.jpg
Title: 토이 스토리 3, Image: https://image.tmdb.org/t/p/w500/hbUWahBLUon8RaIb9Tq7aWCBCtS.jpg
Title: 인사이드 아웃, Image: https://image.tmdb.org/t/p/w500/rMXHvHzpuYZXrJUhRVJ3TvDSwe5.jpg
