## 행렬 요인화(MF) 기반 추천 시스템 구현

In [1]:
import pandas as pd
import pickle
import joblib

In [3]:
# 모델 로딩
model = joblib.load('./ml-latest-small.pkl') 
# 데이터 불러오기 (데이터 프레임)
ratings = pd.read_csv('./data/ratings.csv') 
# 영화에 대한 상세 속성 정보 DataFrame로딩
movies = pd.read_csv('./data/movies.csv')

In [4]:
# 아직 보지 않은 영화 리스트 함수
def get_unseen_surprise(ratings, movies, userId):
     # 특정 userId가 평점을 매긴 모든 영화 리스트
    seen_movies = ratings[ratings['userId']== userId]['movieId'].tolist()
    
    # 모든 영화명을 list 객체로 만듬. 
    total_movies = movies['movieId'].tolist()
      
    # 한줄 for + if문으로 안 본 영화 리스트 생성
    unseen_movies = [ movie for movie in total_movies if movie not in seen_movies]
    
    # 일부 정보 출력
    total_movie_cnt = len(total_movies)
    seen_cnt = len(seen_movies)
    unseen_cnt = len(unseen_movies)
    
    print(f"전체 영화 수: {total_movie_cnt}, 평점 매긴 영화 수: {seen_cnt}, 추천 대상 영화 수: {unseen_cnt}")
    
    return unseen_movies

In [5]:
def recomm_movie_by_surprise(algo, userId, unseen_movies, top_n=10):
    
    # 아직 보지 않은 영화의 예측 평점: prediction 객체 생성
    predictions = []    
    for movieId in unseen_movies:
        predictions.append(algo.predict(str(userId), str(movieId)))
    
    # 리스트 내의 prediction 객체의 est를 기준으로 내림차순 정렬
    def sortkey_est(pred):
        return pred.est

    predictions.sort(key=sortkey_est, reverse=True) # key에 리스트 내 객체의 정렬 기준을 입력
    
    # 상위 top_n개의 prediction 객체
    top_predictions = predictions[:top_n]
    
    # 영화 아이디, 제목, 예측 평점 출력
    print(f"Top-{top_n} 추천 영화 리스트")
    
    for pred in top_predictions:
        movie_id = int(pred.iid)
        movie_title = movies[movies["movieId"] == movie_id]["title"].tolist()
        movie_rating = pred.est
        
        print(f"{movie_title}: {movie_rating:.2f}")

In [6]:
userId = int(input('회원 번호를 입력하세요(9):'))
unseen_movies = get_unseen_surprise(ratings, movies, userId)
recomm_movie_by_surprise(model, userId, unseen_movies, top_n=10)

회원 번호를 입력하세요(9):2
전체 영화 수: 9742, 평점 매긴 영화 수: 29, 추천 대상 영화 수: 9713
Top-10 추천 영화 리스트
['Star Wars: Episode IV - A New Hope (1977)']: 4.53
['Godfather, The (1972)']: 4.47
['Godfather: Part II, The (1974)']: 4.47
['In the Name of the Father (1993)']: 4.45
['Seventh Seal, The (Sjunde inseglet, Det) (1957)']: 4.44
['Fight Club (1999)']: 4.44
['Boondock Saints, The (2000)']: 4.43
['Lawrence of Arabia (1962)']: 4.41
['Monty Python and the Holy Grail (1975)']: 4.41
['Goodfellas (1990)']: 4.41


In [7]:
userId = int(input('회원 번호를 입력하세요(10):'))
unseen_movies = get_unseen_surprise(ratings, movies, userId)
recomm_movie_by_surprise(model, userId, unseen_movies, top_n=10)

회원 번호를 입력하세요(10):1
전체 영화 수: 9742, 평점 매긴 영화 수: 232, 추천 대상 영화 수: 9510
Top-10 추천 영화 리스트
['Hoop Dreams (1994)']: 5.00
['Shawshank Redemption, The (1994)']: 5.00
['Wallace & Gromit: The Best of Aardman Animation (1996)']: 5.00
['Ghost in the Shell (Kôkaku kidôtai) (1995)']: 5.00
['Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb (1964)']: 5.00
['Philadelphia Story, The (1940)']: 5.00
['North by Northwest (1959)']: 5.00
['Casablanca (1942)']: 5.00
['My Fair Lady (1964)']: 5.00
['Streetcar Named Desire, A (1951)']: 5.00
