In [6]:
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# 데이터 불러오기
data = pd.read_csv('prob-0101 (1).csv')

# 영화의 특징 결합 (장르 + 감독 + 출연진)
data['features'] = data['장르'] + ' ' + data['감독'] + ' ' + data['출연진']

# 텍스트를 숫자로 변환 (벡터화)
vectorizer = CountVectorizer()
feature_matrix = vectorizer.fit_transform(data['features'])

# 영화 간의 유사도 계산 (코사인 유사도)
cosine_sim = cosine_similarity(feature_matrix, feature_matrix)

# 영화 추천 함수
def recommend_movies(title, data, cosine_sim):
    # 선택한 영화의 인덱스 찾기
    idx = data[data['제목'] == title].index[0]
    
    # 해당 영화와 다른 영화들 간의 유사도 점수 가져오기
    sim_scores = list(enumerate(cosine_sim[idx]))
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    
    # 유사도가 높은 상위 5개 영화 추천
    sim_indices = [i[0] for i in sim_scores[1:6]]
    return data['제목'].iloc[sim_indices]

# 예시: 특정 영화와 비슷한 영화 추천
print("추천된 영화 목록:")
print(recommend_movies('스위치', data, cosine_sim))  # '스위치' 대신 다른 영화 제목을 넣어보세요!


추천된 영화 목록:
46          스프린터
1           강남좀비
2     별 볼일 없는 인생
3       10일간의 애인
4             교섭
Name: 제목, dtype: object


In [9]:
import pandas as pd
import random

# prob 데이터 불러오기
data_path = 'prob-0101 (1).csv'
prob_data = pd.read_csv(data_path)

# 가상의 사용자 평점 데이터 생성
random.seed(42)
user_ids = [random.randint(1, 5) for _ in range(len(prob_data))]  # 사용자 ID (1~5)
ratings = [random.randint(1, 5) for _ in range(len(prob_data))]  # 평점 (1~5)

# 사용자 평점 데이터프레임 생성
ratings_df = pd.DataFrame({
    "user_id": user_ids,
    "item_id": prob_data['제목'],
    "rating": ratings
})

# 사용자 1이 이미 본 영화 찾기
user_id = 1
watched_movies = ratings_df[ratings_df['user_id'] == user_id]['item_id']

# 사용자 1이 보지 않은 영화 중 평점이 높은 영화 추천
unwatched_movies = ratings_df[~ratings_df['item_id'].isin(watched_movies)]
top_recommendations = unwatched_movies.groupby('item_id')['rating'].mean().sort_values(ascending=False).head(3)

# 결과 출력
print(f"사용자 {user_id}에게 추천하는 영화:")
print(top_recommendations)


사용자 1에게 추천하는 영화:
item_id
육지것들                        5.0
남자는 처음을 원하고 여자는 마지막을 원한다    5.0
바람개비                        5.0
Name: rating, dtype: float64
