In [None]:
import numpy as np
import pandas as pd

from surprise import accuracy, Dataset, Reader, SVD
from surprise.model_selection import cross_validate, train_test_split


---
# 1. Завантаження даних
---

In [None]:
# Завантажуємо датасет MovieLens (файл ratings.csv)
df = pd.read_csv("ratings.csv")

# Налаштовуємо формат даних для Surprise
reader = Reader(rating_scale=(0.5, 5.0))
data = Dataset.load_from_df(df[['userId', 'movieId', 'rating']], reader)

# Розділяємо дані на тренувальний та тестовий набори
trainset, testset = train_test_split(data, test_size=0.2, random_state=42)

---
# 2. Тренування моделі
---

In [None]:
# Тренуємо модель SVD
model = SVD()
model.fit(trainset)


---
# 3. Вирішення Cold Start (новий користувач)
---

Якщо в нас з’являється новий користувач, ми можемо порекомендувати йому найпопулярніші фільми або кращі за середнім рейтингом.

In [None]:
# Рахуємо середній рейтинг для кожного фільму
movie_means = df.groupby("movieId")["rating"].mean()

# Вибираємо топ-10 найкращих фільмів
top_movies = movie_means.sort_values(ascending=False).head(10)

print("Рекомендовані фільми для нового користувача:")
print(top_movies)


---
# 4. Вирішення Cold Start (новий фільм)
---

Якщо додано новий фільм без оцінок, можна рекомендувати його схожим користувачам за жанром або контент-орієнтованими методами.

In [None]:
# Припустимо, що у нас є новий фільм movieId = 99999
new_movie_id = 99999

# Якщо немає рейтингу, рекомендуємо цей фільм схожим користувачам
if new_movie_id not in df["movieId"].values:
    print(f"Новий фільм {new_movie_id} рекомендується користувачам, які оцінили схожі фільми!")
