In [None]:
# ⬇️ Встановлення бібліотеки
!pip install scikit-surprise --quiet

# 📦 Імпорти
from surprise import Dataset, SVD, KNNBasic, accuracy
from surprise.model_selection import cross_validate, GridSearchCV, train_test_split
import pandas as pd

# 📥 Завантаження датасету ml-100k
data = Dataset.load_builtin('ml-100k')

# 📊 Виведення перших 5 рядків
print("🔹 Перші 5 рядків raw_ratings:")
for i in range(5):
    print(data.raw_ratings[i])

# 🔁 Крос-валідація для двох алгоритмів
algo_svd = SVD()
algo_knn = KNNBasic()

print("\n📈 Крос-валідація для SVD:")
results_svd = cross_validate(algo_svd, data, measures=['MAE'], cv=5, verbose=True)

print("\n📈 Крос-валідація для KNNBasic:")
results_knn = cross_validate(algo_knn, data, measures=['MAE'], cv=5, verbose=True)

# 🔍 Підбір параметрів для SVD
print("\n🔧 Grid Search для SVD:")
param_grid = {
    'n_epochs': [5, 10],
    'lr_all': [0.002, 0.005],
    'reg_all': [0.4, 0.6]
}
gs = GridSearchCV(SVD, param_grid, measures=['mae'], cv=3)
gs.fit(data)

print("✅ Найкращі параметри SVD:", gs.best_params['mae'])
print("🔻 Найменший MAE:", gs.best_score['mae'])

# 🏆 Вибираємо найкращий алгоритм
best_algo = gs.best_estimator['mae']
trainset, testset = train_test_split(data, test_size=0.2)
best_algo.fit(trainset)
predictions = best_algo.test(testset)
print("\n🎯 MAE на тестовій вибірці:", accuracy.mae(predictions))

# 🎬 Рекомендації для конкретного користувача
user_id = '196'  # змінити на потрібного користувача
trainset_full = data.build_full_trainset()
best_algo.fit(trainset_full)
anti_testset = trainset_full.build_anti_testset()
user_items = [entry for entry in anti_testset if entry[0] == user_id]
user_predictions = best_algo.test(user_items)

top_10 = sorted(user_predictions, key=lambda x: x.est, reverse=True)[:10]
print(f"\n📌 Топ-10 рекомендацій для користувача {user_id}:")
for pred in top_10:
    print(f"Фільм ID: {pred.iid}, Очікуваний рейтинг: {pred.est:.2f}")
#У ході виконання лабораторної роботи було реалізовано систему рекомендацій на основі датасету MovieLens 100k за допомогою бібліотеки Surprise. Було проведено такі дії:

#Завантажено та проаналізовано дані: зчитано 100 тисяч оцінок фільмів від 943 користувачів.

#Реалізовано два алгоритми:

#SVD (матричне розкладання).

#KNNBasic (метод k-ближчих сусідів).

#Проведено крос-валідацію: використано п’ятиразову крос-валідацію для оцінки якості моделей за метрикою MAE (Mean Absolute Error).

#Підібрано найкращі параметри для алгоритму SVD за допомогою GridSearchCV.

#Отримано рекомендації для конкретного користувача: сформовано список із 10 фільмів, які модель вважає найбільш підходящими.

#У результаті:

#Алгоритм SVD показав кращу точність порівняно з KNNBasic.

#Значення MAE після оптимізації було нижчим, що підтверджує ефективність підбору параметрів.
##
#Отримані персоналізовані рекомендації можуть бути використані для покращення користувацького досвіду у платформах перегляду фільмів.