In [9]:
import pandas as pd
from surprise import Dataset, Reader
from surprise.model_selection import cross_validate
from surprise import SVD, SVDpp, NMF

# Зчитування даних з файлів
ratings_data = pd.read_csv('ratings.csv')

# Створення об'єкту 'Reader' для специфікації рейтингового діапазону
reader = Reader(rating_scale=(0.5, 5.0))

# Створення набору даних за допомогою 'Dataset.load_from_df'
data = Dataset.load_from_df(ratings_data[['userId', 'movieId', 'rating']], reader)

# Створення списку моделей для порівняння
models = [SVD(), SVDpp(), NMF()]

# Створення DataFrame для результатів
Final_result = pd.DataFrame(columns=['SVD', 'SVDpp', 'NMF'])

# Перебір моделей для крос-валідації
for model in models:
    model_name = model.__class__.__name__
    print(f"Обробка моделі: {model_name}")
    result = cross_validate(model, data, measures=['rmse', 'mae'], cv=3, verbose=False)
    result_df = pd.DataFrame.from_dict(result).mean(axis=0)
    Final_result.loc['test_rmse', model_name] = result_df['test_rmse']
    Final_result.loc['test_mae', model_name] = result_df['test_mae']
    Final_result.loc['fit_time', model_name] = result_df['fit_time']
    Final_result.loc['test_time', model_name] = result_df['test_time']

# Виведення результатів
print("Фінальний підсумок:")
print(Final_result)


Обробка моделі: SVD
Обробка моделі: SVDpp
Обробка моделі: NMF
Фінальний підсумок:
                SVD      SVDpp       NMF
test_rmse  0.880679   0.867947  0.935135
test_mae   0.676936   0.666246  0.717033
fit_time   0.388352  24.908603  0.864117
test_time  0.161813   8.365925  0.192174
