In [26]:
from surprise import SVD, SVDpp, NMF, Dataset, accuracy
from surprise.model_selection import cross_validate, GridSearchCV

# 1. Імпорт бібліотек і завантаження даних
data = Dataset.load_builtin('ml-100k')  # змініть назву датасету, якщо потрібно

# Параметри для SVD і SVD++
param_grid_svd = {
    'n_epochs': [5, 10, 20],
    'lr_all': [0.002, 0.005],
    'reg_all': [0.4, 0.6]
}

gs_svd = GridSearchCV(SVD, param_grid_svd, measures=['rmse', 'mae'], cv=5)
gs_svd.fit(data)

print("SVD - Найкращий RMSE:", gs_svd.best_score['rmse'])
print("Параметри для найкращої моделі SVD:", gs_svd.best_params['rmse'])

# Експерименти з SVD++
gs_svdpp = GridSearchCV(SVDpp, param_grid_svd, measures=['rmse', 'mae'], cv=5)
gs_svdpp.fit(data)

print("SVD++ - Найкращий RMSE:", gs_svdpp.best_score['rmse'])
print("Параметри для найкращої моделі SVD++:", gs_svdpp.best_params['rmse'])

# Параметри для NMF
param_grid_nmf = {
    'n_epochs': [5, 10, 20],
    'reg_pu': [0.4, 0.6],
    'reg_qi': [0.4, 0.6]
}

gs_nmf = GridSearchCV(NMF, param_grid_nmf, measures=['rmse', 'mae'], cv=5)
gs_nmf.fit(data)

print("NMF - Найкращий RMSE:", gs_nmf.best_score['rmse'])
print("Параметри для найкращої моделі NMF:", gs_nmf.best_params['rmse'])

# Ось так можна обрати найкращу модель на основі RMSE:
models = {
    "SVD": gs_svd.best_score['rmse'],
    "SVD++": gs_svdpp.best_score['rmse'],
    "NMF": gs_nmf.best_score['rmse']
}

best_model_name = min(models, key=models.get)
print(f"Найкраща модель: {best_model_name} з RMSE: {models[best_model_name]}")


SVD - Найкращий RMSE: 0.9568162766078174
Параметри для найкращої моделі SVD: {'n_epochs': 20, 'lr_all': 0.005, 'reg_all': 0.4}
SVD++ - Найкращий RMSE: 0.956698018484768
Параметри для найкращої моделі SVD++: {'n_epochs': 20, 'lr_all': 0.005, 'reg_all': 0.4}
NMF - Найкращий RMSE: 1.027785550020639
Параметри для найкращої моделі NMF: {'n_epochs': 10, 'reg_pu': 0.4, 'reg_qi': 0.4}
Найкраща модель: SVD++ з RMSE: 0.956698018484768
