In [None]:
import os
from surprise import SVD, SVDpp, NMF
from surprise import Dataset
from surprise import Reader
from surprise.model_selection import cross_validate

In [14]:
# Завантаження даних
data = Dataset.load_builtin('ml-100k')

# Створення базової моделі SVD
model = SVD()

# Просте тренування та оцінка моделі
cross_validate(model, data, measures=['RMSE', 'MAE'], cv=3, verbose=True)

Evaluating RMSE, MAE of algorithm SVD on 3 split(s).

                  Fold 1  Fold 2  Fold 3  Mean    Std     
RMSE (testset)    0.9449  0.9478  0.9449  0.9459  0.0014  
MAE (testset)     0.7467  0.7494  0.7435  0.7465  0.0024  
Fit time          0.71    0.73    0.76    0.73    0.02    
Test time         0.21    2.49    0.44    1.04    1.03    


{'test_rmse': array([0.94488476, 0.94783324, 0.94489674]),
 'test_mae': array([0.7466721 , 0.7493792 , 0.74346674]),
 'fit_time': (0.711475133895874, 0.730370044708252, 0.7571742534637451),
 'test_time': (0.20629525184631348, 2.490959644317627, 0.4371817111968994)}

In [19]:
# Параметри для SVD
param_grid_svd = {
    'n_factors': [50, 100],  # Кількість факторів
    'n_epochs': [20],        # Кількість епох тренування
}

# Проведення GridSearchCV
gs_svd = GridSearchCV(SVD, param_grid_svd, measures=['rmse', 'mae'], cv=3)
gs_svd.fit(data)

# Виведення найкращих результатів
print("SVD:")
print("Найкращий RMSE:", gs_svd.best_score['rmse'])
print("Найкращі параметри для RMSE:", gs_svd.best_params['rmse'])
print("Найкращий MAE:", gs_svd.best_score['mae'])
print("Найкращі параметри для MAE:", gs_svd.best_params['mae'])

SVD:
Найкращий RMSE: 0.9421489013298224
Найкращі параметри для RMSE: {'n_factors': 50, 'n_epochs': 20}
Найкращий MAE: 0.7441342174380651
Найкращі параметри для MAE: {'n_factors': 50, 'n_epochs': 20}


In [18]:
param_grid_svd = {
    'n_factors': [10, 150, 200],
    'n_epochs': [20, 30, 50],
    'lr_all': [0.005, 0.01, 0.1],
    'reg_all': [0.02, 0.1, 0.5]
}

gs_svd = GridSearchCV(SVD, param_grid_svd, measures=['rmse', 'mae'], cv=3)
gs_svd.fit(data)

# Виведення найкращих результатів
print("SVD:")
print("Найкращий RMSE:", gs_svd.best_score['rmse'])
print("Найкращі параметри для RMSE:", gs_svd.best_params['rmse'])
print("Найкращий MAE:", gs_svd.best_score['mae'])
print("Найкращі параметри для MAE:", gs_svd.best_params['mae'])

SVD:
Найкращий RMSE: 0.9207080524340189
Найкращі параметри для RMSE: {'n_factors': 150, 'n_epochs': 30, 'lr_all': 0.01, 'reg_all': 0.1}
Найкращий MAE: 0.7285994573004543
Найкращі параметри для MAE: {'n_factors': 150, 'n_epochs': 30, 'lr_all': 0.01, 'reg_all': 0.1}


In [22]:
data = Dataset.load_builtin('ml-100k')

# Використання NMF
param_grid_nmf = {
    'n_factors': [20, 50, 100],  # Кількість факторів
    'n_epochs': [20, 30, 40],         # Кількість епох тренування
    'reg_pu': [0.02, 0.1, 0.5],        # Регуляризація для факторів користувача
    'reg_qi': [0.02, 0.1, 0.5],        # Регуляризація для факторів елементів
    'biased': [False],      # Включення параметра зміщення
}

# Проведення GridSearchCV для NMF
gs_nmf = GridSearchCV(NMF, param_grid_nmf, measures=['rmse', 'mae'], cv=3)
gs_nmf.fit(data)

# Виведення найкращих результатів для NMF
print("NMF:")
print("Найкращий RMSE:", gs_nmf.best_score['rmse'])
print("Найкращі параметри для RMSE:", gs_nmf.best_params['rmse'])
print("Найкращий MAE:", gs_nmf.best_score['mae'])
print("Найкращі параметри для MAE:", gs_nmf.best_params['mae'])

NMF:
Найкращий RMSE: 0.9497746662957937
Найкращі параметри для RMSE: {'n_factors': 100, 'n_epochs': 20, 'reg_pu': 0.1, 'reg_qi': 0.5, 'biased': False}
Найкращий MAE: 0.7412883191587384
Найкращі параметри для MAE: {'n_factors': 100, 'n_epochs': 40, 'reg_pu': 0.5, 'reg_qi': 0.02, 'biased': False}


In [6]:
data = Dataset.load_builtin('ml-100k')

models = {
    "SVD": SVD(),
    "SVD++": SVDpp(),
    "NMF": NMF()
}

# Виконання крос-валідації для кожної моделі та збереження результатів
results = {}
for name, model in models.items():
    results[name] = cross_validate(model, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)


for name, result in results.items():
    print(f"{name}: Середній RMSE: {result['test_rmse'].mean()}, Середній MAE: {result['test_mae'].mean()}")

Evaluating RMSE, MAE of algorithm SVD on 5 split(s).

                  Fold 1  Fold 2  Fold 3  Fold 4  Fold 5  Mean    Std     
RMSE (testset)    0.9344  0.9374  0.9393  0.9387  0.9356  0.9371  0.0019  
MAE (testset)     0.7358  0.7401  0.7399  0.7403  0.7361  0.7384  0.0020  
Fit time          0.71    0.75    0.76    0.76    0.72    0.74    0.02    
Test time         0.56    0.09    0.12    0.08    0.13    0.20    0.18    
Evaluating RMSE, MAE of algorithm SVDpp on 5 split(s).

                  Fold 1  Fold 2  Fold 3  Fold 4  Fold 5  Mean    Std     
RMSE (testset)    0.9171  0.9137  0.9247  0.9233  0.9172  0.9192  0.0041  
MAE (testset)     0.7188  0.7157  0.7272  0.7246  0.7208  0.7214  0.0041  
Fit time          13.81   13.82   14.01   13.73   13.89   13.85   0.09    
Test time         2.33    2.29    2.31    2.30    2.35    2.32    0.02    
Evaluating RMSE, MAE of algorithm NMF on 5 split(s).

                  Fold 1  Fold 2  Fold 3  Fold 4  Fold 5  Mean    Std     
RMSE (tests