# **Algoritmo NMF**
---

### **¿Cómo funciona el NMF en un sistema de recomendación?**

#### **Representación de los datos:**
Supón que tenemos una matriz \( R \) de **valoraciones** (ratings), donde las filas representan a los **usuarios** y las columnas representan a los **ítems**.

Las celdas de la matriz contienen las valoraciones que los usuarios han dado a los ítems. Esta matriz es generalmente **dispersa**, ya que los usuarios solo valoran una pequeña fracción de los ítems disponibles.

#### **Descomposición:**
El algoritmo NMF descompone la matriz de valoraciones \( R \) en dos matrices de características no negativas:
- **W (usuarios)**: Una matriz de características latentes de los usuarios (\( m \times k \), donde \( m \) es el número de usuarios y \( k \) es el número de características latentes).
- **H (ítems)**: Una matriz de características latentes de los ítems (\( k \times n \), donde \( n \) es el número de ítems).

La descomposición completa es:
\[
R \approx W \cdot H
\]
- \( R \) es la matriz original de valoraciones.
- \( W \) es la matriz de usuarios con las características latentes de los usuarios.
- \( H \) es la matriz de ítems con las características latentes de los ítems.

#### **Predicción:**
La idea principal de NMF es **predecir las valoraciones faltantes** en la matriz \( R \), es decir, aquellas celdas en las que el usuario aún no ha dado una valoración. Para ello, una vez descompuesta la matriz \( R \), el modelo puede usar la multiplicación de las matrices \( W \cdot H \) para aproximar las valoraciones que el usuario podría dar a ítems no valorados.

#### **Optimización:**
NMF realiza la descomposición de la matriz \( R \) de manera que las matrices \( W \) y \( H \) contienen **valores no negativos**. Esto hace que el modelo sea especialmente adecuado para tareas de recomendación, ya que las valoraciones y las características latentes no pueden ser negativas. Para obtener una buena descomposición, se optimizan los valores de \( W \) y \( H \) mediante técnicas de **optimización iterativa**, como el descenso por gradiente o la actualización de las reglas de multiplicación.

#### **Regularización:**
Al igual que en otros métodos de factorización de matrices, se aplica **regularización** en NMF para evitar el sobreajuste (overfitting) a los datos de entrenamiento. La regularización penaliza la complejidad del modelo, evitando que las matrices \( W \) y \( H \) contengan valores demasiado grandes. Esto mejora la capacidad de generalización del modelo y previene el sobreajuste a las peculiaridades de los datos.



## **Reader Dataset**

In [None]:
import urllib
import random
from scipy.special import digamma
from math import exp
import os
import random
import operator
import requests
import numpy as np
import pandas as pd
from scipy import sparse
import sys
from surprise import Dataset, Reader
from surprise import KNNBasic, SVD
from surprise.model_selection import train_test_split
from surprise import accuracy
from surprise.dataset import DatasetAutoFolds
import matplotlib.pyplot as plt
import seaborn as sns
import itertools

In [3]:
%pip install scikit-surprise --quiet

Note: you may need to restart the kernel to use updated packages.


In [None]:
import pandas as pd

df_train = pd.read_csv('train.csv', sep=',', index_col=False)
df_test = pd.read_csv('test.csv', sep=',', index_col=False)

In [7]:
df_train.head(5)

Unnamed: 0,user,item,rating
0,1,25715,7.0
1,1,25716,10.0
2,5,25851,9.0
3,6,25923,5.0
4,7,25924,6.0


In [8]:
reader = Reader(rating_scale=(0,10)) # rating scale range
data = Dataset.load_from_df(df_train[['user', 'item', 'rating']], reader)
print(type(data))

<class 'surprise.dataset.DatasetAutoFolds'>


In [9]:
trainset, testset = train_test_split(data, test_size=0.25)
print(type(trainset))

<class 'surprise.trainset.Trainset'>


In [30]:
trainset = data.build_full_trainset()

## **Algoritmo**

In [29]:
from surprise import Dataset, Reader, NMF

algo = NMF(n_factors=15, n_epochs=50, biased=False, reg_pu=0.06, reg_qi=0.06, random_state=42, verbose=True)
algo.fit(trainset)
predictions = algo.test(testset)

accuracy.mae(predictions)

solution = []

for _, row in df_test.iterrows():
    user = row['user']
    item = row['item']
    
    pred = algo.predict(user, item).est  # Predicción de rating
    solution.append([row['ID'], pred])

solution_df = pd.DataFrame(solution, columns=["ID", "rating"])

solution_df.to_csv('predictions_nmf.csv', index=False)

Processing epoch 0
Processing epoch 1
Processing epoch 2
Processing epoch 3
Processing epoch 4
Processing epoch 5
Processing epoch 6
Processing epoch 7
Processing epoch 8
Processing epoch 9
Processing epoch 10
Processing epoch 11
Processing epoch 12
Processing epoch 13
Processing epoch 14
Processing epoch 15
Processing epoch 16
Processing epoch 17
Processing epoch 18
Processing epoch 19
Processing epoch 20
Processing epoch 21
Processing epoch 22
Processing epoch 23
Processing epoch 24
Processing epoch 25
Processing epoch 26
Processing epoch 27
Processing epoch 28
Processing epoch 29
Processing epoch 30
Processing epoch 31
Processing epoch 32
Processing epoch 33
Processing epoch 34
Processing epoch 35
Processing epoch 36
Processing epoch 37
Processing epoch 38
Processing epoch 39
Processing epoch 40
Processing epoch 41
Processing epoch 42
Processing epoch 43
Processing epoch 44
Processing epoch 45
Processing epoch 46
Processing epoch 47
Processing epoch 48
Processing epoch 49
MAE:  1.77

In [42]:
from surprise import Dataset, Reader, NMF

algo = NMF(n_factors=40, n_epochs=75, biased=False, reg_pu=0.06, reg_qi=0.06, random_state=42, verbose=True)
algo.fit(trainset)
predictions = algo.test(testset)

# accuracy.mae(predictions)

solution = []

for _, row in df_test.iterrows():
    user = row['user']
    item = row['item']
    
    pred = algo.predict(user, item).est  # Predicción de rating
    solution.append([row['ID'], pred])

solution_df = pd.DataFrame(solution, columns=["ID", "rating"])

solution_df.to_csv('predictions_nmf_k40_e75.csv', index=False)

Processing epoch 0
Processing epoch 1
Processing epoch 2
Processing epoch 3
Processing epoch 4
Processing epoch 5
Processing epoch 6
Processing epoch 7
Processing epoch 8
Processing epoch 9
Processing epoch 10
Processing epoch 11
Processing epoch 12
Processing epoch 13
Processing epoch 14
Processing epoch 15
Processing epoch 16
Processing epoch 17
Processing epoch 18
Processing epoch 19
Processing epoch 20
Processing epoch 21
Processing epoch 22
Processing epoch 23
Processing epoch 24
Processing epoch 25
Processing epoch 26
Processing epoch 27
Processing epoch 28
Processing epoch 29
Processing epoch 30
Processing epoch 31
Processing epoch 32
Processing epoch 33
Processing epoch 34
Processing epoch 35
Processing epoch 36
Processing epoch 37
Processing epoch 38
Processing epoch 39
Processing epoch 40
Processing epoch 41
Processing epoch 42
Processing epoch 43
Processing epoch 44
Processing epoch 45
Processing epoch 46
Processing epoch 47
Processing epoch 48
Processing epoch 49
Processing

**GridSearch**

In [None]:
import os
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, NMF
from surprise.model_selection import GridSearchCV

output_dir = "nmf_gridsearch"
os.makedirs(output_dir, exist_ok=True)

df_train = pd.read_csv("train.csv")  
df_test = pd.read_csv("test.csv")

reader = Reader(rating_scale=(df_train["rating"].min(), df_train["rating"].max()))
data = Dataset.load_from_df(df_train[['user', 'item', 'rating']], reader)

param_grid = {
    "n_factors": [10, 15, 20],
    "n_epochs": [30, 50, 70],
    "reg_pu": [0.04, 0.06, 0.08],
    "reg_qi": [0.04, 0.06, 0.08],
}

# Grid Search
grid_search = GridSearchCV(NMF, param_grid, measures=["mae"], cv=3, n_jobs=-1)
grid_search.fit(data)

best_params = grid_search.best_params["mae"]
print(f"Mejores parámetros: {best_params}")

# Entrenar el mejor modelo con todos los datos
best_nmf = NMF(**best_params, random_state=42)
trainset = data.build_full_trainset()
best_nmf.fit(trainset)

solution = []
for _, row in df_test.iterrows():
    user = row["user"]
    item = row["item"]
    pred = best_nmf.predict(user, item).est
    solution.append([row["ID"], pred])

solution_df = pd.DataFrame(solution, columns=["ID", "rating"])
output_file = os.path.join(output_dir, "predictions_nmf.csv")
solution_df.to_csv(output_file, index=False)

print(f"Predicciones guardadas en {output_file}")