# Introducción a la librería Surprise

Surprise (Simple Python RecommendatIon System Engine) es una librería especializada en construir y evaluar sistemas de recomendación colaborativos. Está orientada a datasets donde los usuarios califican ítems (por ejemplo, cursos, libros, películas), como en una escala de 1 a 5.

Aquí trabajaremos con:
- Carga de datos
- Algoritmo colaborativo (KNN o SVD)
- Entrenamiento y predicción
- Evaluación del modelo

###  Instalación de la librería Surprise

In [1]:
!pip install scikit-surprise

Collecting scikit-surprise
  Downloading scikit_surprise-1.1.4.tar.gz (154 kB)
     ---------------------------------------- 0.0/154.4 kB ? eta -:--:--
     ---------------------------------------- 0.0/154.4 kB ? eta -:--:--
     -- ------------------------------------- 10.2/154.4 kB ? eta -:--:--
     -- ------------------------------------- 10.2/154.4 kB ? eta -:--:--
     ------- ----------------------------- 30.7/154.4 kB 145.2 kB/s eta 0:00:01
     ------- ----------------------------- 30.7/154.4 kB 145.2 kB/s eta 0:00:01
     --------- --------------------------- 41.0/154.4 kB 151.3 kB/s eta 0:00:01
     -------------- ---------------------- 61.4/154.4 kB 192.5 kB/s eta 0:00:01
     ---------------------- -------------- 92.2/154.4 kB 262.6 kB/s eta 0:00:01
     --------------------------------- -- 143.4/154.4 kB 370.8 kB/s eta 0:00:01
     ------------------------------------ 154.4/154.4 kB 384.5 kB/s eta 0:00:00
  Installing build dependencies: started
  Installing build depende


[notice] A new release of pip is available: 24.0 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [1]:
import numpy
print(numpy.__version__)

1.26.4


## 1. Cargar librerías y crear un conjunto de datos artificial

Primero importamos lo necesario y creamos un conjunto de datos simulado con calificaciones dadas por estudiantes a actividades relacionadas con habilidades blandas.

In [2]:
from surprise import Dataset, Reader
import pandas as pd

# Creamos un DataFrame con calificaciones de estudiantes a actividades
data = pd.DataFrame({
    'usuario': ['U1', 'U1', 'U2', 'U2', 'U3', 'U3'],
    'item': ['Comunicación', 'Empatía', 'Empatía', 'Trabajo en equipo', 'Comunicación', 'Gestión del ego'],
    'rating': [4, 5, 3, 4, 2, 5]
})

# Mostrar los datos
print(data)

  usuario               item  rating
0      U1       Comunicación       4
1      U1            Empatía       5
2      U2            Empatía       3
3      U2  Trabajo en equipo       4
4      U3       Comunicación       2
5      U3    Gestión del ego       5


## 2. Preparar los datos con el formato que requiere Surprise

Surprise necesita que los datos tengan 3 columnas: usuario, ítem y calificación (en ese orden). 
Usamos `Reader` para definir el rango de las calificaciones y luego cargamos el dataset.

In [3]:
# Definir el rango de las calificaciones
reader = Reader(rating_scale=(1, 5))

# Convertir el DataFrame a un dataset compatible con Surprise
data_surprise = Dataset.load_from_df(data[['usuario', 'item', 'rating']], reader)

## 3. Entrenar un modelo usando KNN (filtrado colaborativo basado en usuario)

Usaremos el algoritmo KNNBasic para hacer recomendaciones según similitudes entre usuarios.

In [4]:
from surprise import KNNBasic
from surprise.model_selection import train_test_split
from surprise import accuracy

# Dividir los datos en entrenamiento y prueba
trainset, testset = train_test_split(data_surprise, test_size=0.25)

# Crear el modelo KNN
algo = KNNBasic()

# Entrenar el modelo
algo.fit(trainset)

# Hacer predicciones
predictions = algo.test(testset)

# Mostrar precisión del modelo
accuracy.rmse(predictions)


Computing the msd similarity matrix...
Done computing similarity matrix.
RMSE: 1.1180


1.118033988749895

## 4. Predecir una calificación para un usuario que no ha calificado un ítem

Probamos cómo el sistema predice una calificación para el usuario "U1" en la actividad "Gestión del ego".

In [5]:
# Predecir una calificación que aún no existe en los datos
prediccion = algo.predict('U1', 'Gestión del ego')
print(prediccion)

user: U1         item: Gestión del ego r_ui = None   est = 3.50   {'was_impossible': True, 'reason': 'User and/or item is unknown.'}


## Conclusión

Este ejemplo muestra cómo con muy pocos datos se puede crear un sistema de recomendación básico utilizando la librería Surprise. 
Este sistema puede recomendar actividades (ítems) que ayuden a mejorar habilidades blandas basándose en lo que otros usuarios han valorado positivamente.

A futuro, puedes usar datos reales y probar otros algoritmos como SVD, SVD++, NMF, entre otros. También puedes ajustar parámetros, usar validación cruzada y calcular métricas más específicas.

Esta lógica puede integrarse en tu proyecto para recomendar actividades personalizadas de formación en habilidades blandas.
