# Sistemas de recomendación con LightFM
En este notebook se obtienen los distintos tipos de modelos (colaborativo, basado en contenido e híbrido) con el conjunto de datos de MovieLens y la librería LightFM.

In [None]:
# Importar todo lo necesario
import numpy as np
import pandas as pd
import scipy as sp
from lightfm import LightFM
from lightfm.evaluation import precision_at_k
from lightfm.data import Dataset

## Obtención de los dataframes

In [None]:
# Obtención del dataframe de ml_data
data_df = pd.read_csv('data/ml_data.csv', delim_whitespace=True, names=['Id Usuario','Id Película','Valoración','Fecha'])

# Descomentar para comprobar que el dataframe se ha obtenido correctamente
#data_df

# Obtención del dataframe de ml_items
items_df = pd.read_csv('data/ml_items.csv', sep='|',
    names=['Id Película','Título','Fecha de estreno','Fecha DVD','iMDB','Género desconocido','Acción','Aventura','Animación','Infantil','Comedia', 'Crimen','Docuemntal','Drama','Fantasía','Cine negro','Horror','Musical','Misterio','Romance','Ciencia ficción','Thriller','Bélico','Western'],
    encoding='latin-1')

# Descomentar para comprobar que el dataframe se ha obtenido correctamente
#items_df

## Obtención del dataset y las matrices de interacciones
Convierto los dataframes en las estructuras de datos que necesita LightFM para poder sacar las matrices y poder hacer uso de su sistema de recomendación

In [None]:
# Obtención de los dataset
dataset = Dataset()
dataset.fit(data_df['Id Usuario'], data_df['Id Película'])
dataset.fit_partial(items=items_df['Id Película'], item_features=items_df['Título'])

#num_users, num_items = dataset.interactions_shape()
#print('Num users: {}, num_items {}.'.format(num_users, num_items))

# Obtención de las matrices
(interactions, weights) = dataset.build_interactions((row['Id Usuario'], row['Id Película']) for index, row in data_df.iterrows())
item_features = dataset.build_item_features((row['Id Película'], [row['Título']]) for index, row in items_df.iterrows())

## Obtención del modelo colaborativo

In [None]:
collab_model = LightFM(loss='warp')
collab_model.fit(interactions, epochs=30, num_threads=2)

In [None]:
scores = collab_model.predict(5, np.arange(3))
top_items = items_df['Título'][np.argsort(-scores)]
print(top_items)

## Obtención del modelo híbrido

In [None]:
hybrid_model = LightFM(loss='warp')
hybrid_model.fit(interactions, item_features=item_features, epochs=30, num_threads=2)

In [None]:
scores = hybrid_model.predict(5, np.arange(3))
top_items = items_df['Título'][np.argsort(-scores)]
print(top_items)