# Simple Movie Recommender Using SVD

## Filtrado colaborativo
- El Filtrado colaborativo (FC) es una técnica utilizada por algunos sistemas recomendadores.
- Dentro de los Sistemas de Recomendacion basados en Filtrado Colaborativo se tiene una matriz de votos.

<img src="img/collab1.PNG"/>
<img src="img/collab2.PNG"/>
<img src="img/collab3.PNG"/>

### Similitud coseno
- Una medida de la similitud existente entre dos vectores.
- El valor del coseno del ángulo comprendido entre ellos.

<img src="img/similitudCoseno1.PNG"/>
Representamos cada persona con un vector.
<img src="img/similitudCoseno2.PNG"/>
Formula para el cálculo de similitud coseno entre 2 vectores.
<img src="img/similitudCoseno3.PNG"/>
La similitud de estos dos vectores indica la similitud de las preferencias de estas dos personas. 
<img src="img/similitudCoseno4.PNG"/>
El resultado está muy cerca del 1, las preferencias son casi iguales.

## SVD

### Objetivo

- SVD aplicada a los sistemas de recomendacion basados en filtrado colaborativo realiza muy buenas recomendaciones.
- Tiempo de computo es muy grande y los principales objetivos de los sistemas de recomendacion son recomendar bien y hacerlo rapido.

A = U·S·V   (El producto matricial de 'U', 'S', 'V' es la matriz A)


- Dentro de los Sistemas de Recomendacion basados en Filtrado Colaborativo se tiene una matriz de votos.
- Con SVD se obtienen una serie de factores que caracteriza cada uno de los usuarios y los items (peliculas).

- Con SVD podemos simplificar el proceso de recomendación obteniendo solo las matrices de factores de usuarios e items (U y V).

<img src="img/SVD.PNG"/>

In [None]:
# Importamos numpy y pandas.
import numpy as np
import pandas as pd

In [None]:
# Leemos los datos con pandas.
data = pd.io.parsers.read_csv('data/ratings.dat', 
    names=['user_id', 'movie_id', 'rating', 'time'],
    engine='python', delimiter='::')
print(data.head(5))

movie_data = pd.io.parsers.read_csv('data/movies.dat',
    names=['movie_id', 'title', 'genre'],
    engine='python', delimiter='::')
print(movie_data.head(5))

In [None]:
# Creamos una matriz de valoraciones(m×n) (row=películas, col=usuarios)
ratings_mat = np.ndarray(
    shape=(np.max(data.movie_id.values), np.max(data.user_id.values)),
    dtype=np.uint8)

ratings_mat[data.movie_id.values-1, data.user_id.values-1] = data.rating.values

print(ratings_mat)

In [None]:
# Factorizamos la matriz de valoraciones con SVD.
normalised_mat = ratings_mat - np.asarray([(np.mean(ratings_mat, 1))]).T
A = normalised_mat.T / np.sqrt(ratings_mat.shape[0] - 1)
U, S, V = np.linalg.svd(A)

print(V)

In [None]:
# Cálculo de similitud coseno, devuelve el top N de las películas más similares.
def top_cosine_similarity(data, movie_id, top_n=10):
    index = movie_id - 1 # movie_id empieza por 1.
    movie_row = data[index, :]
    magnitude = np.sqrt(np.einsum('ij, ij -> i', data, data))
    similarity = np.dot(movie_row, data.T) / (magnitude[index] * magnitude)
    sort_indexes = np.argsort(-similarity)
    return sort_indexes[:top_n]

# Print de las películas top N.
def print_similar_movies(movie_data, movie_id, top_indexes):
    print('Recommendations for {0}: \n'.format(
    movie_data[movie_data.movie_id == movie_id].title.values[0]))
    for id in top_indexes + 1:
        print(movie_data[movie_data.movie_id == id].title.values[0])

In [None]:
np.seterr(divide='ignore', invalid='ignore')

# Hacemos el dataset más pequeño (para que tarde menos).
k = 50
movie_id = 1 # Seleccionamos una película para obtener recomendaciones.
top_n = 10

sliced = V.T[:, :k]
indexes = top_cosine_similarity(sliced, movie_id, top_n)
print_similar_movies(movie_data, movie_id, indexes)

In [None]:
# Bibliografía
# http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.3.1001&rep=rep1&type=pdf
# https://www.researchgate.net/profile/Konstantinos_G_Margaritis/publication/4215624_Applying_SVD_on_item-based_filtering/links/02e7e52088aae97991000000.pdf
# https://www.researchgate.net/profile/Konstantinos_G_Margaritis/publication/27382630_Applying_SVD_on_Item-based_Filtering/links/02e7e52600d2e7d2ac000000/Applying-SVD-on-Item-based-Filtering.pdf
# http://informatico.ricardomoya.es/docs/ProyectoFinDeMaster_V1.pdf
# https://alyssaq.github.io/2015/20150426-simple-movie-recommender-using-svd