# Sistemas de Recomendación - Instalación y Configuración

## Configuración del entorno

### Instalación de conda

Para este curso utilizaremos `conda` como gestor de paquetes y entornos de trabajo en Python. Pueden instalar la versión que quieran de Anaconda o Miniconda. Las instrucciones, de acuerdo a su sistema operativo, pueden encontrarse en la [documentación oficial](https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html#regular-installation).

### Crear un entorno virtual con las librerías de Anaconda

    $ conda create --name rec-sys python=3.7 anaconda

Activar el entorno

    $ conda activate rec-sys    

### Instalación de Surpr!se

La librería que vamos a utilizar para entrenar nuestos sistemas de recomendación es [Surpr!se](http://surpriselib.com/) que tiene una implementación bastante completa de varios algoritmos de recomendación y una API muy similar a la de `scikit-learn`. Para instalarla, una vez activado el entorno, basta con el siguiente comando:

    (rec-sys) $ conda install -c conda-forge scikit-surprise

Para probar que se instaló correctamente, basta comprobarlo ejecutando la siguiente celda:

In [1]:
import surprise

surprise.__version__

'1.1.0'

## Conjunto de datos

### MovieLens

El conjunto de datos de [MovieLens](https://grouplens.org/datasets/movielens/) es uno de los más comunes para iniciarse en Sistemas de Recomendación, donde, en este caso, se buscan recomendar películas a los distintos usuarios en base a su review sobre películas vistas. Para descargarlo basta correr la celda siguiente (sólo disponible en Linux, en caso de utilizar Windows es mejor hacer la [descarga directa](https://grouplens.org/datasets/movielens/ml-latest-small.zip) y descomprimir el archivo):

In [2]:
%%bash

mkdir -p data/
curl -LO http://files.grouplens.org/datasets/movielens/ml-latest-small.zip
unzip ml-latest-small.zip -d data/
rm -f ml-latest-small.zip

Archive:  ml-latest-small.zip
   creating: data/ml-latest-small/
  inflating: data/ml-latest-small/links.csv  
  inflating: data/ml-latest-small/tags.csv  
  inflating: data/ml-latest-small/ratings.csv  
  inflating: data/ml-latest-small/README.txt  
  inflating: data/ml-latest-small/movies.csv  


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0  4  955k    4 46059    0     0  38033      0  0:00:25  0:00:01  0:00:24 38033 30  955k   30  295k    0     0   150k      0  0:00:06  0:00:01  0:00:05  150k 62  955k   62  595k    0     0   198k      0  0:00:04  0:00:03  0:00:01  198k 94  955k   94  906k    0     0   214k      0  0:00:04  0:00:04 --:--:--  214k100  955k  100  955k    0     0   225k      0  0:00:04  0:00:04 --:--:--  225k


### Steam

Para el práctico 1 de la materia vamos a estar utilizando el conjunto de datos de [Steam Video Games](https://www.kaggle.com/tamber/steam-video-games/), que tiene información sobre juegos comprados y horas jugadas de usuarios de Steam sobre determinados juegos. Nuevamente, si no están utilizando una terminal de Linux, recomiendo hacer el proceso de manera manual mediante la [descarga directa](http://www2.informatik.uni-freiburg.de/~cziegler/BX/BX-CSV-Dump.zip).

In [1]:
%%bash

mkdir -p data/steam/
curl -LO https://cs.famaf.unc.edu.ar/~ccardellino/diplomatura/steam-200k.csv.zip
unzip steam-200k.csv.zip -d data/steam
rm -f steam-200k.csv.zip

Archive:  steam-200k.csv.zip
  inflating: data/steam/steam-200k.csv  


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0100 1497k  100 1497k    0     0  4277k      0 --:--:-- --:--:-- --:--:-- 4277k


## Algunos recursos extras

- [Building and Testing Recommender Systems With Surprise, Step-By-Step](https://towardsdatascience.com/building-and-testing-recommender-systems-with-surprise-step-by-step-d4ba702ef80b)
- [Building a Recommender System from Scratch](https://github.com/topspinj/pydata-workshop/blob/master/tutorial.ipynb)