# Sistemas de Recomendación - Instalación y Configuración

## Configuración del entorno

### Instalación de conda

Para este curso utilizaremos `conda` como gestor de paquetes y entornos de trabajo en Python. Pueden instalar la versión que quieran de Anaconda o Miniconda. Las instrucciones, de acuerdo a su sistema operativo, pueden encontrarse en la [documentación oficial](https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html#regular-installation).

### Crear un entorno virtual con las librerías de Anaconda

    $ conda create --name rec-sys python=3.7 anaconda

Activar el entorno

    $ conda activate rec-sys    

### Instalación de Surpr!se

La librería que vamos a utilizar para entrenar nuestos sistemas de recomendación es [Surpr!se](http://surpriselib.com/) que tiene una implementación bastante completa de varios algoritmos de recomendación y una API muy similar a la de `scikit-learn`. Para instalarla, una vez activado el entorno, basta con el siguiente comando:

    (rec-sys) $ conda install -c conda-forge scikit-surprise

Para probar que se instaló correctamente, basta comprobarlo ejecutando la siguiente celda:

In [None]:
import surprise

surprise.__version__

## Conjunto de datos

### MovieLens

El conjunto de datos de [MovieLens](https://grouplens.org/datasets/movielens/) es uno de los más comunes para iniciarse en Sistemas de Recomendación, donde, en este caso, se buscan recomendar películas a los distintos usuarios en base a su review sobre películas vistas. Para descargarlo basta correr la celda siguiente (sólo disponible en Linux, en caso de utilizar Windows es mejor hacer la [descarga directa](https://grouplens.org/datasets/movielens/ml-latest-small.zip) y descomprimir el archivo):

In [1]:
%%bash

mkdir -p data/
curl -LO http://files.grouplens.org/datasets/movielens/ml-latest-small.zip
unzip ml-latest-small.zip -d data/
rm -f ml-latest-small.zip

Archive:  ml-latest-small.zip
   creating: data/ml-latest-small/
  inflating: data/ml-latest-small/links.csv  
  inflating: data/ml-latest-small/tags.csv  
  inflating: data/ml-latest-small/ratings.csv  
  inflating: data/ml-latest-small/README.txt  
  inflating: data/ml-latest-small/movies.csv  
     failed setting times/attribs for 1 dir entries

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0  1  955k    1 15783    0     0  27738      0  0:00:35 --:--:--  0:00:35 27689 76  955k   76  728k    0     0   484k      0  0:00:01  0:00:01 --:--:--  484k100  955k  100  955k    0     0   530k      0  0:00:01  0:00:01 --:--:--  529k
chmod (directory attributes) error: Operation not permitted
fchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permitted
          Operation

### LastFM

Para el práctico 1 de la materia vamos a estar utilizando el conjunto de datos de [LastFM](https://grouplens.org/datasets/hetrec-2011/), que tiene información sobre usuarios y artistas que estos escuchan. Nuevamente, si no están utilizando una terminal de Linux, recomiendo hacer el proceso de manera manual mediante la [descarga directa](http://files.grouplens.org/datasets/hetrec2011/hetrec2011-lastfm-2k.zip).

In [2]:
%%bash

mkdir -p data/lastfm/
curl -LO http://files.grouplens.org/datasets/hetrec2011/hetrec2011-lastfm-2k.zip
unzip hetrec2011-lastfm-2k.zip -d data/lastfm/
rm -f hetrec2011-lastfm-2k.zip

Archive:  hetrec2011-lastfm-2k.zip
  inflating: data/lastfm/user_friends.dat  
  inflating: data/lastfm/user_taggedartists.dat  
  inflating: data/lastfm/user_taggedartists-timestamps.dat  
  inflating: data/lastfm/artists.dat  
  inflating: data/lastfm/readme.txt  
  inflating: data/lastfm/tags.dat    
  inflating: data/lastfm/user_artists.dat  


  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0  8 2528k    8  216k    0     0   190k      0  0:00:13  0:00:01  0:00:12  190k 89 2528k   89 2263k    0     0  1092k      0  0:00:02  0:00:02 --:--:-- 1091k100 2528k  100 2528k    0     0  1147k      0  0:00:02  0:00:02 --:--:-- 1146k
fchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedfchmod (file attributes) error: Operation not permitted
          Operation not permittedf

## Algunos recursos extras

- [Building and Testing Recommender Systems With Surprise, Step-By-Step](https://towardsdatascience.com/building-and-testing-recommender-systems-with-surprise-step-by-step-d4ba702ef80b)
- [Building a Recommender System from Scratch](https://github.com/topspinj/pydata-workshop/blob/master/tutorial.ipynb)