# Spotify 

Spotify es un servicio de música, podcasts y vídeos digitales en streaming que da acceso a millones de canciones y otros contenidos de artistas de todo el mundo.

## Documentación necesaria 

Hay dos recursos de consulta que son elementales para la realización de esta práctica:

* 1). *Documentación de la API de Spotify* donde poder comprobar las opciones de consulta disponibles. La documentación se encuentra aquí: <https://developer.spotify.com/documentation/web-api/reference/>

* 2). *Documentación de librerías específicas en R* para el uso de la API de Spotify. En el repositorio principal de R se encuentran dos librerías con este propósito: ```Rspotify``` y ```spotifyr```. Para comprobar si están instaladas:

In [1]:
"Rspotify" %in% row.names(installed.packages())
"spotifyr" %in% row.names(installed.packages())

Aunque ambas son adecuadas para los propósitos de esta práctica, usaremos ```spotifyr```, un wrapper aún en desarrollo que se puede instalar desde el repositorio de su creador. [Aquí](https://www.rcharlie.com/spotifyr/reference/index.html) podéis encontrar la documentación de la librería. Esperemos que pronto vuelva a estar disponible en el `CRAN`.

Comenzamos instalando y cargando la librería:

In [2]:
devtools::install_github('charlie86/spotifyr')
library(spotifyr)

Downloading GitHub repo charlie86/spotifyr@master



[32m✔[39m  [90mchecking for file ‘/tmp/RtmpadCJsA/remotes1961eb5b2be/charlie86-spotifyr-1bc55d5/DESCRIPTION’[39m[36m[39m
[90m─[39m[90m  [39m[90mpreparing ‘spotifyr’:[39m[36m[39m
[32m✔[39m  [90mchecking DESCRIPTION meta-information[39m[36m[39m
[90m─[39m[90m  [39m[90mchecking for LF line-endings in source and make files and shell scripts[39m[36m[39m
[90m─[39m[90m  [39m[90mchecking for empty or unneeded directories[39m[36m[39m
[90m─[39m[90m  [39m[90mbuilding ‘spotifyr_2.1.1.tar.gz’[39m[36m[39m
   


## Cuenta de Spotify

Para usar la API de Spotify es necesario tener una **cuenta de usuario** (no importa si es con el plan gratuito o de pago) y un **client id**. 

Sigue los siguientes pasos para obtener la cuenta y el *client_id*:

1. *Cuenta de usuario*: crea una cuenta, si aún no tienes una, o inicia sesión, en caso contrario. Puedes acceder a ambas posibilidades haciendo click [aquí](https://accounts.spotify.com/es-ES/login/?_locale=es-ES&continue=https:%2F%2Fwww.spotify.com%2Fes%2Faccount%2Foverview%2F).
2. *Client id*: 

    - Con la sesión iniciada, puedes acceder a la sección dedicada a la comunidad de desarrolladores desde el _footer_ de la web o haciendo click [aquí](https://developer.spotify.com/?_ga=2.95562388.962042622.1571125786-840831842.1566985327&_gac=1.258283000.1571133034.Cj0KCQjw3JXtBRC8ARIsAEBHg4kCXay3_JIdYI15Xz8OjMkJvwVBWX32MbRS02z1VkqXmCGTHjudlL0aAvTKEALw_wcB).
    - Para obtener un ```clientId```, necesitamos crear un _proyecto_. Podemos hacerlo desde la subsección [_Dashboards_](https://developer.spotify.com/dashboard/applications), haciendo click en ```CREATE A CLIENT ID```. 

## Autenticación

Para comenzar a usar la API, Spotify solicitará un _token de acceso_. Nuestra librería proporciona una función para conseguir este _token_: ``. 

Para hacer la consulta, necesitaremos disponer del ``CLIENT_ID``y el ``SECRET_ID``, ambos disponibles en nuestra aplicación en el _Dashboard_ de _Spotify for developers_.


In [3]:
my_client_id <- ???????????????
my_client_secret <- ????????????????

token <- get_spotify_access_token(client_id = my_client_id,
                                  client_secret = my_client_secret)

Con nuestro _token_ ya estaríamos en condiciones de hacer las consultas a la API de Spotify con la librería ``spotifyr``. Para comprobar que todo ha ido bien, vamos a hacer una consulta de prueba: vamos a simular una búsqueda del artista **Queen** en el buscador de Spotify:

In [18]:
result <- search_spotify("Queen", type = "artist", authorization = token)
print(result$name)

 [1] "Queen"                         "Queen Naija"                  
 [3] "Queens of the Stone Age"       "Beyoncé"                      
 [5] "Queendome Come"                "Queen Pen"                    
 [7] "Queen Latifah"                 "Queensrÿche"                  
 [9] "Queen Key"                     "QUEEN BEE"                    
[11] "Queen Boss King Records"       "Ivy Queen"                    
[13] "Queen Ifrica"                  "Queen of Apostles"            
[15] "Queensland Symphony Orchestra" "Queena Cui"                   
[17] "Queen Deusah"                  "Queen Chrysalis"              
[19] "Queen Dominique"               "Queen Kenzie"                 


# Actividades

## Exploración de una playlist

Navega por la versión web del reproductor ojeando las distintas listas de reproducción. Elige una de ellas y selecciónala. En la barra del navegador, aparecerá una dirección del tipo:

> ```https://open.spotify.com/playlist/{XXXXXXXXXXXXXXXXXXXXX}```

Selecciona el identificador alfanumérico que aparece al final de la dirección y guárdalo en un objeto de tu sesión de R. Por ejemplo, la lista *Top 50 de España*, tiene por identificador ```37i9dQZEVXbNFJfN1Vw8d9```.

Haz una consulta a la API para extraer la información de la lista de reproducción seleccionada y responde a las siguientes preguntas:

1. ¿Qué tipo de objeto devuelve la consulta? Descríbelo brevemente. 
2. ¿Cuántos seguidores tiene?
3. A partir de la información obtenida, crea un dataframe con las siguientes columnas: 

|id   | nombre   |  artista | album   | popularidad   |
|---|---|---|---|---|
|   |   |   |   |   |

donde:

- **id**: identificador de la canción.
- **nombre**: nombre de la canción.
- **artista**: artista/-s que interpreta/-n la canción. 
- **album**: tipo de álbum al que pertenece la canción.
- **popularidad**: popularidad de la canción (métrica calculada por Spotify). 
    - Consulta en la documentación de la API de Spotify lo que representa esta métrica.

### Respuestas

#### Objeto devuelto
La consulta nos devuelve una lista de 15 elementos cuyos nombres son:   

In [19]:
pl <- get_playlist("37i9dQZEVXbNFJfN1Vw8d9", authorization = token)
print(names(pl))

 [1] "collaborative" "description"   "external_urls" "followers"    
 [5] "href"          "id"            "images"        "name"         
 [9] "owner"         "primary_color" "public"        "snapshot_id"  
[13] "tracks"        "type"          "uri"          


Para ver la descripción de cada elemento, se puede consultar la descripción del objeto playlist que se recoge en la documentación de la API en este [enlace](https://developer.spotify.com/documentation/web-api/reference/playlists/get-playlist/). 

Cabe destacar el elemento ```tracks```, que es el que contiene toda la información relativa a las canciones:

In [6]:
class(pl$tracks)
length(pl$tracks)
names(pl$tracks)

Es decir, el elemento ```tracks``` es a su vez una lista formada por 7 elementos. Uno de ellos es ```items```, que es el que contiene información directa sobre las canciones (identificador, título, artistas, etc).

#### Seguidores
El número de seguidores de la lista de reproducción que hemos elegido está contenido directamente en el elemento ```followers``` del objeto que nos hemos descargado:

In [7]:
pl$followers

#### Dataframe de canciones

Para crear el dataframe de canciones comenzaremos localizando, en la jerarquía del objeto ```pl```, la información que se solicita:

| Columna  | Elemento de la jerarquía de ```pl``` | Tipo  |
|---|---|---|
| id|  ```pl$tracks$items$track.id``` | vector  |
| nombre |  ```pl$tracks$items$track.name``` |  vector |
| artista  | ```pl$tracks$items$track.artists```  | lista  |
| album  | ```pl$trakcs$items$track.album.album_type```  |  vector |
| popularidad  | ```pl$tracks$items$track.popularity```  |   vector |

Para contruir nuestro dataframe, necesitamos que todas las columnas sean vectores, de modo que tendremos que transformar la lista con la información de artistas en un vector antes de crear el dataframe. Exploramos el primer elemento de la lista para ver la estructura que tiene:

In [8]:
artista_track1 <- pl$tracks$items$track.artists[[1]]
artista_track1

href,id,name,type,uri,external_urls.spotify
<chr>,<chr>,<chr>,<chr>,<chr>,<chr>
https://api.spotify.com/v1/artists/4q3ewBCX7sLwd24euuV69X,4q3ewBCX7sLwd24euuV69X,Bad Bunny,artist,spotify:artist:4q3ewBCX7sLwd24euuV69X,https://open.spotify.com/artist/4q3ewBCX7sLwd24euuV69X
https://api.spotify.com/v1/artists/0EFisYRi20PTADoJrifHrz,0EFisYRi20PTADoJrifHrz,Jhay Cortez,artist,spotify:artist:0EFisYRi20PTADoJrifHrz,https://open.spotify.com/artist/0EFisYRi20PTADoJrifHrz


Se trata de un dataframe donde cada fila contiene información de uno de los artistas de la canción correspondiente. Es decir, la primera canción de nuestra lista tiene 2 artistas asociados. 

Necesitamos "unificar" los nombres de todos los artistas de la canción en un único elemento. Para ello, usaremos la función ```paste``` que de forma sencilla nos permite pegar todos los elementos de un vector en un único elemento utilizando el separador que queramos:

In [20]:
art_track1 <- paste(artista_track1$name, collapse = ", ")
print(art_track1)

[1] "Bad Bunny, Jhay Cortez"


Ahora debemos hacer lo mismo para el resto de elementos de la lista de canciones. Lo haremos en dos pasos usando la función ``sapply``: 

1. Primero la utilizaremos para extraer la componente ``name`` de cada elemento de la lista de artistas de canciones, que nos devolverá un vector donde cada componente contendrá el nombre de los cantantes de esa canción:

In [22]:
list.nombres <- sapply(pl$tracks$items$track.artists, "[[", "name")
print(list.nombres[[1]])

[1] "Bad Bunny"   "Jhay Cortez"


2. Después, la utilizaremos con la función ``paste`` para construir un vector donde cada elemento sea el resultado de separar por comas la colección de nombres de cada elemento de ``list.nombres``. 

In [23]:
nombres <- sapply(list.nombres, paste, collapse=", ")
print(nombres[1:10])

 [1] "Bad Bunny, Jhay Cortez"                    
 [2] "C. Tangana, Niño de Elche, La Húngara"     
 [3] "Manuel Turizo, Rauw Alejandro, Myke Towers"
 [4] "Paris Boy"                                 
 [5] "C. Tangana"                                
 [6] "KAROL G"                                   
 [7] "Wisin, Myke Towers, Los Legendarios"       
 [8] "Ana Mena, Rocco Hunt"                      
 [9] "Sech, J Balvin"                            
[10] "Ozuna, J Balvin, Chencho Corleone"         


Finalmente, el dataframe que solicitado resulta:

In [25]:
df_canciones <- data.frame(id = pl$tracks$items$track.id,
                           nombre = pl$tracks$items$track.name,
                           artista = nombres,
                           album = pl$tracks$items$track.album.album_type,
                           popularidad = pl$tracks$items$track.popularity)
head(df_canciones)

id,nombre,artista,album,popularidad
<fct>,<fct>,<fct>,<fct>,<int>
47EiUVwUp4C9fGccaPuUCS,Dakiti,"Bad Bunny, Jhay Cortez",single,99
0XinBYhf1X3kdvKQHOX971,Tú Me Dejaste De Querer (feat. Niño de Elche & La Hungara),"C. Tangana, Niño de Elche, La Húngara",single,86
7ndTONDDRFGiPnnhOzOXxq,La Nota,"Manuel Turizo, Rauw Alejandro, Myke Towers",single,92
2aQJOc2QUTdQl1J2Z9VxYO,Problemas,Paris Boy,single,79
2iUz95Osgl4fFZbNJ0xuoD,Demasiadas Mujeres,C. Tangana,single,82
7vrJn5hDSXRmdXoR30KgF1,BICHOTA,KAROL G,single,90


## Exploración de canciones

Spotify permite obtener distintas características de las canciones. Puede resultar de interés explorar las métricas que ellos mismos asocian a las canciones y sobre las que basarán, en parte, su algoritmo de recomendación.  Utiliza la API para extraer información de las canciones que conforman tu dataframe y responde a las siguientes preguntas:

1. ¿Cuál es la media del índice de bailabilidad (```danceability```) de tu lista? ¿Y del índice de positividad (```valence```)?
2. ¿Cuál es el título de la canción con la energía (```energy```) más baja de tu lista?
3. Supongamos que una canción es acústica si la métrica de acústica asociada es mayor que $0.7$. ¿De cuántas canciones acústicas se compone tu lista?
4. Compara visualmente la popularidad de las canciones de tu lista con otras métricas (```danceability```, ```energy```, etc). ¿Se observa algo destacable?

## Librería ``httr``

1. Reescribe las dos consultas de los ejercicios anteriores usando la librería ```httr```.

**Pista**. la consulta será de la forma: 

> ``` GET(url_que_tienes_que_averiguar,  config = add_headers(authorization = paste("Bearer", token)))```
