# Mentoría 'de cómo clasificar en géneros a las canciones'
## Práctico I : Análisis de features de audio

**Consideraciones:**
- Se evalúa el estilo y prolijidad del código.
- Se permite hacer trabajo extra, siempre y cuando las actividades básicas estén resueltas.

### Librerías

In [None]:
!pip3 install spotipy
!pip3 install pandas

# Agregar las librerías extra que se utilicen en esta celda y la siguiente

### Dependencias y acceso al API

In [1]:
import pandas as pd
import numpy as np
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

client_id = '46b333d567314a89a6254b6c6b054be6'
client_secret = '9d922c3613e441518349dcf55f7d5853'
client_credentials_manager = SpotifyClientCredentials(client_id=client_id, client_secret=client_secret)

sp = spotipy.Spotify(client_credentials_manager=client_credentials_manager)
#dir(sp)

### 1) Plantear una pregunta que quieran responder con estos datos

Las preguntas pueden ser por ejemplo: 
- ¿Por qué este artista destaca dentro de su género?
- ¿Por qué no lo hace?
- ¿Por qué un género musical es más escuchado que otro?

Sin embargo, pueden usar cualquier afirmación que hayan leído en internet y que se pueda responder con los datos este trabajo para validarla o rechazarla.

### Pregunta: Qué tan bien representan las features de audio de Spotify las características de canciones experimentales?

- Cómo se comportan las features ante la música experimental? Son capaces de representar lo que se escucha o dan resultados erróneos?



### 2) Obtener datos para responder la pregunta

Para esto hay que hacer pedidos a la API para obtener una lista de canciones de sus artistas, de las cuáles se obtienen sus features de audio como en este [ejemplo](https://developer.spotify.com/console/get-audio-features-track/?id=17VP4tofJ3evJbtY8Tk1Qi) de la versión web de la API. Una vez obtenidos los datos, seleccionar un subconjunto de 5 o 6 features de audio y agrupar los datos en un [DataFrame de pandas](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html).

**Recomendación** : Usar un dataframe para su artista y otro para la competencia si es que eligierone esa opción, les va a ahorrar tiempo.

**Aclaración** : Si plantearon una pregunta que no requiera los datos de la consigna, obtengan esos datos.

Primero algunas funciones auxiliares

In [159]:
def genres_by_artist_id(id): #id: str
    artist = sp.artist(id)
    genres = artist['genres']
    return genres    #genres: List[str]

def songs_from_album_id(album_id): #album_id : str
    songs = []
    album = sp.album(album_id)
    for i in range(album['total_tracks']):
        track = {}
        track["song_name"] = album['tracks']['items'][i]['name']
        track["song_id"] = album['tracks']['items'][i]['id']
        track["album_name"] = album['name']
        track["album_id"] = album["id"]
        songs.append(track)
    return songs    #songs:List[dict]

def add_track(track_id, songs): #track_id:str, songs:List[dict]
    track = sp.track(track_id)
    audio_features = sp.audio_features(track_id)
    row = {}
    row["song_name"] = track['name']
    row["song_id"] = track['id']
    row["album_name"] = track['album']['name']
    row["album_id"] = track['album']['id']
    row["audio_features"] = audio_features[0]
    songs.append(row)
    return songs



Armamos el dataset.
Canciones: mother of the world, 30 red houses, Hunting down individual mosquitoes, 
            Oral couture, Turbo Olé, Ceaseless Suffering, 
            The Wolf, Aorta, Declare Independence,
            sin rumbo, Anger, Soichiro,
            No Love, Hunger Games, Double Helix,
            Hacker, Black paint, Visceras,
            Micro, 1 hour white noise, Peg,
            Alice, Woodpecker No 1, Tokyo times ten,
            Data.Duplex, Data.Syntax, 5 movements for string quartet, op.5: 1.heftig bewegt,
            Pierrot Lunaire, Op. 21:VIII. Die Nacht, Metastaseis, Horses,
            Heavy Water/I'd rather be sleeping
            

In [162]:

dataset = []
tracks = ["5zNQPB67iLm11Zyg6hwiQX","1X8VjdoPONsFDepJcmvz3E","26pTHO6oeJwjacJFhDzqVl",
          "6ZzpYaAQVvRKwFtMej9OEM","5ecFLLkXuMdZgLYihUfFGk", "2eL3QVjeJF9KhpYkVxjLUA",
          "1YJ264vuusaeDpbe8BKpBP", "0UxLfXmjXU5qoRFL25n5lA", "7gy9d7iBHW9BWhMNPjHuFf",
          "0aL27vskbMpwsMGUkHm3Zf", "1QofoyawKCfWd5lZXwE02k", "4zsfqkM7X1ZYcMAXpGkOO5",
          "5fDj1YVNR04RtQNP4iYapO", "3Pt8XN6zWFmW2ShLna8Ttb", "2SWHZzjaqBuWYUUuxjdeBG",
          "7y8X0Z04gJCKtfrnSAMywJ", "2yY0LXGpN7U2y5tbagNnXq", "1IDi1OjPT8y7MmNflRYMHO",
          "32IPwbBBWJzubJAAZeVx0x", "7Ipe9FfRceDN51YMyd99pO", "2DYxoQbcgjuduAYb98SVLj",
          "7n6WNQidHGzHm0TQHWV7aH", "4UO1pfxi5fDbxshrwwznJ2", "2GgN9rZOpMMGoGVxK9jRxf",
          "6f41Dmik9o6ByGCCe6AJR1", "1C811u2Eqsp6IWki8HyIJC", "5xFWfrJXy7WLdNrioyjUmt",
          "7oTjhU3qCmmXxGR3zi5H2L", "1efDBHuz4k6Zei6chsAwfq", "3e20AQb9sMo23KokSqBrBY",
          "6IUwiHsyKAZtfBy37Wu4ij",
         ]
track_2 = ["5zNQPB67iLm11Zyg6hwiQX","1X8VjdoPONsFDepJcmvz3E","26pTHO6oeJwjacJFhDzqVl",
          "6ZzpYaAQVvRKwFtMej9OEM","5ecFLLkXuMdZgLYihUfFGk", "2eL3QVjeJF9KhpYkVxjLUA",
          ]
for track in tracks:
    add_track(track, dataset)
dataset

[{'album_id': '774XM9c4BAxkNqvu7Rea1E',
  'album_name': 'The Seer',
  'audio_features': {'acousticness': 0.0323,
   'analysis_url': 'https://api.spotify.com/v1/audio-analysis/5zNQPB67iLm11Zyg6hwiQX',
   'danceability': 0.305,
   'duration_ms': 597253,
   'energy': 0.79,
   'id': '5zNQPB67iLm11Zyg6hwiQX',
   'instrumentalness': 0.368,
   'key': 9,
   'liveness': 0.153,
   'loudness': -9.633,
   'mode': 1,
   'speechiness': 0.0965,
   'tempo': 139.551,
   'time_signature': 3,
   'track_href': 'https://api.spotify.com/v1/tracks/5zNQPB67iLm11Zyg6hwiQX',
   'type': 'audio_features',
   'uri': 'spotify:track:5zNQPB67iLm11Zyg6hwiQX',
   'valence': 0.383},
  'song_id': '5zNQPB67iLm11Zyg6hwiQX',
  'song_name': 'Mother of the World'},
 {'album_id': '3aYI83u5Fx5ZRk66jv5QBx',
  'album_name': 'The Light Is Leaving Us All',
  'audio_features': {'acousticness': 0.905,
   'analysis_url': 'https://api.spotify.com/v1/audio-analysis/1X8VjdoPONsFDepJcmvz3E',
   'danceability': 0.727,
   'duration_ms': 199

Armamos los dataframes

In [163]:
songs = pd.DataFrame(dataset)
audio_features = pd.DataFrame(list(songs["audio_features"].values))

In [167]:
audio_features.describe()

Unnamed: 0,acousticness,danceability,duration_ms,energy,instrumentalness,key,liveness,loudness,mode,speechiness,tempo,time_signature,valence
count,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0,31.0
mean,0.348903,0.427052,408727.7,0.578963,0.428008,5.677419,0.179181,-11.492548,0.741935,0.12071,118.905419,3.903226,0.244329
std,0.383779,0.204478,627848.7,0.346732,0.428033,3.798132,0.150501,9.277614,0.444803,0.103448,30.737752,0.472923,0.246081
min,2.6e-05,0.0846,53427.0,6.6e-05,0.0,0.0,0.0412,-33.952,0.0,0.0283,68.404,3.0,1e-05
25%,0.009585,0.2635,173188.5,0.279,0.00028,1.0,0.09865,-17.8095,0.5,0.04265,99.5795,4.0,0.0397
50%,0.146,0.486,250386.0,0.709,0.291,7.0,0.12,-8.96,1.0,0.0726,118.001,4.0,0.101
75%,0.753,0.5625,409255.5,0.8765,0.877,9.0,0.202,-5.902,1.0,0.148,136.3845,4.0,0.513
max,0.95,0.823,3631718.0,0.998,1.0,11.0,0.674,4.14,1.0,0.402,184.102,5.0,0.738


In [None]:
def track_by_feature(feature, value):
    return audio_features[audio_features[feature]==value]

I chose 6 audio features to analyse Arca's music:
- **energy**: [float] Energy is a measure from 0.0 to 1.0 and represents a perceptual measure of intensity and activity. Typically, energetic tracks feel fast, loud, and noisy. For example, death metal has high energy, while a Bach prelude scores low on the scale. Perceptual features contributing to this attribute include dynamic range, perceived loudness, timbre, onset rate, and general entropy.
- **key**: [int] The key the track is in. Integers map to pitches using standard Pitch Class notation . E.g. 0 = C, 1 = C♯/D♭, 2 = D, and so on.
- **tempo**: [float] The overall estimated tempo of a track in beats per minute (BPM). In musical terminology, tempo is the speed or pace of a given piece and derives directly from the average beat duration.
- **valence**:

### 3) Hacer un gráfico de estilo [radar chart](https://en.wikipedia.org/wiki/Radar_chart)  comparando a su artista o banda con 'la competencia'
En esta parte tienen que hacer los gráficos tomando como parámetros las features de audio que eligieron. Pueden usar la librería que quieran para hacer los gráficos.

**Recomendaciones** : 
- Hacer ambos gráficos en una misma figura.
- Antes de graficar, obtener los valores medios o medianos para los valores de las features. 
- Chequear los rangos de valores para cada feature antes de hacer los gráficos.

**Aclaración**: pueden usar otro tipo de gráfico si lo consideran particularmente útil para resolver su pregunta.

### 4) Escribir un informe

Este informe tiene que describir qué datos que obtuvieron, el volumen de estos (# de canciones del artista, # de canciones de la competencia, etc), una explicación de cómo estos se relacionan con la pregunta planteada, cómo ayudan a responderla y los resultados que obtuvieron. Usar la celda de abajo con formato markdown.




In [151]:
genres_by_artist_id("7JRs0G0kHZTBs0Lo7qOjL8")

['nu gaze', 'one-person band', 'quebec indie']

### Pregunta: ¿Qué tan bien representan las features de audio de Spotify las características de canciones experimentales?

- Cómo se comportan las features ante la música experimental? Son capaces de representar lo que se escucha o dan resultados erróneos?

Para esto armé un dataset pequeño con 30 canciones seleccionadas a mano, buscando representar distintos tipos de experimentación en lo sonoro. Elegí el tamaño del dataset ya que para comparar cada canción con las features hay que escucharlas a todas.
Entre las canciones hay cosas como
* Ruido blanco
* Música dedacofónica y Serialista
* Noise y Harsh Noise (Merzbow)
* indie (dirty beaches,
* drone, avant-garde metal,atmospheric black metal ( Sun 0))), The angelic process, Swans )
* Música predominantemente vocal, throat singing (Tanya Tagaq)
* experimental electronic (JASSS, Contrafacto)
* art pop, Experimental pop (Arca)
* synth punk (Deli girls)
* Música minimal (Ryoji Ikeda)
* Ambient (Rainforest Spiritual Enslavement, Worms of the earth)

Sun 0))) Monoliths and Dimensions


In [100]:
#https://open.spotify.com/artist/70MMkLXtue3Edj3RJhJkYp
genres_by_artist_id("7vF3DcPluq6lZI36VniagW")
#https://open.spotify.com/track/1X8VjdoPONsFDepJcmvz3E?si=zMqXD0gNTR6_IRF_0lqSew
sp.audio_features("1X8VjdoPONsFDepJcmvz3E")

[{'acousticness': 0.905,
  'analysis_url': 'https://api.spotify.com/v1/audio-analysis/1X8VjdoPONsFDepJcmvz3E',
  'danceability': 0.727,
  'duration_ms': 199707,
  'energy': 0.329,
  'id': '1X8VjdoPONsFDepJcmvz3E',
  'instrumentalness': 0,
  'key': 4,
  'liveness': 0.0687,
  'loudness': -8.96,
  'mode': 0,
  'speechiness': 0.0375,
  'tempo': 109.019,
  'time_signature': 3,
  'track_href': 'https://api.spotify.com/v1/tracks/1X8VjdoPONsFDepJcmvz3E',
  'type': 'audio_features',
  'uri': 'spotify:track:1X8VjdoPONsFDepJcmvz3E',
  'valence': 0.158}]