# Extracción de APIs #

1. Registro con la cuenta de Spotify para conseguir la API Key.
2. Creación de un dashboard para registrar el proyecto.
3. Leer la documentación suministrada por Spotify for Developers y la librería Spotipy.
4. Posteriormente, en la documentación, navegar por el punto "search for item" donde observamos el endpoint (q, type, limit, offset) con el "search".
5. Importamos la librería Spotipy para poder autentificar los requests que nos daba la documentación de las APIs de Spotify (q, type, limit, offset).

In [1]:
import spotipy
import pandas as pd
from spotipy.oauth2 import SpotifyClientCredentials

In [2]:
url = "https://accounts.spotify.com/api/token"

client_id = "54778a9f1fd7438d9c5710a72d0ca202"

client_secret = "5a150e27569642f99ff3ca122492e811"

# Autenticación

client_credential = SpotifyClientCredentials(client_id=client_id, client_secret=client_secret)

sp = spotipy.Spotify(auth_manager=client_credential)

# Llamamos a la API #

1. Con mucho trabajo y esfuerzo, hicimos una primera llamada a la API para extraer los datos entre los años 2000 y 2024. Una vez obtuvimos estos datos, filtramos por año (2021 y 2022), por género (*rock*, *pop*, *rap* e *indie*) y por tracks (canciones).
2. Basándonos en lo anterior, se creó una función para conseguir los datos usando un *bucle for in range* de 50 en 50 hasta 1000 (que es el máximo que ofrece el *offset*) canciones por género y año.
3. La búsqueda de los datos se realizó utilizando la autenticación de la librería Spotipy (sp) y .search que nos proporcionaba la documentación de la API de Spotify.
4. Se crea un bucle for para iterar por los elementos de los datos obtenidos en el paso anterior.
5. Retornamos un *Data Frame* con los datos filtrados necesarios.

In [3]:
def datos_filtrados(año, genero):


    datos_filtrados = {"artista": [], "tipo": [], "título_canción": [], "nombre_album": [], "año": [], 'genre': genero}
    for offset in range(0, 1000, 50):
        datos = sp.search(q=f"genre:{genero} year:{año}", type='track', limit=50, offset=offset)
    
        
        for elemento in datos["tracks"]["items"]:
            datos_filtrados["artista"].append(elemento["album"]["artists"][0]["name"])
            datos_filtrados["tipo"].append(elemento['type'])
            datos_filtrados["título_canción"].append(elemento['name'])
            datos_filtrados["nombre_album"].append(elemento["album"]["name"])
            datos_filtrados["año"].append(elemento["album"]["release_date"][0:4])

    return pd.DataFrame(datos_filtrados)
        

# Extracción de datos #

Creamos diferentes variables por género y año elegidos anteriormente para llamar a la función datos_filtrados y almacenamos las 1000 canciones obtenidas.

In [None]:
rock_2021 = datos_filtrados(2021, 'rock')

In [24]:
rock_2021

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Måneskin,track,I WANNA BE YOUR SLAVE,Teatro d'ira - Vol. I,2021,rock
1,Elton John,track,Cold Heart - PNAU Remix,The Lockdown Sessions,2021,rock
2,Elton John,track,Cold Heart - PNAU Remix,Cold Heart (PNAU Remix),2021,rock
3,Parmalee,track,Just the Way,For You,2021,rock
4,Thomas Rhett,track,What’s Your Country Song,Country Again (Side A),2021,rock
...,...,...,...,...,...,...
995,Queen,track,Now I'm Here - Remastered 2011,Greatest Hits,2021,rock
996,Dragonette,track,Summer Thing,Summer Thing,2021,rock
997,Twenty One Pilots,track,Mulberry Street - Livestream Version,Scaled And Icy (Livestream Version),2021,rock
998,Scotty McCreery,track,How Ya Doin' Up There,Same Truck,2021,rock


In [25]:
rock_2022 = datos_filtrados(2022, 'rock')

rock_2022

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Royel Otis,track,Oysters In My Pocket,Oysters In My Pocket,2022,rock
1,Imagine Dragons,track,Bones,Mercury - Acts 1 & 2,2022,rock
2,Jon Pardi,track,Your Heart Or Mine,Mr. Saturday Night,2022,rock
3,Cole Swindell,track,She Had Me At Heads Carolina,Stereotype,2022,rock
4,OneRepublic,track,I Ain't Worried,I Ain’t Worried (Music From The Motion Picture...,2022,rock
...,...,...,...,...,...,...
995,Simple Plan,track,Wake Me Up (When This Nightmare’s Over),Harder Than It Looks,2022,rock
996,Karma To Burn,track,Twenty Nine,Wild Wonderful Purgatory,2022,rock
997,Natalia Lafourcade,track,Mi manera de querer,De Todas las Flores,2022,rock
998,Papa Roach,track,Liar,Ego Trip,2022,rock


In [26]:
pop_2021 = datos_filtrados(2021, 'pop')

pop_2021

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,PinkPantheress,track,Pain,to hell with it,2021,pop
1,Tory Lanez,track,The Color Violet,Alone At Prom,2021,pop
2,Eyedress,track,Something About You,Mulholland Drive,2021,pop
3,Jordana,track,Better in the Dark,Summer's Over,2021,pop
4,Olivia Rodrigo,track,good 4 u,SOUR,2021,pop
...,...,...,...,...,...,...
995,Rotimi,track,Love Somebody,All or Nothing (Deluxe),2021,pop
996,(G)I-DLE,track,HWAA,I burn,2021,pop
997,Ariana Grande,track,main thing,Positions (Deluxe),2021,pop
998,The Marías,track,Fog as a Bullet,CINEMA,2021,pop


In [27]:
pop_2022 = datos_filtrados(2022, 'pop')

pop_2022

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Noah Kahan,track,Stick Season,Stick Season,2022,pop
1,Djo,track,End of Beginning,DECIDE,2022,pop
2,Sabrina Carpenter,track,Nonsense,emails i can't send,2022,pop
3,SZA,track,Snooze,SOS,2022,pop
4,d4vd,track,Romantic Homicide,Romantic Homicide,2022,pop
...,...,...,...,...,...,...
995,ELVIS (Original Motion Picture Soundtrack),track,Vegas,ELVIS (Original Motion Picture Soundtrack),2022,pop
996,Lil Durk,track,Computer Murderers,7220 (Reloaded),2022,pop
997,Amos Lee,track,Worry No More,Dreamland,2022,pop
998,D.O.D,track,Like You Do,Like You Do,2022,pop


In [28]:
indie_2021 = datos_filtrados(2021, 'indie')

indie_2021

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Surf Curse,track,Freaks,Freaks,2021,indie
1,Eyedress,track,Something About You,Mulholland Drive,2021,indie
2,Jordana,track,Better in the Dark,Summer's Over,2021,indie
3,Cafuné,track,Tek It,Running,2021,indie
4,The Rare Occasions,track,Notion,Notion,2021,indie
...,...,...,...,...,...,...
995,JUDAH.,track,Just Because,7,2021,indie
996,The Blue Stones,track,One By One,Hidden Gems,2021,indie
997,Nascent,track,On My Own,Minus The Bullshit Life's Great,2021,indie
998,CHVRCHES,track,Death Stranding,In Search Of Darkness,2021,indie


In [29]:
indie_2022 = datos_filtrados(2022, 'indie')

indie_2022

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Noah Kahan,track,Stick Season,Stick Season,2022,indie
1,Djo,track,End of Beginning,DECIDE,2022,indie
2,Noah Kahan,track,All My Love,Stick Season,2022,indie
3,Suki Waterhouse,track,Good Looking,Good Looking,2022,indie
4,beabadoobee,track,the perfect pair,Beatopia,2022,indie
...,...,...,...,...,...,...
995,YUNGBLUD,track,The Funeral,YUNGBLUD,2022,indie
996,Q,track,TODAY,TODAY,2022,indie
997,Nu Genea,track,Marechià,Bar Mediterraneo,2022,indie
998,Kenny Beats,track,Still,LOUIE,2022,indie


In [30]:
rap_2021 = datos_filtrados(2021, 'rap')

rap_2021

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Tory Lanez,track,The Color Violet,Alone At Prom,2021,rap
1,Sleepy Hallow,track,2055,Still Sleep?,2021,rap
2,Baby Keem,track,family ties (with Kendrick Lamar),The Melodic Blue,2021,rap
3,Lil Tecca,track,LOT OF ME,We Love You Tecca 2,2021,rap
4,Polo G,track,RAPSTAR,Hall of Fame,2021,rap
...,...,...,...,...,...,...
995,French Montana,track,Handstand (with Doja Cat feat. Saweetie),They Got Amnesia,2021,rap
996,Larry June,track,Intercepted (feat. Money Man),Orange Print,2021,rap
997,Yeat,track,Talk 2 God,4L,2021,rap
998,BRS Kash,track,Throat Baby (Go Baby) (with DaBaby & City Girl...,Kash Only,2021,rap


In [31]:
rap_2022 = datos_filtrados(2022, 'rap')

rap_2022

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,SZA,track,Snooze,SOS,2022,rap
1,SZA,track,Kill Bill,SOS,2022,rap
2,Future,track,WAIT FOR U (feat. Drake & Tems),I NEVER LIKED YOU,2022,rap
3,Lil Durk,track,Broadway Girls (feat. Morgan Wallen),7220 (Reloaded),2022,rap
4,Future,track,PUFFIN ON ZOOTIEZ,I NEVER LIKED YOU,2022,rap
...,...,...,...,...,...,...
995,Slipknot,track,Hive Mind,"The End, So Far",2022,rap
996,Freddie Dredd,track,Greed,Freddie's Inferno,2022,rap
997,P-Lo,track,Good (feat. Larry June),STUNNA,2022,rap
998,Future,track,GOLD STACKS,I NEVER LIKED YOU,2022,rap


# *Data Frame* concatenado #

Una vez obtenidos todos los Data Frames, usamos la libería pandas con la función .concat() para unirlos. Para concatenarlos por filas, igualamos el axis a 0, y para ordenar los índices en orden ascendente, añadimos ingore_index = True

In [32]:
df_concatenado = pd.concat([rock_2021, rock_2022, pop_2022, pop_2021, indie_2021, indie_2022, rap_2021, rap_2022], axis=0, ignore_index=True) 

In [33]:
df_concatenado

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Måneskin,track,I WANNA BE YOUR SLAVE,Teatro d'ira - Vol. I,2021,rock
1,Elton John,track,Cold Heart - PNAU Remix,The Lockdown Sessions,2021,rock
2,Elton John,track,Cold Heart - PNAU Remix,Cold Heart (PNAU Remix),2021,rock
3,Parmalee,track,Just the Way,For You,2021,rock
4,Thomas Rhett,track,What’s Your Country Song,Country Again (Side A),2021,rock
...,...,...,...,...,...,...
7995,Slipknot,track,Hive Mind,"The End, So Far",2022,rap
7996,Freddie Dredd,track,Greed,Freddie's Inferno,2022,rap
7997,P-Lo,track,Good (feat. Larry June),STUNNA,2022,rap
7998,Future,track,GOLD STACKS,I NEVER LIKED YOU,2022,rap


# ALmacenamos los datos en .csv #

Exportamos el Data Frame a .csv para poder seguir trabajando en las siguientes fases del proyecto. Usamos index=False para excluir los índices.

In [34]:
df_concatenado.to_csv('df_concatenado.csv', index=False)

In [35]:
df_spotify = pd.read_csv('df_concatenado.csv')

In [36]:
df_spotify

Unnamed: 0,artista,tipo,título_canción,nombre_album,año,genre
0,Måneskin,track,I WANNA BE YOUR SLAVE,Teatro d'ira - Vol. I,2021,rock
1,Elton John,track,Cold Heart - PNAU Remix,The Lockdown Sessions,2021,rock
2,Elton John,track,Cold Heart - PNAU Remix,Cold Heart (PNAU Remix),2021,rock
3,Parmalee,track,Just the Way,For You,2021,rock
4,Thomas Rhett,track,What’s Your Country Song,Country Again (Side A),2021,rock
...,...,...,...,...,...,...
7995,Slipknot,track,Hive Mind,"The End, So Far",2022,rap
7996,Freddie Dredd,track,Greed,Freddie's Inferno,2022,rap
7997,P-Lo,track,Good (feat. Larry June),STUNNA,2022,rap
7998,Future,track,GOLD STACKS,I NEVER LIKED YOU,2022,rap


# Limpieza de datos #

Creamos una lista de artistas extraídos del Data Frame concatenado, usamos la función .unique() para la limpieza de los artistas repetidos. Creamos un Data Frame de la lista para, posteriormente, exportarlo a .csv. Con esto, ya podemos trabajar en la siguiente fase con MusicBrainz.

In [49]:
lista_artistas = list(df_spotify['artista'].unique())

print(lista_artistas)

df_lista_artistas = pd.DataFrame(lista_artistas)




In [54]:
df_lista_artistas.to_csv('lista_artistas.csv', index=False)