Importación de librerías

In [38]:
# Se importan las librerías necesarias.
import os 
from dotenv import load_dotenv
import requests
import json
import pandas as pd
import csv

# Bibliotecas para conectar a la API de Spotify 
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

# Cargamos las credenciales del .env
load_dotenv()

client_id_i = os.getenv('client_id_i')
client_secret_i = os.getenv('client_secret_i')

Creación de funciones

In [26]:
# Crea un cliente en Spotipy para acceder a la API de Spotify
# Parámetros:
#  client_id (str): ID del cliente de la API de Spotify.
#  client_secret (str): Secreto del cliente de la API de Spotify.

def crear_cliente_spotify(client_id, client_secret):
            
    # Configurar el administrador de credenciales de cliente
    client_credentials_manager = SpotifyClientCredentials(client_id=client_id, client_secret=client_secret)
    
    #  cliente de Spotipy
    return spotipy.Spotify(client_credentials_manager=client_credentials_manager)

In [29]:
# Crear función para obtener las canciones por generos y año de Spotify

# Parámetros:
#  sp (spotipy.Spotify): Cliente de Spotipy autenticado.
#  genero (str): El género musical a buscar.
#  ano (int): El año de lanzamiento de las canciones a buscar.
#  limite (int): El número máximo de canciones a recopilar. Por defecto es 500.

# Retorna:
#  dict: Un diccionario con la información de las canciones

def resultado_canciones_genero(sp, genero, ano, limite=500):

    dicc_canciones = {"Artista": [], "Album": [], "Cancion": [], "Año Lanzamiento": [], "Total tracks": []}
    contador = 0

    while contador < limite:
        for valor in range(0, 451, 50):
            result = sp.search(q=f'genre: {genero} year: {ano}', type='track', limit=50, offset={valor})
            
            
            for elemento in result['tracks']['items']:
                dicc_canciones["Artista"].append(elemento['artists'][0]['name'])
                dicc_canciones["Album"].append(elemento['album']['name'])
                dicc_canciones["Cancion"].append(elemento['name'])
                dicc_canciones["Año Lanzamiento"].append(elemento['album']['release_date'])
                dicc_canciones["Total tracks"].append(elemento['album']['total_tracks'])
                
                contador += 1
                
                if contador >= limite:
                    break
            if contador >= limite:
                break

    return dicc_canciones

Utilizar la función de las crendenciales para utilizar la biblioteca Spotipy

In [27]:
# Llamar la función de crear cliente en spotify

sp = crear_cliente_spotify(client_id_i, client_secret_i)

1. Hip Hop 

In [31]:
# Utilizar la función para extrair los datos de 2022

dicc_canciones_hh_2022 = resultado_canciones_genero(sp, genero='hiphop', ano=2022, limite=500)

In [32]:
# Utilizar la función para extrair los datos de 2023

dicc_canciones_hh_2023 = resultado_canciones_genero(sp, genero='hiphop', ano=2023, limite=500)

In [None]:
# Crear Dataframe para los dos años extraídos, 2022 y 2023.

df_hh_22 = pd.DataFrame(dicc_canciones_hh_2022)

df_hh_23 = pd.DataFrame(dicc_canciones_hh_2023)

# Unir los dos dataframes que tenemos (de 2022 y 2023). Utilizamos el ignore_index para crear un nuevo index con las 1000 canciones

dataframe_hiphop = pd.concat([df_hh_22, df_hh_23], ignore_index =True)

In [None]:
# Guardar este DataFrame total como CSV

dataframe_hiphop.to_csv('../Data/dataframe_hiphop.csv')

In [37]:
# Lista con los artistas unicos que aparecen en estos dos años seleccionados

artistas_hiphop_total = dataframe_hiphop["Artista"].unique()

type(dataframe_hiphop["Artista"].unique())

numpy.ndarray

In [None]:
# Guardar esta lista con artistas unico como CSV

artistas_hiphop_total = pd.DataFrame (artistas_hiphop_total)

artistas_hiphop_total.to_csv('../Data/artistas_hiphop_total.csv')

2. Latino

In [39]:
# Utilizar la función para extrair los datos de 2022

dicc_canciones_lat_2022 = resultado_canciones_genero(sp, genero='latino', ano=2022, limite=500)

In [40]:
# Utilizar la función para extrair los datos de 2023

dicc_canciones_lat_2023 = resultado_canciones_genero(sp, genero='latino', ano=2023, limite=500)

In [41]:
# Crear Dataframe para los dos años extraídos, 2022 y 2023.

df_lat_22 = pd.DataFrame(dicc_canciones_lat_2022)

df_lat_23 = pd.DataFrame(dicc_canciones_lat_2023)

# Unir los dos dataframes que tenemos (de 2022 y 2023). Utilizamos el ignore_index para crear un nuevo index con las 1000 canciones

dataframe_latino = pd.concat([df_lat_22, df_lat_23], ignore_index =True)

In [None]:
# Guardar este DataFrame total como CSV

dataframe_latino.to_csv('../Data/dataframe_latino.csv')

In [42]:
# Lista con los artistas unicos que aparecen en estos dos años seleccionados

artistas_latino_total = dataframe_latino["Artista"].unique()

type(dataframe_latino["Artista"].unique())

# Guardar esta lista con artistas unico como CSV

artistas_latino_total = pd.DataFrame (artistas_latino_total)

artistas_latino_total.to_csv('../Data/artistas_latino_total.csv')

numpy.ndarray

3. Pop

In [43]:
# Utilizar la función para extrair los datos de 2022

dicc_canciones_pop_2022 = resultado_canciones_genero(sp, genero='pop', ano=2022, limite=500)

In [44]:
# Utilizar la función para extrair los datos de 2023

dicc_canciones_pop_2023 = resultado_canciones_genero(sp, genero='pop', ano=2023, limite=500)

In [45]:
# Crear Dataframe para los dos años extraídos, 2022 y 2023.

df_pop_22 = pd.DataFrame(dicc_canciones_pop_2022)

df_pop_23 = pd.DataFrame(dicc_canciones_pop_2023)

# Unir los dos dataframes que tenemos (de 2022 y 2023). Utilizamos el ignore_index para crear un nuevo index con las 1000 canciones

dataframe_pop = pd.concat([df_pop_22, df_pop_23], ignore_index =True)

In [None]:
# Guardar este DataFrame total como CSV

dataframe_pop.to_csv('../Data/dataframe_pop.csv')

In [None]:
# Lista con los artistas unicos que aparecen en estos dos años seleccionados

artistas_pop_total = dataframe_pop["Artista"].unique()

type(dataframe_pop["Artista"].unique())

# Guardar esta lista con artistas unico como CSV

artistas_pop_total = pd.DataFrame (artistas_pop_total)

artistas_pop_total.to_csv('../Data/artistas_pop_2022_2023.csv')

4. Rock

In [46]:
# Utilizar la función para extrair los datos de 2022

dicc_canciones_rock_2022 = resultado_canciones_genero(sp, genero='rock', ano=2022, limite=500)

In [48]:
# Utilizar la función para extrair los datos de 2023

dicc_canciones_rock_2023 = resultado_canciones_genero(sp, genero='rock', ano=2023, limite=500)

In [49]:
# Crear Dataframe para los dos años extraídos, 2022 y 2023.

df_rock_22 = pd.DataFrame(dicc_canciones_rock_2022)

df_rock_23 = pd.DataFrame(dicc_canciones_rock_2023)

# Unir los dos dataframes que tenemos (de 2022 y 2023). Utilizamos el ignore_index para crear un nuevo index con las 1000 canciones

dataframe_rock = pd.concat([df_rock_22, df_rock_23], ignore_index =True)

In [None]:
# Guardar este DataFrame total como CSV

dataframe_rock.to_csv('../Data/dataframe_rock.csv')

In [None]:
# Lista con los artistas unicos que aparecen en estos dos años seleccionados

artistas_rock_total = dataframe_rock["Artista"].unique()

type(dataframe_rock["Artista"].unique())

# Guardar esta lista con artistas unico como CSV

artistas_rock_total = pd.DataFrame (artistas_rock_total)

artistas_rock_total.to_csv('../Data/artistas_rock_2022_2023.csv')