Importación de librerías

In [1]:
# Se importan las librerías necesarias.
import os 
# from dotenv import load_dotenv
import requests
import json
import pandas as pd
import time

# Configuración
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames

Creacción de funciones

In [2]:
# Crear una función de llamada a la API de Music Brainz

def llamar_api_brainz(url):

    # Encabezados con el token de acceso

    # Realizar una solicitud con el GET a la url proporcionada y almacenar la llamada en una "respuesta"
    time.sleep(1)
    respuesta = requests.get(url)
    
    # Imprime el código de estado de la respuesta.
    print(f"La llamada a la API nos ha dado una respuesta de tipo: {respuesta.status_code}")  
    
    if respuesta.status_code != 200:  # Comprueba si la respuesta no fue exitosa (código de estado distinto de 200).
        print(f"El motivo por el que la llamada falló es {respuesta.reason}") # Imprime la razón de la falla.
         
    else:
        return respuesta.json()  # Si la llamada fue exitosa, devuelve los datos de respuesta en formato JSON.
    

In [3]:
# Crear una función para limpiar los datos y transformar el formato JSON en un DataFrame estructurado.

def limpiar_datos_brainz(datos):

    #Crear un diccionario vacío para almacenar los datos estructurados
    datos_brainz = {
        "Artista":[],
        "Pais_origen": [],
        "Area_origen": [],
        "Fecha_ini_act": [],
        "Fecha_fin_act": [],
        "Genero": []
        }
    
    # Iteramos por los datos obtenidos en Musicbrainz para cada uno de los artistas que le hemos proporcionado, para extraer la infomració que necesitamos de esos artistas. 
    for n in datos:
        try:
            # Verificar si 'artists' existe y tiene al menos un artista
            if 'artists' in n and len(n['artists']) > 0:
                # Extraer datos relevantes y agregarlos a las listas del diccionario resultados

                # Agregar el nombre del artista
                artista = n['artists'][0].get('name', 'no data')
                datos_brainz["Artista"].append(artista)
                # Obtener 'area' si está disponible
                pais_origen = n['artists'][0].get('area', {}).get('name', 'no data')
                datos_brainz["Pais_origen"].append(pais_origen)
                # Obtener 'begin-area' si está disponible
                area_origen = n['artists'][0].get('begin-area', {}).get('name', 'no data')
                datos_brainz["Area_origen"].append(area_origen)
                # Obtener 'life-span' begin y ended si están disponibles
                fecha_ini = n['artists'][0].get('life-span', {}).get('begin', 'no data')
                datos_brainz["Fecha_ini_act"].append(fecha_ini)
                fecha_fin = n['artists'][0].get('life-span', {}).get('ended', 'no data')
                datos_brainz["Fecha_fin_act"].append(fecha_fin)
                # Obtrner 'gender' si está disponible
                genero = n['artists'][0].get('gender', 'no data')
                datos_brainz["Genero"].append(genero)

            else:
                # Si no hay artistas en la lista, usar 'no data' para todos los campos
                datos_brainz["Artista"].append("no data")
                datos_brainz["Pais_origen"].append("no data")
                datos_brainz["Area_origen"].append("no data")
                datos_brainz["Fecha_ini_act"].append("no data")
                datos_brainz["Fecha_fin_act"].append("no data")
                datos_brainz["Genero"].append("no data")

        except KeyError:
            # Si ocurre cualquier error inesperado en las claves, manejar con 'no data'
            datos_brainz["Artista"].append("no data")
            datos_brainz["Pais_origen"].append("no data")
            datos_brainz["Area_origen"].append("no data")
            datos_brainz["Fecha_ini_act"].append("no data")
            datos_brainz["Fecha_fin_act"].append("no data")
            datos_brainz["Genero"].append("no data")

    
    # Crear un DataFrame de Pandas a partir del diccionario resultados
    df_datos_brainz = pd.DataFrame(datos_brainz)

    # Devolver el DataFrame con los datos limpios y estructurados
    return df_datos_brainz
    

1) Hip Hop

In [None]:
# HIP HOP

# Abrir el archivo.csv donde hay los artistas

artistas_hh_path = '../Data/artistas_hiphop_total.csv'

df_hh = pd.read_csv(artistas_hh_path, index_col=0)

# Crear una lista para añadir el resultado de la API

datos_hh=[]

# Definir la url para hacer las llamadas necesarias para cada artista y hacer la llamada a la API

for artista in df_hh['0']:
    try:
        # Construir la URL para llamar a la API cada cantante
        url_hh = f'https://musicbrainz.org/ws/2/artist/?query=artist:{artista}&fmt=json'

        # Llamar a la función 'llamar_api_brainz' para obtener datos del cantante desde la API.

        datos = llamar_api_brainz(url_hh)
        
        datos_hh.append(datos)
        
    except:
        # Manejar excepciones en caso de que ocurra un error al consultar un artista especifico
        print(f"Estamos teniendo problemas con el siguiente: {artista}")

         

In [None]:
# HIP HOP

len(datos_hh)

In [None]:
# HIP HOP

# Llamar la función de limpieza para obtene los datos 

df_datos_hh_brainz = limpiar_datos_brainz(datos_hh)
df_datos_hh_brainz

In [14]:
# HIP HOP
# Gaurdar estos datos en la carpeta correcta en formato csv

file_path = '../Data/data_hh_brainz.csv'

df_datos_hh_brainz.to_csv(file_path)

2) Latino

In [None]:
# LATINO

# Abrir el archivo.csv donde hay los artistas

artistas_hh_path = '../Data/artistas_latino_total.csv'

df_lat = pd.read_csv(artistas_hh_path, index_col=0)

# Crear una lista para añadir el resultado de la API

datos_lat=[]

# Definir la url para hacer las llamadas necesarias para cada artista y hacer la llamada a la API

for artista in df_lat['0']:
    try:
        # Construir la URL para llamar a la API cada cantante
        url_lat = f'https://musicbrainz.org/ws/2/artist/?query=artist:{artista}&fmt=json'

        # Llamar a la función 'llamar_api_brainz' para obtener datos del cantante desde la API.

        datos = llamar_api_brainz(url_lat)
        
        datos_lat.append(datos)
        
    except:
        # Manejar excepciones en caso de que ocurra un error al consultar un artista especifico
        print(f"Estamos teniendo problemas con el siguiente: {artista}")

In [None]:
# LATINO

len(datos_lat)

In [None]:
# LATINO

# Llamar la función de limpieza para obtene los datos 

df_datos_lat_brainz = limpiar_datos_brainz(datos_lat)
df_datos_lat_brainz

In [18]:
# LATINO

# Gaurdar estos datos en la carpeta correcta en formato csv

file_path_latino = '../Data/data_lat_brainz.csv'

df_datos_lat_brainz.to_csv(file_path_latino)

3) Pop

In [4]:
# POP

# Abrir el archivo.csv donde hay los artistas

artistas_pop_path = '../Data/artistas_pop_2022_2023.csv'

df_pop = pd.read_csv(artistas_pop_path, index_col=0)

# Crear una lista para añadir el resultado de la API

datos_pop=[]

# Definir la url para hacer las llamadas necesarias para cada artista y hacer la llamada a la API

for artista in df_pop['0']:
    try:
        # Construir la URL para llamar a la API cada cantante
        url_pop = f'https://musicbrainz.org/ws/2/artist/?query=artist:{artista}&fmt=json'

        # Llamar a la función 'llamar_api_brainz' para obtener datos del cantante desde la API.

        datos = llamar_api_brainz(url_pop)
        
        datos_pop.append(datos)
        
    except:
        # Manejar excepciones en caso de que ocurra un error al consultar un artista especifico
        print(f"Estamos teniendo problemas con el siguiente: {artista}")

La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 2

In [5]:
# POP

len(datos_pop)

217

In [6]:
# POP

# Llamar la función de limpieza para obtene los datos 

df_datos_pop_brainz = limpiar_datos_brainz(datos_pop)
df_datos_pop_brainz

Unnamed: 0,Artista,Pais_origen,Area_origen,Fecha_ini_act,Fecha_fin_act,Genero
0,Noah Kahan,United States,Strafford,1997-01-01,,male
1,Djo,United States,Newburyport,1992-04-24,,male
2,Sabrina Carpenter,United States,Bucks County,1999-05-11,,female
3,SZA,United States,St. Louis,1989-11-08,,female
4,d4vd,United States,Queens,2005-03-28,,male
...,...,...,...,...,...,...
212,Bob Schneider,United States,Ypsilanti,1965-10-12,,male
213,Porter Robinson,United States,Chapel Hill,1992-07-15,,male
214,Punctual,United Kingdom,no data,no data,,no data
215,Jung Kook,South Korea,Busan,1997-09-01,,male


In [7]:
# POP

# Gaurdar estos datos en la carpeta correcta en formato csv

file_path_pop = '../Data/data_pop_brainz.csv'

df_datos_pop_brainz.to_csv(file_path_pop)

4) Rock

In [8]:
# ROCK

# Abrir el archivo.csv donde hay los artistas

artistas_rock_path = '../Data/artistas_rock_2022_2023.csv'

df_rock = pd.read_csv(artistas_rock_path, index_col=0)

# Crear una lista para añadir el resultado de la API

datos_rock=[]

# Definir la url para hacer las llamadas necesarias para cada artista y hacer la llamada a la API

for artista in df_rock['0']:
    try:
        # Construir la URL para llamar a la API cada cantante
        url_rock = f'https://musicbrainz.org/ws/2/artist/?query=artist:{artista}&fmt=json'

        # Llamar a la función 'llamar_api_brainz' para obtener datos del cantante desde la API.

        datos = llamar_api_brainz(url_rock)
        
        datos_rock.append(datos)
        
    except:
        # Manejar excepciones en caso de que ocurra un error al consultar un artista especifico
        print(f"Estamos teniendo problemas con el siguiente: {artista}")

La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 200
La llamada a la API nos ha dado una respuesta de tipo: 2

In [9]:
# ROCK

len(datos_rock)

319

In [10]:
# ROCK

# Llamar la función de limpieza para obtene los datos 

df_datos_rock_brainz = limpiar_datos_brainz(datos_rock)
df_datos_rock_brainz

Unnamed: 0,Artista,Pais_origen,Area_origen,Fecha_ini_act,Fecha_fin_act,Genero
0,Royel Otis,Sydney,Sydney,no data,,no data
1,Imagine Dragons,United States,Las Vegas,2008,,no data
2,Jon Pardi,United States,Dixon,1985-05-20,,male
3,Cole Swindell,United States,Glennville,1983-06-30,,male
4,OneRepublic,United States,Colorado Springs,2004,,no data
...,...,...,...,...,...,...
314,Taylor Swift,United States,West Reading,1989-12-13,,female
315,Cold War Kids,United States,Fullerton,2004,,no data
316,SadGirl,Los Angeles,no data,no data,,no data
317,Flyte,London,London,2013,,no data


In [12]:
# ROCK

# Gaurdar estos datos en la carpeta correcta en formato csv

file_path_rock = '../Data/data_rock_brainz.csv'

df_datos_rock_brainz.to_csv(file_path_rock)