In [1]:
import requests #librerias necesarias
import pandas as pd
import sys 
# sys.exit(1) detiene la ejecuci√≥n del script INMEDIATAMENTE al encontrar un error
# CR√çTICO (como un archivo faltante o una columna incorrecta), evitando que el programa
# intente continuar y falle despu√©s. El n√∫mero '1' indica que la terminaci√≥n fue por un error.


apikey = "b4fcada0293085a139072e5e87a365b4"
url = "http://ws.audioscrobbler.com/2.0/"

# lectura de archivo csv
ruta_csv_artistas = '../csv/total_canciones_2018-2022.csv'
# recordamos usar rutas relativas para que funcione en todos los entornos locales

try:
    df_artistas = pd.read_csv(ruta_csv_artistas) #dataframe de artistas desde la ruta de lectura
    
    artistas_con_duplicados = df_artistas['artista'].tolist() #hacemos de 'artista' una lista
    
    artistas_unicos_set = set(artistas_con_duplicados) #con set eliminamos los duplicados
    
    artistas_a_buscar = list(artistas_unicos_set) #aqui ya tenemos la lista limpia con artistas unicos para poder analizar
    
    print(f"‚úÖ Se cargaron {len(artistas_con_duplicados)} registros de artistas (incluidos duplicados).")
    print(f"‚ú® Se analizar√°n {len(artistas_a_buscar)} artistas √∫nicos.")

except FileNotFoundError: #los except nos indican que tipo de errores se ha encontrado a la hora de cargar el csv
    print(f"‚ùå ERROR CR√çTICO: No se encontr√≥ el archivo CSV en la ruta '{ruta_csv_artistas}'.")
    sys.exit(1) # El c√≥digo de salida 1 indica que hubo un error.

except KeyError:
    print(f"‚ùå ERROR CR√çTICO: La columna 'artista' no se encontr√≥ en el archivo CSV.")
    print("Por favor, verifica que el encabezado de la columna en el CSV se llame exactamente 'artista'.")
    sys.exit(1)

except Exception as e:
    print(f"‚ùå ERROR CR√çTICO: Ocurri√≥ un error inesperado al leer el CSV: {e}")
    sys.exit(1)

# ----------------------------------------------------
# üìå PUNTO 1: Inicializar la lista para guardar los datos
# ----------------------------------------------------
resultados_api = []
ruta_csv_salida = '../csv/datos_artistas_lastfm.csv' # Define la ruta y nombre del archivo de salida


#bucle para cargar todos los artistas (√∫nicos)
for artista_actual in artistas_a_buscar:
    
    print(f"\n==================================================") #llamadas a la API
    print(f"üîé Procesando artista: **{artista_actual}**")
    print(f"==================================================")

    # Inicializar un diccionario para los datos de este artista
    datos_artista = {"artista": artista_actual}
    
    #llamada para BIOGRAFIA
    params_info = { #estas lineas no se pueden modificar ya que son necesarias para que nos de la biografia completa
        "method": "artist.getInfo",
        "artist": artista_actual,
        "api_key": apikey,
        "format": "json",
        "autocorrect": 1
    }
    
    try:
        response_info = requests.get(url, params=params_info) 
        datos_info = response_info.json()

        if response_info.status_code == 200 and 'artist' in datos_info: #comprueba que la llamada haya sido exitosa
            info_artista = datos_info['artist']
            
            # --- Extracci√≥n y Guardado de datos de BIOGRAF√çA y ESTAD√çSTICAS ---
            print("--- BIOGRAF√çA y ESTAD√çSTICAS ---")
            biografia_corta = info_artista.get('bio', {}).get('summary', 'No disponible')
            biografia_limpia = biografia_corta.split('<a href')[0].strip()
            
            estadisticas = info_artista.get('stats', {})
            playcount = estadisticas.get('playcount')
            listeners = estadisticas.get('listeners')
            
            # üìå PUNTO 2: Almacenar datos en el diccionario
            datos_artista['playcount'] = playcount
            datos_artista['listeners'] = listeners
            datos_artista['biografia_resumen'] = biografia_limpia
            
            print(f"Nombre: {info_artista.get('name')}")
            print(f"Biograf√≠a (Resumen): {biografia_limpia}")
            print(f"Playcount Total (Last.fm): {playcount}")
            print(f"N√∫mero de Oyentes √önicos: {listeners}")
            
        else:
            print(f"‚ùå Error al obtener info para {artista_actual}. Estado HTTP: {response_info.status_code}")
            datos_artista['playcount'] = None # Si falla, asignamos None para no dejar el campo vac√≠o
            datos_artista['biografia_resumen'] = "API Error"
            
    except requests.RequestException as e:
        print(f"‚ùå Error de conexi√≥n al obtener info para {artista_actual}: {e}")
        datos_artista['playcount'] = None
        datos_artista['biografia_resumen'] = "Connection Error"


    # llamada artistas similares
    similares = {
        "method": "artist.getSimilar",
        "artist": artista_actual,
        "api_key": apikey,
        "format": "json",
        "limit": 5 # Obtener los 5 artistas m√°s similares
    }
    
    # Inicializar la columna de similares
    datos_artista['similares'] = "" # Cadena vac√≠a por defecto
    
    try:
        response_similar = requests.get(url, params=similares)
        datos_similar = response_similar.json()

        if response_similar.status_code == 200 and 'similarartists' in datos_similar:
            artistas_similares = datos_similar['similarartists']['artist']
            
            # Artistas Similares
            print("\n--- ARTISTAS SIMILARES ---")
            if artistas_similares:
                # Crear una lista de nombres de artistas similares y unirlos con coma
                nombres_similares = [similar.get('name') for similar in artistas_similares]
                datos_artista['similares'] = ", ".join(nombres_similares) # üìå PUNTO 3: Guardar en el diccionario

                for i, similar in enumerate(artistas_similares):
                    print(f"{i+1}. {similar.get('name')} (Similitud: {similar.get('match')})")
            else:
                print("No se encontraron artistas similares.")
        else:
            print(f"‚ùå Error al obtener similares para {artista_actual}. Estado HTTP: {response_similar.status_code}")
            
    except requests.RequestException as e:
        print(f"‚ùå Error de conexi√≥n al obtener similares para {artista_actual}: {e}")

    # A√±adir el diccionario de datos al listado general
    resultados_api.append(datos_artista)


#conversion a csv en el caso de que asi lo queramos
try:
    df_resultados = pd.DataFrame(resultados_api)
    df_resultados.to_csv(ruta_csv_salida, index=False, encoding='utf-8')
    print(f"Datos guardados en '{ruta_csv_salida}'")
    print(f"Columnas guardadas: {list(df_resultados.columns)}")

except Exception as e:
    print(f"\n‚ùå ERROR al guardar el CSV: {e}")

‚úÖ Se cargaron 1710 registros de artistas (incluidos duplicados).
‚ú® Se analizar√°n 537 artistas √∫nicos.

üîé Procesando artista: **Russell Dickerson**
--- BIOGRAF√çA y ESTAD√çSTICAS ---
Nombre: Russell Dickerson
Biograf√≠a (Resumen): Multi-Platinum chart-topper and Triple Tigers entertainer Russell Dickerson is no stranger to the grind. The country headliner first broke through by wearing his heart on his sleeve, launching a string of five deeply romantic #1 hits -- ‚ÄúYours‚Äù (3x Platinum), ‚ÄúBlue Tacoma‚Äù (2x Platinum), ‚ÄúLove You Like I Used To‚Äù (2x Platinum), ‚ÄúEvery Little Thing‚Äù (Platinum), and ‚ÄúGod Gave Me a Girl.‚Äù He followed that success with the slinky, soul-infused ‚ÄúShe Likes It‚Äù (with Jake Scott
Playcount Total (Last.fm): 2580647
N√∫mero de Oyentes √önicos: 167661

--- ARTISTAS SIMILARES ---
1. Dustin Lynch (Similitud: 1)
2. Jordan Davis (Similitud: 0.887187)
3. Thomas Rhett (Similitud: 0.772894)
4. Dylan Scott (Similitud: 0.695383)
5. Chris Lane (Simi