In [8]:
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials
import requests
import pandas as pd
import time
from datetime import datetime

# --- PAR√ÅMETROS ESPEC√çFICOS PARA TU TAREA ---
GENRES = ['funk']
YEARS = [2010, 2024] 

In [9]:
pip install python-dotenv

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


In [10]:
import os
from dotenv import load_dotenv

load_dotenv() # Carga las variables del archivo .env

SPOTIPY_CLIENT_ID = os.getenv('SPOTIPY_CLIENT_ID')
SPOTIPY_CLIENT_SECRET = os.getenv('SPOTIPY_CLIENT_SECRET')
LASTFM_API_KEY = os.getenv('LASTFM_API_KEY')


In [11]:
# A√±os para iterar
YEARS = [2010, 2024] 

# T√©rminos optimizados para una b√∫squeda de ALTO VOLUMEN
# Lista de g√©neros relacionados con funk
funk_related_genres = [
    # Funk cl√°sico
    "funk",
    "classic funk",
    "deep funk",
    "funky",
    "funky breaks",
    "p-funk",
    "funk rock",
    "funk metal",
    "afro funk",
    "jazz funk",
    "disco funk",
    "boogie",
    "old school funk",

    # Soul / neo soul
    "soul",
    "classic soul",
    "neo soul",
    "contemporary r&b",
    "motown",
    "funk soul",

    # Funk house / dance
    "funk house",
    "disco house",
    "funky house",
    "deep funk house",
    "electro funk",
    "dance funk",
    "groove house"
]

# T√©rminos para b√∫squeda
query_terms = funk_related_genres

# 4. Inicializa el cliente de Spotify
try:
    sp = spotipy.Spotify(auth_manager=SpotifyClientCredentials(
        client_id=SPOTIPY_CLIENT_ID,
        client_secret=SPOTIPY_CLIENT_SECRET
    ))
    print("‚úÖ Conexi√≥n a Spotify exitosa.")
except Exception as e:
    print(f"‚ùå Error de conexi√≥n a Spotify: {e}")
    sp = None

‚úÖ Conexi√≥n a Spotify exitosa.


In [12]:
# NUEVA CELDA: Comprobaci√≥n de autenticaci√≥n
print(type(sp)) 

<class 'spotipy.client.Spotify'>


In [13]:
# --- CELDA 2: DEFINICI√ìN DE LA FUNCI√ìN ESTABLE CON DOBLE L√çMITE (500 TOTAL, 250 ANUAL) ---

import time 
import pandas as pd 

def extract_spotify_data_simplificada(sp, years, query_terms): 
    """
    VERSION ESTABLE CON L√çMITES: 500 total, 250 por a√±o. Extrae datos b√°sicos
    y la Popularidad (sin Audio Features) para garantizar estabilidad.
    """
    
    if sp is None:
        print("Error: Cliente de Spotify no inicializado.")
        return pd.DataFrame()

    spotify_data = []
    MAX_TOTAL_SONGS = 500     # L√≠mite global
    MAX_SONGS_PER_YEAR = 250  # L√≠mite por a√±o (REINTRODUCIDO)
    
    for year in years:
        
        # 1. VERIFICACI√ìN DEL L√çMITE GLOBAL
        if len(spotify_data) >= MAX_TOTAL_SONGS:
            print(f"üõë L√çMITE GLOBAL ALCANZADO ({MAX_TOTAL_SONGS}). Terminando la extracci√≥n.")
            break
            
        year_range = f'{year}-{year}'
        print(f"\n--- INICIANDO EXTRACCI√ìN PARA EL A√ëO {year} ---")
        
        songs_added_in_year = 0 # Contador reiniciado para el l√≠mite anual
        
        for term in query_terms:
            
            # 2. VERIFICACI√ìN DEL L√çMITE ANUAL (antes de la b√∫squeda)
            if songs_added_in_year >= MAX_SONGS_PER_YEAR:
                print(f"üõë L√çMITE ANUAL ALCANZADO ({MAX_SONGS_PER_YEAR}) para {year}. Pasando al siguiente a√±o.")
                break # Rompe el bucle de t√©rminos, y avanza al siguiente a√±o.
            
            query = f'{term} year:{year_range}'
            print(f" ¬† -> Buscando con t√©rmino: {term}")
            
            # --- BLOQUE DE B√öSQUEDA ---
            try:
                results = sp.search(q=query, type='track', limit=50)
            except Exception as e:
                print(f" ¬† ‚ùå ERROR grave al buscar con '{term}': {e}. Esperando 5s.")
                time.sleep(5)
                continue
            
            songs_added_in_term = 0
            
            while results: 
                
                for track in results['tracks']['items']:
                    
                    track_id = track['id']
                    
                    # 3. VERIFICACI√ìN DE L√çMITES Y DEDUPLICACI√ìN
                    if len(spotify_data) >= MAX_TOTAL_SONGS:
                        print(f"üõë L√çMITE GLOBAL ALCANZADO ({MAX_TOTAL_SONGS}). Terminando la extracci√≥n.")
                        return pd.DataFrame(spotify_data)
                        
                    # 4. VERIFICACI√ìN DE L√çMITE ANUAL (por si se alcanza con la canci√≥n actual)
                    if songs_added_in_year >= MAX_SONGS_PER_YEAR:
                        break # Rompe el bucle de canciones (for track...), pasar√° al chequeo de abajo.
                        
                    if any(d.get('ID_Spotify') == track_id for d in spotify_data):
                        continue
                        
                    # 5. A√±adir la canci√≥n
                    data_row = {
                        'Artista': track['artists'][0]['name'],
                        'G√©nero musical': f'funk (Origen: {term})',
                        'Tipo': 'Canci√≥n',
                        'Nombre': track['name'],
                        'A√±o de lanzamiento': year,
                        'ID_Spotify': track_id,
                        'ID_Album': track['album']['id'],
                        'Popularidad': track.get('popularity', None) 
                    }
                    spotify_data.append(data_row)
                    songs_added_in_year += 1
                    songs_added_in_term += 1

                # Rompe el bucle de paginaci√≥n si se alcanz√≥ el l√≠mite anual en el bucle interior.
                if songs_added_in_year >= MAX_SONGS_PER_YEAR:
                    break 

                # 6. Paginaci√≥n
                try:
                    if results['tracks']['next']:
                        results = sp.next(results['tracks'])
                        time.sleep(1.0) # Pausa estable entre p√°ginas de 50
                    else:
                        results = None
                except Exception as e:
                    print(f" ¬† ‚ùå ERROR al obtener la p√°gina siguiente: {e}")
                    results = None

            print(f" ¬† ¬† ¬†-> A√±adidas {songs_added_in_term} canciones √öNICAS de '{term}'.")
            
    return pd.DataFrame(spotify_data)

In [14]:
# --- CELDA 3: LLAMADA, EJECUCI√ìN Y GUARDADO DEL CSV ---

if sp:
    # Llamamos a la versi√≥n simplificada y estable
    df_spotify_raw = extract_spotify_data_simplificada(sp, YEARS, query_terms) 
    
    print("\n--- RESULTADO FINAL DE EXTRACCI√ìN ESTABLE ---")
    print(f"Total de registros extra√≠dos: {len(df_spotify_raw)}") 
    print(df_spotify_raw[['Nombre', 'Artista', 'Popularidad']].head())
else:
    print("‚ùå El cliente 'sp' no est√° inicializado. No se pudo ejecutar la extracci√≥n.")


--- INICIANDO EXTRACCI√ìN PARA EL A√ëO 2010 ---
 ¬† -> Buscando con t√©rmino: funk
 ¬† ¬† ¬†-> A√±adidas 49 canciones √öNICAS de 'funk'.
 ¬† -> Buscando con t√©rmino: classic funk
 ¬† ¬† ¬†-> A√±adidas 98 canciones √öNICAS de 'classic funk'.
 ¬† -> Buscando con t√©rmino: deep funk
 ¬† ¬† ¬†-> A√±adidas 99 canciones √öNICAS de 'deep funk'.
 ¬† -> Buscando con t√©rmino: funky
 ¬† ¬† ¬†-> A√±adidas 4 canciones √öNICAS de 'funky'.
üõë L√çMITE ANUAL ALCANZADO (250) para 2010. Pasando al siguiente a√±o.

--- INICIANDO EXTRACCI√ìN PARA EL A√ëO 2024 ---
 ¬† -> Buscando con t√©rmino: funk
 ¬† ¬† ¬†-> A√±adidas 46 canciones √öNICAS de 'funk'.
 ¬† -> Buscando con t√©rmino: classic funk
 ¬† ¬† ¬†-> A√±adidas 100 canciones √öNICAS de 'classic funk'.
 ¬† -> Buscando con t√©rmino: deep funk
 ¬† ¬† ¬†-> A√±adidas 98 canciones √öNICAS de 'deep funk'.
 ¬† -> Buscando con t√©rmino: funky
üõë L√çMITE GLOBAL ALCANZADO (500). Terminando la extracci√≥n.

--- RESULTADO FINAL DE EXTRACCI√ìN ESTABLE ---
Tota

In [15]:
# VERIFICACI√ìN DE CANCIONES
print(f"N√∫mero de canciones encontradas en df_spotify_raw: {len(df_spotify_raw)}")
print(f"Primeras filas (head) de df_spotify_raw:\n{df_spotify_raw.head()}")

N√∫mero de canciones encontradas en df_spotify_raw: 500
Primeras filas (head) de df_spotify_raw:
          Artista       G√©nero musical     Tipo               Nombre  \
0     Bryce Janey  funk (Origen: funk)  Canci√≥n   Funky Guitar Blues   
1     Funky Bijou  funk (Origen: funk)  Canci√≥n   Funky Bijou Anthem   
2           Kas√≠r  funk (Origen: funk)  Canci√≥n     The Funky Spider   
3  La Discoth√®que  funk (Origen: funk)  Canci√≥n            Funkytown   
4      Tom Browne  funk (Origen: funk)  Canci√≥n  Funkin' for Jamaica   

   A√±o de lanzamiento              ID_Spotify                ID_Album  \
0                2010  2dqkDzJPwSIduZlKJh0lvB  1ULW18kqQ47Qp3YUATkvFQ   
1                2010  3vqJENUjIAwBiWs5zVLWha  4ieRodIyGcBr9uU20D2MQU   
2                2010  5LXgUQ5VRmm7PsVBTnQyOn  6tZRWMS69RdXXvcuSC0ILj   
3                2010  3fehLpIWjlE3YnTXRkqPN1  6CXNfnJUwEHFYUaiUNmeby   
4                2010  1es1B258zAVeXx6uzksrJd  34psLr9vLAgw49ehAgo6SJ   

   Popularidad  
0    

In [16]:
# --- CELDA COMPLETA: EXTRACCI√ìN Y UNIFICACI√ìN DE √ÅLBUMES ---

# Aseg√∫rate de que las librer√≠as necesarias (pandas, time) y la variable 'sp' est√©n disponibles
import pandas as pd
import time
# Nota: La variable 'sp' debe estar definida por la Celda 1.

# -------------------------------------------------------------------
# BLOQUE 1: DEFINICI√ìN DE LA FUNCI√ìN
# -------------------------------------------------------------------

def extract_album_details(sp, album_ids):
    """
    Extrae los metadatos completos (nombre, a√±o, artista) de los √°lbumes.
    """
    album_details = []
    
    # El set ya se crea cuando se llama a la funci√≥n con album_ids_list.
    unique_album_ids = album_ids
    
    print(f"\n--- INICIANDO EXTRACCI√ìN DE METADATOS DE {len(unique_album_ids)} √ÅLBUMES ---")
    
    for album_id in unique_album_ids:
        try:
            album_info = sp.album(album_id) 
            
            data_row = {
                'ID_Album': album_id,
                'Nombre_Album': album_info['name'],
                'A√±o_Lanzamiento_Album': album_info['release_date'][:4], # Tomamos solo el a√±o
                'Artista_Principal_Album': album_info['artists'][0]['name'],
                'Tipo_Lanzamiento': album_info['album_type'] 
            }
            album_details.append(data_row)
            time.sleep(0.2) # Pausa para no saturar la API
            
        except Exception as e:
            # Capturamos errores como √°lbumes que han sido eliminados de Spotify
            print(f"   -> Error al extraer detalles del √°lbum {album_id}: {e}")
            pass
            
    print(f"‚úÖ Extracci√≥n de {len(album_details)} √°lbumes completada.")
    return pd.DataFrame(album_details)

# -------------------------------------------------------------------
# BLOQUE 2: EJECUCI√ìN Y FUSI√ìN
# -------------------------------------------------------------------

# Verificaci√≥n de que el DataFrame de canciones est√° disponible
if 'df_spotify_raw' in locals() and not df_spotify_raw.empty:
    
    print("\n--- INICIANDO PROCESO DE UNIFICACI√ìN DE √ÅLBUMES ---")
    
    # 1. VERIFICACI√ìN CR√çTICA: La columna 'ID_Album' debe existir.
    if 'ID_Album' not in df_spotify_raw.columns:
        print("‚ùå ERROR CR√çTICO: La columna 'ID_Album' NO se encontr√≥. La Celda 3 fall√≥ al guardar el ID del √°lbum.")
    else:
        
        # 2. Obtener IDs √∫nicos v√°lidos de los √°lbumes
        album_ids_list = df_spotify_raw['ID_Album'].dropna().unique() 
        
        if len(album_ids_list) == 0:
            print("‚ùå LISTA VAC√çA: Se encontraron canciones, pero 0 IDs de √°lbumes v√°lidos. No se puede continuar.")
        else:
            print(f"‚úÖ Se encontraron {len(album_ids_list)} IDs de √°lbumes √∫nicos. Extrayendo ahora...")
            
            # 3. Ejecutar la funci√≥n de extracci√≥n (Tardar√° unos minutos)
            df_album_details = extract_album_details(sp, album_ids_list)
            
            # 4. Fusionar (JOIN) los detalles del √°lbum con los datos de las canciones
            df_spotify_final = pd.merge(
                df_spotify_raw,
                df_album_details[['ID_Album', 'Nombre_Album', 'A√±o_Lanzamiento_Album', 'Artista_Principal_Album']],
                on='ID_Album',
                how='left' 
            )
            
            print(f"\n--- PROCESO DE √ÅLBUMES COMPLETADO ---")
            print(f"DataFrame intermedio 'df_spotify_final' creado con {len(df_spotify_final)} filas.")
            print(df_spotify_final.head())
            
else:
    print("‚ùå ERROR: El DataFrame de canciones (df_spotify_raw) no est√° disponible. Vuelve a ejecutar la Celda 3.")


--- INICIANDO PROCESO DE UNIFICACI√ìN DE √ÅLBUMES ---
‚úÖ Se encontraron 351 IDs de √°lbumes √∫nicos. Extrayendo ahora...

--- INICIANDO EXTRACCI√ìN DE METADATOS DE 351 √ÅLBUMES ---
‚úÖ Extracci√≥n de 351 √°lbumes completada.

--- PROCESO DE √ÅLBUMES COMPLETADO ---
DataFrame intermedio 'df_spotify_final' creado con 500 filas.
          Artista       G√©nero musical     Tipo               Nombre  \
0     Bryce Janey  funk (Origen: funk)  Canci√≥n   Funky Guitar Blues   
1     Funky Bijou  funk (Origen: funk)  Canci√≥n   Funky Bijou Anthem   
2           Kas√≠r  funk (Origen: funk)  Canci√≥n     The Funky Spider   
3  La Discoth√®que  funk (Origen: funk)  Canci√≥n            Funkytown   
4      Tom Browne  funk (Origen: funk)  Canci√≥n  Funkin' for Jamaica   

   A√±o de lanzamiento              ID_Spotify                ID_Album  \
0                2010  2dqkDzJPwSIduZlKJh0lvB  1ULW18kqQ47Qp3YUATkvFQ   
1                2010  3vqJENUjIAwBiWs5zVLWha  4ieRodIyGcBr9uU20D2MQU   
2         

In [17]:
def extract_lastfm_artist_details(artist_name):
    """Extrae biograf√≠a y estad√≠sticas de popularidad de un artista."""
    
    url = 'http://ws.audioscrobbler.com/2.0/'
    params = {
        'method': 'artist.getinfo',
        'artist': artist_name,
        'api_key': LASTFM_API_KEY,
        'format': 'json'
    }
    
    try:
        response = requests.get(url, params=params)
        response.raise_for_status()
        data = response.json()
        
        if 'artist' in data:
            artist_info = data['artist']
            
            # Extraer los datos relevantes (Biograf√≠a, Popularidad/Plays)
            biography = artist_info.get('bio', {}).get('summary', 'N/A')
            playcount = artist_info.get('stats', {}).get('playcount', '0')
            listeners = artist_info.get('stats', {}).get('listeners', '0')
            
            return {
                'Artista': artist_name,
                'Biografia_Resumen': biography,
                'Playcount_LastFM': playcount,
                'Listeners_LastFM': listeners,
            }
    except Exception:
        # En caso de error de conexi√≥n o artista no encontrado, devuelve None
        pass 
        
    return None

# --- Ejecuci√≥n para Artistas √önicos ---

if 'df_spotify_raw' in locals() and not df_spotify_raw.empty:
    
    # Obtener la lista √∫nica de artistas para evitar b√∫squedas repetidas
    unique_artists = df_spotify_raw['Artista'].unique()
    lastfm_results = []
    
    print("\n--- EXTRACCI√ìN DETALLES LAST.FM ---")
    
    for artist in unique_artists: 
        details = extract_lastfm_artist_details(artist)
        if details:
            lastfm_results.append(details)
        time.sleep(0.5) # Pausa crucial para no sobrecargar la API

    df_lastfm = pd.DataFrame(lastfm_results)
    
    # 5. UNIFICACI√ìN DE DATOS
    # Fusionar los datos de Spotify con los detalles de Last.fm
    df_final_funk = pd.merge(
        df_spotify_raw, 
        df_lastfm[['Artista', 'Playcount_LastFM', 'Listeners_LastFM']],
        on='Artista', 
        how='left' # Usamos left join para mantener todas las canciones de Spotify
    )
    
    print("\n--- DATAFRAME FINAL DE FUNK LISTO PARA ALMACENAMIENTO ---")
    print(df_final_funk.head())
    print(f"Total de registros finales para funk: {len(df_final_funk)}")


--- EXTRACCI√ìN DETALLES LAST.FM ---

--- DATAFRAME FINAL DE FUNK LISTO PARA ALMACENAMIENTO ---
          Artista       G√©nero musical     Tipo               Nombre  \
0     Bryce Janey  funk (Origen: funk)  Canci√≥n   Funky Guitar Blues   
1     Funky Bijou  funk (Origen: funk)  Canci√≥n   Funky Bijou Anthem   
2           Kas√≠r  funk (Origen: funk)  Canci√≥n     The Funky Spider   
3  La Discoth√®que  funk (Origen: funk)  Canci√≥n            Funkytown   
4      Tom Browne  funk (Origen: funk)  Canci√≥n  Funkin' for Jamaica   

   A√±o de lanzamiento              ID_Spotify                ID_Album  \
0                2010  2dqkDzJPwSIduZlKJh0lvB  1ULW18kqQ47Qp3YUATkvFQ   
1                2010  3vqJENUjIAwBiWs5zVLWha  4ieRodIyGcBr9uU20D2MQU   
2                2010  5LXgUQ5VRmm7PsVBTnQyOn  6tZRWMS69RdXXvcuSC0ILj   
3                2010  3fehLpIWjlE3YnTXRkqPN1  6CXNfnJUwEHFYUaiUNmeby   
4                2010  1es1B258zAVeXx6uzksrJd  34psLr9vLAgw49ehAgo6SJ   

   Popularidad Playcou

In [18]:
# --- FUSI√ìN FINAL SPOTIFY (CON √ÅLBUMES) + LAST.FM Y GUARDADO CSV ---

import pandas as pd

# Usaremos df_spotify_final si ya lo tienes, porque incluye √°lbumes + Popularidad
base_df = None
if 'df_spotify_final' in locals() and not df_spotify_final.empty:
    base_df = df_spotify_final
elif 'df_spotify_raw' in locals() and not df_spotify_raw.empty:
    base_df = df_spotify_raw

if base_df is not None and 'df_lastfm' in locals():
    print("‚úÖ DataFrames disponibles para fusi√≥n final.")
    print("Columnas base (Spotify):", base_df.columns.tolist())
    print("Columnas Last.fm:", df_lastfm.columns.tolist())

    df_proyecto_final = pd.merge(
        base_df,
        df_lastfm,
        on='Artista',
        how='left'
    )

    print("Columnas despu√©s de la fusi√≥n final:", df_proyecto_final.columns.tolist())

    # Limpieza de Last.fm
    if 'Biografia_Resumen' in df_proyecto_final.columns:
        df_proyecto_final['Biografia_Resumen'] = df_proyecto_final['Biografia_Resumen'].fillna('N/A')

    for col in ['Playcount_LastFM', 'Listeners_LastFM']:
        if col in df_proyecto_final.columns:
            df_proyecto_final[col] = df_proyecto_final[col].fillna(0).astype(int)

    # Guardar CSV definitivo
    output_filename = "funk_data_2010_2024.csv"
    df_proyecto_final.to_csv(output_filename, index=False, encoding="utf-8")

    print(f"\nüéâ CSV FINAL GENERADO CON √âXITO üéâ")
    print(f"Archivo guardado como: {output_filename}")
    print(f"Filas totales: {len(df_proyecto_final)}")

    columnas_demo = [c for c in ['Nombre','Artista','Popularidad','Listeners_LastFM','Biografia_Resumen'] if c in df_proyecto_final.columns]
    if columnas_demo:
        print("\n--- Primeras 5 filas ---")
        print(df_proyecto_final[columnas_demo].head())
    else:
        print("‚ö†Ô∏è No se encontraron las columnas esperadas para el ejemplo de head().")
else:
    print("‚ùå Falta base_df (Spotify) o df_lastfm; ejecuta antes las celdas de extracci√≥n.")


‚úÖ DataFrames disponibles para fusi√≥n final.
Columnas base (Spotify): ['Artista', 'G√©nero musical', 'Tipo', 'Nombre', 'A√±o de lanzamiento', 'ID_Spotify', 'ID_Album', 'Popularidad', 'Nombre_Album', 'A√±o_Lanzamiento_Album', 'Artista_Principal_Album']
Columnas Last.fm: ['Artista', 'Biografia_Resumen', 'Playcount_LastFM', 'Listeners_LastFM']
Columnas despu√©s de la fusi√≥n final: ['Artista', 'G√©nero musical', 'Tipo', 'Nombre', 'A√±o de lanzamiento', 'ID_Spotify', 'ID_Album', 'Popularidad', 'Nombre_Album', 'A√±o_Lanzamiento_Album', 'Artista_Principal_Album', 'Biografia_Resumen', 'Playcount_LastFM', 'Listeners_LastFM']

üéâ CSV FINAL GENERADO CON √âXITO üéâ
Archivo guardado como: funk_data_2010_2024.csv
Filas totales: 500

--- Primeras 5 filas ---
                Nombre         Artista  Popularidad  Listeners_LastFM  \
0   Funky Guitar Blues     Bryce Janey           42             25748   
1   Funky Bijou Anthem     Funky Bijou           35              8626   
2     The Funky Spide

## CONEXION CON SQL

In [19]:
!pip install sqlalchemy mysql-connector-python




[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


In [20]:
import pandas as pd

df = pd.read_csv("funk_data_2010_2024.csv")
print(df.columns.tolist())
print(len(df))


['Artista', 'G√©nero musical', 'Tipo', 'Nombre', 'A√±o de lanzamiento', 'ID_Spotify', 'ID_Album', 'Popularidad', 'Nombre_Album', 'A√±o_Lanzamiento_Album', 'Artista_Principal_Album', 'Biografia_Resumen', 'Playcount_LastFM', 'Listeners_LastFM']
500


In [21]:
from sqlalchemy import create_engine

user = "root"
password = "AlumnaAdalab"
host = "localhost"
port = 3306
database = "funk_db"

engine = create_engine(f"mysql+mysqlconnector://{user}:{password}@{host}:{port}/{database}")


In [None]:
## COMPROBACIONES DE CONEXION CON SQL

In [23]:
import pandas as pd

df_csv = pd.read_csv("funk_data_2010_2024.csv")
print("Filas en CSV:", len(df_csv))
print("Columnas:", df_csv.columns.tolist())
print(df_csv.head())


Filas en CSV: 500
Columnas: ['Artista', 'G√©nero musical', 'Tipo', 'Nombre', 'A√±o de lanzamiento', 'ID_Spotify', 'ID_Album', 'Popularidad', 'Nombre_Album', 'A√±o_Lanzamiento_Album', 'Artista_Principal_Album', 'Biografia_Resumen', 'Playcount_LastFM', 'Listeners_LastFM']
          Artista       G√©nero musical     Tipo               Nombre  \
0     Bryce Janey  funk (Origen: funk)  Canci√≥n   Funky Guitar Blues   
1     Funky Bijou  funk (Origen: funk)  Canci√≥n   Funky Bijou Anthem   
2           Kas√≠r  funk (Origen: funk)  Canci√≥n     The Funky Spider   
3  La Discoth√®que  funk (Origen: funk)  Canci√≥n            Funkytown   
4      Tom Browne  funk (Origen: funk)  Canci√≥n  Funkin' for Jamaica   

   A√±o de lanzamiento              ID_Spotify                ID_Album  \
0                2010  2dqkDzJPwSIduZlKJh0lvB  1ULW18kqQ47Qp3YUATkvFQ   
1                2010  3vqJENUjIAwBiWs5zVLWha  4ieRodIyGcBr9uU20D2MQU   
2                2010  5LXgUQ5VRmm7PsVBTnQyOn  6tZRWMS69RdXXvcuSC0IL

In [7]:
import mysql.connector

try:
    conn_test = mysql.connector.connect(
        host="localhost",
        user="root",
        password="AlumnaAdalab"
    )
    print("‚úÖ Conexi√≥n b√°sica a MySQL OK")
    conn_test.close()
except Exception as e:
    print("‚ùå Error conectando a MySQL:", e)


‚úÖ Conexi√≥n b√°sica a MySQL OK


In [27]:
from sqlalchemy.sql import text

with engine.connect() as conn:
    conn.execute(text("DROP TABLE IF EXISTS tracks_funk;"))
    conn.commit()

print("‚úÖ Tabla tracks_funk eliminada (si exist√≠a).")


‚úÖ Tabla tracks_funk eliminada (si exist√≠a).


In [28]:
import pandas as pd

df = pd.read_csv("funk_data_2010_2024.csv")  # tu CSV final

df.to_sql(
    name="tracks_funk",
    con=engine,
    if_exists="replace",  # crea la tabla de cero
    index=False
)

print("‚úÖ Tabla tracks_funk creada con todas las columnas del CSV.")


‚úÖ Tabla tracks_funk creada con todas las columnas del CSV.


In [29]:
import pandas as pd

df_desc = pd.read_sql("DESCRIBE tracks_funk;", engine)
print(df_desc)

preview = pd.read_sql("""
    SELECT Artista, Nombre, `G√©nero musical`, Popularidad,
           Playcount_LastFM, Listeners_LastFM
    FROM tracks_funk
    LIMIT 10;
""", engine)
print(preview)


                      Field    Type Null Key Default Extra
0                   Artista    text  YES        None      
1            G√©nero musical    text  YES        None      
2                      Tipo    text  YES        None      
3                    Nombre    text  YES        None      
4        A√±o de lanzamiento  bigint  YES        None      
5                ID_Spotify    text  YES        None      
6                  ID_Album    text  YES        None      
7               Popularidad  bigint  YES        None      
8              Nombre_Album    text  YES        None      
9     A√±o_Lanzamiento_Album  bigint  YES        None      
10  Artista_Principal_Album    text  YES        None      
11        Biografia_Resumen    text  YES        None      
12         Playcount_LastFM  bigint  YES        None      
13         Listeners_LastFM  bigint  YES        None      
          Artista                      Nombre       G√©nero musical  \
0     Bryce Janey          Funky Guitar B