#### Cambiamos el directorio raíz del proyecto para facilitar la carga de los datasets y las importaciones

In [1]:
import os

notebook_dir = os.getcwd()
root_dir = os.path.abspath(os.path.join(notebook_dir, '..'))
os.chdir(root_dir)

print("Directorio de trabajo actual después del cambio:", os.getcwd())

Directorio de trabajo actual después del cambio: /home/cami/workshop2


#### Importamos la Conexion 

In [17]:
import pandas as pd  
from Base_de_Datos_Operaciones.conexionBD import create_connection

connection = create_connection()

Conectando con la Base de Datos...
Conexion con la Base de Datos MySQL Lograda.


#### Cargamos nuestro Dataset Spotify Original

In [18]:
Dataset_Spotify = pd.read_csv('csv/spotify_dataset.csv', delimiter=',')

#### Renombramos la primera columna del dataset 

In [22]:
if 'Unnamed: 0' in Dataset_Spotify.columns:
    Dataset_Spotify = Dataset_Spotify.rename(columns={'Unnamed: 0': 'id'})

print("Columnas del DataFrame:", Dataset_Spotify.columns.tolist())

Columnas del DataFrame: ['id', 'track_id', 'artists', 'album_name', 'track_name', 'popularity', 'duration_ms', 'explicit', 'danceability', 'energy', 'key', 'loudness', 'mode', 'speechiness', 'acousticness', 'instrumentalness', 'liveness', 'valence', 'tempo', 'time_signature', 'track_genre']


#### Eliminamos el contenido de la columna id del dataset para que cuando se inserten se autoincremente y asi evitar datos repetidos 

In [19]:
import numpy as np 

if 'id' in Dataset_Spotify.columns:
    Dataset_Spotify['id'] = np.nan  

#### Remplazamos los valores NaN con valores predeterminados 

In [20]:
Dataset_Spotify = Dataset_Spotify.fillna({
    'track_id': 0, 
    'artists': 'Unknown',
    'album_name': 'Unknown',
    'track_name': 'Unknown',
    'popularity': 0,
    'duration_ms': 0,
    'explicit': False,
    'danceability': 0.0,
    'energy': 0.0,
    'key': 0,
    'loudness': 0.0,
    'mode': 0,
    'speechiness': 0.0,
    'acousticness': 0.0,
    'instrumentalness': 0.0,
    'liveness': 0.0,
    'valence': 0.0,
    'tempo': 0.0,
    'time_signature': 0,
    'track_genre': 'Unknown'
})


#### Lo insertamos en la tabla Spotify

In [21]:
if connection is not None:
    cursor = connection.cursor()

    insert_query = """
    INSERT INTO Spotify (id, track_id, artists, album_name, track_name, popularity, duration_ms, explicit, danceability, energy, `key`, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, time_signature, track_genre)
    VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
    """
    
    data = Dataset_Spotify.values.tolist()

    try:
        cursor.executemany(insert_query, data)
        connection.commit()
        print("Datos insertados correctamente.")
    except Exception as e:
        print(f"Error al insertar datos: {e}")
    finally:
        cursor.close()
        connection.close()

Datos insertados correctamente.


#### Cargamos el Dataset Grammys Original 

In [64]:
Dataset_Grammys = pd.read_csv('csv/the_grammy_awards.csv', delimiter=',')

#### Remplazamos NaN con valores predeterminados para que no interfieran con la insercion 

In [69]:
Dataset_Grammys = Dataset_Grammys.fillna({
    'year': 'Unknown',  
    'title': 'Unknown',  
    'published_at': 'Unknown',  
    'updated_at': 'Unknown',  
    'category': 'Unknown',  
    'nominee': 'Unknown',  
    'artist': 'Unknown',  
    'workers': 'Unknown',  
    'img': 'Unknown',  
    'winner': False  
})

#### Lo insertamos en la tabla Grammys

In [72]:
if connection is not None:
    cursor = connection.cursor()

    insert_query = """
    INSERT INTO Grammys (year, title, published_at, updated_at, category, nominee, artist, workers, img, winner)
    VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
    """

    data = Dataset_Grammys.values.tolist()

    try:
        cursor.executemany(insert_query, data)
        connection.commit()
        print("Datos insertados correctamente.")
    except Exception as e:
        print(f"Error al insertar datos: {e}")
    finally:
        cursor.close()
        connection.close()

Datos insertados correctamente.
