In [None]:
import pandas as pd
import numpy as np
import os

# --- 1. CONFIGURACIÓN DE RUTAS (Solución al NameError) ---
# En Jupyter, simplemente definimos la carpeta donde están los datos
data_folder = 'data'
input_file = os.path.join(data_folder, 'bank_marketing.csv')

# Verificación de seguridad para asegurar que el archivo existe
if not os.path.exists(input_file):
    print(f"❌ Error: No se encontró 'bank_marketing.csv' en la carpeta '{data_folder}'.")
    print("Por favor, asegúrate de que el archivo esté en la ruta correcta.")
else:
    # 2. CARGA DE DATOS
    marketing = pd.read_csv(input_file)
    print("✅ Archivo original cargado correctamente.")

    # 3. TRANSFORMACIÓN: TABLA CLIENT
    client = marketing[["client_id", "age", "job", "marital", "education", "credit_default", "mortgage"]].copy()
    
    # Limpieza de strings (Reemplazo de puntos por guiones bajos)
    client["education"] = client["education"].str.replace(".", "_", regex=False).replace("unknown", np.nan)
    client["job"] = client["job"].str.replace(".", "", regex=False)
    
    # Guardar client.csv
    client.to_csv(os.path.join(data_folder, "client.csv"), index=False)

    # 4. TRANSFORMACIÓN: TABLA CAMPAIGN
    campaign = marketing[["client_id", "number_contacts", "month", "day", "contact_duration", 
                         "previous_campaign_contacts", "previous_outcome", "campaign_outcome"]].copy()
    
    # Estandarización de fechas
    campaign["month"] = campaign["month"].capitalize()
    campaign["year"] = "2022"
    campaign["day"] = campaign["day"].astype(str)
    campaign["last_contact_date"] = pd.to_datetime(campaign["year"] + "-" + campaign["month"] + "-" + campaign["day"])
    
    # Limpieza final de campaign
    campaign.drop(columns=["month", "day", "year"], inplace=True)
    campaign["campaign_outcome"] = campaign["campaign_outcome"].map({"yes": 1, "no": 0})
    campaign["previous_outcome"] = campaign["previous_outcome"].map({"success": 1, "failure": 0, "nonexistent": 0})
    
    campaign.to_csv(os.path.join(data_folder, "campaign.csv"), index=False)

    # 5. TRANSFORMACIÓN: TABLA ECONOMICS
    economics = marketing[["client_id", "cons_price_idx", "euribor_three_months"]].copy()
    economics.to_csv(os.path.join(data_folder, "economics.csv"), index=False)

    print(f"✅ ETL Completado con éxito. 3 archivos generados en /{data_folder}")

In [4]:
import pandas as pd
import numpy as np
import os

# --- 1. CONFIGURACIÓN DE RUTAS (Solución al NameError) ---
# En Jupyter, simplemente definimos la carpeta donde están los datos
data_folder = 'data'
input_file = os.path.join(data_folder, 'bank_marketing.csv')

# Verificación de seguridad para asegurar que el archivo existe
if not os.path.exists(input_file):
    print(f"❌ Error: No se encontró 'bank_marketing.csv' en la carpeta '{data_folder}'.")
    print("Por favor, asegúrate de que el archivo esté en la ruta correcta.")
else:
    # 2. CARGA DE DATOS
    marketing = pd.read_csv(input_file)
    print("✅ Archivo original cargado correctamente.")

    # 3. TRANSFORMACIÓN: TABLA CLIENT
    client = marketing[["client_id", "age", "job", "marital", "education", "credit_default", "mortgage"]].copy()
    
    # Limpieza de strings (Reemplazo de puntos por guiones bajos)
    client["education"] = client["education"].str.replace(".", "_", regex=False).replace("unknown", np.nan)
    client["job"] = client["job"].str.replace(".", "", regex=False)
    
    # Guardar client.csv
    client.to_csv(os.path.join(data_folder, "client.csv"), index=False)

    # 4. TRANSFORMACIÓN: TABLA CAMPAIGN
    campaign = marketing[["client_id", "number_contacts", "month", "day", "contact_duration", 
                         "previous_campaign_contacts", "previous_outcome", "campaign_outcome"]].copy()
    
    # Estandarización de fechas
    campaign["month"] = campaign["month"].str.capitalize()
    campaign["year"] = "2022"
    campaign["day"] = campaign["day"].astype(str)
    campaign["last_contact_date"] = pd.to_datetime(campaign["year"] + "-" + campaign["month"] + "-" + campaign["day"])
    
    # Limpieza final de campaign
    campaign.drop(columns=["month", "day", "year"], inplace=True)
    campaign["campaign_outcome"] = campaign["campaign_outcome"].map({"yes": 1, "no": 0})
    campaign["previous_outcome"] = campaign["previous_outcome"].map({"success": 1, "failure": 0, "nonexistent": 0})
    
    campaign.to_csv(os.path.join(data_folder, "campaign.csv"), index=False)

    # 5. TRANSFORMACIÓN: TABLA ECONOMICS
    economics = marketing[["client_id", "cons_price_idx", "euribor_three_months"]].copy()
    economics.to_csv(os.path.join(data_folder, "economics.csv"), index=False)

    print(f"✅ ETL Completado con éxito. 3 archivos generados en /{data_folder}")

✅ Archivo original cargado correctamente.
✅ ETL Completado con éxito. 3 archivos generados en /data
