In [None]:
# =================================================================
# PROJECT: E-commerce Logistics Analytics (Medallion Architecture)
# LAYER: Bronze (Raw Data Ingestion)
# SOURCE: Supabase (Transaction Pooler - IPv4) -> Fabric Lakehouse
# =================================================================

from pyspark.sql import SparkSession

# 1. Parámetros de conexión basados en image_2eae6b
# IMPORTANTE: Reemplaza 'TU_PASSWORD' con la contraseña que elegiste
db_config = {
    "host": "------", #
    "port": "----",                               #
    "database": "postgres",                       #
    "user": "-----",      #
    "password": "-----"                 
}

# 2. URL de conexión JDBC segura
jdbc_url = f"jdbc:postgresql://{db_config['host']}:{db_config['port']}/{db_config['database']}"

# 3. Lista de tablas a migrar
# Estas son las tablas que contienen tus datos de 2023, 2024 y 2025
source_tables = ["ordenes", "order_items", "logistica_investigacion", "productos"]

def run_bronze_ingestion(table_name):
    print(f"--- Procesando tabla: {table_name} ---")
    try:
        # Lectura desde Supabase
        df = spark.read \
            .format("jdbc") \
            .option("url", jdbc_url) \
            .option("dbtable", table_name) \
            .option("user", db_config['user']) \
            .option("password", db_config['password']) \
            .option("driver", "org.postgresql.Driver") \
            .load()
        
        # Guardado en el Lakehouse (Capa Bronze)
        # Usamos mode('overwrite') para refrescar la data completa en esta etapa
        target_table = f"bronze_{table_name}"
        df.write.format("delta").mode("overwrite").saveAsTable(target_table)
        
        print(f"ÉXITO: {target_table} cargada con {df.count()} registros.")
        
    except Exception as e:
        print(f"ERROR: No se pudo procesar la tabla {table_name}.")
        print(f"Detalle técnico: {str(e)}")

# 4. Ejecución del proceso para todas las tablas
for table in source_tables:
    run_bronze_ingestion(table)

print("\n--- INGESTA A CAPA BRONZE FINALIZADA ---")

StatementMeta(, 229460d5-2a77-415f-81f4-a035fe5a3cb4, 3, Finished, Available, Finished)

--- Procesando tabla: ordenes ---
ÉXITO: bronze_ordenes cargada con 1200 registros.
--- Procesando tabla: order_items ---
ÉXITO: bronze_order_items cargada con 1200 registros.
--- Procesando tabla: logistica_investigacion ---
ÉXITO: bronze_logistica_investigacion cargada con 1280 registros.
--- Procesando tabla: productos ---
ÉXITO: bronze_productos cargada con 15 registros.

--- INGESTA A CAPA BRONZE FINALIZADA ---
