In [None]:
import mysql.connector
import pandas as pd

# Configuración de conexión al Data Warehouse
DW_CONFIG = {
    "host": "192.168.0.103",
    "port": 3307,
    "user": "etl_user",
    "password": "TuPasswordFuerte",
    "database": "db_soporte"
}

print("Conectando al Data Warehouse...")
conn = mysql.connector.connect(**DW_CONFIG)

# -----------------------------------------------------------
# Query 1: Proyectos (con estado, presupuesto, costo, cliente)
# -----------------------------------------------------------
query_proyectos = """
SELECT 
    dp.idProyecto,
    dp.nombre_proyecto,
    dp.tipo_proyecto,
    dp.presupuesto,
    dp.costo_real,
    dp.fecha_inicio,
    dp.fecha_fin_real,
    des.estado AS EstadoProyecto,
    dc.industria AS Industria,
    dt.anio AS AnioCierre
FROM dim_proyecto dp
INNER JOIN dim_estado_proyecto des ON dp.idEstado = des.idEstado
INNER JOIN dim_cliente dc ON dp.idCliente = dc.idCliente
LEFT JOIN dim_tiempo dt ON dp.idProyecto = dt.idTiempo  -- Ajusta join si tu modelo usa otra relación
"""

print("Extrayendo información de proyectos...")
df_proyectos = pd.read_sql(query_proyectos, conn)
df_proyectos.to_csv("dw_proyectos.csv", index=False)
print(f"✓ {len(df_proyectos)} proyectos exportados a 'dw_proyectos.csv'")

# -----------------------------------------------------------
# Query 2: Tareas (con indicador de automatización y proyecto)
# -----------------------------------------------------------
query_tareas = """
SELECT 
    idTarea,
    nombre,
    es_automatizacion AS EsAutomatizacion,
    es_reutilizado AS EsReutilizado,
    idProyecto AS Proyecto_idProyecto
FROM dim_tarea
"""

print("Extrayendo información de tareas...")
df_tareas = pd.read_sql(query_tareas, conn)
df_tareas.to_csv("dw_tareas.csv", index=False)
print(f"✓ {len(df_tareas)} tareas exportadas a 'dw_tareas.csv'")

# -----------------------------------------------------------
# Query 3: Incidentes (con proyecto asociado)
# -----------------------------------------------------------
query_incidentes = """
SELECT 
    idIncidente,
    idProyecto AS Proyecto_idProyecto,
    idTarea,
    severidad,
    costo_correccion
FROM hecho_incidente
"""

print("Extrayendo información de incidentes...")
df_incidentes = pd.read_sql(query_incidentes, conn)
df_incidentes.to_csv("dw_incidentes.csv", index=False)
print(f"✓ {len(df_incidentes)} incidentes exportados a 'dw_incidentes.csv'")

# -----------------------------------------------------------
# Query 4 (opcional): Hechos agregados por proyecto
# -----------------------------------------------------------
query_hechos = """
SELECT 
    idProyecto,
    presupuesto,
    costo_real,
    desviacion_presupuestal,
    tareas_automatizacion_total,
    defectos_reportados
FROM hecho_proyecto
"""

print("Extrayendo tabla de hechos (agregada)...")
df_hechos = pd.read_sql(query_hechos, conn)
df_hechos.to_csv("dw_hechos_proyecto.csv", index=False)
print(f"✓ {len(df_hechos)} registros de hechos exportados a 'dw_hechos_proyecto.csv'")

conn.close()
print("\n✅ Extracción completada. Archivos CSV listos para Streamlit.")


Conectando al Data Warehouse...
Extrayendo información de proyectos...
✓ 15 proyectos exportados a 'dw_proyectos.csv'
Extrayendo información de tareas...
✓ 64 tareas exportadas a 'dw_tareas.csv'
Extrayendo información de incidentes...
✓ 70 incidentes exportados a 'dw_incidentes.csv'
Extrayendo tabla de hechos (agregada)...
✓ 15 registros de hechos exportados a 'dw_hechos_proyecto.csv'

✅ Extracción completada. Archivos CSV listos para Streamlit.


  df_proyectos = pd.read_sql(query_proyectos, conn)
  df_tareas = pd.read_sql(query_tareas, conn)
  df_incidentes = pd.read_sql(query_incidentes, conn)
  df_hechos = pd.read_sql(query_hechos, conn)
