<h2 align="center">INSTITUTO TECNOLÓGICO Y DE ESTUDIOS<br>SUPERIORES DE MONTERREY</h2>
<h3 align="center">Campus Ciudad de México<br>Escuela de Ingeniería y Ciencias</h3>

<br>

<h3 align="center">Análisis de Ciencia de Datos</h3>

<h4 align="center">Profesores: Leonardo Cañete-Sifuentes y Enrique González Núñez</h4>

<br>

<h3 align="center">Proyecto integrador:</h3>

<h3 align="center">Análisis Financiero y Presupuestal en Producciones Audiovisuales</h3>

<br><br>

#### Integrantes del equipo:
- **Victor Angel Martínez Vidaurri** – A01665456  
- **Uziel Heredia Estrada** – A01XXXXXXX  
- **Alan Ulises Luna Hernandez** – A01424523  
- **Bertin Flores Silva** – A01XXXXXXX
- **Bertin Flores Silva** – A01XXXXXXX    

**Grupo:** 641  
**Fecha:** junio, 2025



# 🧪 Análisis Exploratorio de Datos (EDA) y Desarrollo

En esta sección se incluye el desarrollo técnico del proyecto: lectura de archivos, transformación de datos, visualizaciones y cálculos estadísticos necesarios para comprobar las hipótesis planteadas.

A continuación, se presenta el paso a paso del análisis.


## 📦 Bloque 1 – Importación de librerías
Se cargan las bibliotecas necesarias para manipulación de datos, visualización y lectura de archivos Excel con múltiples hojas.


In [1]:
# ==================== BLOQUE 1 – LIBRERÍAS ====================

# Manipulación y análisis de datos
import pandas as pd
import numpy as np

# Visualización estática y estadística
import matplotlib.pyplot as plt
import seaborn as sns

# Visualización interactiva
import plotly.express as px
import plotly.graph_objects as go
import plotly.io as pio

# Lectura de archivos Excel con múltiples hojas
import openpyxl


## 📥 Bloque 2 – Carga de Datos
Se cargan las tres hojas principales del archivo Excel: `Summary`, `Cost Report` y `Data`.  
Se omiten filas irrelevantes en la hoja de costos y se seleccionan sólo las columnas útiles (C:Z).


In [2]:
# ==================== BLOQUE 2 – CARGA DE DATOS ====================

# Cargar archivo Excel con múltiples hojas
archivo = "data/CR EJEMPLO MOD.xlsx"
xlsx = pd.ExcelFile(archivo)

# Mostrar nombres de hojas disponibles
print("📄 Hojas disponibles en el archivo:")
print(xlsx.sheet_names)

# Leer hoja 'Summary' sin transformación adicional
df_summary = pd.read_excel(xlsx, sheet_name="Summary")

# Leer hoja 'Data' completa
df_data = pd.read_excel(xlsx, sheet_name="Data")

# Leer hoja 'Cost Report', omitiendo encabezados y tomando columnas útiles (C:Z)
df_costreport = pd.read_excel(
    xlsx,
    sheet_name="Cost Report",
    skiprows=8,
    usecols="C:Z"
)

# Vista preliminar de los tres DataFrames cargados
print("\n📊 Hoja 'Summary':")
display(df_summary.head())

print("\n📊 Hoja 'Cost Report':")
display(df_costreport.head())

print("\n📊 Hoja 'Data':")
display(df_data.head())


📄 Hojas disponibles en el archivo:
['Summary', 'Comprometidos', 'Cost Report', 'Balance Sheet', 'Budget', 'Data Commitments', 'Data', 'Commitments', 'Tablas', 'Conciliación Bancaria']


  warn(msg)
  warn(msg)



📊 Hoja 'Summary':


Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14
0,,,,,,,,,,,,,,,
1,,,,,,,,,,,,,,,
2,,,,,,,,,,,,,,,
3,,,,COST REPORT,,,,,,,,,,,
4,,,,Etapa:,ALL,,,,1.0,0.0,,,,,



📊 Hoja 'Cost Report':


Unnamed: 0,TIPO,REF,Etapa,Sección,ACCT,Unnamed: 7,1,COST TO DATE,COMMITMENTS,TOTAL CTD,...,INDEX,2,P ESTIMATE FINAL COST,VARIANCE VS PFCST,INDEX.1,Comentarios,Unnamed: 22,Unnamed: 23,Unnamed: 24,Unnamed: 25
0,Above the Line,Cuenta General,,,1100,,,10065000.08,0.0,10065000.08,...,,,10065000.08,0.0,,,,,,
1,Above the Line,Sub cuenta,,,1101,,,8340000.02,0.0,8340000.02,...,,,8340000.02,0.0,,,,,,11.0
2,Above the Line,Detalle,,,1101-002,,,0.0,0.0,0.0,...,,,0.0,0.0,,,,,1101.0,
3,Above the Line,Detalle,,,1101-004,,,0.0,0.0,0.0,...,,,0.0,0.0,,,,,1101.0,
4,Above the Line,Detalle,DEVELOPMENT,,1101-005,,,1400000.0,0.0,1400000.0,...,,,1400000.0,0.0,,,,,1101.0,



📊 Hoja 'Data':


Unnamed: 0,CONTROL,# CHEQUE,PARTIDA PRESUPUESTAL,UIDD/FOLIO FISCAL,DIRECCION,REGIMEN FISCAL,NOMBRE REGIMEN FISCAL,RFC,STATUS,FECHA DE RECIBIDO,...,Valida,MES,Column1,SUBTOTAL2,IVA3,RET IVA4,RET ISR.1,TOTAL.1,CAMBIOS,Unnamed: 36
0,,,Income (Funding),,,,,,,,...,Balance,,0,,,,,,,
1,,,Income (Funding) IVA,,,,,,,,...,Balance,,0,,,,,,,
2,F1.2,,Income (Funding),,,Estados Unidos (los),Estados Unidos (los),0.0,,,...,Balance,,0,,,,,,,
3,N001,1.0,7007-009,0.0,86127.0,Régimen Simplificado de Confianza,Régimen Simplificado de Confianza,1.0,,33.0,...,7007-009,,0,,,,,,,-45135.0
4,N003,4.0,1107-009,1.0,4318.0,Régimen Simplificado de Confianza,Régimen Simplificado de Confianza,2.0,,40.0,...,1107-009,,0,,,,,,,-45128.0


## 🧹 Bloque 3 – Preprocesamiento del Cost Report
Se limpia y transforma la hoja `Cost Report` para dejarla lista para el análisis.  
Se eliminan columnas irrelevantes, se filtran registros útiles (detalles), y se normalizan campos como `ACCT`, `Etapa` y `COMMITMENTS`. También se crea la jerarquía contable.


In [None]:
# ============== BLOQUE 3 – PREPROCESAMIENTO DE COST REPORT ==============

# Copia de seguridad del DataFrame original
df_cost = df_costreport.copy()

# Eliminar columnas generadas por Excel con encabezados vacíos
df_cost = df_cost.loc[:, ~df_cost.columns.str.contains(r'^Unnamed', na=False)]

# Limpiar espacios en los nombres de columna
df_cost.columns = df_cost.columns.str.strip()

# Convertir columnas numéricas relevantes a tipo float (forzando errores como NaN)
cols_numericas = [
    "COST TO DATE", "COMMITMENTS", "TOTAL CTD",
    "ESTIMATE TO COMPLETE (ETC)", "ESTIMATE FINAL COST (EFC)",
    "BUDGET", "VARIANCE $", "INDEX", "P FCST", "VARIANCE $ "
]
for col in cols_numericas:
    if col in df_cost.columns:
        df_cost[col] = pd.to_numeric(df_cost[col], errors="coerce")

# Filtrar filas que hacen referencia a "detalle" en la columna REF (sin importar mayúsculas/minúsculas)
df_cost = df_cost[
    df_cost["REF"]
        .astype(str)
        .str.strip()
        .str.lower()
        .str.contains(r"\bdetalle\b", regex=True)
].copy()

# Validación: comparación de suma de “COST TO DATE” antes y después del filtrado
suma_original = df_costreport["COST TO DATE"].sum()
suma_filtrado = df_cost["COST TO DATE"].sum()
print(f"Suma Cost Report original      : {suma_original:,.2f}")
print(f"Suma tras filtrar 'detalle'    : {suma_filtrado:,.2f}")
print(f"Diferencia                      : {(suma_original - suma_filtrado):,.2f}")

# Convertir columna “ACCT” a texto limpio (sin espacios)
df_cost["ACCT"] = df_cost["ACCT"].astype(str).str.strip()

# Limpiar y convertir "COMMITMENTS", reemplazando valores no numéricos con 0
df_cost["COMMITMENTS"] = pd.to_numeric(df_cost["COMMITMENTS"], errors="coerce").fillna(0)

# Crear jerarquía contable
df_cost["Cuenta Madre"] = df_cost["ACCT"].str.split("-").str[0]
df_cost["Es Detalle"] = df_cost["ACCT"].str.contains("-")

def asignar_nivel(acct):
    if "-" in acct:
        return "Detalle"
    elif len(acct) == 4:
        return "Subcuenta"
    else:
        return "Cuenta General"

df_cost["Nivel"] = df_cost["ACCT"].apply(asignar_nivel)

# Crear campo “Cuenta General” (primeros dos dígitos + "00")
df_cost["Cuenta General"] = df_cost["Cuenta Madre"].str[:2] + "00"

# Etiqueta para gráficas: "ACCT - Sección" si la sección existe
df_cost["Etiqueta"] = df_cost.apply(
    lambda row: f"{row['ACCT']} - {row['Sección']}" if pd.notna(row.get("Sección")) else row["ACCT"],
    axis=1
)

# Normalizar columna “Etapa”
etapas_validas = ["DEVELOPMENT", "SOFT", "PREP", "SHOOT", "WRAP", "POST"]
df_cost["Etapa_str"] = df_cost["Etapa"].astype(str).str.strip().str.upper()
df_cost["Etapa Normalizada"] = df_cost["Etapa_str"].apply(lambda x: x if x in etapas_validas else "SHOOT")
df_cost.loc[df_cost["Etapa"].isna(), "Etapa Normalizada"] = None
df_cost["Etapa Normalizada"] = df_cost["Etapa Normalizada"].fillna(method="ffill").fillna(method="bfill")
df_cost.drop(columns=["Etapa_str"], inplace=True)

# Seleccionar solo columnas útiles
columnas_validas = [
    "TIPO", "REF", "Etapa", "Etapa Normalizada", "Sección", "ACCT",
    "COST TO DATE", "COMMITMENTS", "TOTAL CTD",
    "ESTIMATE TO COMPLETE (ETC)", "ESTIMATE FINAL COST (EFC)",
    "BUDGET", "VARIANCE $", "INDEX", "P FCST", "VARIANCE $ ",
    "Cuenta General", "Cuenta Madre", "Es Detalle", "Nivel", "Etiqueta"
]
df_cost = df_cost[[col for col in columnas_validas if col in df_cost.columns]].copy()

# Resetear índice y guardar versión limpia
df_cost.reset_index(drop=True, inplace=True)
df_cost_clean = df_cost.copy()

# Vista previa del DataFrame preprocesado
print("\nVista final de Cost Report preprocesado:")
display(df_cost_clean.head())


Suma Cost Report original      : 402,840,948.29
Suma tras filtrar 'detalle'    : 134,371,982.76
Diferencia                      : 268,468,965.53

Vista final de Cost Report preprocesado:


  df_cost["Etapa Normalizada"] = df_cost["Etapa Normalizada"].fillna(method="ffill").fillna(method="bfill")


Unnamed: 0,TIPO,REF,Etapa,Etapa Normalizada,Sección,ACCT,COST TO DATE,COMMITMENTS,TOTAL CTD,ESTIMATE TO COMPLETE (ETC),ESTIMATE FINAL COST (EFC),BUDGET,VARIANCE $,INDEX,Cuenta General,Cuenta Madre,Es Detalle,Nivel,Etiqueta
0,Above the Line,Detalle,,DEVELOPMENT,,1101-002,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,1100,1101,True,Detalle,1101-002
1,Above the Line,Detalle,,DEVELOPMENT,,1101-004,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,1100,1101,True,Detalle,1101-004
2,Above the Line,Detalle,DEVELOPMENT,DEVELOPMENT,,1101-005,1400000.0,0.0,1400000.0,0.0,1400000.0,1400000.0,0.0,,1100,1101,True,Detalle,1101-005
3,Above the Line,Detalle,DEVELOPMENT,DEVELOPMENT,,1101-006,100000.03,0.0,100000.03,0.0,100000.03,100000.0,-0.03,,1100,1101,True,Detalle,1101-006
4,Above the Line,Detalle,DEVELOPMENT,DEVELOPMENT,,1101-007,100000.0,0.0,100000.0,0.0,100000.0,100000.0,0.0,,1100,1101,True,Detalle,1101-007


## 🔗 Bloque 4 – Integración de Gasto Real y Normalización de Fechas
Se integran los subtotales reales (`SUBTOTAL`) desde la hoja `Data` al `Cost Report` limpio.  
Además, se limpian, rellenan y asignan fechas de pago (`FECHA DE PAGO`) de forma consistente para cada partida.


In [4]:
df_data.columns.values

array(['CONTROL', '# CHEQUE', 'PARTIDA PRESUPUESTAL', 'UIDD/FOLIO FISCAL',
       'DIRECCION', 'REGIMEN FISCAL', 'NOMBRE REGIMEN FISCAL', 'RFC',
       'STATUS', 'FECHA DE RECIBIDO', 'SEMANA QUE SE PAGA', 'TIPO',
       'NOMBRE DEL PROVEEDOR', 'CORREO', 'CONCEPTO', 'TIPO2', 'SUBTOTAL',
       'IVA', 'OTROS IMPUESTOS', 'RET IVA', 'RET ISR', 'TOTAL',
       'CUENTA CLAVE', 'BANCO', 'ESTATUS', 'FECHA DE PAGO ', 'NOTAS',
       'Valida', 'MES', 'Column1', 'SUBTOTAL2', 'IVA3', 'RET IVA4',
       'RET ISR.1', 'TOTAL.1', 'CAMBIOS', 'Unnamed: 36'], dtype=object)

In [5]:
# ============== BLOQUE 4 – INTEGRACIÓN DE GASTO REAL Y FECHAS ==============

# Copia del DataFrame original y limpieza de nombres de columna
df_d = df_data.copy()
df_d.columns = df_d.columns.str.strip()

# Convertir SUBTOTAL a numérico y calcular total por partida
df_d["SUBTOTAL"] = pd.to_numeric(df_d["SUBTOTAL"], errors="coerce")
df_d_agg = (
    df_d
    .groupby("PARTIDA PRESUPUESTAL")[["SUBTOTAL"]]
    .sum()
    .reset_index()
    .rename(columns={"SUBTOTAL": "Total_Data"})
)

# Unir gasto real al Cost Report limpio
df_join = df_cost_clean.merge(
    df_d_agg,
    left_on="ACCT",
    right_on="PARTIDA PRESUPUESTAL",
    how="left"
)
print(len(df_d["SUBTOTAL"]))
df_join["Total_Data"] = df_join["Total_Data"].fillna(0)

# Calcular gasto total (SUBTOTAL + COMMITMENTS)
df_join["COMMITMENTS"] = pd.to_numeric(df_join["COMMITMENTS"], errors="coerce").fillna(0)
df_join["Cost_Total"] = df_join["Total_Data"] + df_join["COMMITMENTS"]
df_join.drop(columns=["PARTIDA PRESUPUESTAL"], inplace=True)

# Preparar DataFrame de fechas de pago
df_dates = df_data.copy()
df_dates.columns = df_dates.columns.str.strip()
df_dates = df_dates[["PARTIDA PRESUPUESTAL", "FECHA DE PAGO", "SUBTOTAL"]].copy()
df_dates["FECHA_NUM"] = pd.to_numeric(df_dates["FECHA DE PAGO"], errors="coerce")

# Reemplazar fechas negativas con NaN
df_dates.loc[df_dates["FECHA_NUM"] < 0, "FECHA_NUM"] = np.nan

# Filtrar sólo partidas válidas (presentes en df_join)
validas = df_join["ACCT"].astype(str).tolist()
df_dates = df_dates[df_dates["PARTIDA PRESUPUESTAL"].astype(str).isin(validas)].copy()

# Ordenar por partida y por número de fecha
df_dates.sort_values(["PARTIDA PRESUPUESTAL", "FECHA_NUM"], inplace=True)

# Rellenar fechas faltantes con backfill y forward-fill por partida
df_dates["FECHA_NUM_LIMPIA"] = (
    df_dates
    .groupby("PARTIDA PRESUPUESTAL")["FECHA_NUM"]
    .transform(lambda s: s.bfill().ffill())
)

# Para los que aún falten, usar la mediana de su propia partida
df_dates["FECHA_NUM_LIMPIA"] = (
    df_dates
    .groupby("PARTIDA PRESUPUESTAL")["FECHA_NUM_LIMPIA"]
    .transform(lambda s: s.fillna(s.median()))
)

# Rellenar con la mediana global si alguna partida sigue sin fecha
global_med = df_dates["FECHA_NUM"].median()
df_dates["FECHA_NUM_LIMPIA"].fillna(global_med, inplace=True)

# Seleccionar un solo valor mínimo por partida
fechas_unique = (
    df_dates
    .groupby("PARTIDA PRESUPUESTAL", as_index=False)[["FECHA_NUM_LIMPIA"]]
    .max()
)

# Mapear fechas limpias de vuelta al DataFrame principal
map_fechas = dict(zip(fechas_unique["PARTIDA PRESUPUESTAL"],
                      fechas_unique["FECHA_NUM_LIMPIA"]))
df_join["FECHA_NUM_LIMPIA"] = df_join["ACCT"].map(map_fechas)

# Opcional: marcar como NaN aquellas partidas con gasto total 0
df_join.loc[df_join["Cost_Total"] == 0, "FECHA_NUM_LIMPIA"] = np.nan

# Verificación de totales tras integración de fechas
total_general = df_join["Cost_Total"].sum()
with_date     = df_join.loc[df_join["FECHA_NUM_LIMPIA"].notna(), "Cost_Total"].sum()
without_date  = df_join.loc[df_join["FECHA_NUM_LIMPIA"].isna(),   "Cost_Total"].sum()
cnt_with      = df_join["FECHA_NUM_LIMPIA"].notna().sum()
cnt_without   = df_join["FECHA_NUM_LIMPIA"].isna().sum()

print("🔍 Totales tras integrar fechas (sin ceros):")
print(f"  • Total Cost_Total general : {total_general:,.2f}")
print(f"  • Con fecha limpia         : {with_date:,.2f} ({cnt_with} partidas)")
print(f"  • Sin fecha limpia         : {without_date:,.2f} ({cnt_without} partidas)")
print(f"  • Verificación parcial     : {with_date + without_date:,.2f} == {total_general:,.2f}")

# Mostrar partidas que aún tienen gasto pero sin fecha
conf = df_join[
    df_join["FECHA_NUM_LIMPIA"].isna() &
    (df_join["Cost_Total"] != 0)
][["ACCT", "Cost_Total"]]
if not conf.empty:
    print("\n⚠️ Partidas sin fecha aún con gasto real:")
    display(conf.reset_index(drop=True))

# Guardar resultado final validado
df_cost_data_validado = df_join.copy()


7886
🔍 Totales tras integrar fechas (sin ceros):
  • Total Cost_Total general : 135,445,624.41
  • Con fecha limpia         : 135,445,624.41 (1049 partidas)
  • Sin fecha limpia         : 0.00 (1185 partidas)
  • Verificación parcial     : 135,445,624.41 == 135,445,624.41


  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, out=out, keepdims=keepdims)
  return np.nanmean(a, axis, ou

## 🎯 Hipótesis de Análisis

Se plantea identificar **cuáles fueron las cuentas a detalle que presentaron una variación negativa significativa** (es decir, aquellas donde el costo real superó el presupuesto asignado).

El objetivo es:

- Detectar **cuentas específicas** responsables del exceso de gasto.
- Verificar si **estas cuentas están concentradas en una o más etapas específicas** del proyecto.
- Visualizar los resultados para facilitar su interpretación y toma de decisiones.

Este análisis permitirá entender **dónde y cuándo** se produjo el desvío presupuestal, facilitando medidas correctivas o preventivas en futuras producciones.


In [50]:
import datetime
df_odates=df_data.copy()
# Eliminar filas vacías o irrelevantes en df_resumen
df_odates = df_odates.dropna(subset=["TIPO", "Valida", "TIPO","TOTAL","FECHA DE PAGO ","SUBTOTAL","PARTIDA PRESUPUESTAL"], how='all')
df_odates = df_odates[~df_odates['FECHA DE PAGO '].apply(lambda x: isinstance(x, datetime.time))]
df_odates.loc[df_odates['FECHA DE PAGO '] < 0, 'FECHA DE PAGO '] = np.nan


# Asegurar que los datos numéricos estén en el formato correcto
df_odates["FECHA DE PAGO "]=df_odates["FECHA DE PAGO "].fillna(method="bfill")
df_odates = df_odates[pd.to_numeric(df_odates['FECHA DE PAGO '], errors='coerce').notna()]


df_odates=df_odates.loc[df_odates["FECHA DE PAGO "] != -45168, :]
cuentas=df_join["ACCT"].unique()
df_odates=df_odates[df_odates['PARTIDA PRESUPUESTAL'].isin(cuentas)]
df_odates = df_odates.dropna(subset=['TOTAL'])
df_odates = df_odates.dropna(subset=['SUBTOTAL'])
df_odates = df_odates.dropna(subset=['PARTIDA PRESUPUESTAL'])
df_odates.rename(columns={'FECHA DE PAGO ': 'FECHA_NUM_LIMPIA'}, inplace=True)
df_odates.sort_values(by="FECHA_NUM_LIMPIA", ascending=True, inplace=True)


Series.fillna with 'method' is deprecated and will raise in a future version. Use obj.ffill() or obj.bfill() instead.


Downcasting object dtype arrays on .fillna, .ffill, .bfill is deprecated and will change in a future version. Call result.infer_objects(copy=False) instead. To opt-in to the future behavior, set `pd.set_option('future.no_silent_downcasting', True)`



In [51]:
import plotly.graph_objects as go
df_ojoin = df_join.copy()
df_ojoin.sort_values(by="FECHA_NUM_LIMPIA", inplace=True)
df_odates.loc[(df_odates["PARTIDA PRESUPUESTAL"]=="7003-004") & (df_odates['SUBTOTAL'] == df_odates[df_odates["PARTIDA PRESUPUESTAL"]=="7003-004"]["SUBTOTAL"].max()), 'SUBTOTAL'] += 1069395.97 - 486500
df_odates.loc[(df_odates["PARTIDA PRESUPUESTAL"]=="7038-008") & (df_odates['SUBTOTAL'] == df_odates[df_dates["PARTIDA PRESUPUESTAL"]=="7038-008"]["SUBTOTAL"].max()), 'SUBTOTAL'] += 4245.68 
df_odates["ACUMULADO"]=np.cumsum(df_odates["SUBTOTAL"])
Acumulado_budget=np.cumsum(df_ojoin["BUDGET"])
#df_dates[df_dates["PARTIDA PRESUPUESTAL"]=="7003-004"]["SUBTOTAL"].max()=df_dates[df_dates["PARTIDA PRESUPUESTAL"]=="7003-004"]["SUBTOTAL"].max()+ 1069395.97 
#df_dates[df_dates["PARTIDA PRESUPUESTAL"]=="7038-008"]["SUBTOTAL"].max()=df_dates[df_dates["PARTIDA PRESUPUESTAL"]=="7038-008"]["SUBTOTAL"].max()+ 4245.68 
fig = go.Figure()

fig.add_trace(go.Scatter(
    name="Gasto Acumulado",
    x=df_odates["FECHA_NUM_LIMPIA"],
    y=df_odates["ACUMULADO"],
    hovertemplate="%{y}%{_xother}"
))

fig.add_trace(go.Scatter(
    name="Budget",
    x=df_ojoin["FECHA_NUM_LIMPIA"],
    y=Acumulado_budget,
    hovertemplate="%{y}%{_xother}"
))
valormaximo=f"Gasto acumulado: {round(df_odates["ACUMULADO"].max()/1000000,3)}M"
ultimovalor= pd.DataFrame(dict(
    x=[df_odates["FECHA_NUM_LIMPIA"].max()],
    y=[df_odates["ACUMULADO"].max()]
))

fig.add_trace(go.Scatter(
    name=valormaximo,
    x=ultimovalor["x"],
    y=ultimovalor["y"]
))

budgetmaximo=f"Budget: {round(Acumulado_budget.max()/1000000,3)}M"
ultimobudget= pd.DataFrame(dict(
    x=[df_ojoin["FECHA_NUM_LIMPIA"].max()],
    y=[Acumulado_budget.max()]
))

fig.add_trace(go.Scatter(
    name=budgetmaximo,
    x=ultimobudget["x"],
    y=ultimobudget["y"]
))

fig.update_xaxes(title_text="Dias")
fig.update_yaxes(title_text="Gasto")
fig.update_layout(title="Gasto acumulado vs Budget")
fig.update_layout(hovermode="x unified")
fig.show()



Boolean Series key will be reindexed to match DataFrame index.



### 📉 Análisis de Cuentas Detalle con Mayor Desviación Presupuestal

Se identifican las cuentas a nivel **detalle** que superaron su presupuesto, y se agrupan por etapa para observar si existe una relación significativa entre las **desviaciones negativas** y la **etapa del proyecto** en la que ocurrieron.


In [7]:
# ==================== ANÁLISIS DE DESVIACIONES POR ETAPA ====================

# 1. Filtrar cuentas a nivel "Detalle"
df_detalle = df_cost_clean[df_cost_clean["Nivel"] == "Detalle"].copy()

# 2. Calcular el costo total real (COST TO DATE + COMMITMENTS)
df_detalle["TOTAL COSTO"] = df_detalle["COST TO DATE"].fillna(0) + df_detalle["COMMITMENTS"].fillna(0)

# 3. Calcular la diferencia respecto al presupuesto (negativo si se excede)
df_detalle["DIFERENCIA vs BUDGET"] = df_detalle["BUDGET"].fillna(0) - df_detalle["TOTAL COSTO"]

# 4. Filtrar sólo partidas donde el gasto total superó el presupuesto (desviación negativa)
df_detalle_desviado = df_detalle[df_detalle["DIFERENCIA vs BUDGET"] < 0].copy()

# 5. Agrupar por etapa para obtener cantidad y monto total de desviaciones
resumen_por_etapa = (
    df_detalle_desviado
    .groupby("Etapa Normalizada")
    .agg(
        **{
            "Cantidad de Desviaciones": ("DIFERENCIA vs BUDGET", "count"),
            "Suma de Desviaciones": ("DIFERENCIA vs BUDGET", "sum")
        }
    )
    .reset_index()
    .rename(columns={"Etapa Normalizada": "Etapa"})
)

# 6. Formatear monto total para mayor legibilidad
resumen_por_etapa["Suma de Desviaciones"] = resumen_por_etapa["Suma de Desviaciones"].apply(lambda x: f"{x:,.2f}")

# 7. Mostrar resumen final
print("Resumen de partidas de detalle que excedieron el presupuesto, por etapa:")
display(resumen_por_etapa)



Resumen de partidas de detalle que excedieron el presupuesto, por etapa:


Unnamed: 0,Etapa,Cantidad de Desviaciones,Suma de Desviaciones
0,DEVELOPMENT,2,-0.09
1,POST,5,-943044.54
2,PREP,38,-1056115.76
3,SHOOT,321,-14388276.07
4,SOFT,2,-26250.0
5,WRAP,27,-372008.9


### 📊 Visualización de Desviaciones por Etapa

Se grafica la **suma total de desviaciones negativas** por etapa del proyecto.  
Esto permite identificar visualmente en qué fases hubo mayor sobrepaso del presupuesto.


In [8]:
# 1. Preparar copia del resumen y convertir montos a formato numérico
resumen_plot = resumen_por_etapa.copy()
resumen_plot["Suma_num"] = (
    resumen_plot["Suma de Desviaciones"]
    .str.replace(",", "", regex=False)
    .astype(float)
)

# 2. Ordenar por monto de desviación (más negativo primero)
resumen_plot = resumen_plot.sort_values(by="Suma_num")

# 3. Crear gráfico de barras
fig = px.bar(
    resumen_plot,
    x="Etapa",
    y="Suma_num",
    title="Desviaciones Negativas por Etapa",
    text="Suma_num",
    labels={"Suma_num": "Desviación Total ($)", "Etapa": "Etapa del Proyecto"},
    color_discrete_sequence=["#1F77B4"]
)

# 4. Formato del texto dentro de las barras y tooltip
fig.update_traces(
    texttemplate="$%{text:,.2f}",
    hovertemplate="<b>%{x}</b><br>Desviación: $%{y:,.2f}"
)

# 5. Ajustes de formato general
fig.update_layout(
    yaxis_tickformat=",.2f",
    uniformtext_minsize=12,
    uniformtext_mode="hide"
)

# 6. Mostrar la visualización
fig.show()


### 💰 Análisis de Ahorros por Etapa

Se identifican las cuentas a detalle que **gastaron menos de lo presupuestado**, y se agrupan por etapa.  
Este análisis permite visualizar **en qué fases del proyecto hubo eficiencia financiera**.


In [10]:
# ==================== ANÁLISIS DE AHORROS POR ETAPA ====================

# 1. Filtrar cuentas a detalle que presentaron ahorro (gasto menor al presupuesto)
df_detalle_ahorro = df_detalle[
    df_detalle["DIFERENCIA vs BUDGET"] > 0
].copy()

# 2. Agrupar por etapa y calcular cantidad de ahorros y suma total
resumen_ahorro_etapa = (
    df_detalle_ahorro
    .groupby("Etapa Normalizada")
    .agg(
        Cantidad_con_Ahorro = ("DIFERENCIA vs BUDGET", "count"),
        Suma_de_Ahorros    = ("DIFERENCIA vs BUDGET", "sum")
    )
    .reset_index()
    .rename(columns={"Etapa Normalizada": "Etapa"})
)

# 3. Formatear la suma total para mayor legibilidad
resumen_ahorro_etapa["Suma_de_Ahorros"] = \
    resumen_ahorro_etapa["Suma_de_Ahorros"].map(lambda x: f"${x:,.2f}")

# 4. Mostrar el resumen final de ahorros
print("Resumen de partidas detalle que quedaron con ahorro, por etapa:")
display(resumen_ahorro_etapa)


Resumen de partidas detalle que quedaron con ahorro, por etapa:


Unnamed: 0,Etapa,Cantidad_con_Ahorro,Suma_de_Ahorros
0,DEVELOPMENT,3,"$5,460.01"
1,POST,85,"$1,744,465.53"
2,PREP,81,"$997,453.76"
3,SHOOT,391,"$13,038,734.79"
4,WRAP,45,"$651,867.85"


### 📈 Visualización de Ahorros por Etapa

Se representa gráficamente el **ahorro total por etapa**, es decir, la diferencia positiva entre el presupuesto y el gasto real.  
Esto permite identificar las fases del proyecto que tuvieron **mejor control financiero**.


In [11]:
# ==================== VISUALIZACIÓN DE AHORROS POR ETAPA ====================

# 1. Crear copia del resumen original de ahorros
res_ahorro = resumen_ahorro_etapa.copy()

# 2. Asegurar que los valores estén en formato numérico (por si vienen como string con $)
res_ahorro["Suma de Ahorros"] = (
    res_ahorro["Suma_de_Ahorros"]
    .replace({"[$,]": ""}, regex=True)
    .astype(float)
)

# 3. Ordenar etapas por monto de ahorro (mayor primero)
res_ahorro = res_ahorro.sort_values(by="Suma de Ahorros", ascending=False)

# 4. Crear gráfico de barras
fig = px.bar(
    res_ahorro,
    x="Etapa",
    y="Suma de Ahorros",
    title="Ahorros Presupuestarios por Etapa",
    text="Suma de Ahorros",
    labels={
        "Suma de Ahorros": "Ahorro Total ($)",
        "Etapa": "Etapa del Proyecto"
    },
    color_discrete_sequence=["#2CA02C"]  # Verde accesible y positivo
)

# 5. Ajuste de texto y etiquetas de hover
fig.update_traces(
    texttemplate="$%{text:,.2f}",
    hovertemplate="<b>%{x}</b><br>Ahorro: $%{y:,.2f}"
)

# 6. Configuración de ejes y márgenes
fig.update_layout(
    yaxis_tickformat=",.2f",
    xaxis_tickangle=-45,
    margin={"t":50, "b":150}
)

# 7. Mostrar el gráfico
fig.show()


#### 🔍 Interpretación del gráfico de ahorros

Como se observa en el gráfico, la etapa **SOFT** no aparece, lo que indica que en dicha fase **no se generaron ahorros**. Esto puede deberse a dos razones:

- Todas las cuentas asociadas a SOFT **mantuvieron el gasto igual al presupuesto** (es decir, sin diferencia).
- O bien, **hubo pérdidas** que superaron el presupuesto, por lo que no se clasifican como ahorro.

Por otro lado, destaca la etapa **SHOOT**, que concentra el mayor monto de ahorro presupuestario, con más de $13 millones, lo que puede **sugerir** una optimización significativa en esa fase del proyecto, sin embargo falta comparar las perdidas .


#### 🧭 Hallazgo específico: Etapa SOFT

Se analizaron las 16 cuentas de detalle asociadas a la etapa **SOFT** y se observó lo siguiente:

- Ninguna generó **ahorro**.
- Sólo **2 partidas presentaron sobregasto** (es decir, superaron el presupuesto).
- Las **14 restantes se ejecutaron exactamente como estaban previstas**, sin desvíos significativos.

Este comportamiento sugiere que en esta etapa hubo una **planeación financiera precisa**, pero sin espacio para optimización presupuestal.


In [13]:
# 1. Asegurarnos de partir de df_cost_clean y recalcular DIFERENCIA vs BUDGET
df_detalle = df_cost_clean[df_cost_clean["Nivel"] == "Detalle"].copy()

# 2. TOTAL COSTO = COST TO DATE + COMMITMENTS
df_detalle["TOTAL COSTO"] = df_detalle["COST TO DATE"].fillna(0) + df_detalle["COMMITMENTS"].fillna(0)

# 3. DIFERENCIA vs BUDGET = BUDGET − TOTAL COSTO
df_detalle["DIFERENCIA vs BUDGET"] = df_detalle["BUDGET"].fillna(0) - df_detalle["TOTAL COSTO"]

# 4. Filtrar solo la etapa SOFT
df_soft = df_detalle[df_detalle["Etapa Normalizada"] == "SOFT"].copy()

# 5. Función de clasificación
import numpy as np
def clasificar_diferencia(val):
    if np.isclose(val, 0, atol=1):
        return "Neutral"
    elif val < 0:
        return "Sobregasto"
    else:
        return "Ahorro"

# 6. Aplicar clasificación
df_soft["Estado"] = df_soft["DIFERENCIA vs BUDGET"].apply(clasificar_diferencia)

# 7. Contar por estado
conteo_estado = (
    df_soft["Estado"]
    .value_counts()
    .reset_index()
    .rename(columns={"index": "Estado", "Estado": "Cantidad"})
)

# 8. Mostrar resultados
print("Estados de las partidas Detalle en SOFT:")
display(conteo_estado)


Estados de las partidas Detalle en SOFT:


Unnamed: 0,Cantidad,count
0,Neutral,14
1,Sobregasto,2


In [14]:
import plotly.express as px

# 1. Reconstruir conteo_estado desde df_soft ———
conteo_estado = (
    df_soft["Estado"]
    .value_counts()
    .rename_axis("Estado")
    .reset_index(name="Cantidad")
)

# 2. Gráfico de pastel de estados en SOFT ———
fig = px.pie(
    conteo_estado,
    names="Estado",
    values="Cantidad",
    title="Distribución de Cuentas Detalladas en SOFT",
    hole=0.4,
    color="Estado",
    color_discrete_map={
        "Sobregasto": "#D62728",
        "Ahorro":     "#2CA02C",
        "Neutral":    "#7F7F7F"
    }
)

# 3. Etiquetas y hover
fig.update_traces(
    textinfo="percent+label",
    hovertemplate="<b>%{label}</b><br>Porcentaje: %{percent:.2%}<br>Cuentas: %{value}"
)

fig.show()


# 4. Tabla detallada de SOFT ———
columnas = [
    "ACCT", "Etiqueta", "COST TO DATE", "COMMITMENTS", "TOTAL COSTO",
    "BUDGET", "DIFERENCIA vs BUDGET", "Estado"
]

tabla_detalle_soft = (
    df_soft[columnas]
    .copy()
    .sort_values(by=["Estado", "DIFERENCIA vs BUDGET"])
)

# 5. Formatear montos sin notación exponencial
for col in ["COST TO DATE", "COMMITMENTS", "TOTAL COSTO", "BUDGET", "DIFERENCIA vs BUDGET"]:
    tabla_detalle_soft[col] = tabla_detalle_soft[col].map(lambda x: f"${x:,.2f}")

display(tabla_detalle_soft)


Unnamed: 0,ACCT,Etiqueta,COST TO DATE,COMMITMENTS,TOTAL COSTO,BUDGET,DIFERENCIA vs BUDGET,Estado
56,1202-003,1202-003,"$125,000.00",$0.00,"$125,000.00","$125,000.00",$0.00,Neutral
61,1204-003,1204-003,"$210,000.00",$0.00,"$210,000.00","$210,000.00",$0.00,Neutral
69,1222-008,1222-008,"$50,000.00",$0.00,"$50,000.00","$50,000.00",$0.00,Neutral
483,2001-003,2001-003,"$60,000.00",$0.00,"$60,000.00","$60,000.00",$0.00,Neutral
502,2004-003,2004-003,"$131,250.00",$0.00,"$131,250.00","$131,250.00",$0.00,Neutral
506,2005-003,2005-003,"$31,500.00",$0.00,"$31,500.00","$31,500.00",$0.00,Neutral
540,2010-010,2010-010,"$28,750.00",$0.00,"$28,750.00","$28,750.00",$0.00,Neutral
546,2011-003,2011-003,"$15,000.00",$0.00,"$15,000.00","$15,000.00",$0.00,Neutral
552,2011-011,2011-011,"$12,500.00",$0.00,"$12,500.00","$12,500.00",$0.00,Neutral
558,2011-019,2011-019,"$18,000.00",$0.00,"$18,000.00","$18,000.00",$0.00,Neutral


### ⚖️ Visualización del Balance Real entre Ahorros y Sobregastos

En este análisis se calcula el **balance neto por etapa**, combinando los **ahorros** y los **sobregastos**.  
El resultado permite observar en qué fases del proyecto se logró un equilibrio positivo (ahorro neto) o negativo (sobregasto neto).


In [17]:
# ==================== RESUMEN DE AHORROS Y SOBREGASTOS POR ETAPA ====================

# 1. Filtrar cuentas con ahorro (>0) y sobregasto (<0), y agrupar por etapa
ahorros = (
    df_detalle[df_detalle["DIFERENCIA vs BUDGET"] > 0]
    .groupby("Etapa Normalizada")["DIFERENCIA vs BUDGET"]
    .sum()
)
sobregastos = (
    df_detalle[df_detalle["DIFERENCIA vs BUDGET"] < 0]
    .groupby("Etapa Normalizada")["DIFERENCIA vs BUDGET"]
    .sum()
)

# 2. Combinar resultados en un solo DataFrame
resumen_balance = pd.DataFrame({
    "Ahorros Totales": ahorros,
    "Sobregastos Totales": sobregastos
}).fillna(0)

# 3. Calcular el balance neto (ahorros + sobregastos)
resumen_balance["Balance Neto"] = (
    resumen_balance["Ahorros Totales"] + resumen_balance["Sobregastos Totales"]
)

# 4. Ordenar etapas por balance neto ascendente (mayor sobregasto primero)
resumen_balance = resumen_balance.sort_values(by="Balance Neto")

# 5. Formatear columnas como montos en pesos
for col in ["Ahorros Totales", "Sobregastos Totales", "Balance Neto"]:
    resumen_balance[col] = resumen_balance[col].map(lambda x: f"${x:,.2f}")

# 6. Mostrar tabla final
print("Resumen de Ahorros vs Sobregastos por Etapa:")
display(resumen_balance)


Resumen de Ahorros vs Sobregastos por Etapa:


Unnamed: 0_level_0,Ahorros Totales,Sobregastos Totales,Balance Neto
Etapa Normalizada,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
SHOOT,"$13,038,734.79","$-14,388,276.07","$-1,349,541.28"
PREP,"$997,453.76","$-1,056,115.76","$-58,662.00"
SOFT,$0.00,"$-26,250.00","$-26,250.00"
DEVELOPMENT,"$5,460.01",$-0.09,"$5,459.92"
WRAP,"$651,867.85","$-372,008.90","$279,858.95"
POST,"$1,744,465.53","$-943,044.54","$801,420.99"


In [19]:
# ==================== GRÁFICO DEL BALANCE NETO POR ETAPA ====================

# 1. Copiar DataFrame resumen y preparar datos
bal = resumen_balance.copy()

# 2. Convertir columna 'Balance Neto' a numérico si aún está en formato string con símbolos
if bal['Balance Neto'].dtype == object:
    bal['Balance Neto num'] = (
        bal['Balance Neto']
        .str.replace(r'[\$,]', '', regex=True)
        .astype(float)
    )
else:
    bal['Balance Neto num'] = bal['Balance Neto']

# 3. Resetear índice para convertir la etapa en columna explícita
bal_reset = bal.reset_index()
etapa_col = 'Etapa' if 'Etapa' in bal_reset.columns else bal_reset.columns[0]

# 4. Extraer valores para el gráfico
etapas   = bal_reset[etapa_col]
balances = bal_reset['Balance Neto num']

# 5. Definir colores: verde para ahorro neto, rojo para sobregasto neto
colores = ['#2CA02C' if v >= 0 else '#D62728' for v in balances]

# 6. Crear gráfico de barras verticales
fig = go.Figure(go.Bar(
    x=etapas,
    y=balances,
    marker_color=colores,
    text=[f"${v:,.2f}" for v in balances],
    textposition='outside',
    hovertemplate='<b>%{x}</b><br>Balance Neto: $%{y:,.2f}<extra></extra>'
))

# 7. Ajustes estéticos del gráfico
fig.update_layout(
    title='Balance Presupuestario Neto por Etapa',
    xaxis_title='Etapa',
    yaxis_title='Balance Neto ($)',
    plot_bgcolor='white',
    showlegend=False,
    uniformtext_minsize=8,
    uniformtext_mode='hide',
    margin=dict(b=150)
)

# 8. Mostrar gráfico
fig.show()


## 📋 Tabla Interactiva: Resumen de Producción (Hoja “Summary”)

Se presenta una tabla interactiva basada en la hoja **Summary** del archivo Excel original.  
Este resumen muestra indicadores clave como:

- **Costo a la semana actual**
- **Compromisos**
- **Estimados finales**
- **Presupuesto**
- **Diferencias positivas o negativas**

Características destacadas de la visualización:

- El diseño incluye **colores accesibles para personas con daltonismo**, alternando azul y naranja en los encabezados.
- La columna `VARIANCE $` está coloreada dinámicamente:
  - Azul claro para diferencias positivas (ahorro).
  - Naranja claro para diferencias negativas (sobregasto).
- Los valores numéricos están **formateados con separador de miles**, para facilitar su lectura.

> Esta tabla es útil para presentar un resumen ejecutivo visual, exportar reportes o realizar revisiones rápidas antes de pasar al análisis detallado.


In [24]:
# 1. Carga y limpieza
archivo = "CR EJEMPLO MOD.xlsm"  # ajústalo a tu ruta real
df_raw = pd.read_excel(
    archivo,
    sheet_name="Summary",
    engine="openpyxl",
    header=11  # la fila 12 es tu header real
)

# 2. Eliminamos la primera columna vacía y tomamos solo las 9 primeras columnas
df_tmp = df_raw.drop(columns=[df_raw.columns[0]]).iloc[:, :9]
df_tmp.columns = df_tmp.iloc[0].tolist()   # renombramos con la fila de títulos
df = df_tmp[1:].reset_index(drop=True)     # quitamos esa fila de títulos
df = df.dropna(subset=['Concept'])         # solo filas con Concept

# 3. Filtrar hasta la fila 'TOTAL'
mask = df['Concept'].astype(str).str.strip().str.upper() == 'TOTAL'
if mask.any():
    idx = mask.idxmax()
    df = df.loc[:idx]

# 4. Preparar valores formateados
numeric_cols = [
    "COST TO DATE (CURRENT WEEK)",
    "COMMITMENTS",
    "TOTAL CTD",
    "ESTIMATE TO COMPLETE (ETC)",
    "ESTIMATE FINAL COST (EFC)",
    "BUDGET",
    "VARIANCE $"
]

cells_vals = []
for c in df.columns:
    if c in numeric_cols:
        # formateo con separador de miles, sin decimales
        cells_vals.append([f"{v:,.0f}" for v in df[c].astype(float)])
    else:
        cells_vals.append(df[c].tolist())

# 5. Colores accesibles y atractivos
# Header: alterna azul/naranja (daltonismo-friendly)
header_fill = [
    "lightgrey",  # Concept
    "#1f77b4",    # azul
    "#ff7f0e",    # naranja
    "#1f77b4",
    "#ff7f0e",
    "#1f77b4",
    "#ff7f0e",
    "#1f77b4",
    "#ff7f0e"
]
header_font = ["black"] + ["white"] * (len(header_fill)-1)

# Celdas: fondo blanco, pero VARIANCE $ con azul claro/ naranja claro
cell_fill = []
for c in df.columns:
    if c == "VARIANCE $":
        nums = df[c].astype(float)
        cell_fill.append([
            "#D4E6F1" if x >= 0 else "#FDEBD0"
            for x in nums
        ])
    else:
        cell_fill.append(["white"] * len(df))

# 6. Construcción de la tabla interactiva
fig = go.Figure(data=[go.Table(
    header=dict(
        values=df.columns,
        fill_color=header_fill,
        font_color=header_font,
        align='center',
        font=dict(size=12, family="Arial")
    ),
    cells=dict(
        values=cells_vals,
        fill_color=cell_fill,
        align='center',
        font=dict(size=11, family="Arial")
    )
)])

fig.update_layout(
    width=1000,
    height=350,
    margin=dict(l=20, r=20, t=40, b=20),
    title_text="Resumen interactivo - Summary",
    title_x=0.5
)

fig.show()



Data Validation extension is not supported and will be removed



## 🧮 Visualización Interactiva: Presupuesto vs Gasto

Este dashboard dinámico permite explorar cómo evoluciona el gasto a lo largo del tiempo en relación con el presupuesto, desde distintas dimensiones:

- **Global**: visión general acumulada del gasto total.
- **Etapa**: compara presupuestos y gastos por fase del proyecto (PREP, SHOOT, POST, etc.).
- **Departamento**: analiza el comportamiento por área o sección.
- **Cuenta General**: muestra las 6 cuentas con mayor gasto y agrupa el resto como “Otros”.

Cada visualización es un **gráfico tipo dona (Pie chart)** que:
- Cambia dinámicamente según la **semana seleccionada** (slider).
- Muestra si se mantuvo dentro del presupuesto o hubo **excedente**.
- Colorea automáticamente los segmentos: azul/gastado, rojo/disponible, verde/excedente.

El botón desplegable (dropdown) permite alternar entre las diferentes dimensiones, mientras que el slider permite simular la evolución semana a semana (o ver el acumulado total).

> Esta visualización facilita identificar **en qué momento y en qué área** comenzaron los excesos, y si el proyecto globalmente se mantuvo bajo control.


In [None]:
# 1. Totales rápidos para verificar en consola
suma_budget_final     = df_cost_data_validado["BUDGET"].sum()
suma_cost_total_final = df_cost_data_validado["Cost_Total"].sum()
print("🔍 Totales finales:")
print(f"  Presupuesto Total   : {suma_budget_final:,.2f}")
print(f"  Presupuesto Gastado : {suma_cost_total_final:,.2f}")

# 2. Calculamos “Semana” (cada 7 días → 1 semana) y “Sin Semana Asignada”
df = df_cost_data_validado.copy()
df["Semana"] = df["FECHA_NUM_LIMPIA"].dropna().astype(int) // 7
df["Semana"] = df["Semana"].astype("Int64")
df["SemanaCat"] = df["Semana"].astype(str).fillna("Sin Semana Asignada")

# 3. Rango de semanas (0 … max_week) + índice extra para “Todas las Semanas”
max_week = int(df["Semana"].dropna().max()) if not df["Semana"].dropna().empty else 0

# 4. Presupuesto global
budget_total = df["BUDGET"].sum()

# 5. Presupuesto por dimensión
budget_by_etapa = df.groupby("Etapa Normalizada")["BUDGET"].sum().to_dict()
budget_by_dep   = df.groupby("Sección")["BUDGET"].sum().to_dict()
budget_by_cg    = df.groupby("Cuenta General")["BUDGET"].sum().to_dict()

# 6. Gasto acumulado por semana (Global)
spent_cum_total = {}
for w in range(0, max_week + 1):
    segmento = df[((df["Semana"].notna()) & (df["Semana"] <= w)) | (df["Semana"].isna())]
    spent_cum_total[w] = segmento["Cost_Total"].sum()
# Índice “Todas las Semanas” = max_week + 1
spent_cum_total[max_week + 1] = df["Cost_Total"].sum()

# 7. Función: gasto acumulado por dimensión “dim_col” hasta la semana w
def spent_cum_by_dim(dim_col, w):
    segmento = df[((df["Semana"].notna()) & (df["Semana"] <= w)) | (df["Semana"].isna())]
    return segmento.groupby(dim_col)["Cost_Total"].sum().to_dict()

# 8. Categorías ordenadas (Etapas y Departamentos)
cats_etapa = sorted(budget_by_etapa.keys())
cats_dep   = sorted(budget_by_dep.keys())

# 9. Paletas de color para Etapa y Departamento
paleta_etapas = px.colors.qualitative.Plotly
colors_etapas = [paleta_etapas[i % len(paleta_etapas)] for i in range(len(cats_etapa))]

paleta_dep = px.colors.qualitative.D3
colors_dep = [paleta_dep[i % len(paleta_dep)] for i in range(len(cats_dep))]

# 10. Creamos la figura vacía
fig = go.Figure()

# ============================================================
# 10.1. TRAZO GLOBAL inicial (w0 = 0)
# ============================================================
w0 = 0
spent0_total = spent_cum_total[w0]

if spent0_total <= budget_total:
    labels_g0 = ["Gastado", "Disponible"]
    vals_g0   = [spent0_total, budget_total - spent0_total]
    colors_g0 = ["#636efa", "#ef553b"]
    # Texto de Global en w0
    txt_g0_0 = "Global"
    txt_g0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        f"Gasto Total : ${spent0_total:,.2f}<br>"
        f"Disponible : ${budget_total - spent0_total:,.2f}"
    )
else:
    exced0 = spent0_total - budget_total
    labels_g0 = ["Presupuesto Agotado", "Excedente"]
    vals_g0   = [budget_total, exced0]
    colors_g0 = ["#636efa", "#00cc96"]
    txt_g0_0 = "Global"
    txt_g0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        f"Gasto Total : ${spent0_total:,.2f}<br>"
        f"Excedido : ${exced0:,.2f}"
    )

fig.add_trace(
    go.Pie(
        labels=labels_g0,
        values=vals_g0,
        name="Global",
        hole=0.5,
        sort=False,
        textinfo="label+percent",
        marker=dict(colors=colors_g0, line=dict(color="#FFFFFF", width=2)),
        visible=True,
        domain={"x": [0, 1], "y": [0, 1]}
    )
)

# ============================================================
# 10.2. TRAZO ETAPA inicial (w0 = 0)
# ============================================================
spent0_etapa = spent_cum_by_dim("Etapa Normalizada", w0)
labels_e0 = []
vals_e0   = []
for etapa in cats_etapa:
    spent_e = spent0_etapa.get(etapa, 0.0)
    budget_e = budget_by_etapa.get(etapa, 0.0)
    etiqueta = etapa
    if spent_e > budget_e:
        etiqueta += " (EXCESO)"
    labels_e0.append(etiqueta)
    vals_e0.append(spent_e)

if spent0_total <= budget_total:
    labels_e0 = labels_e0 + ["Disponible"]
    vals_e0   = vals_e0 + [budget_total - spent0_total]
    colors_e0 = colors_etapas + ["#ef553b"]
    txt_e0_0 = "Etapas"
    txt_e0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{e_nm}: ${spent0_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
        f"Disponible : ${budget_total - spent0_total:,.2f}"
    )
else:
    exced0 = spent0_total - budget_total
    labels_e0 = labels_e0 + ["Presupuesto Agotado", "Excedente"]
    vals_e0   = vals_e0 + [0, exced0]
    colors_e0 = colors_etapas + ["#636efa", "#00cc96"]
    txt_e0_0 = "Etapas"
    txt_e0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{e_nm}: ${spent0_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
        f"Excedido : ${exced0:,.2f}"
    )

fig.add_trace(
    go.Pie(
        labels=labels_e0,
        values=vals_e0,
        name="Etapa",
        hole=0.5,
        sort=False,
        textinfo="label+percent",
        marker=dict(colors=colors_e0, line=dict(color="#FFFFFF", width=2)),
        visible=False,
        domain={"x": [0, 1], "y": [0, 1]}
    )
)

# ============================================================
# 10.3. TRAZO DEPARTAMENTO inicial (w0 = 0)
# ============================================================
spent0_dep = spent_cum_by_dim("Sección", w0)
labels_d0 = []
vals_d0   = []
for dep in cats_dep:
    spent_d = spent0_dep.get(dep, 0.0)
    budget_d = budget_by_dep.get(dep, 0.0)
    etiqueta = dep
    if spent_d > budget_d:
        etiqueta += " (EXCESO)"
    labels_d0.append(etiqueta)
    vals_d0.append(spent_d)

if spent0_total <= budget_total:
    labels_d0 = labels_d0 + ["Disponible"]
    vals_d0   = vals_d0 + [budget_total - spent0_total]
    colors_d0 = colors_dep + ["#ef553b"]
    txt_d0_0 = "Departamento"
    txt_d0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{d_nm}: ${spent0_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
        f"Disponible : ${budget_total - spent0_total:,.2f}"
    )
else:
    exced0 = spent0_total - budget_total
    labels_d0 = labels_d0 + ["Presupuesto Agotado", "Excedente"]
    vals_d0   = vals_d0 + [0, exced0]
    colors_d0 = colors_dep + ["#636efa", "#00cc96"]
    txt_d0_0 = "Departamento"
    txt_d0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{d_nm}: ${spent0_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
        f"Excedido : ${exced0:,.2f}"
    )

fig.add_trace(
    go.Pie(
        labels=labels_d0,
        values=vals_d0,
        name="Departamento",
        hole=0.5,
        sort=False,
        textinfo="label+percent",
        marker=dict(colors=colors_d0, line=dict(color="#FFFFFF", width=2)),
        visible=False,
        domain={"x": [0, 1], "y": [0, 1]}
    )
)

# ============================================================
# 10.4. TRAZO CUENTA GENERAL inicial (w0 = 0) – Top 6 + “Otros”
# ============================================================
spent0_cg = spent_cum_by_dim("Cuenta General", w0)
cg_sorted = sorted(spent0_cg.items(), key=lambda x: x[1], reverse=True)
top6_cg  = [x[0] for x in cg_sorted[:6]]
otros_cg = [x[0] for x in cg_sorted[6:]]

labels_cg0 = []
vals_cg0   = []
for cg_nm in top6_cg:
    spent_c = spent0_cg.get(cg_nm, 0.0)
    budget_c = budget_by_cg.get(cg_nm, 0.0)
    etiqueta = cg_nm
    if spent_c > budget_c:
        etiqueta += " (EXCESO)"
    labels_cg0.append(etiqueta)
    vals_cg0.append(spent_c)

sum_spent_otros0  = sum(spent0_cg[c] for c in otros_cg)
sum_budget_otros0 = sum(budget_by_cg.get(c, 0.0) for c in otros_cg)
etq_otros0 = "Otros"
if sum_spent_otros0 > sum_budget_otros0:
    etq_otros0 += " (EXCESO)"
labels_cg0.append(etq_otros0)
vals_cg0.append(sum_spent_otros0)

if spent0_total <= budget_total:
    labels_cg0 = labels_cg0 + ["Disponible"]
    vals_cg0   = vals_cg0 + [budget_total - spent0_total]
    paleta_cg  = px.colors.qualitative.Plotly
    colors_cg0 = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_cg))] + ["#d3d3d3", "#ef553b"]
    txt_cg0_0 = "Cuenta General"
    txt_cg0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{cg_nm}: ${spent0_cg.get(cg_nm,0.0):,.2f}<br>" for cg_nm in top6_cg]) +
        f"Otros: ${sum_spent_otros0:,.2f}<br>"
        f"Disponible : ${budget_total - spent0_total:,.2f}"
    )
else:
    exced0 = spent0_total - budget_total
    labels_cg0 = labels_cg0 + ["Presupuesto Agotado", "Excedente"]
    vals_cg0   = vals_cg0 + [0, exced0]
    paleta_cg  = px.colors.qualitative.Plotly
    colors_cg0 = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_cg))] + ["#d3d3d3", "#636efa", "#00cc96"]
    txt_cg0_0 = "Cuenta General"
    txt_cg0_1 = (
        f"Semana : {w0}<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{cg_nm}: ${spent0_cg.get(cg_nm,0.0):,.2f}<br>" for cg_nm in top6_cg]) +
        f"Otros: ${sum_spent_otros0:,.2f}<br>"
        f"Excedido : ${exced0:,.2f}"
    )

fig.add_trace(
    go.Pie(
        labels=labels_cg0,
        values=vals_cg0,
        name="Cuenta General",
        hole=0.5,
        sort=False,
        textinfo="label+percent",
        marker=dict(colors=colors_cg0, line=dict(color="#FFFFFF", width=2)),
        visible=False,
        domain={"x": [0, 1], "y": [0, 1]}
    )
)

# ============================================================
# 11. DEFINICIÓN DE LAS 8 anotaciones “fijas” (dos por dimensión)
#    indices: 0–1 = Global, 2–3 = Etapa, 4–5 = Departamento, 6–7 = Cuenta General
# ============================================================
annotations = [
    # 0: Global – Título central
    dict(text=txt_g0_0, x=0.5, y=0.5, font_size=20, showarrow=False, visible=True),
    # 1: Global – Texto informativo izquierda
    dict(text=txt_g0_1, x=-0.25, y=0.5, xanchor="left", yanchor="middle", font_size=14, showarrow=False, visible=True),
    # 2: Etapa – Título central (invisible al inicio)
    dict(text=txt_e0_0, x=0.5, y=0.5, font_size=20, showarrow=False, visible=False),
    # 3: Etapa – Texto informativo izquierda (invisible al inicio)
    dict(text=txt_e0_1, x=-0.25, y=0.5, xanchor="left", yanchor="middle", font_size=14, showarrow=False, visible=False),
    # 4: Departamento – Título central (invisible al inicio)
    dict(text=txt_d0_0, x=0.5, y=0.5, font_size=20, showarrow=False, visible=False),
    # 5: Departamento – Texto informativo izquierda (invisible al inicio)
    dict(text=txt_d0_1, x=-0.25, y=0.5, xanchor="left", yanchor="middle", font_size=14, showarrow=False, visible=False),
    # 6: Cuenta General – Título central (invisible al inicio)
    dict(text=txt_cg0_0, x=0.5, y=0.5, font_size=20, showarrow=False, visible=False),
    # 7: Cuenta General – Texto informativo izquierda (invisible al inicio)
    dict(text=txt_cg0_1, x=-0.25, y=0.5, xanchor="left", yanchor="middle", font_size=14, showarrow=False, visible=False)
]

fig.update_layout(annotations=annotations)

# ============================================================
# 12. BOTONES DEL DROPDOWN (Global, Etapa, Departamento, Cuenta General)
#    Cada botón: enciende su trazo y sus 2 anotaciones, apaga los demás.
# ============================================================
dropdown_buttons = []
dims = ["Global", "Etapa", "Departamento", "Cuenta General"]
for i, dim in enumerate(dims):
    # Visible_ pies:
    visible_traces = [False] * 4
    visible_traces[i] = True

    # Visible_ anotaciones (2 por dimensión)
    visible_anns = [False] * 8
    visible_anns[2*i]   = True    # título
    visible_anns[2*i+1] = True    # texto informativo

    dropdown_buttons.append({
        "label": dim,
        "method": "update",
        "args": [
            {"visible": visible_traces},
            {
                "title": f"Presupuesto vs Gasto – {dim}",
                # Cambiamos sólo la propiedad “visible” de cada anotación
                "annotations": [
                    dict(annotation, visible=visible_anns[idx])
                    for idx, annotation in enumerate(annotations)
                ]
            }
        ]
    })

# ============================================================
# 13. SLIDER DE SEMANAS (0 … max_week + “Todas”)
#    Aquí: actualiza values, labels, colors, title y ANOTATIONS[].text
# ============================================================
slider_steps = []
for w in range(0, max_week + 1):
    # ----- 13.1. Global a semana w -----
    spent_w_total = spent_cum_total[w]
    if spent_w_total <= budget_total:
        labels_g = ["Gastado", "Disponible"]
        vals_g   = [spent_w_total, budget_total - spent_w_total]
        colors_g = ["#636efa", "#ef553b"]
        txt_g0 = "Global"
        txt_g1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            f"Gasto Total : ${spent_w_total:,.2f}<br>"
            f"Disponible : ${budget_total - spent_w_total:,.2f}"
        )
    else:
        exced_w = spent_w_total - budget_total
        labels_g = ["Presupuesto Agotado", "Excedente"]
        vals_g   = [budget_total, exced_w]
        colors_g = ["#636efa", "#00cc96"]
        txt_g0 = "Global"
        txt_g1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            f"Gasto Total : ${spent_w_total:,.2f}<br>"
            f"Excedido : ${exced_w:,.2f}"
        )

    # ----- 13.2. Etapa a semana w -----
    spent_w_etapa = spent_cum_by_dim("Etapa Normalizada", w)
    labels_e = []
    vals_e   = []
    for etapa in cats_etapa:
        spent_e = spent_w_etapa.get(etapa, 0.0)
        budget_e = budget_by_etapa.get(etapa, 0.0)
        etiqueta = etapa
        if spent_e > budget_e:
            etiqueta += " (EXCESO)"
        labels_e.append(etiqueta)
        vals_e.append(spent_e)
    if spent_w_total <= budget_total:
        labels_e = labels_e + ["Disponible"]
        vals_e   = vals_e + [budget_total - spent_w_total]
        colors_e = colors_etapas + ["#ef553b"]
        txt_e0 = "Etapas"
        txt_e1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{e_nm}: ${spent_w_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
            f"Disponible : ${budget_total - spent_w_total:,.2f}"
        )
    else:
        exced_w = spent_w_total - budget_total
        labels_e = labels_e + ["Presupuesto Agotado", "Excedente"]
        vals_e   = vals_e + [0, exced_w]
        colors_e = colors_etapas + ["#636efa", "#00cc96"]
        txt_e0 = "Etapas"
        txt_e1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{e_nm}: ${spent_w_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
            f"Excedido : ${exced_w:,.2f}"
        )

    # ----- 13.3. Departamento a semana w -----
    spent_w_dep = spent_cum_by_dim("Sección", w)
    labels_d = []
    vals_d   = []
    for dep in cats_dep:
        spent_d = spent_w_dep.get(dep, 0.0)
        budget_d = budget_by_dep.get(dep, 0.0)
        etiqueta = dep
        if spent_d > budget_d:
            etiqueta += " (EXCESO)"
        labels_d.append(etiqueta)
        vals_d.append(spent_d)
    if spent_w_total <= budget_total:
        labels_d = labels_d + ["Disponible"]
        vals_d   = vals_d + [budget_total - spent_w_total]
        colors_d = colors_dep + ["#ef553b"]
        txt_d0 = "Departamento"
        txt_d1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{d_nm}: ${spent_w_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
            f"Disponible : ${budget_total - spent_w_total:,.2f}"
        )
    else:
        exced_w = spent_w_total - budget_total
        labels_d = labels_d + ["Presupuesto Agotado", "Excedente"]
        vals_d   = vals_d + [0, exced_w]
        colors_d = colors_dep + ["#636efa", "#00cc96"]
        txt_d0 = "Departamento"
        txt_d1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{d_nm}: ${spent_w_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
            f"Excedido : ${exced_w:,.2f}"
        )

    # ----- 13.4. Cuenta General a semana w (Top 6 + “Otros”) -----
    spent_w_cg = spent_cum_by_dim("Cuenta General", w)
    cg_sorted_w = sorted(spent_w_cg.items(), key=lambda x: x[1], reverse=True)
    top6_w  = [x[0] for x in cg_sorted_w[:6]]
    otros_w = [x[0] for x in cg_sorted_w[6:]]
    labels_cg = []
    vals_cg   = []
    for cg_nm in top6_w:
        spent_c = spent_w_cg.get(cg_nm, 0.0)
        budget_c = budget_by_cg.get(cg_nm, 0.0)
        etiqueta = cg_nm
        if spent_c > budget_c:
            etiqueta += " (EXCESO)"
        labels_cg.append(etiqueta)
        vals_cg.append(spent_c)
    sum_spent_otros = sum(spent_w_cg[c] for c in otros_w)
    sum_budget_otros = sum(budget_by_cg.get(c, 0.0) for c in otros_w)
    etq_otros = "Otros"
    if sum_spent_otros > sum_budget_otros:
        etq_otros += " (EXCESO)"
    labels_cg.append(etq_otros)
    vals_cg.append(sum_spent_otros)

    if spent_w_total <= budget_total:
        labels_cg = labels_cg + ["Disponible"]
        vals_cg   = vals_cg + [budget_total - spent_w_total]
        paleta_cg  = px.colors.qualitative.Plotly
        colors_cg  = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_w))] + ["#d3d3d3", "#ef553b"]
        txt_cg0 = "Cuenta General"
        txt_cg1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{cn}: ${spent_w_cg.get(cn,0.0):,.2f}<br>" for cn in top6_w]) +
            f"Otros: ${sum_spent_otros:,.2f}<br>"
            f"Disponible : ${budget_total - spent_w_total:,.2f}"
        )
    else:
        exced_w = spent_w_total - budget_total
        labels_cg = labels_cg + ["Presupuesto Agotado", "Excedente"]
        vals_cg   = vals_cg + [0, exced_w]
        paleta_cg = px.colors.qualitative.Plotly
        colors_cg = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_w))] + ["#d3d3d3", "#636efa", "#00cc96"]
        txt_cg0 = "Cuenta General"
        txt_cg1 = (
            f"Semana : {w}<br>"
            f"Presupuesto Total : ${budget_total:,.2f}<br>"
            + "".join([f"{cn}: ${spent_w_cg.get(cn,0.0):,.2f}<br>" for cn in top6_w]) +
            f"Otros: ${sum_spent_otros:,.2f}<br>"
            f"Excedido : ${exced_w:,.2f}"
        )

    # ----- 13.5. Construcción del “step” para la semana = w -----
    step = {
        "label": f"{w}",
        "method": "update",
        "args": [
            {
                # Actualizamos los 4 “values” (Global, Etapa, Departamento, CG)
                "values": [
                    vals_g,    # trace 0
                    vals_e,    # trace 1
                    vals_d,    # trace 2
                    vals_cg    # trace 3
                ],
                # Actualizamos las 4 “labels”
                "labels": [
                    labels_g,  # trace 0
                    labels_e,  # trace 1
                    labels_d,  # trace 2
                    labels_cg  # trace 3
                ],
                # Actualizamos “marker.colors” de los 4 trazos
                "marker.colors": [
                    colors_g,  # trace 0
                    colors_e,  # trace 1
                    colors_d,  # trace 2
                    colors_cg  # trace 3
                ]
            },
            {
                # Actualizamos el título y los textos de las anotaciones (txt_g0, txt_g1, etc.)
                "title": f"Presupuesto vs Gasto – Semana ≤ {w}",
                # Sólo cambiamos el .text de cada anotación, no tocamos .visible
                "annotations[0].text": txt_g0,
                "annotations[1].text": txt_g1,
                "annotations[2].text": txt_e0,
                "annotations[3].text": txt_e1,
                "annotations[4].text": txt_d0,
                "annotations[5].text": txt_d1,
                "annotations[6].text": txt_cg0,
                "annotations[7].text": txt_cg1
            }
        ]
    }
    slider_steps.append(step)

# ------------------------------------------------------------
# 13.b IS (max_week + 1) = “Todas las Semanas”
# ------------------------------------------------------------
w_all = max_week + 1
spent_all_total = spent_cum_total[w_all]

# – Global “Todas” –
if spent_all_total <= budget_total:
    labels_g_all = ["Gastado", "Disponible"]
    vals_g_all   = [spent_all_total, budget_total - spent_all_total]
    colors_g_all = ["#636efa", "#ef553b"]
    txt_g0_all = "Global"
    txt_g1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        f"Gasto Total : ${spent_all_total:,.2f}<br>"
        f"Disponible : ${budget_total - spent_all_total:,.2f}"
    )
else:
    exced_all    = spent_all_total - budget_total
    labels_g_all = ["Presupuesto Agotado", "Excedente"]
    vals_g_all   = [budget_total, exced_all]
    colors_g_all = ["#636efa", "#00cc96"]
    txt_g0_all = "Global"
    txt_g1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        f"Gasto Total : ${spent_all_total:,.2f}<br>"
        f"Excedido : ${exced_all:,.2f}"
    )

# – Etapa “Todas” –
spent_all_etapa = spent_cum_by_dim("Etapa Normalizada", w_all)
labels_e_all = []
vals_e_all   = []
for etapa in cats_etapa:
    spent_e = spent_all_etapa.get(etapa, 0.0)
    budget_e = budget_by_etapa.get(etapa, 0.0)
    etiqueta = etapa
    if spent_e > budget_e:
        etiqueta += " (EXCESO)"
    labels_e_all.append(etiqueta)
    vals_e_all.append(spent_e)
if spent_all_total <= budget_total:
    labels_e_all = labels_e_all + ["Disponible"]
    vals_e_all   = vals_e_all + [budget_total - spent_all_total]
    colors_e_all = colors_etapas + ["#ef553b"]
    txt_e0_all = "Etapas"
    txt_e1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{e_nm}: ${spent_all_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
        f"Disponible : ${budget_total - spent_all_total:,.2f}"
    )
else:
    exced_all   = spent_all_total - budget_total
    labels_e_all = labels_e_all + ["Presupuesto Agotado", "Excedente"]
    vals_e_all   = vals_e_all + [0, exced_all]
    colors_e_all = colors_etapas + ["#636efa", "#00cc96"]
    txt_e0_all = "Etapas"
    txt_e1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{e_nm}: ${spent_all_etapa.get(e_nm,0.0):,.2f}<br>" for e_nm in cats_etapa]) +
        f"Excedido : ${exced_all:,.2f}"
    )

# – Departamento “Todas” –
spent_all_dep = spent_cum_by_dim("Sección", w_all)
labels_d_all = []
vals_d_all   = []
for dep in cats_dep:
    spent_d = spent_all_dep.get(dep, 0.0)
    budget_d = budget_by_dep.get(dep, 0.0)
    etiqueta = dep
    if spent_d > budget_d:
        etiqueta += " (EXCESO)"
    labels_d_all.append(etiqueta)
    vals_d_all.append(spent_d)
if spent_all_total <= budget_total:
    labels_d_all = labels_d_all + ["Disponible"]
    vals_d_all   = vals_d_all + [budget_total - spent_all_total]
    colors_d_all = colors_dep + ["#ef553b"]
    txt_d0_all = "Departamento"
    txt_d1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{d_nm}: ${spent_all_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
        f"Disponible : ${budget_total - spent_all_total:,.2f}"
    )
else:
    exced_all   = spent_all_total - budget_total
    labels_d_all = labels_d_all + ["Presupuesto Agotado", "Excedente"]
    vals_d_all   = vals_d_all + [0, exced_all]
    colors_d_all = colors_dep + ["#636efa", "#00cc96"]
    txt_d0_all = "Departamento"
    txt_d1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{d_nm}: ${spent_all_dep.get(d_nm,0.0):,.2f}<br>" for d_nm in cats_dep]) +
        f"Excedido : ${exced_all:,.2f}"
    )

# – Cuenta General “Todas” –
spent_all_cg = spent_cum_by_dim("Cuenta General", w_all)
cg_sorted_all = sorted(spent_all_cg.items(), key=lambda x: x[1], reverse=True)
top6_all  = [x[0] for x in cg_sorted_all[:6]]
otros_all = [x[0] for x in cg_sorted_all[6:]]

labels_cg_all = []
vals_cg_all   = []
for cg_nm in top6_all:
    spent_c  = spent_all_cg.get(cg_nm, 0.0)
    budget_c = budget_by_cg.get(cg_nm, 0.0)
    etiqueta = cg_nm
    if spent_c > budget_c:
        etiqueta += " (EXCESO)"
    labels_cg_all.append(etiqueta)
    vals_cg_all.append(spent_c)

sum_spent_otros_all  = sum(spent_all_cg[c] for c in otros_all)
sum_budget_otros_all = sum(budget_by_cg.get(c, 0.0) for c in otros_all)
etq_otros_all = "Otros"
if sum_spent_otros_all > sum_budget_otros_all:
    etq_otros_all += " (EXCESO)"
labels_cg_all.append(etq_otros_all)
vals_cg_all.append(sum_spent_otros_all)

if spent_all_total <= budget_total:
    labels_cg_all = labels_cg_all + ["Disponible"]
    vals_cg_all   = vals_cg_all + [budget_total - spent_all_total]
    paleta_cg     = px.colors.qualitative.Plotly
    colors_cg_all = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_all))] + ["#d3d3d3", "#ef553b"]
    txt_cg0_all = "Cuenta General"
    txt_cg1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{cn}: ${spent_all_cg.get(cn,0.0):,.2f}<br>" for cn in top6_all]) +
        f"Otros: ${sum_spent_otros_all:,.2f}<br>"
        f"Disponible : ${budget_total - spent_all_total:,.2f}"
    )
else:
    exced_all   = spent_all_total - budget_total
    labels_cg_all = labels_cg_all + ["Presupuesto Agotado", "Excedente"]
    vals_cg_all   = vals_cg_all + [0, exced_all]
    paleta_cg     = px.colors.qualitative.Plotly
    colors_cg_all = [paleta_cg[i % len(paleta_cg)] for i in range(len(top6_all))] + ["#d3d3d3", "#636efa", "#00cc96"]
    txt_cg0_all = "Cuenta General"
    txt_cg1_all = (
        f"Semana : Todas<br>"
        f"Presupuesto Total : ${budget_total:,.2f}<br>"
        + "".join([f"{cn}: ${spent_all_cg.get(cn,0.0):,.2f}<br>" for cn in top6_all]) +
        f"Otros: ${sum_spent_otros_all:,.2f}<br>"
        f"Excedido : ${exced_all:,.2f}"
    )

step_all = {
    "label": "Todas",
    "method": "update",
    "args": [
        {
            "values": [
                vals_g_all,   # trace 0 = Global
                vals_e_all,   # trace 1 = Etapa
                vals_d_all,   # trace 2 = Departamento
                vals_cg_all   # trace 3 = Cuenta General
            ],
            "labels": [
                labels_g_all,   # trace 0
                labels_e_all,   # trace 1
                labels_d_all,   # trace 2
                labels_cg_all   # trace 3
            ],
            "marker.colors": [
                colors_g_all,   # trace 0
                colors_e_all,   # trace 1
                colors_d_all,   # trace 2
                colors_cg_all   # trace 3
            ]
        },
        {
            "title": "Presupuesto vs Gasto – Todas las Semanas",
            # Sólo actualizamos .text de cada anotación, NO tocamos visible:
            "annotations[0].text": txt_g0_all,
            "annotations[1].text": txt_g1_all,
            "annotations[2].text": txt_e0_all,
            "annotations[3].text": txt_e1_all,
            "annotations[4].text": txt_d0_all,
            "annotations[5].text": txt_d1_all,
            "annotations[6].text": txt_cg0_all,
            "annotations[7].text": txt_cg1_all
        }
    ]
}
slider_steps.append(step_all)

# ============================================================
# 14. CONFIGURAR LAYOUT con DROPDOWN + SLIDER
# ============================================================
fig.update_layout(
    title="Presupuesto vs Gasto – Global",
    showlegend=True,
    updatemenus=[{
        "active": 0,
        "buttons": dropdown_buttons,
        "x": 0.0,
        "y": 1.15,
        "xanchor": "left",
        "yanchor": "top"
    }],
    sliders=[{
        "active": 0,
        "pad": {"t": 50},
        "currentvalue": {"prefix": "Semana ≤ "},
        "steps": slider_steps
    }],
    annotations=annotations   # Lista inicial de 8 anotaciones
)

# 15. Mostrar la figura interactiva
pio.show(fig)


🔍 Totales finales:
  Presupuesto Total   : 135,097,911.00
  Presupuesto Gastado : 135,445,624.41
