In [None]:
# ─────────────────────────────────────────────────────────────
# 📦 IMPORTACIÓN DE LIBRERÍAS - RECONFIGURACIONES INNOVA
# ─────────────────────────────────────────────────────────────

# 📊 Procesamiento y visualización de datos
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
import seaborn as sns

# 🗃️ Conexión a bases de datos
import pyodbc
from sqlalchemy import create_engine

# # 🤖 Inteligencia Artificial / OpenAI
# import openai
# from openai import OpenAI

# 🧰 Utilidades del sistema
import os
import re
import base64
import re
import unicodedata
from datetime import datetime
# from dotenv import load_dotenv

# 📓 Entorno Jupyter Notebook
import nbformat
from IPython.display import display, Markdown

# 🌐 Web scraping y análisis de HTML
from bs4 import BeautifulSoup

# 📝 Conversión y renderizado de Markdown
import markdown2



In [None]:
# # Ruta al archivo .env (ajusta si tu archivo está en otra carpeta)
# load_dotenv("pass.env")
# # Acceder a las variables
# openai.api_key = os.getenv("key")
# assistant_id = os.getenv("assistant").strip()
# # (Opcional) Verifica que se cargó correctamente (no muestres en producción)
# print("🔐 Clave cargada:", openai.api_key[:10] + "...")

# client = OpenAI(api_key=openai.api_key)
# thread = client.beta.threads.create()

In [None]:
# Función para guardar gráficos automáticamente
def guardar_grafico(fig, idx):
    output_dir = "maquetas/img"
    os.makedirs(output_dir, exist_ok=True)
    ruta = os.path.join(output_dir, f"grafico_{idx}.png")
    fig.savefig(ruta, dpi=150, bbox_inches='tight')
    print(f"✅ Guardado automático: {ruta}")

In [None]:
# Consulta SQL para extraer las columnas requeridas
sql_query = """
SELECT "Código", "Nombre Ejecutivo Técnico"
FROM innova_sgp_Carga.dbo.snapshot_proyectos
WHERE Gerencia='Innovación';
"""

# Establecer la cadena de conexión a la base de datos SQL Server
connection_string = (
    "Driver={ODBC Driver 18 for SQL Server};"
    "Uid=user_seg;Pwd=user_seg;"
    "Server=ddssql11-avs\\orion;Port=1972;"
    "Database=innova_sgp_Carga;Encrypt=No;TrustServerCertificate=No"
)

# Conectar a la base de datos
con = pyodbc.connect(connection_string, timeout=10)

# Ejecutar la consulta y guardar el resultado en un DataFrame
datos_proyecto = pd.read_sql_query(sql_query, con)

# Limpiar los datos en el DataFrame
datos_proyecto = datos_proyecto.apply(lambda x: x.str.strip() if x.dtype == "object" else x)
datos_proyecto = datos_proyecto.applymap(lambda x: None if x == "" or x == "NA" else x)

# Renombrar las columnas para que sigan las convenciones de nombres en Python
datos_proyecto.columns = datos_proyecto.columns.str.replace(" ", "_").str.replace("ñ", "n")

con.close()

# Ver el resultado
print(datos_proyecto)

In [None]:
# Guarda en un dataframe el resultado de datos_proyecto
df = datos_proyecto.copy()

In [None]:
df = df[df["Nombre_Ejecutivo_Técnico"].isin([
    "JEREMY ANTONIO SALAS VENEGAS", 
    "JEANETTE ALEJANDRA MUNDACA DESPECCI", 
    "MARIA JOSE MORAGA CASTRO",
    "MARTA ESTHER  MINA AVENDANO", 
    "JUAN CARLOS CASTRO CABEZAS",
    "BARBARA SOL PARRAGUE GUZMAN", 
    "PAULA CAMILA DURÁN ABURTO",
    "JAIME TORRES MUÑOZ", 
    "Hugo Jara Vargas",
    "CRISTOFER ANTONIO MONSALVE SEPULVEDA", 
    "DIEGO IGNACIO VILLALOBOS RAMOS VILLALOBOS RAMOS",
    "JAVIERA DEL PILAR GOMEZ MURUA", 
    "JUAN MARTINEZ F.", 
    "PABLO GAETE HALLER",
    "CHRISTOPHER ANDRES VIVANCO BARRA", 
    "Lisette Espinoza", 
    "JUAN PABLO ALVAREZ CERECEDA",
    "SEBASTIAN  JILBERTO", 
    "YESSENNIA ESPINOZA", 
    "ALEJANDRO  LEMUS",
    "JAIME TORRES MUÑOZ", 
    "ANDRES SALVADOR LEAL VILCHES",
    "MARIA BELEN RAMIREZ BUNSTER"
])]

In [None]:
# resetea el indice al dataframe df
df.reset_index(drop=True, inplace=True)
df

In [None]:
# Generar un dataframe a partir de esta ruta de acceso "C:\Users\esteban.berrios\OneDrive - corfo.cl\Documentos - SUBDIRECCIÓN DE MEJORA CONTINUA\General\Reconfiguraciones\BD Reconfiguraciones 2024.xlsx" y que solo se lea la hoja de trabajo "BD Reconfiguraciones 2024"
df_reconfiguraciones = pd.read_excel(
    r"C:\Users\esteban.berrios\OneDrive - corfo.cl\Documentos - SUBDIRECCIÓN DE MEJORA CONTINUA\Configuraciones y Reconfiguraciones\Reconfiguraciones\BD Reconfiguraciones 2024.xlsx",
    sheet_name="BBDD Reconfiguraciones"
)

In [None]:
# Eliminar las filas que tengan la columna vacia "Código Proyecto"
df_reconfiguraciones = df_reconfiguraciones[df_reconfiguraciones["Código Proyecto"].notna()]

In [None]:
#Obtener las siguientes columnas del dataframe df_reconfiguraciones
# "Código Proyecto", "Tipo Notificación", "N° Oficialización", "Fecha", "Año", "Instrumento", "Ejecutivo MC", "Situación (uso interno MC)", "Casuisticas errores en solicitudes"

df_reconfiguraciones = df_reconfiguraciones[
    [
        "Código Proyecto",
        "Tipo Notificación",
        "N° Oficialización",
        "Fecha",
        "Año",
        "Instrumento",
        "Ejecutivo MC",
        "Situación (uso interno MC)",
        "Casuisticas errores en solicitudes"
    ]
]

In [None]:
df_reconfiguraciones

In [None]:
df_reporte = pd.merge(df,df_reconfiguraciones,left_on='Código',right_on='Código Proyecto',how='left'
)

In [None]:
df_reporte.drop(columns=['Código Proyecto'], inplace=True)

In [None]:
df_reporte

In [None]:
# Eliminar las filas que tengan la columna vacia "Código Proyecto"
df_reporte = df_reporte[df_reporte["N° Oficialización"].notna()]

In [None]:
"""
# Explicación:
Este bloque de código asigna proyectos específicos a la ejecutiva técnica "PAULA CAMILA DURÁN ABURTO" en el DataFrame df_reporte.

"""
# Lista de proyectos a asignar a PAULA CAMILA DURÁN ABURTO
proyectos_paula = [
    "24CVCS-255709", "24CVI-264683", "24IAT-267528", "24CVCS-256022",
    "24CVCS-255764", "24CVIS-255842", "24CVCS-255984", "24CVCS-255846",
    "24CVI-265016", "24CVIS-255935", "24CVIS-255786", "24CVCS-255807",
    "24CVC-264562", "24CVIS-255922", "24CVIS-255825", "24CVI-264982",
    "24CVCS-255996", "24CVI-264653", "24CVIS-255705", "24IAT-267198",
    "24CVIS-255868", "23IATS-248301", "24CVI-264684", "24CVIS-255890",
    "24CVCS-255784", "24CVCS-255945", "24IAT-272787", "24CVI-264878",
    "24IAT-272736", "24CVIS-255832", "24CVCS-255736", "24CVIS-255755",
    "24CVC-265029", "24CVCS-256030", "23CYE-241031", "23CVI2-251478",
    "24CVCS-255822", "24CVI-264699", "24CVIS-255823"
]

# Asignar el nombre a esos proyectos en df_reporte
df_reporte.loc[df_reporte["Código"].isin(proyectos_paula), "Nombre_Ejecutivo_Técnico"] = "PAULA CAMILA DURÁN ABURTO"

In [None]:
# Se carga base  de los ejecutivos espejo que reeemplazan a Paula Durán
df_ejecutivo = pd.read_excel(
    r"C:\Users\esteban.berrios\OneDrive - corfo.cl\Documentos - SUBDIRECCIÓN DE MEJORA CONTINUA\Configuraciones y Reconfiguraciones\Reportería reconfiguraciones\Proyectos a distribuir cartera PD 2.xlsx",
    sheet_name="Hoja1",
    usecols=["Código", "Nombre Ejecutivo Espejo", "Asignación Ejecutivo"]
)

In [None]:
"""
# Explicación:
1. Se define el rango de fechas entre el 10 de junio de 2025 y el 11 de agosto de 2025.
2. Se asegura que la columna "Fecha" en el DataFrame df_reporte esté en formato datetime, manejando errores y considerando el formato día/mes/año.
3. Se crea un diccionario que mapea los códigos de proyecto a los nombres de los ejecutivos espejo.
4. Se aplica una condición para filtrar los proyectos que están en la lista de proyectos de Paula y que tienen una fecha dentro del rango especificado.
5. Finalmente, se actualiza la columna "Nombre_Ejecutivo_Técnico" en df_reporte con los nombres de los ejecutivos espejo correspondientes.
"""

# Definir el rango de fechas
fecha_inicio = pd.to_datetime("2025-06-10")
fecha_fin = pd.to_datetime("2025-08-11")

# Asegurar formato datetime en df_reporte
df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce", dayfirst=True)

# Crear un diccionario {Código: Nombre Ejecutivo Espejo}
mapa_espejo = df_ejecutivo.set_index("Código")["Nombre Ejecutivo Espejo"].to_dict()

# Aplicar el reemplazo solo en los proyectos de Paula y dentro del rango de fechas
condicion = (
    df_reporte["Código"].isin(proyectos_paula) &
    (df_reporte["Fecha"].between(fecha_inicio, fecha_fin))
)

df_reporte.loc[condicion, "Nombre_Ejecutivo_Técnico"] = df_reporte.loc[condicion, "Código"].map(mapa_espejo)

In [None]:
"""
# Explicación:
Este bloque de código asigna los ejecutivos finales a los proyectos específicos de Paula Durán que tienen una fecha posterior al 12 de agosto de 2025,
 utilizando un mapeo basado en un DataFrame adicional que contiene las asignaciones de ejecutivos.
"""

# Definir la fecha de corte
fecha_corte = pd.to_datetime("2025-08-12")

# Crear un diccionario {Código: Asignación Ejecutivo}
mapa_final = df_ejecutivo.set_index("Código")["Asignación Ejecutivo"].to_dict()

# Condición: proyectos de Paula + fecha posterior al 12-08-2025
condicion_final = (
    df_reporte["Código"].isin(proyectos_paula) &
    (df_reporte["Fecha"] > fecha_corte)
)

# Aplicar el reemplazo con el ejecutivo final
df_reporte.loc[condicion_final, "Nombre_Ejecutivo_Técnico"] = df_reporte.loc[condicion_final, "Código"].map(mapa_final)

In [None]:
# # Descargar df_reporte a un archivo excel en Descargas con el nombre "Reporte Reconfiguraciones2.xlsx"
# df_reporte.to_excel(
#     os.path.join(os.path.expanduser("~"), "Downloads", "Reporte Reconfiguraciones2.xlsx"),
#     index=False
# )   

In [None]:


def normalizar_nombre(nombre):
    if isinstance(nombre, str):
        # Eliminar espacios invisibles y normalizar unicode
        nombre = unicodedata.normalize("NFKC", nombre)
        # Quitar espacios extras
        nombre = " ".join(nombre.split())
        # Convertir a formato título (respetando tildes)
        nombre = nombre.lower().title()
        return nombre
    return nombre

# Aplicar normalización base
df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].apply(normalizar_nombre)

# Reemplazos manuales conocidos
reemplazos = {
    "Diego Ignacio Villalobos Ramos Villalobos Ramos": "Diego Villalobos Ramos",
    "Sebastian Jilberto": "No Tiene Ejecutivo Asignado",
    "Yessenia Espinoza": "No Tiene Ejecutivo Asignado",
    "Felipe Francisco Aandueza Del Campo": "No Tiene Ejecutivo Asignado"
}

# Aplicar los reemplazos
df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].replace(reemplazos)

# También podemos normalizar la situación
df_reporte["Situación (uso interno MC)"] = df_reporte["Situación (uso interno MC)"].replace("LISTA", "FINALIZADA")


In [None]:
# # En la columna "Nombre_Ejecutivo_Técnico" formatear con la primera letra en mayúscula y el resto en minúscula
# df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].str.title()
# # Si encuentra la palabra "Diego Villalobos Ramos Villalobos Ramos" en la columna "Nombre_Ejecutivo_Técnico" reemplazar por "Diego Villalobos Ramos"
# df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].str.replace("Diego Ignacio Villalobos Ramos Villalobos Ramos", "Diego Villalobos Ramos", regex=False)
# df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].str.replace("Sebastian Jilberto", "No tiene ejecutivo asignado", regex=False)
# df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].str.replace("Yessenia Espinoza", "No tiene ejecutivo asignado", regex=False)
# df_reporte["Nombre_Ejecutivo_Técnico"] = df_reporte["Nombre_Ejecutivo_Técnico"].str.replace("Felipe Francisco Aandueza Del Campo", "No tiene ejecutivo asignado", regex=False)

# # Si encuentra la palabra "LISTA" en la columna "NomSituación (uso interno MC)" reemplazar por "FINALIZADA"
# df_reporte["Situación (uso interno MC)"] = df_reporte["Situación (uso interno MC)"].str.replace("LISTA", "FINALIZADA", regex=False)


In [None]:
# import time

# # Guardar el DataFrame como CSV temporal
# ruta_csv = "df_reporte.csv"
# df_reporte.to_csv(ruta_csv, index=False)

# # Subir el archivo al Assistant
# uploaded_file = client.files.create(
#     file=open(ruta_csv, "rb"),
#     purpose="assistants"
# )

# # Esperar un momento para asegurar que el archivo esté listo
# time.sleep(2)

# # Enviar el archivo y un mensaje solicitando análisis general
# mensaje_df = client.beta.threads.messages.create(
#     thread_id=thread.id,
#     role="user",
#     content=(
#         "Hola, te adjunto el archivo 'df_reporte.csv', que contiene información de reconfiguraciones "
#         "de proyectos. Por favor analiza su estructura, columnas principales, y entrega un resumen general "
#         "de los datos antes de que te haga consultas específicas."
#     ),
#     attachments=[
#         {
#             "file_id": uploaded_file.id,
#             "tools": [{"type": "code_interpreter"}]
#         }
#     ]
# )

# # Ejecutar el análisis del Assistant
# run = client.beta.threads.runs.create(
#     thread_id=thread.id,
#     assistant_id=assistant_id,
# )

# # Esperar a que el análisis esté completo
# print("⏳ Esperando que el Assistant complete la ejecución...")
# while True:
#     estado = client.beta.threads.runs.retrieve(thread_id=thread.id, run_id=run.id)
    
#     if estado.status == "completed":
#         print("✅ Análisis completado.")
#         break
#     elif estado.status == "failed":
#         print("❌ Falló la ejecución del Assistant.")
#         if estado.last_error:
#             print("💥 Detalle del error:", estado.last_error)
#         break
#     time.sleep(2)

# # Mostrar la respuesta del Assistant (si existe)
# mensajes = client.beta.threads.messages.list(thread_id=thread.id)
# for m in mensajes.data:
#     if m.role == "assistant":
#         print("📊 Resumen del Assistant:")
#         print(m.content[0].text.value)

In [None]:
# Descargar df_reporte en archivo csv
df_reporte.to_csv(r"C:\Users\esteban.berrios\OneDrive - corfo.cl\Documentos - SUBDIRECCIÓN DE MEJORA CONTINUA\Configuraciones y Reconfiguraciones\Reportería reconfiguraciones\df_reporte.csv", index=False)

## 🎯 Objetivo del Reporte

Este folleto visual tiene por finalidad ofrecer una visión estructurada y estratégica sobre los **procesos de reconfiguración de proyectos INNOVA** registrados en el sistema durante el período analizado. Para ello, se presentan **10 gráficos** y **3 tablas explicativas**, diseñados para facilitar la interpretación de datos complejos mediante recursos visuales y descripciones analíticas.

El objetivo central es analizar estos elementos de forma cruzada y complementaria, a fin de entregar insights estratégicos que permitan tomar decisiones informadas en torno a los siguientes ejes clave:

📈 **Evolución temporal de solicitudes**: detectar tendencias, estacionalidades y momentos críticos de mayor carga operativa.  
🧩 **Distribución por instrumento y ejecutivo**: identificar concentración de casos, perfiles especializados y oportunidades para balancear la gestión técnica.  
🧾 **Calidad técnico-administrativa**: observar la recurrencia de rectificaciones y revisar su impacto en la eficiencia de los procesos.  
❗ **Frecuencia y tipo de observaciones**: visibilizar las principales causas de rechazo o corrección, para fortalecer criterios de evaluación y lineamientos operativos.

Este enfoque integral busca no solo describir el comportamiento histórico de las reconfiguraciones, sino también entregar evidencia útil para la mejora continua de los procesos de validación, seguimiento y gestión institucional.

---

## ✅ ¿Qué Puedes Consultar?

- 📈 ¿Cómo ha evolucionado el volumen de reconfiguraciones de enero 2024 a **julio 2025**?  
- 🏷️ ¿Qué instrumentos o ejecutivos concentran la mayor carga operativa y cómo varía ese liderazgo?  
- 📅 ¿Cómo se distribuye la actividad mensual en 2025 y cuáles fueron los meses más críticos?  
- 📊 ¿Qué estados internos (PROCESAR, FINALIZADA, NO APLICA, etc.) dominan el flujo de tramitación?  
- ❌ ¿Cuáles son los tipos de notificación más frecuentes y su proporción en 2025?  
- ✅ ¿Cómo se compara la calidad documental (cartas con/sin errores) en 2025 vs. histórico?  
- ⚠️ ¿Qué patrones de errores destacan y dónde enfocar acciones preventivas?

📎 **Fuente de datos:** Registro consolidado de notificaciones de reconfiguración INNOVA CHILE
📅 **Cobertura temporal:** Enero 2024 – Julio 2025  
📌 **Segmentos clave:** Instrumento, Ejecutivo Técnico, Tipo de Notificación, Situación Interna Mejora Continua

---

## 📊 Gráficos Incluidos

1. **Tipo de solicitud de reconfiguración (2024–2025):** Distribución general de Reitemización, Reprogramación, Suspensión, etc.  
2. **Tendencia mensual por tipo de solicitud (2025):** Barras/líneas que muestran la evolución por tipo de solicitud mes a mes.  
3. **Distribución por instrumento (2025):** Reconfiguraciones según línea de financiamiento (gráfico circular).  
4. **Distribución por ejecutivo técnico (2025):** Carga operativa por ejecutivo.  
5. **Calidad administrativa de las cartas emitidas:** Cartas con vs. sin errores detectados (gráfico de barras).  
6. **Errores por instrumento (2025):** Distribución de errores según instrumento involucrado.  
7. **Errores por ejecutivo técnico (2025):** Comparativo de errores por profesional.  
8. **Evolución mensual de errores administrativos (2025):** Visualización de errores por mes.  
9. **Estados internos de tramitación (2025):** Distribución de las solicitudes según PROCESAR, FINALIZADA, NO APLICA, etc.  
10. **Distribución mensual por estado interno (2025):** Barras agrupadas por estado × mes de enero a julio.

---

## 📋 Tablas Incluidas

1. **Tabla 1 – Cartas con vs. sin observaciones (Total):**  
   Comparativo general de todas las cartas emitidas con y sin observaciones durante todo el marco temporal.

2. **Tabla 2 – Cartas con vs. sin observaciones (2025):**  
   Foco exclusivo en las cartas emitidas entre enero y julio de 2025, con énfasis en calidad técnica actual.

3. **Tabla 3 – Tipos de observaciones identificadas:**  
   Clasificación de las observaciones más frecuentes detectadas en reconfiguraciones y su peso relativo.

### 1-. **Análisis mensual de reconfiguraciones de proyectos INNOVA (Ene 2024 – Ago 2025)**  

#### 📁 **Descripción del análisis**  

El gráfico presenta la cantidad total de solicitudes de reconfiguración de proyectos INNOVA, notificadas mensualmente desde enero 2024 hasta agosto 2025, según datos extraídos del archivo `df_reporte.csv`. Estas solicitudes incluyen reprogramaciones, reitemizaciones, suspensiones y otras modificaciones formales notificadas por los ejecutivos técnicos a través de resoluciones.  

#### 📅 **Meses con Mayor Actividad**  

Los tres meses con mayor cantidad de reconfiguraciones notificadas en el período analizado son:  

* **Noviembre 2024**: 55 notificaciones  
* **Junio 2025**: 52 notificaciones  
* **Diciembre 2024**: 49 notificaciones  

📌 *Se confirma una alta concentración de actividad al cierre del año calendario (noviembre–diciembre), seguida por un nuevo peak en el primer semestre 2025.*  

#### 📉 **Tendencia Temporal**  

El comportamiento temporal muestra oscilaciones con bloques bien definidos:  

- **Finales de 2024**: se registran los mayores peaks (noviembre y diciembre).  
- **Inicios de 2025**: se observa un descenso en febrero (29 notificaciones), con una recuperación sostenida hacia abril–mayo.  
- **Junio 2025**: máximo peak semestral con 52 notificaciones, seguido de una leve disminución en julio (44) y agosto (40).  

Estos ciclos parecen estar asociados a:  

* **Fechas de entrega de informes técnicos** (avances, continuidad, final).  
* **Procesos de control y auditoría** que impulsan ajustes antes de los hitos administrativos.  

> **Observación clave:**  
> 💡 El patrón de reconfiguraciones se comporta como una **serie cíclica**, con concentraciones hacia el cierre de semestres, lo que sugiere una planificación ajustada a hitos institucionales y procesos de control.  


In [None]:
# --- Preparar datos
df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
df_reporte = df_reporte[df_reporte["Fecha"] >= "2024-01-01"]
df_reporte = df_reporte[df_reporte["Fecha"].dt.to_period("M").astype(str) != "2025-09"]
df_reporte['Mes'] = df_reporte['Fecha'].dt.to_period('M').astype(str)

reconfiguraciones_por_mes = df_reporte['Mes'].value_counts().sort_index()
df_plot = reconfiguraciones_por_mes.reset_index()
df_plot.columns = ['Mes', 'Cantidad']

# --- Generar gradiente de rosado CORFO
base_color = mcolors.to_rgb("#FD9893")
rosados = [mcolors.to_hex(tuple(min(1, c + i * 0.015) for c in base_color)) for i in range(len(df_plot))]

# --- Graficar
fig, ax = plt.subplots(figsize=(16, 8))
sns.barplot(data=df_plot, x='Mes', y='Cantidad', palette=rosados, ax=ax)

# Etiquetas
for container in ax.containers:
    ax.bar_label(container, fmt='%d', label_type='edge', padding=3)

# Títulos y estilo
plt.title("Análisis mensual de reconfiguraciones de proyectos INNOVA (Enero 2024 – Agosto 2025)", fontsize=14)
plt.xlabel("Mes")
plt.ylabel("Cantidad de Reconfiguraciones")
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()

# ✅ Guardar gráfico
guardar_grafico(fig, 1)
plt.show()

### 2-. **Reconfiguraciones por mes y por instrumento**

#### 🎯 **Descripción del análisis**

El gráfico de barras apiladas muestra la distribución mensual de solicitudes de reconfiguración de proyectos INNOVA desde enero 2024 hasta agosto 2025, diferenciadas por tipo de instrumento. Para facilitar la visualización, se destacan solo aquellos instrumentos que representan al menos el 3 % del total acumulado; los demás se agrupan en la categoría **“Otros”**.

#### 🔍 **Hallazgos principales**

#### 🥇 **Instrumentos más activos por volumen**

- **Crea y Valida**: 395 reconfiguraciones (~65 % del total)  
  📌 Se consolida como el instrumento con mayor cantidad de modificaciones, liderando en forma consistente todo el período.

#### 📉 **Instrumentos con menor participación o estabilidad**

- **Capital Humano**:  
  - Peak de 15 notificaciones en diciembre 2024.  
  - Se mantiene estable en el rango de 4 a 7 reconfiguraciones mensuales durante 2025.  

- **Consolida y Expande**:  
  - Presencia continua pero baja, entre 1 y 7 casos mensuales.  
  - Máximo en julio 2025 con 7 notificaciones.  

- **Gestión de la Innovación**:  
  - Participación marginal en todo el período.  
  - Su mayor registro fue de 3 notificaciones en abril 2024.  

- **Innova Alta Tecnología**:  
  - Presenta intermitencias con repuntes en noviembre 2024 y junio 2025.  
  - Llegó hasta 6 notificaciones en meses peak.  

#### 📌 **Importancia de la categoría “Otros”**

- La categoría **“Otros”** reúne instrumentos con menos del 3 % de participación.  
- Su impacto es mínimo: no superó las 3 notificaciones en ningún mes, confirmando su rol secundario en el período.  

> **Observación clave:**  
> 💡 La alta concentración en **Crea y Valida** confirma que este instrumento es el núcleo de la gestión de reconfiguraciones y requiere planificación diferenciada por su volumen y constancia.

In [None]:
df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
df_reporte = df_reporte[df_reporte["Fecha"] >= "2024-01-01"]
df_reporte["Mes"] = df_reporte["Fecha"].dt.to_period("M").astype(str)
# Excluir abril 2025
df_reporte = df_reporte[df_reporte['Mes'] != '2025-09']

# Calcular % total por instrumento para agrupar los que son menores a 3%
porcentaje_instrumento = df_reporte["Instrumento"].value_counts(normalize=True)
instrumentos_principales = porcentaje_instrumento[porcentaje_instrumento >= 0.03].index.tolist()

# Reemplazar los instrumentos menores a 3% por "Otros"
df_reporte["Instrumento Agrupado"] = df_reporte["Instrumento"].apply(
    lambda x: x if x in instrumentos_principales else "Otros"
)

# Mapeo específico para mantener colores consistentes
color_mapeo = {
    "Crea y Valida": "#221E7C",
    "Consolida y Expande": "#FD9893",
    "Capital Humano": "#78DDBB",
    "Gestión de la Innovación": "#3F3F3F",
    "Innova Alta Tecnología": "#72C7D5",
    "Otros": "#A0A0A0"# Más contrastante que el celeste  # si aparece este también
}

# Crear tabla cruzada
tabla_instrumentos = pd.crosstab(df_reporte["Mes"], df_reporte["Instrumento Agrupado"])

# Ordenar columnas por frecuencia
orden_columnas = tabla_instrumentos.sum().sort_values(ascending=False).index.tolist()
tabla_instrumentos = tabla_instrumentos[orden_columnas]

# Aplicar colores en el mismo orden
colores_usados = [color_mapeo.get(col, "#CCCCCC") for col in tabla_instrumentos.columns]

# Graficar
plt.figure(figsize=(16, 8), facecolor='white')
tabla_instrumentos.plot(
    kind="bar",
    stacked=True,
    color=colores_usados,
    figsize=(16, 8)
)

plt.title("Cantidad de Reconfiguraciones por Mes y por Instrumento", color='black')
plt.xlabel("Mes", color='black')
plt.ylabel("Cantidad de reconfiguraciones", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.legend(title="Instrumento", bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()

# Guardar
fig = plt.gcf()
guardar_grafico(fig, 2)
plt.show()

### 3-. **Reconfiguraciones por mes en 2025 (Ene – Ago 2025)**

#### 🎯 **Descripción del análisis**  
El gráfico de columnas simples muestra el volumen total de reconfiguraciones de proyectos INNOVA notificadas durante los primeros ocho meses de 2025. Se procesaron los datos del archivo `df_reporte.csv`, filtrando desde enero 2025 hasta agosto 2025. Cada barra representa el total de reconfiguraciones registradas en el mes correspondiente.

#### 📅 **Evolución de solicitudes en 2025**  
- **Junio 2025**: 52 reconfiguraciones  
- **Mayo 2025**: 48 reconfiguraciones  
- **Julio 2025**: 44 reconfiguraciones  
- **Enero 2025**: 40 reconfiguraciones  
- **Agosto 2025**: 40 reconfiguraciones  
- **Marzo 2025**: 36 reconfiguraciones  
- **Abril 2025**: 36 reconfiguraciones  
- **Febrero 2025**: 29 reconfiguraciones  

📌 *El peak se mantiene en junio con 52 notificaciones, seguido de mayo (48) y julio (44). En agosto se observa una estabilización en torno a 40 solicitudes, similar al inicio del año. El mínimo corresponde a febrero con 29 reconfiguraciones.*  

#### 📌 **Observación clave**  
La distribución confirma un **ciclo semestral**, con aumento sostenido hasta el cierre del primer semestre (mayo–junio), seguido de una leve baja en julio y estabilización en agosto. Este comportamiento refuerza la relación de las reconfiguraciones con **procesos de entrega de informes e hitos institucionales clave**.


In [None]:
# Convertir la columna Fecha a datetime
df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")

# Filtrar desde enero 2025 en adelante
df_reporte_2025 = df_reporte[df_reporte["Fecha"] >= "2025-01-01"].copy()

# Agrupar por mes y contar
df_reporte_2025['Mes'] = df_reporte_2025['Fecha'].dt.to_period("M").astype(str)

# Excluir mayo 2025
df_reporte_2025 = df_reporte_2025[df_reporte_2025['Mes'] != '2025-09']

# Conteo mensual
reconfiguraciones_por_mes = df_reporte_2025['Mes'].value_counts().sort_index()
df_plot = reconfiguraciones_por_mes.reset_index()
df_plot.columns = ['Mes', 'Cantidad']

# Paleta con más diferenciación
colores_meses_2025 = ["#B8BBE5", "#9094D8", "#4A4FB2"]

# Graficar
plt.figure(figsize=(16, 8))
ax = sns.barplot(data=df_plot, x='Mes', y='Cantidad', palette=colores_meses_2025)

# Etiquetas sobre las barras
for container in ax.containers:
    ax.bar_label(container, fmt='%d', label_type='edge', padding=3)

plt.title("Reconfiguraciones por mes en 2025", fontsize=14)
plt.xlabel("Mes")
plt.ylabel("Cantidad de reconfiguraciones")
plt.xticks(rotation=45)
plt.grid(axis="y", linestyle='--', alpha=0.7)
plt.tight_layout()

# ✅ Guardar
fig = ax.get_figure()
guardar_grafico(fig, 3)

plt.show()

### 4-. **Reconfiguraciones por mes y por instrumento (2025)**

#### 🎯 **Descripción del análisis**  
Este gráfico de barras apiladas presenta la evolución mensual de las reconfiguraciones de proyectos CORFO durante los primeros ocho meses de 2025. Las solicitudes se agrupan por tipo de instrumento, clasificando como **“Otros”** aquellos con participación inferior al 3 %, para facilitar la lectura de las líneas principales.

La fuente de datos es el archivo `df_reporte.csv`, filtrado desde enero hasta agosto 2025. Cada barra muestra el total de reconfiguraciones por mes, distribuidas por instrumento con codificación de color institucional.

#### 🥇 **Instrumentos que lideran en 2025**  
- **Crea y Valida** mantiene el liderazgo con una participación mensual que varía entre el **62 %** (julio) y el **77 %** (mayo).  
  📌 Esto reafirma su rol estructural dentro de la gestión institucional, concentrando la mayor parte de las modificaciones formales.

#### 🆕 **Nuevos actores relevantes**  
- **Innova Alta Tecnología**:  
  - Mostró repuntes en abril (4), mayo (6) y junio (5).  
  - Aunque con volumen reducido, evidencia mayor presencia que en años anteriores, lo que podría reflejar nuevos ciclos de adjudicación tecnológica.  

- **Consolida y Expande**:  
  - Relevancia creciente en los meses de junio (12) y julio (13).  
  - Su participación amplía la diversidad de instrumentos en la gestión de reconfiguraciones.

- **Capital Humano**:  
  - Mantiene niveles moderados (entre 3 y 7 notificaciones mensuales).  
  - Su peak se observa en junio con 8 reconfiguraciones.

📌 *El crecimiento de instrumentos distintos a **Crea y Valida** en los meses de mayor carga (mayo–junio–julio) sugiere un ciclo activo de ajustes post-adjudicación y en torno a los hitos de informes semestrales.*  

> **Observación clave:**  
> 💡 Aunque **Crea y Valida** continúa dominando, la diversidad de instrumentos se hace más notoria en junio y julio, mostrando que la gestión de reconfiguraciones se está ampliando a líneas como *Consolida y Expande*, *Capital Humano* e *Innova Alta Tecnología*.

In [None]:
df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
df_reporte_2025 = df_reporte[df_reporte["Fecha"] >= "2025-01-01"]
df_reporte_2025["Mes"] = df_reporte_2025["Fecha"].dt.to_period("M").astype(str)

# Excluir abril 2025
df_reporte_2025 = df_reporte_2025[df_reporte_2025['Mes'] != '2025-09']

# Agrupamiento de instrumentos
porcentaje_instrumento = df_reporte_2025["Instrumento"].value_counts(normalize=True)
instrumentos_principales = porcentaje_instrumento[porcentaje_instrumento >= 0.03].index.tolist()

df_reporte_2025["Instrumento Agrupado"] = df_reporte_2025["Instrumento"].apply(
    lambda x: x if x in instrumentos_principales else "Otros"
)

# Tabla cruzada
tabla_instrumentos = pd.crosstab(df_reporte_2025["Mes"], df_reporte_2025["Instrumento Agrupado"])

# --- 🎨 Paleta de colores CORFO ajustada
color_mapeo = {
    "Crea y Valida": "#221E7C",
    "Consolida y Expande": "#FD9893",
    "Capital Humano": "#78DDBB",
    "Gestión de la Innovación": "#3F3F3F",
    "Innova Alta Tecnología": "#72C7D5",
    "Otros": "#A0A0A0"# Más contrastante que el celeste  # si aparece este también
}

# Ordenar columnas por frecuencia
orden_columnas = tabla_instrumentos.sum().sort_values(ascending=False).index.tolist()
tabla_instrumentos = tabla_instrumentos[orden_columnas]

# Colores ordenados
colores_usados = [color_mapeo.get(col, "#CCCCCC") for col in tabla_instrumentos.columns]

# --- 📊 Gráfico
plt.figure(figsize=(16, 8), facecolor='white')
tabla_instrumentos.plot(
    kind="bar",
    stacked=True,
    color=colores_usados,
    figsize=(16, 8)
)

plt.title("Cantidad de reconfiguraciones por mes y por instrumento (año 2025)", color='black')
plt.xlabel("Mes", color='black')
plt.ylabel("Cantidad de reconfiguraciones", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.legend(title="Instrumento", bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(axis="y", linestyle='--', alpha=0.7)
plt.tight_layout()

# ✅ Guardar automáticamente
fig = plt.gcf()
guardar_grafico(fig, 4)

plt.show()

### 5-. **Distribución de instrumentos en 2025**

#### 🎯 **Descripción del análisis**  
El gráfico circular muestra la distribución porcentual de las solicitudes de reconfiguración de proyectos INNOVA según el instrumento de financiamiento, considerando únicamente el año 2025. Las proporciones se calcularon sobre el total de notificaciones registradas, agrupando bajo **“Otros”** los instrumentos con participación inferior al 2 %, para mantener claridad en la visualización.

#### 🥇 **Instrumento con mayor participación**  
- **Crea y Valida** concentra el **64.3 %** de las reconfiguraciones en 2025, reafirmando su papel central como línea estratégica prioritaria durante este período.  

#### 🔍 **Conclusiones clave**  
- **Consolida y Expande**: 16.3 %  
- **Capital Humano**: 8.9 %  
- **Innova Alta Tecnología**: 5.8 % — tendencia creciente que refuerza lo observado en el Gráfico 4 sobre su aparición sostenida.  
- **Gestión de la Innovación**: 3.1 %  
- **Otros**: 1.5 % — participación residual, agrupada para simplificar la lectura.  

> **Observación:** La marcada concentración en *Crea y Valida* confirma una fuerte dependencia operativa de este instrumento. En paralelo, la presencia consistente de *Innova Alta Tecnología* sugiere nuevas adjudicaciones y ajustes técnicos tempranos en proyectos de base tecnológica.

#### 🧩 **Complementariedad con gráficos anteriores**  
Este gráfico consolida lo visto en el Gráfico 4: la hegemonía de *Crea y Valida* y la emergencia de *Innova Alta Tecnología* como actor secundario pero constante. La vista porcentual permite dimensionar que la mayoría de las reconfiguraciones se concentran en un conjunto reducido de instrumentos estratégicos.

In [None]:
# Agrupar categorías con menos del 2% en "Otros"
conteo_instrumento = df_reporte_2025["Instrumento"].value_counts()
porcentajes = conteo_instrumento / conteo_instrumento.sum()

# Separar categorías principales y menores
principales = porcentajes[porcentajes >= 0.02]
otros = porcentajes[porcentajes < 0.02]

# Combinar
conteo_resumido = principales.copy()
conteo_resumido["Otros"] = otros.sum()

# 🎨 Paleta personalizada CORFO (ajustada)
color_mapeo_pie = {
        "Crea y Valida": "#6B70C8",  # 🔵 Más claro que #221E7C
        "Consolida y Expande": "#FD9893",
        "Capital Humano": "#78DDBB",
        "Gestión de la Innovación": "#3F3F3F",
        "Innova Alta Tecnología": "#72C7D5",
        "Otros": "#A0A0A0"
}

# Recalcular colores según las categorías actuales
colors = [color_mapeo_pie.get(cat, "#CCCCCC") for cat in conteo_resumido.index]

# Graficar pie chart actualizado
fig, ax = plt.subplots(figsize=(8, 8), facecolor='white')
ax.set_facecolor("white")

ax.pie(
        conteo_resumido,
        labels=conteo_resumido.index,
        autopct='%1.1f%%',
        startangle=90,
        colors=colors,
        wedgeprops={'edgecolor': 'white'}
)

plt.title("Distribución de Reconfiguraciones por Instrumento (año 2025)", fontsize=14)
plt.tight_layout()

# Guardar actualizado
guardar_grafico(fig, 5)

plt.show()

### 6-. **Reconfiguraciones por ejecutivo técnico (2025)**

#### 🎯 **Descripción del análisis**  
Este gráfico de barras verticales muestra la cantidad total de solicitudes de reconfiguración gestionadas por cada ejecutivo técnico durante el año 2025 (enero a agosto). Los nombres se rotaron para facilitar la lectura y se aplicó un degradado de color basado en la paleta institucional CORFO.

#### 🔍 **Concentración y distribución**  
- **Total de reconfiguraciones 2025**: 374  
- **Top 3 ejecutivos** concentran **93** reconfiguraciones, lo que equivale al **24.9 %** del total:

📌 *Esto evidencia una carga operativa concentrada en algunos perfiles, lo que podría derivar en riesgos de sobrecarga o cuellos de botella en la gestión de reconfiguraciones.*  

#### 🏗️ **Resto del equipo**  
- Lo relevante es  que al menos **9 ejecutivos** tienen entre 20 y 29 reconfiguraciones cada uno, lo que indica que la carga no está tan concentrada como en el top 3, pero sí hay varios con una carga significativa. La concentración de las solicitudes corresponden al **59.3 %** del total (222 reconfiguraciones).

> **Observación clave:** Identificar a los ejecutivos con mayor carga permite planificar redistribuciones o apoyos específicos, con el fin de balancear el trabajo y garantizar tiempos de respuesta óptimos en la tramitación de solicitudes de proyectos INNOVA.

> **Colaboración y apoyo dentro del equipo Innova:** Se destaca el plan colaborativo implementado por la Subdirección de Innovación Empresarial e Internacionalización para respaldar la gestión de las solicitudes vinculadas a la cartera de **Paula Camila Durán Aburto**.

In [None]:
# --- Contar cantidad de reconfiguraciones por ejecutivo (para 2025)
conteo_ejecutivo = df_reporte_2025["Nombre_Ejecutivo_Técnico"].value_counts().reset_index()
conteo_ejecutivo.columns = ["Ejecutivo Técnico", "Cantidad"]

# --- Generar degradado desde color base CORFO #78DDBB
base_color = mcolors.to_rgb("#78DDBB")
verde_corfo = [
    mcolors.to_hex(tuple(min(1, c + i * 0.02) for c in base_color))
    for i in range(len(conteo_ejecutivo))
]

# --- Graficar
fig = plt.figure(figsize=(16, 8), facecolor='white')
ax = sns.barplot(
    data=conteo_ejecutivo,
    x="Ejecutivo Técnico",
    y="Cantidad",
    palette=verde_corfo
)

# --- Etiquetas
for container in ax.containers:
    ax.bar_label(container, fmt='%d', label_type='edge', padding=3)

# --- Estilo y diseño
plt.title("Cantidad de reconfiguraciones por ejecutivo técnico (año 2025)", color='black')
plt.xlabel("Ejecutivo Técnico", color='black')
plt.ylabel("Cantidad de Reconfiguraciones", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.gca().set_facecolor('white')
plt.tight_layout()

# ✅ Guardar automáticamente
guardar_grafico(fig, 6)

plt.show()

### 7-.  **Reconfiguraciones por ejecutivo técnico e instrumento (2025)**

#### 🎯 **Descripción del análisis**  
Este gráfico de barras apiladas muestra el total de reconfiguraciones tramitadas por cada ejecutivo técnico durante el año 2025, desglosadas por instrumento INNOVA. Se construyó a partir de una tabla cruzada entre _Nombre_Ejecutivo_Técnico_ e _Instrumento Agrupado_, ordenando los resultados según el volumen total de casos gestionados.

#### 🥇 **Ejecutivos con mayor diversidad y carga**  
📌 En todos los casos, **Crea y Valida** se mantiene como el instrumento dominante. Sin embargo, se identifican ejecutivos que gestionan **hasta 4 instrumentos distintos**, lo que refleja una versatilidad operativa relevante:

- **Cristofer Antonio Monsalve Sepúlveda** (25 reconfiguraciones):  
  - Instrumentos: Crea y Valida, Consolida y Expande, Capital Humano, Gestión de la Innovación  
- **Juan Carlos Castro Cabezas** (23 reconfiguraciones):  
  - Instrumentos: Crea y Valida, Consolida y Expande, Capital Humano, Gestión de la Innovación  
- **Diego Villalobos Ramos** (14 reconfiguraciones):  
  - Instrumentos: Crea y Valida, Consolida y Expande, Gestión de la Innovación  
- **Juan Martínez F.** (29 reconfiguraciones):  
  - Instrumentos: Crea y Valida, Innova Alta Tecnología  

📌 *Algunos ejecutivos concentran más volumen, mientras que otros gestionan una gama más amplia de instrumentos, lo que revela perfiles tanto especializados como transversales.*  

#### 🧩 **Implicancias estratégicas**   
- **Especialización crítica**: La centralidad de *Crea y Valida* reafirma su rol prioritario en la gestión de proyectos.  
- **Desarrollo de capacidades**: Ejecutivos con alta diversidad instrumental pueden ser claves en procesos de mejora continua, capacitación interna y pilotajes de nuevos sistemas de gestión.  

> **Nota**: Este gráfico, junto con los anteriores, permite observar no solo la carga total de cada ejecutivo sino también su **composición técnica**, apoyando una planificación más equilibrada y estratégica del equipo operativo.

In [None]:
# Definir paleta institucional CORFO (instrumento → color)
colores_instrumentos = {
    "Crea y Valida": "#6B70C8",  # 🔵 Más claro que #221E7C
    "Consolida y Expande": "#FD9893",
    "Capital Humano": "#78DDBB",
    "Gestión de la Innovación": "#3F3F3F",
    "Innova Alta Tecnología": "#72C7D5",
    "Otros": "#A0A0A0"                  # Gris claro para categoría residual
}

# Crear tabla cruzada: ejecutivo técnico x instrumento
tabla_ejecutivo_instrumento = pd.crosstab(
    df_reporte_2025["Nombre_Ejecutivo_Técnico"],
    df_reporte_2025["Instrumento Agrupado"]
)

# Ordenar por total de reconfiguraciones
tabla_ejecutivo_instrumento = tabla_ejecutivo_instrumento.loc[
    tabla_ejecutivo_instrumento.sum(axis=1).sort_values(ascending=False).index
]

# Reordenar columnas según preferencia
column_order = [col for col in colores_instrumentos if col in tabla_ejecutivo_instrumento.columns]
tabla_ejecutivo_instrumento = tabla_ejecutivo_instrumento[column_order]

# Obtener lista de colores en el mismo orden de columnas
colores = [colores_instrumentos[col] for col in tabla_ejecutivo_instrumento.columns]

# Graficar gráfico de barras apiladas
fig = plt.figure(figsize=(16, 8), facecolor='white')
tabla_ejecutivo_instrumento.plot(
    kind="bar",
    stacked=True,
    color=colores,
    figsize=(16, 8)
)

plt.title("Cantidad de Reconfiguraciones por Ejecutivo Técnico e Instrumento (año 2025)", color='black')
plt.xlabel("Ejecutivo Técnico", color='black')
plt.ylabel("Cantidad de Reconfiguraciones", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.legend(title="Instrumento", bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()

# ✅ Guardar automáticamente
fig = plt.gcf()
guardar_grafico(fig, 7)

plt.show()

### 8-. **Reconfiguraciones por tipo de notificación (2025)**

#### 🎯 **Descripción del análisis**  
Este gráfico circular muestra la distribución relativa de los tipos de notificación utilizados en las solicitudes de reconfiguración de proyectos INNOVA durante 2025 (enero–agosto). Se calcularon las proporciones con base en el total de **374 notificaciones registradas**. Se presentan todas las categorías con participación superior al 4 %, descartando aquellas residuales para mantener la claridad visual.

#### 🥇 **Tipo de notificación más frecuente**  
- **Reitemización**: 42.3 %  
- **Reprogramación**: 22.8 %  
- **Rectifica**: 12.0 %  
- **Suspensión**: 9.0 %  
- **Reitemización y Reprogramación**: 9.0 %  
- **Modificación de Proyecto**: 4.9 %  

> **Observación:** *Reitemización* lidera claramente, seguida de *Reprogramación*. Las combinaciones y suspensiones, aunque menos frecuentes, reflejan ajustes simultáneos en presupuesto y cronograma, lo que evidencia una complejidad creciente en la gestión de modificaciones.

#### 🔍 **Conclusiones clave**  
- Existe una alta concentración en dos categorías principales (**Reitemización + Reprogramación = 65.1 %**), lo que confirma que estos son los focos más críticos de ajuste.  
- La presencia de **Rectifica** (12.0 %) refuerza oportunidades de mejora en la calidad de las solicitudes iniciales o en los procesos de revisión.  
- La coexistencia de **Reitemización y Reprogramación** (9.0 %) sugiere la necesidad de un abordaje coordinado entre presupuesto y cronograma.  

#### 🧩 **Complementariedad con gráficos anteriores**  
Este desglose complementa lo observado en el **Gráfico 6** (carga por ejecutivo) y el **Gráfico 7** (ejecutivo × instrumento), al mostrar qué tipos de notificación dominan la carga técnica.  
Permite priorizar **capacitaciones a BENEFICIARIOS** y **ajustes operativos** en los tipos más frecuentes, especialmente en aquellas combinaciones que involucran múltiples dimensiones del proyecto.

In [None]:
# Agrupar categorías con menos del 3% en "Otros"
conteo_tipo = df_reporte_2025["Tipo Notificación"].value_counts()
porcentajes = conteo_tipo / conteo_tipo.sum()

principales = porcentajes[porcentajes >= 0.04]
otros = porcentajes[porcentajes < 0.04]

conteo_resumido = principales.copy()
# conteo_resumido["Otros"] = otros.sum() # SE OPTA POR NO CONSIDERAR "Otros" EN ESTE REPORTE (JUNIO 2025)

# Detectar categoría con mayor porcentaje
categoria_max = conteo_resumido.idxmax()

# 🎨 Paleta institucional CORFO (sin repetir)
paleta_corfo = [
        "#A6A1E0",  # Morado claro institucional (para la mayor)
        "#FD9893",  # Rosado institucional
        "#78DDBB",  # Verde menta institucional
        "#72C7D5",  # Celeste institucional
        "#3F3F3F",  # Gris oscuro
        "#C0C0C0",  # Gris claro
        "#221E7C",  # Azul institucional fuerte
        "#BBBBFF"   # Lavanda de apoyo
]

# ✅ Asignar colores sin repetir
colores_dict = {}
usados = set()

for cat in conteo_resumido.index:
        if cat == categoria_max:
                colores_dict[cat] = "#A6A1E0"
                usados.add("#A6A1E0")
        else:
                for color in paleta_corfo:
                        if color not in usados:
                                colores_dict[cat] = color
                                usados.add(color)
                                break
                        else:
                                colores_dict[cat] = "#999999"  # fallback si se acaban los colores

# Lista ordenada de colores
colores = [colores_dict[cat] for cat in conteo_resumido.index]

# 📊 Gráfico pie
fig, ax = plt.subplots(figsize=(8, 8), facecolor='white')
ax.set_facecolor("white")

ax.pie(
        conteo_resumido,
        labels=conteo_resumido.index,
        autopct='%1.1f%%',
        startangle=90,
        colors=colores,
        textprops={'color': 'black'},
        wedgeprops={'edgecolor': 'white'}
)

plt.title("Distribución de Reconfiguraciones por Tipo de Notificación (2025)", color='black', fontsize=14)
plt.tight_layout()

# ✅ Guardar gráfico
guardar_grafico(fig, 8)

plt.show()

### 9-. **Estado de tramitación de Reconfiguraciones (2025)**

#### 🎯 **Descripción del análisis**  
Este gráfico de barras expone la distribución de las solicitudes de reconfiguración según su estado administrativo interno, tal como se consigna en la columna **“Situación (uso interno MC)”**, para el período enero–agosto 2025.

#### ✅ **Análisis de Gestión**  
- **FINALIZADA**: 208 solicitudes (**65.3 %**) — refleja el cierre exitoso de más de la mitad de los casos.  
- **NO APLICA**: 84 solicitudes (**26.4 %**) — incluye anulaciones, duplicidades o casos fuera de alcance.  
- **NO GESTIONABLE**: 15 solicitudes (**4.7 %**) — casos cerrados sin resolución favorable.  
- **PROCESAR**: 9 solicitudes (**2.8 %**) — que aún no han sido gestionadas.  
- **PENDIENTE REVISIÓN FINANCIERA**: 8 solicitudes (**2.5 %**) — enviadas al área de Seguimiento Financiero.  
- **PROCESADA**: 1 solicitud (**0.3 %**) — casos ya atendidos en trámite de gestión.  

📌 *Casos pendientes o no gestionables suman 33 (**10.3 %**) y requieren intervención o monitoreo.*

#### 🔍 **Observaciones clave**  
- La categoría **NO APLICA** representa más de una cuarta parte del total, lo que sugiere oportunidades de mejora en la **etapa de ingreso** o en la definición inicial de las solicitudes.  
- El **65.3 %** de los casos está tramitado y cerrado, lo cual es positivo, aunque todavía perfectible.  
- Los estados **NO GESTIONABLE**, **PROCESAR** y **PENDIENTE REVISIÓN FINANCIERA** deben ser monitoreados para evitar acumulación en el tiempo.  

> **Observación clave:** Aunque la mayoría de las solicitudes ha sido cerrada, **el 5.6 %** (18 casos) siguen activas o sin resolución definitiva, lo que representa una oportunidad para **agilizar procesos** y fortalecer la trazabilidad de los estados internos.

In [None]:
# Definir las categorías que queremos contar
situaciones_objetivo = [
    "PROCESAR", "NO GESTIONABLE", "NO APLICA", "PROCESADA", "PENDIENTE REVISIÓN FINANCIERA", "FINALIZADA"
]

# Filtrar y contar solo esas categorías
conteo_situaciones = df_reporte_2025["Situación (uso interno MC)"].value_counts()
conteo_filtrado = conteo_situaciones[conteo_situaciones.index.isin(situaciones_objetivo)]

# Graficar el conteo filtrado en un gráfico de barras
fig, ax = plt.subplots(figsize=(16, 8), facecolor='white')
bars = conteo_filtrado.plot(kind='bar', color='skyblue', ax=ax)

plt.title("Cantidad de Reconfiguraciones por Situación (Uso Interno Mejora Continua)", color='black')
plt.xlabel("Situación", color='black')
plt.ylabel("Cantidad", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.gca().set_facecolor("white")
plt.tight_layout()

# ➕ Agregar etiquetas de valor sobre las barras
for container in ax.containers:
    ax.bar_label(container, fmt='%d', label_type='edge', fontsize=10, padding=3, color='black')

# ✅ Guardar el gráfico como grafico_8.png
guardar_grafico(fig, 9)

plt.show()

### 10-. **Distribución de reconfiguraciones por mes y estado (2025)**

#### 🎯 **Descripción del análisis**
Este gráfico muestra cómo se distribuyen las solicitudes de reconfiguración según su estado administrativo interno (uso interno MC) a lo largo de los primeros ocho meses de 2025. Se construyó a partir de una tabla cruzada entre el campo _Mes_ y las categorías seleccionadas de la columna _Situación (uso interno MC)_: **PROCESAR**, **NO GESTIONABLE**, **NO APLICA**, **PROCESADA**, **PENDIENTE REVISIÓN FINANCIERA** y **FINALIZADA**.

Durante los primeros cinco meses, la proporción de casos **FINALIZADA** lidera mensualmente. A partir de junio, se incrementan los estados **NO GESTIONABLE**, **PROCESAR** y **PENDIENTE REVISIÓN FINANCIERA**, lo cual refleja un cambio en el flujo operativo.

#### 📊 **Carga técnica y oportunidad de gestión**
- **Enero 2025**: 32 finalizadas, 8 no aplica  
- **Febrero 2025**: 25 finalizadas, 4 no aplica  
- **Marzo 2025**: 21 finalizadas, 14 no aplica, 1 no gestionable  
- **Abril 2025**: 23 finalizadas, 13 no aplica  
- **Mayo 2025**: 33 finalizadas, 15 no aplica  
- **Junio 2025**: 28 finalizadas, 17 no aplica, 6 no gestionables, 1 procesar, 1 procesada  
- **Julio 2025**: 30 finalizadas, 6 no aplica, 6 no gestionables, 1 procesar, 2 pendientes, 1 procesada  
- **Agosto 2025**: 16 finalizadas, 6 no aplica, 7 procesar, 7 pendientes  

#### 🧩 **Implicancias estratégicas**
El análisis revela un **desempeño robusto hasta mayo**, con predominio de casos cerrados. Sin embargo, desde junio se observa una **diversificación de estados pendientes**, lo que puede indicar:

- Acumulación administrativa por alta demanda.  
- Revisión más rigurosa o cambios en la priorización interna.  
- Necesidad de refuerzo operativo o revisión del flujo de tramitación.  

> **Observación clave:** La tendencia muestra una disminución relativa en reconfiguraciones **finalizadas** durante junio–agosto, acompañada de un alza en solicitudes **no gestionables, procesar o pendientes de revisión**. Esto refuerza la importancia de monitorear el comportamiento operativo en la **transición al segundo semestre** para evitar cuellos de botella.

In [None]:
# Crear tabla cruzada: filas=mes, columnas=situación, valores=cantidad
tabla_situaciones = pd.crosstab(
    df_reporte_2025["Mes"],
    df_reporte_2025["Situación (uso interno MC)"]
)

# Revisar nombres reales en las columnas para evitar errores de clave
columnas_disponibles = tabla_situaciones.columns.tolist()
print("📋 Columnas disponibles:", columnas_disponibles)

# Situaciones de interés (según lo esperado)
situaciones_objetivo = ['PROCESAR', 'NO GESTIONABLE', 'NO APLICA', 'PROCESADA', 'PENDIENTE REVISIÓN FINANCIERA','FINALIZADA']

# Filtrar solo las que realmente están presentes en el DataFrame
situaciones_validas = [s for s in situaciones_objetivo if s in columnas_disponibles]
tabla_situaciones = tabla_situaciones[situaciones_validas]

# Diccionario de colores institucionales CORFO para cada situación
colores_estado = {
    "FINALIZADA": "#78DDBB",                    # Verde institucional
    "NO APLICA": "#FD9893",                     # Rosado institucional
    "NO GESTIONABLE": "#3F3F3F",                # Gris oscuro
    "PENDIENTE REVISIÓN FINANCIERA": "#72C7D5",   # Celeste
    "PROCESAR": "#221E7C",                      # Azul oscuro institucional
    "PROCESADA": "#A0A0A0"                      # Gris claro
}

# Crear gráfico de barras agrupadas con colores personalizados
fig, ax = plt.subplots(figsize=(16, 8), facecolor='white')
tabla_situaciones.plot(
    kind="bar",
    stacked=False,
    color=[colores_estado[col] for col in situaciones_validas],
    ax=ax
)

plt.title("Distribución de las reconfiguraciones por mes y estado", color='black')
plt.xlabel("Mes", color='black')
plt.ylabel("Cantidad de Reconfiguraciones", color='black')
plt.xticks(rotation=45, ha='right', color='black')
plt.yticks(color='black')
plt.legend(title="Situación", bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()

# ➕ Etiquetas sobre las barras
for container in ax.containers:
    ax.bar_label(container, fmt='%d', label_type='edge', fontsize=9, padding=3, color='black')

# ✅ Guardar el gráfico
guardar_grafico(fig, 10)
plt.show()
plt.show()

### 📋 **Tabla resumen 1: cartas correctas vs. cartas con observaciones**

#### 🎯 **Descripción del análisis**  
Esta tabla resume la cantidad total y el porcentaje relativo de cartas de reconfiguración emitidas durante el período, diferenciando si presentan errores u observaciones en su tramitación. Se utilizó la columna **Casuísticas errores en solicitudes** como indicador clave: si el campo estaba vacío se clasificó como “Sin observaciones”, y si contenía texto, como “Con observaciones”.

#### 🔍 **Observaciones clave**  
- **594** cartas fueron emitidas sin observaciones formales, lo que representa el **86.1 %** del total.  
- **96** cartas presentaron algún error u observación, equivalente al **13.9 %** del total.  
- Aunque la proporción de errores es relativamente baja, sigue siendo un segmento relevante que podría optimizarse.

#### ✅ **Implicancias para la “Mejora Continua”**  
- Mantener o reforzar los controles actuales, dado el alto porcentaje de cartas correctas.  
- Implementar revisiones focalizadas o checklists para reducir el **13.9 %** de cartas con observaciones.  
- Complementar este análisis con cruces por **mes, instrumento o ejecutivo técnico** para identificar patrones sistemáticos y reducir recurrencias.


In [None]:
# Clasificar los registros como "Con errores" o "Sin errores (NaN)"
df_reporte["Clasificación Errores"] = df_reporte["Casuisticas errores en solicitudes"].apply(
    lambda x: "Con observaciones" if pd.notna(x) else "Sin observaciones"
)

# Generar la tabla resumen
tabla_errores_total = df_reporte["Clasificación Errores"].value_counts().reset_index()
tabla_errores_total.columns = ["Clasificación", "Cantidad"]

# Agregar columna de porcentaje
total = tabla_errores_total["Cantidad"].sum()
tabla_errores_total["Porcentaje"] = (tabla_errores_total["Cantidad"] / total * 100).round(1).astype(str) + "%"

# Mostrar tabla con título sin índice
display(Markdown("### Tabla 1: **Tabla de relación de cantidad de cartas emitidas correctas v/s cartas con observaciones**"))
display(tabla_errores_total.style.hide(axis="index"))

### 📋 **Tabla resumen 2: cartas emitidas con vs. sin observaciones (2025)**

#### 🎯 **Objetivo del análisis**  
Esta tabla presenta un desglose exclusivo de las cartas emitidas durante el año 2025 (**enero–agosto**), clasificadas según la presencia de observaciones en el campo **Casuísticas errores en solicitudes**.  
Se utilizó el subconjunto `df_reporte_2025` y la columna **Clasificación Errores**, donde **“Sin observaciones”** indica campos vacíos y **“Con observaciones”** aquellos registros con texto en la casuística.

#### ⚠️ **Alto porcentaje de emisión sin observaciones y revisión de observaciones detectadas**  
- **Total cartas 2025**: **690**  
- **Sin observaciones**: **594** (**86.1 %**)  
- **Con observaciones**: **96** (**13.9 %**)  

Aunque el **86.1 %** de cartas sin observaciones refleja un estándar de calidad sólido, el **13.9 %** restante indica áreas de mejora, especialmente en la revisión previa y los procesos de validación técnica.

#### 🔍 **Observaciones clave**  
- La proporción de **“Con observaciones”** en 2025 (**13.9 %**) se encuentra levemente por debajo del promedio general, pero sigue siendo un segmento relevante para reforzar **controles preventivos**.  
- Estos **96 casos** deben analizarse por **mes**, **instrumento** y **ejecutivo técnico**, con el fin de identificar patrones de recurrencia.  
- Sería valioso incorporar un **seguimiento mensual** de esta métrica para evaluar el impacto de las acciones correctivas y reducir gradualmente la proporción de observaciones.

In [None]:
# Clasificar los registros como "Con errores" o "Sin errores (NaN)"
df_reporte_2025["Clasificación Errores"] = df_reporte_2025["Casuisticas errores en solicitudes"].apply(
    lambda x: "Con observaciones" if pd.notna(x) else "Sin observaciones"
)

# Generar la tabla resumen
tabla_errores_2025 = df_reporte_2025["Clasificación Errores"].value_counts().reset_index()
tabla_errores_2025.columns = ["Clasificación", "Cantidad"]

# Agregar columna de porcentaje
total = tabla_errores_2025["Cantidad"].sum()
tabla_errores_2025["Porcentaje"] = (tabla_errores_2025["Cantidad"] / total * 100).round(1).astype(str) + "%"

# Mostrar tabla con título y sin índice
display(Markdown("### Tabla 2: **Tabla de relación de cantidad de cartas emitidas correctas v/s cartas con errores año 2025**"))
display(tabla_errores_2025.style.hide(axis="index"))

### 📋 **Tabla resumen 3: clasificación de tipos de observaciones identificadas**

#### 🎯 **Objetivo del análisis**  
Esta tabla detalla los tipos más frecuentes de observaciones detectadas en la tramitación de solicitudes de reconfiguración, categorizados según el campo **Casuísticas errores en solicitudes**. El análisis permite comprender las causas más recurrentes y orientar acciones de mejora.

#### ⚠️ **Observaciones más frecuentes detectadas**
- **Incidencias en el cálculo presupuestario**: 33 casos (**34.4 %**)  
- **Falta información adicional RRHH nuevos**: 33 casos (**34.4 %**)  
- **Error en la definición de las fechas de los informes (TÉCNICOS, AVANCE Y FINAL)**: 12 casos (**12.5 %**)  
- **Falta claridad en monto a reitemizar**: 6 casos (**6.2 %**)  
- **Valores del presupuesto ya rendidos sin posibilidad de reitemizar**: 5 casos (**5.2 %**)  
- **Error en la definición de RRHH y otros gastos: pecuniarios y valorados**: 4 casos (**4.2 %**)  
- **Falta información adicional Presupuesto**: 3 casos (**3.1 %**)  

#### 🔍 **Observaciones clave**
- Más del **68 %** de las observaciones se concentran en dos casuísticas críticas: **información adicional de RRHH nuevos** y **problemas en el cálculo presupuestario**.  
- Las observaciones en fechas de informes (**12.5 %**) afectan directamente la planificación técnica del proyecto.  
- Aunque las observaciones menos frecuentes suman menos del 20 %, su recurrencia exige medidas preventivas.

#### ✅ **Implicancias para la “Mejora Continua”**
- Reforzar **checklists técnicos** para asegurar la entrega completa de antecedentes de RRHH y presupuesto.  
- Implementar una **validación cruzada temprana** sobre los informes comprometidos y su cronograma.  
- **Capacitación focalizada** en definición presupuestaria y reitemización de gastos valorizados.

In [None]:
# Filtrar solo los registros con errores (no NaN)
df_con_errores = df_reporte[df_reporte["Casuisticas errores en solicitudes"].notna()]

# Contar ocurrencias por tipología de error
tabla_errores_clasificacion_total = df_con_errores["Casuisticas errores en solicitudes"].value_counts().reset_index()
tabla_errores_clasificacion_total.columns = ["Casuística de observación", "Cantidad"]

# Agregar columna de porcentaje
total_errores = tabla_errores_clasificacion_total["Cantidad"].sum()
tabla_errores_clasificacion_total["Porcentaje"] = (tabla_errores_clasificacion_total["Cantidad"] / total_errores * 100).round(1).astype(str) + "%"

# Mostrar todo el contenido de las celdas
pd.set_option("display.max_colwidth", None)

# Mostrar con título y sin índice
display(Markdown("### Tabla 3: **Tabla de clasificación de tipos de observaciones identificadas**"))
display(tabla_errores_clasificacion_total.style.hide(axis="index"))

In [None]:
html_folleto_estructura_inicial = """
<!DOCTYPE html>
<html lang="es">
<head>
    <meta charset="UTF-8">
    <title>Informe de Reconfiguraciones CORFO – Año 2024-2025</title>
    <style>
        body {
            font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
            background-color: #ffffff;
            color: #1a1a1a;
            margin: 40px;
            line-height: 1.6;
        }
        .header {
            background-color: #e9f2fb;
            padding: 30px;
            border-radius: 10px;
            margin-bottom: 40px;
        }
        .header h1 {
            color: #004a99;
            font-size: 28px;
            margin: 0;
        }
        .header h3 {
            color: #2f6fa5;
            font-size: 18px;
            margin: 0;
            font-weight: normal;
        }
        h2 {
            color: #004a99;
            margin-top: 40px;
        }
        .section {
            margin-bottom: 30px;
            text-align: justify;
        }
        .content {
            border-bottom: 1px solid #004a99;
            display: flex;
            flex-wrap: wrap;
            gap: 20px;
            margin-bottom: 50px;
        }
        .grafico, .explicacion, .tabla {
            flex: 1;
            max-width: 45%;
        }
        .grafico img {
            max-width: 100%;
            border-radius: 8px;
            border: 1px solid #ccc;
        }
        .explicacion {
            text-align: justify;
            font-size: 13px;
            color: #333333;
        }
        .tabla {
            overflow-x: auto;
        }
        table {
            width: 100%;
            border-collapse: collapse;
            font-size: 14px;
            background-color: #fff;
            box-shadow: 0 2px 5px rgba(0,0,0,0.05);
        }
        th, td {
            border: 1px solid #ccc;
            padding: 8px 10px;
            text-align: left;
        }
        th {
            background-color: #f2f2f2;
        }
        ul {
            padding-left: 20px;
        }
        ul li {
            margin-bottom: 6px;
        }
        .footer {
            text-align: center;
            font-size: 13px;
            color: #666666;
            border-top: 1px solid #ddd;
            margin-top: 60px;
            padding-top: 20px;
        }

        /* ✨ Nueva clase destacada */
        .destacada {
            background-color: #f4f9ff;
            border-left: 5px solid #004a99;
            padding: 15px;
            margin-bottom: 30px;
        }
        /* Versión móvil: reorganiza bloques para pantallas pequeñas */
        @media (max-width: 1199px) {
            .content {
                flex-direction: column;
            }

            .explicacion, .grafico, .tabla {
                order: unset;        /* se respeta orden de inserción o el especificado arriba */
                max-width: 100% !important;  /* 🔧 sobrescribe el 45% */
                width: 100%;
            }

            .grafico img {
                max-width: 100%;
                height: auto;
            }
        }
    </style>
</head>
<body>
    <div class="header">
        <h1>Informe de Reconfiguraciones de Proyectos INNOVA</h1>
        <h3>Año 2025 – Mes de Agosto. Análisis Ejecutivo</h3>
    </div>

    <!-- Este es el contenedor donde se insertará el contenido -->
    <section class="destacada"></section>
    <section class="contenido-tablas"></section>


</body>
    <div class="footer">
        Subdirección de Operaciones y Mejora Continua<br>
        Gerencia de Innovación<br>
        Corfo<br>
        2025 – Todos los derechos reservados
    </div>
</html>
"""

# # Guardar HTML base

output_path = "maquetas/html/Folleto_Final.html"
os.makedirs(os.path.dirname(output_path), exist_ok=True)

with open(output_path, "w", encoding="utf-8") as f:
    f.write(html_folleto_estructura_inicial)

output_path

In [None]:
# --- Parámetros
notebook_path = "reporte_reconfiguraciones.ipynb"
html_template_path = "maquetas/html/Folleto_Final.html"
output_path = "maquetas/html/Folleto_Final_ConGraficos.html"

# --- Cargar HTML base
with open(html_template_path, "r", encoding="utf-8") as f:
    soup = BeautifulSoup(f.read(), "html.parser")

# --- Cargar notebook
with open(notebook_path, "r", encoding="utf-8") as f:
    nb = nbformat.read(f, as_version=4)

# --- Insertar primer markdown explicativo antes de los gráficos
primer_md = None
for cell in nb.cells:
    if cell.cell_type == "markdown":
        primer_md = cell.source
        break

if primer_md:
    bloque_intro = soup.find("section", class_="destacada")
    if bloque_intro:
        bloque_intro.append(BeautifulSoup(markdown2.markdown(primer_md), "html.parser"))

# --- Namespace de tablas (¡asegúrate de definirlas antes!)
namespace = {
    "tabla_errores_total": tabla_errores_total,
    "tabla_errores_2025": tabla_errores_2025,
    "tabla_errores_clasificacion_total": tabla_errores_clasificacion_total,
}

# --- Crear secciones nuevas
seccion_graficos = soup.new_tag("section")
seccion_graficos.append(soup.new_tag("h2"))
seccion_graficos.h2.string = "📊 Análisis de Gráficos"

seccion_tablas = soup.new_tag("section")
seccion_tablas.append(soup.new_tag("h2"))
seccion_tablas.h2.string = "📋 Análisis de Tablas"

# --- Recorrer celdas del notebook
i = 0
img_index = 1

while i < len(nb.cells):
    md_cell = nb.cells[i]

    if i + 1 < len(nb.cells):
        code_cell = nb.cells[i + 1]
    else:
        break

    if md_cell.cell_type == "markdown" and code_cell.cell_type == "code":
        tiene_grafico = "plt.show" in code_cell.source
        tiene_tabla = "display(" in code_cell.source and ".style" in code_cell.source

        if tiene_grafico or tiene_tabla:
            explicacion_html = f"<div class='explicacion'>{markdown2.markdown(md_cell.source)}</div>"
            grafico_html = ""
            tabla_html = ""

            # 🔷 Gráfico
            if tiene_grafico:
                ruta_local = os.path.join("maquetas/img", f"grafico_{img_index}.png")
                if os.path.exists(ruta_local):
                    with open(ruta_local, "rb") as img_file:
                        encoded = base64.b64encode(img_file.read()).decode("utf-8")
                        grafico_html = f"""
                        <div class="grafico">
                            <img src="data:image/png;base64,{encoded}">
                        </div>
                        """

            # 🔶 Tabla
            match = re.search(r'display\((\w+)\.style', code_cell.source)
            if match:
                tabla_nombre = match.group(1)
                if tabla_nombre in namespace and hasattr(namespace[tabla_nombre], "to_html"):
                    tabla_html = f"<div class='tabla'>{namespace[tabla_nombre].to_html(index=False, escape=False)}</div>"

            # 🔽 Estructura del bloque
            bloque_html = soup.new_tag("section", **{"class": "content"})

            if tiene_grafico and grafico_html.strip():
                bloque_html.append(BeautifulSoup(grafico_html, "html.parser"))
                bloque_html.append(BeautifulSoup(explicacion_html, "html.parser"))
                seccion_graficos.append(bloque_html)

            if tiene_tabla and tabla_html.strip():
                bloque_html.append(BeautifulSoup(explicacion_html, "html.parser"))
                bloque_html.append(BeautifulSoup(tabla_html, "html.parser"))
                seccion_tablas.append(bloque_html)

            img_index += 1
            i += 2
        else:
            i += 1
    else:
        i += 1

# --- Insertar secciones en el body
soup.body.append(seccion_graficos)
soup.body.append(seccion_tablas)

# --- Guardar HTML final
os.makedirs(os.path.dirname(output_path), exist_ok=True)
with open(output_path, "w", encoding="utf-8") as f:
    f.write(str(soup))

print("✅ HTML final generado correctamente con secciones de gráficos y tablas.")

In [None]:
# # Mostrar el dataframe df_reporte_2025 filtrado por el mes de enero 2025 y ordenado por la fecha
# df_reporte_2025_filtrado_enero = df_reporte_2025[df_reporte_2025["Mes"] == "2025-01"]
# df_reporte_2025_filtrado_enero = df_reporte_2025_filtrado_enero.sort_values(by="Fecha")
# df_reporte_2025_filtrado_enero






---

In [None]:
# # 📅 Convertir la columna Fecha a tipo datetime
# df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")

# # 🧮 Clasificar los registros como "Con errores" o "Sin errores"
# df_reporte["Clasificación_Errores"] = df_reporte["Casuisticas errores en solicitudes"].apply(
#     lambda x: "Con errores" if pd.notna(x) else "Sin errores"
# )

# # 📆 Generar columna "Mes"
# df_reporte["Mes"] = df_reporte["Fecha"].dt.to_period("M").astype(str)

# # 📊 Generar tabla: errores por instrumento
# errores_por_instrumento = df_reporte[df_reporte["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores")

# # 📊 Total de solicitudes por instrumento
# total_por_instrumento = df_reporte.groupby("Instrumento")["Código"].count().reset_index(name="Total solicitudes")

# # 🔗 Unir ambas tablas y calcular porcentaje de errores
# errores_ratio = pd.merge(total_por_instrumento, errores_por_instrumento, on="Instrumento", how="left")
# errores_ratio["Con errores"] = errores_ratio["Con errores"].fillna(0).astype(int)
# errores_ratio["% Con errores"] = (errores_ratio["Con errores"] / errores_ratio["Total solicitudes"] * 100).round(1).astype(str) + "%"

# # 📝 Mostrar título y tabla sin índice
# from IPython.display import display, Markdown

# display(Markdown("### 🧾 Tabla: Relación de solicitudes con errores por instrumento"))
# display(errores_ratio.style.hide(axis="index"))

In [None]:
# # 📅 Convertir la columna Fecha a datetime y asegurar columna Año
# df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
# df_reporte["Año"] = df_reporte["Fecha"].dt.year

# # 🧮 Clasificar como "Con errores" o "Sin errores" si no existe ya
# if "Clasificación_Errores" not in df_reporte.columns:
#     df_reporte["Clasificación_Errores"] = df_reporte["Casuisticas errores en solicitudes"].apply(
#         lambda x: "Con errores" if pd.notna(x) else "Sin errores"
#     )

# # 🔹 Datos globales (total histórico)
# errores_total = df_reporte[df_reporte["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores total")

# total_total = df_reporte.groupby("Instrumento")["Código"].count().reset_index(name="Total solicitudes")

# # 🔹 Datos 2025
# df_2025 = df_reporte[df_reporte["Año"] == 2025]

# errores_2025 = df_2025[df_2025["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores 2025")

# total_2025 = df_2025.groupby("Instrumento")["Código"].count().reset_index(name="Total 2025")

# # 🔗 Unir todo
# tabla_comparativa = total_total.merge(errores_total, on="Instrumento", how="left") \
#     .merge(total_2025, on="Instrumento", how="left") \
#     .merge(errores_2025, on="Instrumento", how="left")

# # 🧼 Reemplazar nulos
# tabla_comparativa[["Con errores total", "Con errores 2025"]] = tabla_comparativa[
#     ["Con errores total", "Con errores 2025"]
# ].fillna(0).astype(int)

# # 📈 Cálculo de porcentajes (formato string con %)
# tabla_comparativa["% errores total"] = (
#     tabla_comparativa["Con errores total"] / tabla_comparativa["Total solicitudes"] * 100
# ).round(1).astype(str) + "%"

# tabla_comparativa["% errores 2025"] = (
#     (tabla_comparativa["Con errores 2025"] / tabla_comparativa["Total 2025"].replace(0, pd.NA)) * 100
# ).round(1).astype(str).fillna("0.0") + "%"

# # 📋 Mostrar tabla con título
# from IPython.display import display, Markdown

# display(Markdown("### 📊 Comparación de errores por instrumento: Total vs. 2025"))
# display(tabla_comparativa.style.hide(axis="index"))

In [None]:
# import pandas as pd
# import matplotlib.pyplot as plt
# import numpy as np


# # 🧽 Preprocesamiento
# df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
# df_reporte["Año"] = df_reporte["Fecha"].dt.year
# df_reporte["Clasificación_Errores"] = df_reporte["Casuisticas errores en solicitudes"].apply(
#     lambda x: "Con errores" if pd.notna(x) else "Sin errores"
# )

# # 🔹 Agrupaciones históricas
# errores_total = df_reporte[df_reporte["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores total")

# total_total = df_reporte.groupby("Instrumento")["Código"].count().reset_index(name="Total solicitudes")

# # 🔹 Agrupaciones 2025
# df_2025 = df_reporte[df_reporte["Año"] == 2025]
# errores_2025 = df_2025[df_2025["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores 2025")

# total_2025 = df_2025.groupby("Instrumento")["Código"].count().reset_index(name="Total 2025")

# # 🔗 Unir todas las tablas
# tabla = total_total.merge(errores_total, on="Instrumento", how="left") \
#                    .merge(total_2025, on="Instrumento", how="left") \
#                    .merge(errores_2025, on="Instrumento", how="left")

# # 🧼 Limpiar nulos
# tabla[["Con errores total", "Con errores 2025"]] = tabla[["Con errores total", "Con errores 2025"]].fillna(0).astype(int)

# # 📊 Crear dataframe para graficar
# grafico_df = tabla.copy()
# grafico_df["% errores total"] = grafico_df["Con errores total"] / grafico_df["Total solicitudes"] * 100
# grafico_df["% errores 2025"] = grafico_df["Con errores 2025"] / grafico_df["Total 2025"].replace(0, pd.NA) * 100

# # ─────────────────────────────────────────────
# # 🔻 GRÁFICOS: BARRAS + PIE TOTAL + PIE 2025
# # ─────────────────────────────────────────────

# fig, axs = plt.subplots(3, 1, figsize=(16, 22))

# # 1️⃣ GRÁFICO DE BARRAS COMPARATIVO
# x = np.arange(len(grafico_df["Instrumento"]))
# width = 0.35

# bars1 = axs[0].bar(x - width/2, grafico_df["% errores total"], width, label='% errores total', color="#FD9893")
# bars2 = axs[0].bar(x + width/2, grafico_df["% errores 2025"], width, label='% errores 2025', color="#72C7D5")

# axs[0].set_title("📊 Comparación de % de errores por instrumento: Total histórico vs. 2025", fontsize=14)
# axs[0].set_xlabel("Instrumento")
# axs[0].set_ylabel("% de errores")
# axs[0].set_xticks(x)
# axs[0].set_xticklabels(grafico_df["Instrumento"], rotation=45, ha='right')
# axs[0].legend()
# axs[0].grid(axis='y', linestyle='--', alpha=0.6)
# for bars in [bars1, bars2]:
#     axs[0].bar_label(bars, fmt='%.1f%%', padding=3)

# # 2️⃣ PIE CHART TOTAL HISTÓRICO
# errores_totales = tabla[tabla["Con errores total"] > 0][["Instrumento", "Con errores total"]]
# axs[1].pie(
#     errores_totales["Con errores total"],
#     labels=errores_totales["Instrumento"],
#     autopct='%1.1f%%',
#     startangle=90,
#     colors=plt.cm.Paired.colors,
#     wedgeprops={'edgecolor': 'white'}
# )
# axs[1].set_title("🥧 Distribución de errores por instrumento (Total histórico)")

# # 3️⃣ PIE CHART 2025
# errores_2025_pie = tabla[tabla["Con errores 2025"] > 0][["Instrumento", "Con errores 2025"]]
# axs[2].pie(
#     errores_2025_pie["Con errores 2025"],
#     labels=errores_2025_pie["Instrumento"],
#     autopct='%1.1f%%',
#     startangle=90,
#     colors=plt.cm.Pastel1.colors,
#     wedgeprops={'edgecolor': 'white'}
# )
# axs[2].set_title("🥧 Distribución de errores por instrumento (Año 2025)")

# plt.tight_layout()
# plt.show()

In [None]:
# # Ajustar el gráfico para que el eje de % errores vaya de 0 a 100%
# def graficar_tendencia_errores(df, titulo="Tendencia Temporal de Errores"):
#     df = df.copy()
#     df["Fecha"] = pd.to_datetime(df["Fecha"], errors="coerce")
#     df = df[df["Fecha"] >= "2024-01-01"]
#     df = df[df["Fecha"].notna()]
#     df["Mes"] = df["Fecha"].dt.to_period("M").astype(str)
#     df["Clasificación_Errores"] = df["Casuisticas errores en solicitudes"].apply(
#         lambda x: "Con errores" if pd.notna(x) else "Sin errores"
#     )

#     # Agrupación
#     solicitudes_por_mes = df.groupby("Mes")["Código"].count().reset_index(name="Total solicitudes")
#     errores_por_mes = df[df["Clasificación_Errores"] == "Con errores"] \
#         .groupby("Mes")["Código"].count().reset_index(name="Con errores")

#     errores_tendencia = pd.merge(solicitudes_por_mes, errores_por_mes, on="Mes", how="left")
#     errores_tendencia["Con errores"] = errores_tendencia["Con errores"].fillna(0).astype(int)
#     errores_tendencia["% Errores"] = (errores_tendencia["Con errores"] / errores_tendencia["Total solicitudes"] * 100).round(1)

#     # Gráfico
#     fig, ax1 = plt.subplots(figsize=(14, 6))
#     ax1.bar(errores_tendencia["Mes"], errores_tendencia["Total solicitudes"], color="#D6E4F0", label="Total solicitudes")
#     ax1.set_ylabel("Total de solicitudes", color='black')
#     ax1.set_xlabel("Mes")
#     ax1.tick_params(axis='x', rotation=45)

#     # Línea de % errores
#     ax2 = ax1.twinx()
#     ax2.plot(errores_tendencia["Mes"], errores_tendencia["% Errores"], color="#FD9893", marker='o', label="% Errores")
#     ax2.set_ylabel("% de errores", color='black')
#     ax2.set_ylim(0, 100)  # Escala del 0% al 100%

#     for i, txt in enumerate(errores_tendencia["% Errores"]):
#         ax2.annotate(f"{txt}%", (errores_tendencia["Mes"][i], errores_tendencia["% Errores"][i] + 2), ha='center', fontsize=9)

#     plt.title(f"📈 {titulo}: % de errores vs total de solicitudes por mes")
#     fig.legend(loc="upper left", bbox_to_anchor=(0.1, 0.92))
#     plt.grid(axis='y', linestyle='--', alpha=0.5)
#     plt.tight_layout()
#     plt.show()

# # Ejecutar función actualizada
# graficar_tendencia_errores(df_reporte)

In [None]:
# # Asegurar que la columna de errores esté bien definida
# df_reporte["Clasificación_Errores"] = df_reporte["Casuisticas errores en solicitudes"].apply(
#     lambda x: "Con errores" if pd.notna(x) else "Sin errores"
# )

# # Calcular totales por instrumento
# total_por_instrumento = df_reporte.groupby("Instrumento")["Código"].count().reset_index(name="Total solicitudes")
# errores_por_instrumento = df_reporte[df_reporte["Clasificación_Errores"] == "Con errores"] \
#     .groupby("Instrumento")["Código"].count().reset_index(name="Con errores")

# # Unir ambos conteos y calcular % de errores
# tabla_errores = pd.merge(total_por_instrumento, errores_por_instrumento, on="Instrumento", how="left")
# tabla_errores["Con errores"] = tabla_errores["Con errores"].fillna(0).astype(int)
# tabla_errores["% Errores"] = (tabla_errores["Con errores"] / tabla_errores["Total solicitudes"] * 100).round(1)

# # Ordenar por cantidad de errores
# tabla_errores.sort_values(by="Con errores", ascending=False, inplace=True)

# # 🚨 Identificar si algún instrumento concentra más del 50% de todos los errores
# total_errores = tabla_errores["Con errores"].sum()
# tabla_errores["% del total de errores"] = (tabla_errores["Con errores"] / total_errores * 100).round(1)


# # ✅ Mostrar tabla complementaria
# from IPython.display import display, Markdown
# display(Markdown("### 📋 Tabla: Ranking de instrumentos según frecuencia y tasa de error"))
# display(tabla_errores.style.hide(axis="index"))

In [None]:
# # Filtrado de errores total
# errores_total = df_reporte[df_reporte["Clasificación_Errores"] == "Con errores"]
# conteo_total = errores_total["Instrumento"].value_counts().reset_index()
# conteo_total.columns = ["Instrumento", "Cantidad"]
# conteo_total["Porcentaje"] = (conteo_total["Cantidad"] / conteo_total["Cantidad"].sum() * 100).round(1)

# # Colores
# colores_instrumentos = {
#     "Crea y Valida": "#6B70C8",
#     "Consolida y Expande": "#FD9893",
#     "Capital Humano": "#78DDBB",
#     "Gestión de la Innovación": "#3F3F3F",
#     "Innova Alta Tecnología": "#72C7D5",
#     "Otros": "#A0A0A0"
# }
# colores = [colores_instrumentos.get(inst, "#CCCCCC") for inst in conteo_total["Instrumento"]]

# # Gráfico
# fig, ax = plt.subplots(figsize=(8, 8), facecolor='white')
# ax.set_facecolor("white")
# ax.pie(
#     conteo_total["Cantidad"],
#     labels=conteo_total["Instrumento"],
#     autopct='%1.1f%%',
#     startangle=90,
#     colors=colores,
#     wedgeprops={'edgecolor': 'white'}
# )
# plt.title("📊 Distribución de errores por instrumento (Total histórico)", fontsize=14)
# plt.tight_layout()
# plt.show()

In [None]:
# # Filtrado año 2025
# df_reporte["Fecha"] = pd.to_datetime(df_reporte["Fecha"], errors="coerce")
# df_2025 = df_reporte[df_reporte["Fecha"].dt.year == 2025]
# errores_2025 = df_2025[df_2025["Clasificación_Errores"] == "Con errores"]
# conteo_2025 = errores_2025["Instrumento"].value_counts().reset_index()
# conteo_2025.columns = ["Instrumento", "Cantidad"]
# conteo_2025["Porcentaje"] = (conteo_2025["Cantidad"] / conteo_2025["Cantidad"].sum() * 100).round(1)

# # Colores
# colores_2025 = [colores_instrumentos.get(inst, "#CCCCCC") for inst in conteo_2025["Instrumento"]]

# # Gráfico
# fig, ax = plt.subplots(figsize=(8, 8), facecolor='white')
# ax.set_facecolor("white")
# ax.pie(
#     conteo_2025["Cantidad"],
#     labels=conteo_2025["Instrumento"],
#     autopct='%1.1f%%',
#     startangle=90,
#     colors=colores_2025,
#     wedgeprops={'edgecolor': 'white'}
# )
# plt.title("📊 Distribución de errores por instrumento (Año 2025)", fontsize=14)
# plt.tight_layout()
# plt.show()

---

In [None]:
# # 🛠 Consulta dinámica para obtener todos los campos de la tabla
# sql_query = """
# SELECT *
# FROM innova_sgp_Carga.dbo.snapshot_proyectos
# WHERE Gerencia = 'Innovación';
# """

# # 🔐 Cadena de conexión a SQL Server
# connection_string = (
#     "Driver={ODBC Driver 18 for SQL Server};"
#     "Uid=user_seg;Pwd=user_seg;"
#     "Server=ddssql11-avs\\orion;Port=1972;"
#     "Database=innova_sgp_Carga;Encrypt=No;TrustServerCertificate=No"
# )

# # 🔌 Conectar y ejecutar la consulta
# con = pyodbc.connect(connection_string, timeout=10)
# datos_proyecto = pd.read_sql_query(sql_query, con)

# # 🧹 Limpieza del DataFrame
# datos_proyecto = datos_proyecto.apply(lambda x: x.str.strip() if x.dtype == "object" else x)
# datos_proyecto = datos_proyecto.applymap(lambda x: None if x in ["", "NA"] else x)

# # 📝 Normalización de nombres de columnas
# datos_proyecto.columns = (
#     datos_proyecto.columns
#     .str.strip()
#     .str.replace(" ", "_")
#     .str.replace("ñ", "n")
# )

# # 🔒 Cierre de conexión
# con.close()

# # 👀 Mostrar nombres de columnas obtenidas
# print("✅ Columnas disponibles en snapshot_proyectos:")
# for col in datos_proyecto.columns:
#     print(f"• {col}")

In [None]:
# # Selección de columnas deseadas (asegúrate de que estén normalizadas sin tildes)
# columnas_deseadas = [
#     "codigo", 
#     "nombre_ejecutivo_tecnico", 
#     "instrumento", 
#     "estado_proyecto", 
#     "region_de_ejecucion"
# ]

# # Mostrar solo las columnas solicitadas
# print(datos_filtrados[columnas_deseadas]

In [None]:
# # 🛠 Consulta dinámica
# sql_query = """
# SELECT *
# FROM innova_sgp_Carga.dbo.snapshot_proyectos
# WHERE Gerencia = 'Innovación';
# """

# # 🔐 Cadena de conexión
# connection_string = (
#     "Driver={ODBC Driver 18 for SQL Server};"
#     "Uid=user_seg;Pwd=user_seg;"
#     "Server=ddssql11-avs\\orion;Port=1972;"
#     "Database=innova_sgp_Carga;Encrypt=No;TrustServerCertificate=No"
# )

# # 🔌 Ejecutar consulta
# con = pyodbc.connect(connection_string, timeout=10)
# datos_proyecto = pd.read_sql_query(sql_query, con)

# # 🧹 Limpieza del DataFrame
# datos_proyecto = datos_proyecto.apply(lambda x: x.str.strip() if x.dtype == "object" else x)
# datos_proyecto = datos_proyecto.applymap(lambda x: None if x in ["", "NA"] else x)

# # 📝 Normalización de columnas
# datos_proyecto.columns = (
#     datos_proyecto.columns
#     .str.strip()
#     .str.replace(" ", "_")
#     .str.replace("ñ", "n")
# )

# # 🔒 Cerrar conexión
# con.close()

# # ✅ Filtrar por nombres de ejecutivos
# nombres_ejecutivos = [
#     "JEREMY ANTONIO SALAS VENEGAS", 
#     "JEANETTE ALEJANDRA MUNDACA DESPECCI", 
#     "MARIA JOSE MORAGA CASTRO",
#     "MARTA ESTHER  MINA AVENDANO", 
#     "JUAN CARLOS CASTRO CABEZAS",
#     "BARBARA SOL PARRAGUE GUZMAN", 
#     "PAULA CAMILA DURÁN ABURTO",
#     "JAIME TORRES MUÑOZ", 
#     "HUGO JARA VARGAS",
#     "CRISTOFER ANTONIO MONSALVE SEPULVEDA", 
#     "DIEGO IGNACIO VILLALOBOS RAMOS VILLALOBOS RAMOS",
#     "JAVIERA DEL PILAR GOMEZ MURUA", 
#     "JUAN MARTINEZ F.", 
#     "PABLO GAETE HALLER",
#     "CHRISTOPHER ANDRES VIVANCO BARRA", 
#     "LISETTE ESPINOZA", 
#     "JUAN PABLO ALVAREZ CERECEDA",
#     "SEBASTIAN  JILBERTO", 
#     "YESSENNIA ESPINOZA", 
#     "ALEJANDRO  LEMUS",
#     "ANDRES SALVADOR LEAL VILCHES"
# ]

# # Convertir a mayúsculas la columna de ejecutivos técnicos (ajusta si tiene otro nombre exacto)
# columna_ejecutivo = "Nombre_Ejecutivo_Técnico"
# datos_filtrados = datos_proyecto[
#     datos_proyecto[columna_ejecutivo].str.upper().isin(nombres_ejecutivos)
# ]

# # 👀 Mostrar resultados
# display(Markdown("### 📋 Proyectos de ejecutivos seleccionados"))
# display(datos_filtrados.style.hide(axis="index"))

In [None]:
# # Paso 1: Filtrar por estado "ADJUDICADO"
# estado_adjudicado = datos_proyecto[datos_proyecto["Estado_Proyecto"] == "ADJUDICADO"]

# # Paso 2: Lista de nombres clave (en mayúsculas para facilitar búsqueda insensible a mayúsculas/minúsculas)
# nombres_ejecutivos = [
#     "JEREMY ANTONIO SALAS VENEGAS", 
#     "JEANETTE ALEJANDRA MUNDACA DESPECCI", 
#     "MARIA JOSE MORAGA CASTRO",
#     "MARTA ESTHER  MINA AVENDANO", 
#     "JUAN CARLOS CASTRO CABEZAS",
#     "BARBARA SOL PARRAGUE GUZMAN", 
#     "PAULA CAMILA DURÁN ABURTO",
#     "JAIME TORRES MUÑOZ", 
#     "HUGO JARA VARGAS",
#     "CRISTOFER ANTONIO MONSALVE SEPULVEDA", 
#     "DIEGO IGNACIO VILLALOBOS RAMOS VILLALOBOS RAMOS",
#     "JAVIERA DEL PILAR GOMEZ MURUA", 
#     "JUAN MARTINEZ F.", 
#     "PABLO GAETE HALLER",
#     "CHRISTOPHER ANDRES VIVANCO BARRA", 
#     "LISETTE ESPINOZA", 
#     "JUAN PABLO ALVAREZ CERECEDA",
#     "SEBASTIAN  JILBERTO", 
#     "YESSENNIA ESPINOZA", 
#     "ALEJANDRO  LEMUS",
#     "ANDRES SALVADOR LEAL VILCHES"
# ]

# # Paso 3: Convertir columna de ejecutivo técnico a mayúsculas para hacer comparación insensible a mayúsculas
# datos_filtrados = estado_adjudicado[
#     estado_adjudicado["Nombre_Ejecutivo_Tecnico"].str.upper().isin(nombres_ejecutivos)
# ]

# # Mostrar resultado
# from IPython.display import Markdown, display
# display(Markdown("### 📋 Proyectos 'ADJUDICADOS' con Ejecutivos Técnicos seleccionados"))
# display(datos_filtrados.style.hide(axis="index"))

In [None]:
# # Paso 1: Filtrar por estado "ADJUDICADO"
# estado_adjudicado = datos_proyecto[datos_proyecto["Estado_Proyecto"] == "ADJUDICADO"]

# # Paso 2: Lista de nombres clave (en mayúsculas para facilitar búsqueda insensible a mayúsculas/minúsculas)
# nombres_ejecutivos = [
#     "JEREMY ANTONIO SALAS VENEGAS", 
#     "JEANETTE ALEJANDRA MUNDACA DESPECCI", 
#     "MARIA JOSE MORAGA CASTRO",
#     "MARTA ESTHER  MINA AVENDANO", 
#     "JUAN CARLOS CASTRO CABEZAS",
#     "BARBARA SOL PARRAGUE GUZMAN", 
#     "PAULA CAMILA DURÁN ABURTO",
#     "JAIME TORRES MUÑOZ", 
#     "HUGO JARA VARGAS",
#     "CRISTOFER ANTONIO MONSALVE SEPULVEDA", 
#     "DIEGO IGNACIO VILLALOBOS RAMOS VILLALOBOS RAMOS",
#     "JAVIERA DEL PILAR GOMEZ MURUA", 
#     "JUAN MARTINEZ F.", 
#     "PABLO GAETE HALLER",
#     "CHRISTOPHER ANDRES VIVANCO BARRA", 
#     "LISETTE ESPINOZA", 
#     "JUAN PABLO ALVAREZ CERECEDA",
#     "SEBASTIAN  JILBERTO", 
#     "YESSENNIA ESPINOZA", 
#     "ALEJANDRO  LEMUS",
#     "ANDRES SALVADOR LEAL VILCHES"
# ]

# # Paso 3: Convertir columna de ejecutivo técnico a mayúsculas para hacer comparación insensible a mayúsculas
# datos_filtrados = estado_adjudicado[
#     estado_adjudicado["Nombre_Ejecutivo_Tecnico"].str.upper().isin(nombres_ejecutivos)
# ]

# # Mostrar resultado
# from IPython.display import Markdown, display
# display(Markdown("### 📋 Proyectos 'ADJUDICADOS' con Ejecutivos Técnicos seleccionados"))
# display(datos_filtrados.style.hide(axis="index"))

In [None]:
# # Paso 1: Estados válidos
# estados_validos = [
#     "VIGENTE",
#     "VIGENTE(Reprogramando)",
#     "VIGENTE(Reprogramación Rechazada)"
# ]

# # Paso 2: Lista de nombres clave (en mayúsculas para facilitar búsqueda insensible a mayúsculas/minúsculas)
# nombres_ejecutivos = [
#     "JEREMY ANTONIO SALAS VENEGAS", 
#     "JEANETTE ALEJANDRA MUNDACA DESPECCI", 
#     "MARIA JOSE MORAGA CASTRO",
#     "MARTA ESTHER  MINA AVENDANO", 
#     "JUAN CARLOS CASTRO CABEZAS",
#     "BARBARA SOL PARRAGUE GUZMAN", 
#     "PAULA CAMILA DURÁN ABURTO",
#     "JAIME TORRES MUÑOZ", 
#     "HUGO JARA VARGAS",
#     "CRISTOFER ANTONIO MONSALVE SEPULVEDA", 
#     "DIEGO IGNACIO VILLALOBOS RAMOS VILLALOBOS RAMOS",
#     "JAVIERA DEL PILAR GOMEZ MURUA", 
#     "JUAN MARTINEZ F.", 
#     "PABLO GAETE HALLER",
#     "CHRISTOPHER ANDRES VIVANCO BARRA", 
#     "LISETTE ESPINOZA", 
#     "JUAN PABLO ALVAREZ CERECEDA",
#     "SEBASTIAN  JILBERTO", 
#     "YESSENNIA ESPINOZA", 
#     "ALEJANDRO  LEMUS",
#     "ANDRES SALVADOR LEAL VILCHES"
# ]

# # Paso 3: Normalizar nombre del ejecutivo a mayúsculas para la comparación
# datos_proyecto["Nombre_Ejecutivo_Tecnico_Upper"] = datos_proyecto["Nombre_Ejecutivo_Técnico"].str.upper().str.strip()

# # Paso 4: Filtrar por estado y nombre de ejecutivo
# df_estado_proyecto = datos_proyecto[
#     datos_proyecto["Estado_Proyecto"].isin(estados_validos) &
#     datos_proyecto["Nombre_Ejecutivo_Tecnico_Upper"].isin(nombres_ejecutivos)
#     & datos_proyecto["Estado_Proyecto"] == "ADJUDICADO(Configurando)"
# ][["Código", "Nombre_Ejecutivo_Técnico", "Instrumento", "Estado_Proyecto", "Región_de_Ejecución"]]

# # Paso 5: Mostrar resultado
# print(f"✅ Se encontraron {len(df_estado_proyecto)} proyectos con estado vigente y ejecutivos filtrados:")
# display(df_estado_proyecto.head())

In [None]:
# # 🧮 Contar proyectos por ejecutivo técnico (ya filtrados previamente)
# conteo_por_ejecutivo = (
#     df_estado_proyecto
#     .groupby("Nombre_Ejecutivo_Técnico")
#     .size()
#     .reset_index(name="Total_Proyectos")
#     .sort_values(by="Total_Proyectos", ascending=False)
# )

# # 📊 Mostrar tabla
# print("📋 Conteo de proyectos vigentes por ejecutivo técnico:")
# display(conteo_por_ejecutivo)