# Notebook 2: Preparaci√≥n de Dashboard Streamlit

**Fundaci√≥n Telet√≥n - An√°lisis de Satisfacci√≥n de Benefactores**

---

## Objetivo

Este notebook prepara:
- Funciones reutilizables para calcular KPIs
- Funciones de visualizaci√≥n con la paleta de Telet√≥n
- Agregaciones de datos necesarias para el dashboard
- Componentes que se integrar√°n en la aplicaci√≥n Streamlit

## Estructura del Dashboard Streamlit

1. **Header con KPIs principales**
2. **Perfil de Benefactores** (giro, estado, puesto)
3. **Calidad de Servicio** (13 dimensiones)
4. **Satisfacci√≥n y Lealtad** (NPS, transparencia)
5. **An√°lisis Temporal** (tendencias por antig√ºedad)

---

## 1. Importar Librer√≠as y Configuraci√≥n

In [None]:
# Librer√≠as est√°ndar
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n de visualizaci√≥n
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.family'] = 'sans-serif'
plt.rcParams['font.sans-serif'] = ['Arial', 'DejaVu Sans']
plt.rcParams['axes.unicode_minus'] = False

# Paleta de colores Telet√≥n
COLORES_TELETON = {
    'amarillo': '#F7C600',
    'morado_profundo': '#4B1F76',
    'morado_medio': '#7E3AA7',
    'magenta': '#D7268F',
    'azul': '#1A2A6C',
    'naranja': '#F39C12',
    'verde': '#2ECC71',
    'rojo': '#E74C3C',
    'gris_claro': '#F5F5F5',
    'gris_medio': '#7F8C8D',
    'gris_oscuro': '#2D3436'
}

# Paleta para gr√°ficos
PALETA_PRINCIPAL = ['#F7C600', '#4B1F76', '#7E3AA7', '#D7268F', '#1A2A6C']
sns.set_palette(PALETA_PRINCIPAL)

print("‚úÖ Librer√≠as importadas")
print(f"üìÖ Fecha de ejecuci√≥n: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

## 2. Cargar Dataset Limpio

In [None]:
# Cargar datos limpios generados en Notebook 1
df = pd.read_csv('../datos/teleton_limpio.csv')

print(f"üìä Dataset cargado: {df.shape[0]} filas √ó {df.shape[1]} columnas")
print(f"\nüìã Columnas disponibles:")
print(df.columns.tolist())

## 3. Definir Variables por Categor√≠a

In [None]:
# 13 dimensiones de calidad de servicio (escala Likert 1-5)
VARS_CALIDAD_SERVICIO = [
    'apariencia_comportamiento',
    'claridad_procedimientos',
    'cumplimiento_horarios',
    'conocimiento_competencia',
    'claridad_primer_contacto',
    'rapidez_respuesta',
    'disposicion_ayuda',
    'flexibilidad',
    'actitud_comprensiva',
    'tiempo_dedicado',
    'preocupacion_situacion',
    'atencion_personalizada',
    'comunicacion_continua'
]

# 4 variables de satisfacci√≥n (escala 1-10)
VARS_SATISFACCION = [
    'satisfaccion_general',
    'nps',
    'calidad_percibida',
    'transparencia'
]

# Variables categ√≥ricas
VARS_CATEGORICAS = ['giro', 'puesto', 'estado']

# Variables num√©ricas
VARS_NUMERICAS = ['anos_benefactor']

# Variables calculadas
VARS_CALCULADAS = ['indice_calidad_servicio', 'nps_categoria', 'segmento_antiguedad']

print("‚úÖ Variables clasificadas:")
print(f"   - Calidad de Servicio: {len(VARS_CALIDAD_SERVICIO)} variables")
print(f"   - Satisfacci√≥n: {len(VARS_SATISFACCION)} variables")
print(f"   - Categ√≥ricas: {len(VARS_CATEGORICAS)} variables")
print(f"   - Num√©ricas: {len(VARS_NUMERICAS)} variables")
print(f"   - Calculadas: {len(VARS_CALCULADAS)} variables")

## 4. Funciones para Calcular KPIs

Estas funciones ser√°n reutilizadas en el dashboard de Streamlit.

In [None]:
def calcular_kpi_satisfaccion_general(df):
    """
    KPI 1: Satisfacci√≥n General
    Promedio de la columna 'satisfaccion_general' (escala 1-10)
    """
    return df['satisfaccion_general'].mean()


def calcular_kpi_nps(df):
    """
    KPI 2: Net Promoter Score (NPS)
    F√≥rmula: (% Promotores - % Detractores) √ó 100
    - Promotores: NPS >= 9
    - Pasivos: 7 <= NPS <= 8
    - Detractores: NPS <= 6
    """
    total = len(df)
    promotores = (df['nps'] >= 9).sum()
    detractores = (df['nps'] <= 6).sum()
    
    nps = ((promotores - detractores) / total) * 100
    return nps


def calcular_kpi_calidad_servicio(df):
    """
    KPI 3: √çndice de Calidad de Servicio
    Promedio de las 13 dimensiones de calidad (escala 1-5)
    """
    return df[VARS_CALIDAD_SERVICIO].mean().mean()


def calcular_kpi_transparencia(df):
    """
    KPI 4: Transparencia
    Promedio de la columna 'transparencia' (escala 1-10)
    """
    return df['transparencia'].mean()


def calcular_kpi_antiguedad_promedio(df):
    """
    KPI 5: Antig√ºedad Promedio
    Promedio de a√±os como benefactor
    """
    return df['anos_benefactor'].mean()


def calcular_kpi_calidad_percibida(df):
    """
    KPI 6: Calidad Percibida
    Promedio de la columna 'calidad_percibida' (escala 1-10)
    """
    return df['calidad_percibida'].mean()


def calcular_todos_kpis(df):
    """
    Calcula todos los KPIs y devuelve un diccionario
    """
    kpis = {
        'satisfaccion_general': calcular_kpi_satisfaccion_general(df),
        'nps': calcular_kpi_nps(df),
        'indice_calidad_servicio': calcular_kpi_calidad_servicio(df),
        'transparencia': calcular_kpi_transparencia(df),
        'antiguedad_promedio': calcular_kpi_antiguedad_promedio(df),
        'calidad_percibida': calcular_kpi_calidad_percibida(df)
    }
    return kpis


# Probar las funciones
kpis = calcular_todos_kpis(df)
print("‚úÖ KPIs Calculados:")
print(f"   1. Satisfacci√≥n General: {kpis['satisfaccion_general']:.2f} / 10")
print(f"   2. Net Promoter Score: {kpis['nps']:.1f}%")
print(f"   3. √çndice Calidad Servicio: {kpis['indice_calidad_servicio']:.2f} / 5")
print(f"   4. Transparencia: {kpis['transparencia']:.2f} / 10")
print(f"   5. Antig√ºedad Promedio: {kpis['antiguedad_promedio']:.1f} a√±os")
print(f"   6. Calidad Percibida: {kpis['calidad_percibida']:.2f} / 10")

## 5. Funciones de Segmentaci√≥n NPS

In [None]:
def segmentar_nps(df):
    """
    Calcula la distribuci√≥n de promotores, pasivos y detractores
    Retorna DataFrame con conteos y porcentajes
    """
    total = len(df)
    
    promotores = (df['nps'] >= 9).sum()
    pasivos = ((df['nps'] >= 7) & (df['nps'] <= 8)).sum()
    detractores = (df['nps'] <= 6).sum()
    
    segmentos = pd.DataFrame({
        'Categor√≠a': ['Promotores (9-10)', 'Pasivos (7-8)', 'Detractores (0-6)'],
        'Cantidad': [promotores, pasivos, detractores],
        'Porcentaje': [
            (promotores / total) * 100,
            (pasivos / total) * 100,
            (detractores / total) * 100
        ]
    })
    
    return segmentos


# Probar funci√≥n
segmentos_nps = segmentar_nps(df)
print("‚úÖ Segmentaci√≥n NPS:")
print(segmentos_nps.to_string(index=False))

## 6. Funciones de Agregaci√≥n por Segmento

In [None]:
def agregar_por_giro(df):
    """
    Agrega m√©tricas clave por tipo de giro empresarial
    """
    agregacion = df.groupby('giro').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'anos_benefactor': 'mean',
        'giro': 'count'  # Para contar registros
    }).rename(columns={'giro': 'cantidad'})
    
    agregacion = agregacion.round(2)
    agregacion = agregacion.sort_values('satisfaccion_general', ascending=False)
    
    return agregacion.reset_index()


def agregar_por_estado(df):
    """
    Agrega m√©tricas clave por estado
    """
    agregacion = df.groupby('estado').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'estado': 'count'
    }).rename(columns={'estado': 'cantidad'})
    
    agregacion = agregacion.round(2)
    agregacion = agregacion.sort_values('cantidad', ascending=False)
    
    return agregacion.reset_index()


def agregar_por_antiguedad(df):
    """
    Agrega m√©tricas por segmento de antig√ºedad
    """
    agregacion = df.groupby('segmento_antiguedad').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'transparencia': 'mean',
        'segmento_antiguedad': 'count'
    }).rename(columns={'segmento_antiguedad': 'cantidad'})
    
    agregacion = agregacion.round(2)
    
    return agregacion.reset_index()


# Probar funciones
print("‚úÖ Agregaci√≥n por Giro:")
print(agregar_por_giro(df).head())
print("\n‚úÖ Agregaci√≥n por Estado (Top 5):")
print(agregar_por_estado(df).head())
print("\n‚úÖ Agregaci√≥n por Antig√ºedad:")
print(agregar_por_antiguedad(df))

## 7. Funciones de Visualizaci√≥n

Estas funciones crear√°n gr√°ficos con la paleta de Telet√≥n que ser√°n usados en Streamlit.

### 7.1 Gr√°fico de KPIs (M√©trica √∫nica)

In [None]:
def crear_gauge_kpi(valor, titulo, valor_max=10, umbral_bueno=8, umbral_regular=6):
    """
    Crea un gr√°fico de "gauge" simple usando barras horizontales
    para mostrar un KPI con umbrales de color
    """
    # Determinar color seg√∫n umbral
    if valor >= umbral_bueno:
        color = COLORES_TELETON['verde']
        categoria = 'Excelente'
    elif valor >= umbral_regular:
        color = COLORES_TELETON['amarillo']
        categoria = 'Bueno'
    else:
        color = COLORES_TELETON['rojo']
        categoria = 'Mejorable'
    
    fig, ax = plt.subplots(figsize=(8, 2))
    
    # Barra de fondo (gris)
    ax.barh([0], [valor_max], color=COLORES_TELETON['gris_claro'], height=0.5)
    
    # Barra de valor
    ax.barh([0], [valor], color=color, height=0.5)
    
    # Configuraci√≥n
    ax.set_xlim(0, valor_max)
    ax.set_ylim(-0.5, 0.5)
    ax.set_yticks([])
    ax.set_xlabel('')
    ax.set_title(f"{titulo}: {valor:.2f} / {valor_max} ({categoria})", 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    # Texto del valor
    ax.text(valor/2, 0, f'{valor:.2f}', 
            ha='center', va='center', fontsize=16, fontweight='bold', color='white')
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    ax.spines['left'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_gauge_kpi(
    valor=kpis['satisfaccion_general'],
    titulo='Satisfacci√≥n General',
    valor_max=10,
    umbral_bueno=8,
    umbral_regular=6
)
plt.show()
print("‚úÖ Funci√≥n crear_gauge_kpi() probada")

### 7.2 Gr√°fico de Distribuci√≥n NPS

In [None]:
def crear_grafico_nps(df):
    """
    Crea gr√°fico de barras horizontales con la distribuci√≥n de NPS
    """
    segmentos = segmentar_nps(df)
    
    # Colores por categor√≠a
    colores_nps = [COLORES_TELETON['verde'], COLORES_TELETON['amarillo'], COLORES_TELETON['rojo']]
    
    fig, ax = plt.subplots(figsize=(10, 5))
    
    bars = ax.barh(segmentos['Categor√≠a'], segmentos['Porcentaje'], color=colores_nps)
    
    # A√±adir etiquetas de porcentaje
    for i, (bar, cantidad, porcentaje) in enumerate(zip(bars, segmentos['Cantidad'], segmentos['Porcentaje'])):
        ax.text(bar.get_width() + 1, bar.get_y() + bar.get_height()/2, 
                f'{porcentaje:.1f}% (n={cantidad})',
                va='center', fontsize=11, fontweight='bold')
    
    ax.set_xlabel('Porcentaje (%)', fontsize=12, fontweight='bold')
    ax.set_title('Distribuci√≥n del Net Promoter Score (NPS)', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_xlim(0, max(segmentos['Porcentaje']) + 10)
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_grafico_nps(df)
plt.show()
print("‚úÖ Funci√≥n crear_grafico_nps() probada")

### 7.3 Gr√°fico de Calidad de Servicio (13 dimensiones)

In [None]:
def crear_grafico_calidad_servicio(df):
    """
    Crea gr√°fico de barras horizontales con las 13 dimensiones de calidad
    ordenadas de mayor a menor puntuaci√≥n
    """
    # Calcular promedios
    promedios = df[VARS_CALIDAD_SERVICIO].mean().sort_values(ascending=True)
    
    # Nombres m√°s legibles (primeras palabras)
    nombres_cortos = [
        'Apariencia y comportamiento',
        'Claridad de procedimientos',
        'Cumplimiento de horarios',
        'Conocimiento y competencia',
        'Claridad en primer contacto',
        'Rapidez de respuesta',
        'Disposici√≥n para ayudar',
        'Flexibilidad',
        'Actitud comprensiva',
        'Tiempo dedicado',
        'Preocupaci√≥n por situaci√≥n',
        'Atenci√≥n personalizada',
        'Comunicaci√≥n continua'
    ]
    
    # Crear diccionario de mapeo
    mapeo_nombres = dict(zip(VARS_CALIDAD_SERVICIO, nombres_cortos))
    promedios.index = promedios.index.map(mapeo_nombres)
    
    # Crear figura
    fig, ax = plt.subplots(figsize=(10, 8))
    
    bars = ax.barh(promedios.index, promedios.values, color=COLORES_TELETON['morado_medio'])
    
    # A√±adir valores al final de cada barra
    for bar in bars:
        width = bar.get_width()
        ax.text(width + 0.05, bar.get_y() + bar.get_height()/2,
                f'{width:.2f}',
                va='center', fontsize=10, fontweight='bold')
    
    # L√≠nea de referencia en la media general
    media_general = promedios.mean()
    ax.axvline(media_general, color=COLORES_TELETON['amarillo'], 
               linestyle='--', linewidth=2, label=f'Media general: {media_general:.2f}')
    
    ax.set_xlabel('Puntuaci√≥n Promedio (escala 1-5)', fontsize=12, fontweight='bold')
    ax.set_title('Evaluaci√≥n de las 13 Dimensiones de Calidad de Servicio', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_xlim(0, 5.5)
    ax.legend(loc='lower right')
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_grafico_calidad_servicio(df)
plt.show()
print("‚úÖ Funci√≥n crear_grafico_calidad_servicio() probada")

### 7.4 Gr√°fico de Distribuci√≥n por Giro

In [None]:
def crear_grafico_por_giro(df, metrica='satisfaccion_general', top_n=10):
    """
    Crea gr√°fico de barras con la m√©trica promedio por giro empresarial
    Muestra solo los top_n giros con m√°s registros
    """
    # Contar y filtrar top giros
    conteo_giros = df['giro'].value_counts().head(top_n).index
    df_filtrado = df[df['giro'].isin(conteo_giros)]
    
    # Calcular promedios
    promedios = df_filtrado.groupby('giro')[metrica].mean().sort_values(ascending=False)
    
    # Crear figura
    fig, ax = plt.subplots(figsize=(12, 6))
    
    bars = ax.bar(range(len(promedios)), promedios.values, color=COLORES_TELETON['morado_profundo'])
    
    # Configurar etiquetas
    ax.set_xticks(range(len(promedios)))
    ax.set_xticklabels(promedios.index, rotation=45, ha='right')
    
    # A√±adir valores encima de las barras
    for bar in bars:
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2, height + 0.1,
                f'{height:.2f}',
                ha='center', va='bottom', fontsize=10, fontweight='bold')
    
    # T√≠tulos
    titulo_metrica = metrica.replace('_', ' ').title()
    ax.set_ylabel(titulo_metrica, fontsize=12, fontweight='bold')
    ax.set_title(f'{titulo_metrica} por Giro Empresarial (Top {top_n})', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_grafico_por_giro(df, metrica='satisfaccion_general', top_n=10)
plt.show()
print("‚úÖ Funci√≥n crear_grafico_por_giro() probada")

### 7.5 Gr√°fico Geogr√°fico (Estados)

In [None]:
def crear_grafico_geografico(df, top_n=10):
    """
    Crea gr√°fico de barras con cantidad de benefactores por estado
    """
    conteo_estados = df['estado'].value_counts().head(top_n)
    
    fig, ax = plt.subplots(figsize=(12, 6))
    
    bars = ax.barh(conteo_estados.index, conteo_estados.values, color=COLORES_TELETON['azul'])
    
    # A√±adir etiquetas
    for bar in bars:
        width = bar.get_width()
        ax.text(width + 1, bar.get_y() + bar.get_height()/2,
                f'{int(width)}',
                va='center', fontsize=10, fontweight='bold')
    
    ax.set_xlabel('Cantidad de Benefactores', fontsize=12, fontweight='bold')
    ax.set_title(f'Distribuci√≥n Geogr√°fica de Benefactores (Top {top_n} Estados)', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_grafico_geografico(df, top_n=10)
plt.show()
print("‚úÖ Funci√≥n crear_grafico_geografico() probada")

### 7.6 Gr√°fico de Tendencia por Antig√ºedad

In [None]:
def crear_grafico_antiguedad(df):
    """
    Crea gr√°fico de l√≠neas mostrando c√≥mo var√≠an las m√©tricas seg√∫n antig√ºedad
    """
    # Ordenar categor√≠as de antig√ºedad
    orden_antiguedad = ['Nuevo (0-3 a√±os)', 'Establecido (4-7 a√±os)', 
                        'Veterano (8-15 a√±os)', 'Hist√≥rico (15+ a√±os)']
    
    agregacion = df.groupby('segmento_antiguedad').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean'
    }).reindex(orden_antiguedad)
    
    # Normalizar a escala 0-10 para comparaci√≥n visual
    agregacion['indice_calidad_servicio_normalizado'] = agregacion['indice_calidad_servicio'] * 2
    
    fig, ax = plt.subplots(figsize=(12, 6))
    
    x = range(len(agregacion))
    
    ax.plot(x, agregacion['satisfaccion_general'], marker='o', linewidth=2.5,
            color=COLORES_TELETON['morado_profundo'], label='Satisfacci√≥n General (0-10)')
    
    ax.plot(x, agregacion['indice_calidad_servicio_normalizado'], marker='s', linewidth=2.5,
            color=COLORES_TELETON['morado_medio'], label='Calidad de Servicio (normalizado 0-10)')
    
    ax.plot(x, agregacion['nps'], marker='^', linewidth=2.5,
            color=COLORES_TELETON['amarillo'], label='NPS Promedio (0-10)')
    
    # Configuraci√≥n
    ax.set_xticks(x)
    ax.set_xticklabels(agregacion.index, rotation=15, ha='right')
    ax.set_ylabel('Puntuaci√≥n Promedio', fontsize=12, fontweight='bold')
    ax.set_title('Evoluci√≥n de M√©tricas seg√∫n Antig√ºedad del Benefactor', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_ylim(0, 10)
    ax.legend(loc='best', fontsize=10)
    ax.grid(axis='y', alpha=0.3, linestyle='--')
    
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_grafico_antiguedad(df)
plt.show()
print("‚úÖ Funci√≥n crear_grafico_antiguedad() probada")

### 7.7 Heatmap de Correlaciones

In [None]:
def crear_heatmap_correlacion(df):
    """
    Crea heatmap de correlaciones entre variables de satisfacci√≥n y calidad de servicio
    """
    # Seleccionar variables clave
    vars_analisis = VARS_SATISFACCION + ['indice_calidad_servicio']
    
    # Calcular matriz de correlaci√≥n
    correlacion = df[vars_analisis].corr()
    
    # Crear figura
    fig, ax = plt.subplots(figsize=(10, 8))
    
    # Heatmap con paleta personalizada
    sns.heatmap(correlacion, 
                annot=True, 
                fmt='.2f',
                cmap='YlGnBu',
                square=True,
                linewidths=1,
                cbar_kws={'label': 'Coeficiente de Correlaci√≥n'},
                ax=ax)
    
    # T√≠tulos m√°s legibles
    labels_legibles = [
        'Satisfacci√≥n General',
        'NPS',
        'Calidad Percibida',
        'Transparencia',
        '√çndice Calidad Servicio'
    ]
    
    ax.set_xticklabels(labels_legibles, rotation=45, ha='right')
    ax.set_yticklabels(labels_legibles, rotation=0)
    
    ax.set_title('Matriz de Correlaci√≥n: Satisfacci√≥n y Calidad de Servicio', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'], pad=20)
    
    plt.tight_layout()
    return fig


# Probar visualizaci√≥n
fig = crear_heatmap_correlacion(df)
plt.show()
print("‚úÖ Funci√≥n crear_heatmap_correlacion() probada")

## 8. Exportar Agregaciones para Streamlit

In [None]:
# Crear carpeta para datos procesados si no existe
import os
os.makedirs('../streamlit/data', exist_ok=True)

# Exportar agregaciones
agregar_por_giro(df).to_csv('../streamlit/data/agregacion_giro.csv', index=False)
agregar_por_estado(df).to_csv('../streamlit/data/agregacion_estado.csv', index=False)
agregar_por_antiguedad(df).to_csv('../streamlit/data/agregacion_antiguedad.csv', index=False)
segmentar_nps(df).to_csv('../streamlit/data/segmentos_nps.csv', index=False)

# Exportar KPIs
kpis_df = pd.DataFrame([kpis])
kpis_df.to_csv('../streamlit/data/kpis.csv', index=False)

print("‚úÖ Archivos exportados a streamlit/data/:")
print("   - agregacion_giro.csv")
print("   - agregacion_estado.csv")
print("   - agregacion_antiguedad.csv")
print("   - segmentos_nps.csv")
print("   - kpis.csv")

## 9. Guardar Funciones en M√≥dulo Python

Exportaremos todas las funciones a un archivo `.py` que ser√° importado por la app de Streamlit.

In [None]:
codigo_modulo = '''
"""
M√≥dulo de utilidades para el Dashboard de Fundaci√≥n Telet√≥n
Contiene funciones para calcular KPIs, agregaciones y crear visualizaciones
"""

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Paleta de colores Telet√≥n
COLORES_TELETON = {
    'amarillo': '#F7C600',
    'morado_profundo': '#4B1F76',
    'morado_medio': '#7E3AA7',
    'magenta': '#D7268F',
    'azul': '#1A2A6C',
    'naranja': '#F39C12',
    'verde': '#2ECC71',
    'rojo': '#E74C3C',
    'gris_claro': '#F5F5F5',
    'gris_medio': '#7F8C8D',
    'gris_oscuro': '#2D3436'
}

PALETA_PRINCIPAL = ['#F7C600', '#4B1F76', '#7E3AA7', '#D7268F', '#1A2A6C']

# Variables por categor√≠a
VARS_CALIDAD_SERVICIO = [
    'apariencia_comportamiento', 'claridad_procedimientos', 'cumplimiento_horarios',
    'conocimiento_competencia', 'claridad_primer_contacto', 'rapidez_respuesta',
    'disposicion_ayuda', 'flexibilidad', 'actitud_comprensiva',
    'tiempo_dedicado', 'preocupacion_situacion', 'atencion_personalizada',
    'comunicacion_continua'
]

VARS_SATISFACCION = ['satisfaccion_general', 'nps', 'calidad_percibida', 'transparencia']


# ===== FUNCIONES DE C√ÅLCULO DE KPIs =====

def calcular_kpi_satisfaccion_general(df):
    return df['satisfaccion_general'].mean()


def calcular_kpi_nps(df):
    total = len(df)
    promotores = (df['nps'] >= 9).sum()
    detractores = (df['nps'] <= 6).sum()
    return ((promotores - detractores) / total) * 100


def calcular_kpi_calidad_servicio(df):
    return df[VARS_CALIDAD_SERVICIO].mean().mean()


def calcular_kpi_transparencia(df):
    return df['transparencia'].mean()


def calcular_kpi_antiguedad_promedio(df):
    return df['anos_benefactor'].mean()


def calcular_kpi_calidad_percibida(df):
    return df['calidad_percibida'].mean()


def calcular_todos_kpis(df):
    return {
        'satisfaccion_general': calcular_kpi_satisfaccion_general(df),
        'nps': calcular_kpi_nps(df),
        'indice_calidad_servicio': calcular_kpi_calidad_servicio(df),
        'transparencia': calcular_kpi_transparencia(df),
        'antiguedad_promedio': calcular_kpi_antiguedad_promedio(df),
        'calidad_percibida': calcular_kpi_calidad_percibida(df)
    }


# ===== FUNCIONES DE SEGMENTACI√ìN =====

def segmentar_nps(df):
    total = len(df)
    promotores = (df['nps'] >= 9).sum()
    pasivos = ((df['nps'] >= 7) & (df['nps'] <= 8)).sum()
    detractores = (df['nps'] <= 6).sum()
    
    return pd.DataFrame({
        'Categor√≠a': ['Promotores (9-10)', 'Pasivos (7-8)', 'Detractores (0-6)'],
        'Cantidad': [promotores, pasivos, detractores],
        'Porcentaje': [
            (promotores / total) * 100,
            (pasivos / total) * 100,
            (detractores / total) * 100
        ]
    })


# ===== FUNCIONES DE AGREGACI√ìN =====

def agregar_por_giro(df):
    agregacion = df.groupby('giro').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'anos_benefactor': 'mean',
        'giro': 'count'
    }).rename(columns={'giro': 'cantidad'})
    agregacion = agregacion.round(2)
    return agregacion.sort_values('satisfaccion_general', ascending=False).reset_index()


def agregar_por_estado(df):
    agregacion = df.groupby('estado').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'estado': 'count'
    }).rename(columns={'estado': 'cantidad'})
    agregacion = agregacion.round(2)
    return agregacion.sort_values('cantidad', ascending=False).reset_index()


def agregar_por_antiguedad(df):
    agregacion = df.groupby('segmento_antiguedad').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean',
        'transparencia': 'mean',
        'segmento_antiguedad': 'count'
    }).rename(columns={'segmento_antiguedad': 'cantidad'})
    return agregacion.round(2).reset_index()


# ===== FUNCIONES DE VISUALIZACI√ìN =====

def crear_gauge_kpi(valor, titulo, valor_max=10, umbral_bueno=8, umbral_regular=6):
    if valor >= umbral_bueno:
        color = COLORES_TELETON['verde']
        categoria = 'Excelente'
    elif valor >= umbral_regular:
        color = COLORES_TELETON['amarillo']
        categoria = 'Bueno'
    else:
        color = COLORES_TELETON['rojo']
        categoria = 'Mejorable'
    
    fig, ax = plt.subplots(figsize=(8, 2))
    ax.barh([0], [valor_max], color=COLORES_TELETON['gris_claro'], height=0.5)
    ax.barh([0], [valor], color=color, height=0.5)
    
    ax.set_xlim(0, valor_max)
    ax.set_ylim(-0.5, 0.5)
    ax.set_yticks([])
    ax.set_title(f"{titulo}: {valor:.2f} / {valor_max} ({categoria})", 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    ax.text(valor/2, 0, f'{valor:.2f}', 
            ha='center', va='center', fontsize=16, fontweight='bold', color='white')
    
    for spine in ['top', 'right', 'left']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_grafico_nps(df):
    segmentos = segmentar_nps(df)
    colores_nps = [COLORES_TELETON['verde'], COLORES_TELETON['amarillo'], COLORES_TELETON['rojo']]
    
    fig, ax = plt.subplots(figsize=(10, 5))
    bars = ax.barh(segmentos['Categor√≠a'], segmentos['Porcentaje'], color=colores_nps)
    
    for bar, cantidad, porcentaje in zip(bars, segmentos['Cantidad'], segmentos['Porcentaje']):
        ax.text(bar.get_width() + 1, bar.get_y() + bar.get_height()/2, 
                f'{porcentaje:.1f}% (n={cantidad})',
                va='center', fontsize=11, fontweight='bold')
    
    ax.set_xlabel('Porcentaje (%)', fontsize=12, fontweight='bold')
    ax.set_title('Distribuci√≥n del Net Promoter Score (NPS)', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_xlim(0, max(segmentos['Porcentaje']) + 10)
    
    for spine in ['top', 'right']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_grafico_calidad_servicio(df):
    promedios = df[VARS_CALIDAD_SERVICIO].mean().sort_values(ascending=True)
    
    nombres_cortos = [
        'Apariencia y comportamiento', 'Claridad de procedimientos',
        'Cumplimiento de horarios', 'Conocimiento y competencia',
        'Claridad en primer contacto', 'Rapidez de respuesta',
        'Disposici√≥n para ayudar', 'Flexibilidad',
        'Actitud comprensiva', 'Tiempo dedicado',
        'Preocupaci√≥n por situaci√≥n', 'Atenci√≥n personalizada',
        'Comunicaci√≥n continua'
    ]
    
    mapeo = dict(zip(VARS_CALIDAD_SERVICIO, nombres_cortos))
    promedios.index = promedios.index.map(mapeo)
    
    fig, ax = plt.subplots(figsize=(10, 8))
    bars = ax.barh(promedios.index, promedios.values, color=COLORES_TELETON['morado_medio'])
    
    for bar in bars:
        width = bar.get_width()
        ax.text(width + 0.05, bar.get_y() + bar.get_height()/2,
                f'{width:.2f}', va='center', fontsize=10, fontweight='bold')
    
    media = promedios.mean()
    ax.axvline(media, color=COLORES_TELETON['amarillo'], 
               linestyle='--', linewidth=2, label=f'Media: {media:.2f}')
    
    ax.set_xlabel('Puntuaci√≥n (1-5)', fontsize=12, fontweight='bold')
    ax.set_title('13 Dimensiones de Calidad de Servicio', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_xlim(0, 5.5)
    ax.legend(loc='lower right')
    
    for spine in ['top', 'right']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_grafico_por_giro(df, metrica='satisfaccion_general', top_n=10):
    conteo_giros = df['giro'].value_counts().head(top_n).index
    df_filtrado = df[df['giro'].isin(conteo_giros)]
    promedios = df_filtrado.groupby('giro')[metrica].mean().sort_values(ascending=False)
    
    fig, ax = plt.subplots(figsize=(12, 6))
    bars = ax.bar(range(len(promedios)), promedios.values, color=COLORES_TELETON['morado_profundo'])
    
    ax.set_xticks(range(len(promedios)))
    ax.set_xticklabels(promedios.index, rotation=45, ha='right')
    
    for bar in bars:
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2, height + 0.1,
                f'{height:.2f}', ha='center', va='bottom', fontsize=10, fontweight='bold')
    
    titulo = metrica.replace('_', ' ').title()
    ax.set_ylabel(titulo, fontsize=12, fontweight='bold')
    ax.set_title(f'{titulo} por Giro (Top {top_n})', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    for spine in ['top', 'right']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_grafico_geografico(df, top_n=10):
    conteo = df['estado'].value_counts().head(top_n)
    
    fig, ax = plt.subplots(figsize=(12, 6))
    bars = ax.barh(conteo.index, conteo.values, color=COLORES_TELETON['azul'])
    
    for bar in bars:
        width = bar.get_width()
        ax.text(width + 1, bar.get_y() + bar.get_height()/2,
                f'{int(width)}', va='center', fontsize=10, fontweight='bold')
    
    ax.set_xlabel('Cantidad', fontsize=12, fontweight='bold')
    ax.set_title(f'Top {top_n} Estados por Cantidad de Benefactores', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    
    for spine in ['top', 'right']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_grafico_antiguedad(df):
    orden = ['Nuevo (0-3 a√±os)', 'Establecido (4-7 a√±os)', 
             'Veterano (8-15 a√±os)', 'Hist√≥rico (15+ a√±os)']
    
    agg = df.groupby('segmento_antiguedad').agg({
        'satisfaccion_general': 'mean',
        'nps': 'mean',
        'indice_calidad_servicio': 'mean'
    }).reindex(orden)
    
    agg['indice_normalizado'] = agg['indice_calidad_servicio'] * 2
    
    fig, ax = plt.subplots(figsize=(12, 6))
    x = range(len(agg))
    
    ax.plot(x, agg['satisfaccion_general'], marker='o', linewidth=2.5,
            color=COLORES_TELETON['morado_profundo'], label='Satisfacci√≥n (0-10)')
    ax.plot(x, agg['indice_normalizado'], marker='s', linewidth=2.5,
            color=COLORES_TELETON['morado_medio'], label='Calidad (0-10 normalizado)')
    ax.plot(x, agg['nps'], marker='^', linewidth=2.5,
            color=COLORES_TELETON['amarillo'], label='NPS Promedio')
    
    ax.set_xticks(x)
    ax.set_xticklabels(agg.index, rotation=15, ha='right')
    ax.set_ylabel('Puntuaci√≥n', fontsize=12, fontweight='bold')
    ax.set_title('M√©tricas por Antig√ºedad', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'])
    ax.set_ylim(0, 10)
    ax.legend(loc='best')
    ax.grid(axis='y', alpha=0.3, linestyle='--')
    
    for spine in ['top', 'right']:
        ax.spines[spine].set_visible(False)
    
    plt.tight_layout()
    return fig


def crear_heatmap_correlacion(df):
    vars_analisis = VARS_SATISFACCION + ['indice_calidad_servicio']
    corr = df[vars_analisis].corr()
    
    fig, ax = plt.subplots(figsize=(10, 8))
    sns.heatmap(corr, annot=True, fmt='.2f', cmap='YlGnBu',
                square=True, linewidths=1,
                cbar_kws={'label': 'Correlaci√≥n'}, ax=ax)
    
    labels = ['Satisfacci√≥n', 'NPS', 'Calidad Percibida', 'Transparencia', '√çndice Calidad']
    ax.set_xticklabels(labels, rotation=45, ha='right')
    ax.set_yticklabels(labels, rotation=0)
    ax.set_title('Correlaci√≥n: Satisfacci√≥n y Calidad', 
                 fontsize=14, fontweight='bold', color=COLORES_TELETON['morado_profundo'], pad=20)
    
    plt.tight_layout()
    return fig
'''

# Guardar m√≥dulo
with open('../streamlit/teleton_utils.py', 'w', encoding='utf-8') as f:
    f.write(codigo_modulo)

print("‚úÖ M√≥dulo teleton_utils.py creado en streamlit/")

## 10. Resumen del Notebook

In [None]:
print("="*70)
print("RESUMEN: Preparaci√≥n de Dashboard Streamlit")
print("="*70)
print("\nüì¶ FUNCIONES CREADAS:")
print("   ‚úÖ 6 funciones para calcular KPIs")
print("   ‚úÖ 1 funci√≥n de segmentaci√≥n NPS")
print("   ‚úÖ 3 funciones de agregaci√≥n por dimensi√≥n")
print("   ‚úÖ 8 funciones de visualizaci√≥n con paleta Telet√≥n")
print("\nüìä DATOS EXPORTADOS:")
print("   ‚úÖ agregacion_giro.csv")
print("   ‚úÖ agregacion_estado.csv")
print("   ‚úÖ agregacion_antiguedad.csv")
print("   ‚úÖ segmentos_nps.csv")
print("   ‚úÖ kpis.csv")
print("\nüêç M√ìDULO PYTHON:")
print("   ‚úÖ teleton_utils.py (listo para importar en Streamlit)")
print("\nüéØ PR√ìXIMO PASO:")
print("   üëâ Crear la aplicaci√≥n Streamlit (app.py)")
print("   üëâ Integrar todas las funciones del m√≥dulo")
print("   üëâ Crear dashboard interactivo completo")
print("="*70)