# ANOVA (An√°lisis de Varianza)

## Objetivos
- Entender cu√°ndo usar ANOVA vs m√∫ltiples pruebas t
- Realizar ANOVA de un factor
- Verificar supuestos (normalidad, homogeneidad de varianzas)
- Aplicar pruebas post-hoc (Tukey, Bonferroni)
- Calcular tama√±o del efecto (Œ∑¬≤)
- Usar alternativas no param√©tricas (Kruskal-Wallis)

---

## 1. Preparaci√≥n

In [None]:
import pandas as pd
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.multicomp import pairwise_tukeyhsd, MultiComparison

# Configuraci√≥n
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette("Set2")
%matplotlib inline

# Cargar datos
df = pd.read_csv('../datos/ejemplo_satisfaccion_clientes.csv')
print(f"Dataset cargado: {df.shape[0]} registros")
print(f"√Åreas disponibles: {df['area'].unique()}")

## 2. Recordatorio: ¬øPor qu√© ANOVA?

### Problema con m√∫ltiples pruebas t:

Si queremos comparar 4 √°reas, necesitar√≠amos **6 pruebas t**:
- Norte vs Sur
- Norte vs Este  
- Norte vs Oeste
- Sur vs Este
- Sur vs Oeste
- Este vs Oeste

‚ùå **Problema:** Con Œ±=0.05, la probabilidad de Error Tipo I se infla.

‚úÖ **Soluci√≥n:** ANOVA hace **UNA sola prueba** que controla el error global.

### Pregunta de Investigaci√≥n:
> ¬øLa satisfacci√≥n promedio es diferente entre las 4 √°reas de servicio?

---

## 3. An√°lisis Descriptivo por Grupos

In [None]:
# Estad√≠sticos descriptivos por √°rea
resumen = df.groupby('area')['satisfaccion'].agg([
    ('n', 'count'),
    ('Media', 'mean'),
    ('Mediana', 'median'),
    ('Desv.Std', 'std'),
    ('M√≠nimo', 'min'),
    ('Q1', lambda x: x.quantile(0.25)),
    ('Q3', lambda x: x.quantile(0.75)),
    ('M√°ximo', 'max')
]).round(2)

print("="*80)
print("ESTAD√çSTICOS DESCRIPTIVOS POR √ÅREA")
print("="*80)
print(resumen)

# Media general
media_general = df['satisfaccion'].mean()
print(f"\nMedia General: {media_general:.2f}")

## 4. Visualizaci√≥n Inicial

In [None]:
# Boxplot comparativo
plt.figure(figsize=(12, 6))
df.boxplot(column='satisfaccion', by='area', patch_artist=True, grid=False)
plt.suptitle('')  # Eliminar t√≠tulo autom√°tico
plt.title('Distribuci√≥n de Satisfacci√≥n por √Årea', fontsize=14, fontweight='bold')
plt.xlabel('√Årea', fontsize=12)
plt.ylabel('Satisfacci√≥n (1-10)', fontsize=12)
plt.axhline(y=media_general, color='red', linestyle='--', linewidth=2, label='Media General')
plt.legend()
plt.tight_layout()
plt.show()

In [None]:
# Violin plot
plt.figure(figsize=(12, 6))
sns.violinplot(data=df, x='area', y='satisfaccion', palette='Set2')
plt.title('Distribuci√≥n de Satisfacci√≥n por √Årea (Violin Plot)', fontsize=14, fontweight='bold')
plt.xlabel('√Årea', fontsize=12)
plt.ylabel('Satisfacci√≥n (1-10)', fontsize=12)
plt.axhline(y=media_general, color='red', linestyle='--', linewidth=1.5, label='Media General')
plt.legend()
plt.grid(alpha=0.3, axis='y')
plt.tight_layout()
plt.show()

In [None]:
# Gr√°fico de medias con intervalos de confianza
medias = df.groupby('area')['satisfaccion'].mean()
std_errors = df.groupby('area')['satisfaccion'].sem()

plt.figure(figsize=(10, 6))
medias.plot(kind='bar', yerr=std_errors*1.96, capsize=5, color='steelblue', edgecolor='black')
plt.title('Media de Satisfacci√≥n por √Årea (IC 95%)', fontsize=14, fontweight='bold')
plt.xlabel('√Årea', fontsize=12)
plt.ylabel('Satisfacci√≥n Promedio', fontsize=12)
plt.xticks(rotation=0)
plt.axhline(y=media_general, color='red', linestyle='--', linewidth=2, label='Media General')
plt.ylim(0, 10)
plt.legend()
plt.grid(alpha=0.3, axis='y')
plt.tight_layout()
plt.show()

## 5. Verificaci√≥n de Supuestos

### Supuesto 1: Normalidad

Cada grupo debe seguir una distribuci√≥n normal.

In [None]:
print("="*60)
print("PRUEBA DE NORMALIDAD (SHAPIRO-WILK)")
print("="*60)

normalidad_ok = True
for area in df['area'].unique():
    datos = df[df['area'] == area]['satisfaccion']
    stat, p = stats.shapiro(datos)
    resultado = "‚úì Normal" if p > 0.05 else "‚ö†Ô∏è No normal"
    print(f"{area:10s}: W={stat:.4f}, p={p:.4f} {resultado}")
    
    if p <= 0.05:
        normalidad_ok = False

if normalidad_ok:
    print("\n‚úì Todos los grupos cumplen supuesto de normalidad")
else:
    print("\n‚ö†Ô∏è Algunos grupos NO cumplen normalidad")
    print("   Considerar:")
    print("   1. Transformaci√≥n de datos (log, ra√≠z cuadrada)")
    print("   2. Prueba no param√©trica (Kruskal-Wallis)")

In [None]:
# Q-Q plots para cada grupo
fig, axes = plt.subplots(2, 2, figsize=(12, 10))
areas = df['area'].unique()
axes = axes.flatten()

for i, area in enumerate(areas):
    datos = df[df['area'] == area]['satisfaccion']
    stats.probplot(datos, dist="norm", plot=axes[i])
    axes[i].set_title(f'Q-Q Plot: {area}', fontweight='bold')
    axes[i].grid(alpha=0.3)

plt.tight_layout()
plt.show()

### Supuesto 2: Homogeneidad de Varianzas

Las varianzas de los grupos deben ser similares.

In [None]:
# Prueba de Levene
grupos = [df[df['area'] == area]['satisfaccion'] for area in df['area'].unique()]
stat_levene, p_levene = stats.levene(*grupos)

print("="*60)
print("PRUEBA DE HOMOGENEIDAD DE VARIANZAS (LEVENE)")
print("="*60)
print(f"Estad√≠stico: W={stat_levene:.4f}")
print(f"p-value: {p_levene:.4f}")

if p_levene > 0.05:
    print("\n‚úì Varianzas HOMOG√âNEAS (usar ANOVA est√°ndar)")
    varianzas_ok = True
else:
    print("\n‚ö†Ô∏è Varianzas NO homog√©neas")
    print("   Considerar Welch's ANOVA (no asume varianzas iguales)")
    varianzas_ok = False

In [None]:
# Visualizar varianzas
varianzas = df.groupby('area')['satisfaccion'].var()

plt.figure(figsize=(10, 6))
varianzas.plot(kind='bar', color='coral', edgecolor='black')
plt.title('Varianzas por √Årea', fontsize=14, fontweight='bold')
plt.xlabel('√Årea', fontsize=12)
plt.ylabel('Varianza', fontsize=12)
plt.xticks(rotation=0)
plt.grid(alpha=0.3, axis='y')
plt.tight_layout()
plt.show()

## 6. ANOVA de Un Factor

### Hip√≥tesis:
- **H‚ÇÄ:** Œº‚ÇÅ = Œº‚ÇÇ = Œº‚ÇÉ = Œº‚ÇÑ (Todas las medias son iguales)
- **H‚ÇÅ:** Al menos una media es diferente

In [None]:
# Opci√≥n 1: ANOVA con scipy
norte = df[df['area'] == 'Norte']['satisfaccion']
sur = df[df['area'] == 'Sur']['satisfaccion']
este = df[df['area'] == 'Este']['satisfaccion']
oeste = df[df['area'] == 'Oeste']['satisfaccion']

f_stat, p_value = stats.f_oneway(norte, sur, este, oeste)

print("="*60)
print("ANOVA DE UN FACTOR")
print("="*60)
print(f"Estad√≠stico F: {f_stat:.4f}")
print(f"p-value: {p_value:.4f}")
print("="*60)

In [None]:
# Opci√≥n 2: ANOVA con statsmodels (tabla completa)
modelo = ols('satisfaccion ~ C(area)', data=df).fit()
tabla_anova = sm.stats.anova_lm(modelo, typ=2)

print("\nTabla ANOVA Completa:")
print(tabla_anova)

print("\nüìä Explicaci√≥n de la tabla:")
print("   sum_sq: Suma de cuadrados")
print("   df: Grados de libertad")
print("   F: Estad√≠stico F")
print("   PR(>F): p-value")

In [None]:
# Decisi√≥n
alpha = 0.05

print("\n" + "="*60)
print("DECISI√ìN")
print("="*60)

if p_value < alpha:
    print(f"p-value ({p_value:.4f}) < Œ± ({alpha})")
    print("‚úó RECHAZAMOS H‚ÇÄ")
    print("\nüí° CONCLUSI√ìN:")
    print("   Al menos una √°rea tiene satisfacci√≥n promedio DIFERENTE")
    print("   Siguiente paso: Pruebas POST-HOC para identificar cu√°l(es)")
    realizar_posthoc = True
else:
    print(f"p-value ({p_value:.4f}) ‚â• Œ± ({alpha})")
    print("‚úì NO RECHAZAMOS H‚ÇÄ")
    print("\nüí° CONCLUSI√ìN:")
    print("   No hay evidencia suficiente de diferencias entre √°reas")
    print("   Las medias son estad√≠sticamente similares")
    realizar_posthoc = False

## 7. Tama√±o del Efecto (Eta Cuadrado - Œ∑¬≤)

In [None]:
# Calcular Eta cuadrado
ss_between = tabla_anova['sum_sq']['C(area)']
ss_total = tabla_anova['sum_sq'].sum()
eta_squared = ss_between / ss_total

print("="*60)
print("TAMA√ëO DEL EFECTO")
print("="*60)
print(f"Eta¬≤ (Œ∑¬≤): {eta_squared:.4f}")
print(f"\nInterpretaci√≥n: {eta_squared*100:.1f}% de la varianza en satisfacci√≥n")
print(f"                es explicada por el √°rea")

# Interpretaci√≥n del tama√±o
if eta_squared < 0.01:
    print("\nEfecto: PEQUE√ëO")
elif eta_squared < 0.06:
    print("\nEfecto: MEDIANO")
else:
    print("\nEfecto: GRANDE")

print("\nEscala:")
print("   Œ∑¬≤ < 0.01: Peque√±o")
print("   0.01 ‚â§ Œ∑¬≤ < 0.06: Mediano")
print("   Œ∑¬≤ ‚â• 0.06: Grande")

## 8. Pruebas Post-Hoc (Si rechazamos H‚ÇÄ)

Si ANOVA es significativo, usamos **pruebas post-hoc** para determinar **qu√© pares** de grupos son diferentes.

### Prueba de Tukey (HSD)

In [None]:
if realizar_posthoc:
    print("="*80)
    print("PRUEBA POST-HOC: TUKEY HSD")
    print("="*80)
    
    # Realizar prueba de Tukey
    tukey = pairwise_tukeyhsd(endog=df['satisfaccion'], groups=df['area'], alpha=0.05)
    
    print(tukey)
    
    # Visualizaci√≥n
    tukey.plot_simultaneous(figsize=(10, 6))
    plt.title('Intervalos de Confianza 95% - Prueba de Tukey', fontsize=14, fontweight='bold')
    plt.tight_layout()
    plt.show()
else:
    print("No se requieren pruebas post-hoc (ANOVA no significativo)")

In [None]:
if realizar_posthoc:
    # Resumen de diferencias significativas
    print("\nüìä RESUMEN DE DIFERENCIAS SIGNIFICATIVAS:")
    print("="*80)
    
    tukey_table = tukey.summary()
    for i, row in enumerate(tukey_table.data[1:]):
        grupo1, grupo2, meandiff, p_adj, lower, upper, reject = row
        
        if reject:  # Si hay diferencia significativa
            direccion = "mayor" if meandiff > 0 else "menor"
            print(f"\n‚Ä¢ {grupo1} vs {grupo2}:")
            print(f"  Diferencia de medias: {abs(meandiff):.2f}")
            print(f"  p-value ajustado: {p_adj:.4f}")
            print(f"  {grupo1} tiene satisfacci√≥n {direccion} que {grupo2}")

### Prueba de Bonferroni (alternativa m√°s conservadora)

In [None]:
if realizar_posthoc:
    print("\n" + "="*80)
    print("PRUEBA POST-HOC: BONFERRONI")
    print("="*80)
    
    mc = MultiComparison(df['satisfaccion'], df['area'])
    resultado_bonf = mc.allpairtest(stats.ttest_ind, method='bonf')
    print(resultado_bonf[0])

## 9. Alternativa No Param√©trica: Kruskal-Wallis

Si **NO se cumplen** los supuestos de normalidad, usamos **Kruskal-Wallis** (ANOVA no param√©trico).

In [None]:
# Prueba de Kruskal-Wallis
h_stat, p_kw = stats.kruskal(norte, sur, este, oeste)

print("="*60)
print("PRUEBA DE KRUSKAL-WALLIS (NO PARAM√âTRICA)")
print("="*60)
print(f"Estad√≠stico H: {h_stat:.4f}")
print(f"p-value: {p_kw:.4f}")

if p_kw < 0.05:
    print("\n‚úó Rechazamos H‚ÇÄ")
    print("   Al menos una √°rea tiene MEDIANA diferente")
    print("\n   Post-hoc: Usar Mann-Whitney U con correcci√≥n Bonferroni")
else:
    print("\n‚úì No rechazamos H‚ÇÄ")
    print("   No hay diferencia entre medianas")

In [None]:
# Post-hoc para Kruskal-Wallis (Mann-Whitney U con Bonferroni)
if p_kw < 0.05:
    from itertools import combinations
    
    areas = df['area'].unique()
    n_comparaciones = len(list(combinations(areas, 2)))
    alpha_bonf = 0.05 / n_comparaciones  # Correcci√≥n de Bonferroni
    
    print(f"\nüìä POST-HOC: MANN-WHITNEY U (Œ± ajustado = {alpha_bonf:.4f})")
    print("="*80)
    
    for area1, area2 in combinations(areas, 2):
        grupo1 = df[df['area'] == area1]['satisfaccion']
        grupo2 = df[df['area'] == area2]['satisfaccion']
        
        u_stat, p_mw = stats.mannwhitneyu(grupo1, grupo2, alternative='two-sided')
        
        significativo = "‚úó" if p_mw < alpha_bonf else "‚úì"
        print(f"{area1} vs {area2}: U={u_stat:.1f}, p={p_mw:.4f} {significativo}")

## 10. Comparaci√≥n: ANOVA vs Kruskal-Wallis

In [None]:
print("="*60)
print("COMPARACI√ìN DE PRUEBAS")
print("="*60)
print(f"ANOVA (param√©trica):          F={f_stat:.4f}, p={p_value:.4f}")
print(f"Kruskal-Wallis (no param.):   H={h_stat:.4f}, p={p_kw:.4f}")

print("\nüí° ¬øCu√°l usar?")
if normalidad_ok and varianzas_ok:
    print("   ‚úì Usar ANOVA (supuestos cumplidos)")
else:
    print("   ‚ö†Ô∏è Preferir Kruskal-Wallis (supuestos no cumplidos)")

## 11. An√°lisis Adicional: Otra Variable

In [None]:
# Comparar calidad_atencion entre √°reas
print("="*60)
print("AN√ÅLISIS ADICIONAL: CALIDAD DE ATENCI√ìN POR √ÅREA")
print("="*60)

# Descriptivos
resumen_calidad = df.groupby('area')['calidad_atencion'].agg(['count', 'mean', 'std']).round(2)
print("\nEstad√≠sticos Descriptivos:")
print(resumen_calidad)

# ANOVA
grupos_calidad = [df[df['area'] == area]['calidad_atencion'] for area in df['area'].unique()]
f_cal, p_cal = stats.f_oneway(*grupos_calidad)

print(f"\nANOVA: F={f_cal:.4f}, p={p_cal:.4f}")

if p_cal < 0.05:
    print("‚úó Hay diferencias significativas en calidad de atenci√≥n entre √°reas")
else:
    print("‚úì No hay diferencias significativas en calidad de atenci√≥n entre √°reas")

In [None]:
# Visualizaci√≥n
plt.figure(figsize=(12, 6))
df.boxplot(column='calidad_atencion', by='area', patch_artist=True, grid=False)
plt.suptitle('')
plt.title('Calidad de Atenci√≥n por √Årea', fontsize=14, fontweight='bold')
plt.xlabel('√Årea', fontsize=12)
plt.ylabel('Calidad de Atenci√≥n (1-10)', fontsize=12)
plt.tight_layout()
plt.show()

## 12. Reporte Ejecutivo

In [None]:
print("="*70)
print("REPORTE EJECUTIVO - ANOVA")
print("="*70)

print("\nüéØ OBJETIVO:")
print("   Comparar la satisfacci√≥n promedio entre las 4 √°reas de servicio")

print("\nüìä DESCRIPTIVOS:")
for area in resumen.index:
    print(f"   ‚Ä¢ {area}: Media={resumen.loc[area, 'Media']:.2f}, "
          f"SD={resumen.loc[area, 'Desv.Std']:.2f}, n={int(resumen.loc[area, 'n'])}")

print("\nüî¨ RESULTADOS ANOVA:")
print(f"   F({int(tabla_anova.loc['C(area)', 'df'])}, {int(tabla_anova.loc['Residual', 'df'])}) = {f_stat:.4f}")
print(f"   p-value = {p_value:.4f}")
print(f"   Œ∑¬≤ = {eta_squared:.4f} ({eta_squared*100:.1f}% de varianza explicada)")

print("\nüí° CONCLUSI√ìN:")
if p_value < 0.05:
    print("   Las √°reas tienen satisfacci√≥n promedio DIFERENTE")
    
    if realizar_posthoc:
        # Identificar mejor y peor √°rea
        mejor_area = medias.idxmax()
        peor_area = medias.idxmin()
        
        print(f"\n   üèÜ Mejor desempe√±o: {mejor_area} (Media={medias.max():.2f})")
        print(f"   ‚ö†Ô∏è Peor desempe√±o: {peor_area} (Media={medias.min():.2f})")
        print(f"\n   üìå Recomendaci√≥n: Replicar buenas pr√°cticas del {mejor_area} en otras √°reas")
else:
    print("   No hay diferencia significativa entre √°reas")
    print("   La satisfacci√≥n es consistente en todas las ubicaciones")

print("\n" + "="*70)

## 13. Ejercicios Propuestos

### Ejercicio 1: Tiempo de Espera
Compara `tiempo_espera` entre las 4 √°reas. ¬øHay diferencias significativas?

### Ejercicio 2: Grupos de Edad
Crea 3 grupos de edad:
- Joven: < 35 a√±os
- Adulto: 35-55 a√±os
- Mayor: > 55 a√±os

Compara satisfacci√≥n entre estos grupos.

### Ejercicio 3: Verificar Supuestos
Para las comparaciones anteriores, verifica supuestos de normalidad y homogeneidad.

### Ejercicio 4: An√°lisis Completo
Realiza un an√°lisis completo (ANOVA + post-hoc + visualizaciones) para `calidad_atencion` por `area`.


In [None]:
# Tu c√≥digo aqu√≠


---

## Resumen

En este notebook aprendiste a:
- ‚úì Realizar ANOVA de un factor
- ‚úì Verificar supuestos (normalidad con Shapiro-Wilk, homogeneidad con Levene)
- ‚úì Interpretar el estad√≠stico F y p-value
- ‚úì Calcular tama√±o del efecto (Œ∑¬≤)
- ‚úì Aplicar pruebas post-hoc (Tukey, Bonferroni)
- ‚úì Usar alternativa no param√©trica (Kruskal-Wallis)
- ‚úì Crear visualizaciones efectivas (boxplots, violin plots)
- ‚úì Interpretar resultados en contexto de negocio

**Siguiente notebook:** Regresi√≥n Lineal y Correlaci√≥n
