# Pruebas de Hip√≥tesis para 1 y 2 Muestras

## Objetivos
- Entender el proceso de pruebas de hip√≥tesis
- Realizar prueba t para una muestra
- Realizar prueba t para dos muestras independientes
- Realizar prueba t pareada
- Interpretar p-values y tomar decisiones estad√≠sticas

---

## 1. Preparaci√≥n

In [None]:
import pandas as pd
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns

# Configuraci√≥n
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette("Set2")
%matplotlib inline

# Semilla para reproducibilidad
np.random.seed(42)

# Cargar datos
df = pd.read_csv('../datos/ejemplo_satisfaccion_clientes.csv')
print(f"Dataset cargado: {df.shape[0]} registros")

## 2. Recordatorio: Pasos de una Prueba de Hip√≥tesis

1. **Plantear hip√≥tesis** (H‚ÇÄ y H‚ÇÅ)
2. **Seleccionar nivel de significancia** (Œ±, t√≠picamente 0.05)
3. **Calcular estad√≠stico de prueba** (t, Z, etc.)
4. **Calcular p-value**
5. **Tomar decisi√≥n:** Si p-value < Œ± ‚Üí Rechazar H‚ÇÄ

---

## 3. Prueba t para UNA Muestra

### Contexto de Negocio:
La ONG afirma que su satisfacci√≥n promedio es de **8.0/10**. ¬øLos datos respaldan esta afirmaci√≥n?

### Hip√≥tesis:
- **H‚ÇÄ:** Œº = 8.0 (La media poblacional es 8)
- **H‚ÇÅ:** Œº ‚â† 8.0 (La media poblacional es diferente de 8) [Bilateral]

In [None]:
# Paso 1: Plantear hip√≥tesis
mu_0 = 8.0  # Valor hipot√©tico
alpha = 0.05  # Nivel de significancia

print("="*60)
print("PRUEBA T PARA UNA MUESTRA")
print("="*60)
print(f"H‚ÇÄ: Œº = {mu_0}")
print(f"H‚ÇÅ: Œº ‚â† {mu_0} (prueba bilateral)")
print(f"Œ± = {alpha}")
print("="*60)

In [None]:
# Paso 2: Calcular estad√≠sticos de la muestra
satisfaccion = df['satisfaccion']
n = len(satisfaccion)
media_muestral = satisfaccion.mean()
desv_std_muestral = satisfaccion.std()

print("\nEstad√≠sticos de la muestra:")
print(f"n = {n}")
print(f"Media muestral (xÃÑ) = {media_muestral:.4f}")
print(f"Desviaci√≥n est√°ndar (s) = {desv_std_muestral:.4f}")

In [None]:
# Paso 3: Realizar prueba t
t_statistic, p_value = stats.ttest_1samp(satisfaccion, mu_0)

print("\n" + "="*60)
print("RESULTADOS DE LA PRUEBA")
print("="*60)
print(f"Estad√≠stico t: {t_statistic:.4f}")
print(f"p-value: {p_value:.4f}")
print("="*60)

In [None]:
# Paso 4: Decisi√≥n
print("\nüìä DECISI√ìN:")
if p_value < alpha:
    print(f"   p-value ({p_value:.4f}) < Œ± ({alpha})")
    print("   ‚úó RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: Hay evidencia estad√≠stica suficiente para afirmar que")
    print(f"   la satisfacci√≥n promedio ES DIFERENTE de {mu_0}")
    print(f"   (La satisfacci√≥n promedio real es aproximadamente {media_muestral:.2f})")
else:
    print(f"   p-value ({p_value:.4f}) ‚â• Œ± ({alpha})")
    print("   ‚úì NO RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: No hay evidencia suficiente para rechazar que")
    print(f"   la satisfacci√≥n promedio sea {mu_0}")

In [None]:
# Visualizaci√≥n
plt.figure(figsize=(12, 6))
plt.hist(satisfaccion, bins=15, color='skyblue', edgecolor='black', alpha=0.7, density=True)
plt.axvline(media_muestral, color='blue', linestyle='--', linewidth=2, label=f'Media muestral = {media_muestral:.2f}')
plt.axvline(mu_0, color='red', linestyle='--', linewidth=2, label=f'Œº‚ÇÄ = {mu_0}')

plt.title('Distribuci√≥n de Satisfacci√≥n vs Hip√≥tesis Nula', fontsize=14, fontweight='bold')
plt.xlabel('Satisfacci√≥n', fontsize=12)
plt.ylabel('Densidad', fontsize=12)
plt.legend(fontsize=11)
plt.grid(alpha=0.3)
plt.tight_layout()
plt.show()

## 4. Prueba t para DOS Muestras Independientes

### Contexto de Negocio:
¬øExiste diferencia significativa en la satisfacci√≥n entre el **√Årea Norte** y el **√Årea Sur**?

### Hip√≥tesis:
- **H‚ÇÄ:** Œº‚ÇÅ = Œº‚ÇÇ (Las medias son iguales)
- **H‚ÇÅ:** Œº‚ÇÅ ‚â† Œº‚ÇÇ (Las medias son diferentes) [Bilateral]

In [None]:
# Filtrar datos por √°rea
area_norte = df[df['area'] == 'Norte']['satisfaccion']
area_sur = df[df['area'] == 'Sur']['satisfaccion']

print("="*60)
print("PRUEBA T PARA DOS MUESTRAS INDEPENDIENTES")
print("="*60)
print(f"H‚ÇÄ: Œº_Norte = Œº_Sur")
print(f"H‚ÇÅ: Œº_Norte ‚â† Œº_Sur (prueba bilateral)")
print(f"Œ± = {alpha}")
print("="*60)

print(f"\nEstad√≠sticos descriptivos:")
print(f"\nNORTE:")
print(f"  n = {len(area_norte)}")
print(f"  Media = {area_norte.mean():.4f}")
print(f"  Desv. Std = {area_norte.std():.4f}")

print(f"\nSUR:")
print(f"  n = {len(area_sur)}")
print(f"  Media = {area_sur.mean():.4f}")
print(f"  Desv. Std = {area_sur.std():.4f}")

In [None]:
# Verificar supuesto: Homogeneidad de varianzas (Test de Levene)
stat_levene, p_levene = stats.levene(area_norte, area_sur)

print("\n" + "="*60)
print("VERIFICACI√ìN DE SUPUESTOS")
print("="*60)
print("Test de Levene (homogeneidad de varianzas):")
print(f"  Estad√≠stico: {stat_levene:.4f}")
print(f"  p-value: {p_levene:.4f}")

if p_levene > 0.05:
    print("  ‚úì Las varianzas son homog√©neas (usar prueba t est√°ndar)")
    equal_var = True
else:
    print("  ‚úó Las varianzas NO son homog√©neas (usar Welch's t-test)")
    equal_var = False

In [None]:
# Realizar prueba t para dos muestras
t_stat, p_val = stats.ttest_ind(area_norte, area_sur, equal_var=equal_var)

print("\n" + "="*60)
print("RESULTADOS DE LA PRUEBA")
print("="*60)
print(f"Estad√≠stico t: {t_stat:.4f}")
print(f"p-value: {p_val:.4f}")
print("="*60)

In [None]:
# Decisi√≥n
print("\nüìä DECISI√ìN:")
if p_val < alpha:
    print(f"   p-value ({p_val:.4f}) < Œ± ({alpha})")
    print("   ‚úó RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: HAY diferencia significativa en satisfacci√≥n entre √°reas")
    print(f"   Norte: {area_norte.mean():.2f} vs Sur: {area_sur.mean():.2f}")
    
    if area_norte.mean() > area_sur.mean():
        print(f"   ‚Üí El √Årea Norte tiene MAYOR satisfacci√≥n")
    else:
        print(f"   ‚Üí El √Årea Sur tiene MAYOR satisfacci√≥n")
else:
    print(f"   p-value ({p_val:.4f}) ‚â• Œ± ({alpha})")
    print("   ‚úì NO RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: NO hay evidencia de diferencia significativa")
    print(f"   Las √°reas Norte y Sur tienen satisfacci√≥n similar")

In [None]:
# Calcular tama√±o del efecto (Cohen's d)
def cohen_d(group1, group2):
    """Calcula el tama√±o del efecto de Cohen"""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
    return (np.mean(group1) - np.mean(group2)) / pooled_std

d = cohen_d(area_norte, area_sur)

print(f"\nüìè TAMA√ëO DEL EFECTO (Cohen's d): {d:.4f}")
if abs(d) < 0.2:
    print("   ‚Üí Efecto PEQUE√ëO")
elif abs(d) < 0.5:
    print("   ‚Üí Efecto PEQUE√ëO a MEDIANO")
elif abs(d) < 0.8:
    print("   ‚Üí Efecto MEDIANO")
else:
    print("   ‚Üí Efecto GRANDE")

In [None]:
# Visualizaci√≥n comparativa
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Boxplots
axes[0].boxplot([area_norte, area_sur], labels=['Norte', 'Sur'], patch_artist=True,
                boxprops=dict(facecolor='lightblue'),
                medianprops=dict(color='red', linewidth=2))
axes[0].set_ylabel('Satisfacci√≥n', fontsize=12)
axes[0].set_title('Comparaci√≥n de Satisfacci√≥n (Boxplot)', fontsize=13, fontweight='bold')
axes[0].grid(alpha=0.3, axis='y')

# Histogramas superpuestos
axes[1].hist(area_norte, bins=10, alpha=0.5, label=f'Norte (Œº={area_norte.mean():.2f})', color='blue', edgecolor='black')
axes[1].hist(area_sur, bins=10, alpha=0.5, label=f'Sur (Œº={area_sur.mean():.2f})', color='orange', edgecolor='black')
axes[1].set_xlabel('Satisfacci√≥n', fontsize=12)
axes[1].set_ylabel('Frecuencia', fontsize=12)
axes[1].set_title('Distribuciones Superpuestas', fontsize=13, fontweight='bold')
axes[1].legend()
axes[1].grid(alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

## 5. Prueba t para Muestras Pareadas

### Contexto de Negocio:
La ONG implement√≥ una mejora en el servicio. Tenemos satisfacci√≥n **antes** y **despu√©s** de la intervenci√≥n para los mismos beneficiarios.

### Hip√≥tesis:
- **H‚ÇÄ:** Œº_diferencia = 0 (No hay cambio)
- **H‚ÇÅ:** Œº_diferencia > 0 (Hubo mejora) [Unilateral derecha]

In [None]:
# Simular datos pareados (antes y despu√©s de intervenci√≥n)
# Para este ejemplo, creamos datos sint√©ticos
np.random.seed(42)
n_pareado = 30

# Satisfacci√≥n antes
antes = np.random.normal(loc=7.0, scale=1.2, size=n_pareado)
antes = np.clip(antes, 1, 10)  # Limitar entre 1-10

# Satisfacci√≥n despu√©s (con mejora promedio de 0.8 puntos)
despues = antes + np.random.normal(loc=0.8, scale=0.5, size=n_pareado)
despues = np.clip(despues, 1, 10)

# Crear DataFrame
df_pareado = pd.DataFrame({
    'id': range(1, n_pareado+1),
    'antes': antes,
    'despues': despues,
    'diferencia': despues - antes
})

print("Primeros 10 registros:")
print(df_pareado.head(10))

In [None]:
print("="*60)
print("PRUEBA T PAREADA")
print("="*60)
print(f"H‚ÇÄ: Œº_diferencia = 0 (No hay cambio)")
print(f"H‚ÇÅ: Œº_diferencia > 0 (Hubo mejora) [unilateral]")
print(f"Œ± = {alpha}")
print("="*60)

print(f"\nEstad√≠sticos:")
print(f"Media ANTES:      {df_pareado['antes'].mean():.4f}")
print(f"Media DESPU√âS:    {df_pareado['despues'].mean():.4f}")
print(f"Media DIFERENCIA: {df_pareado['diferencia'].mean():.4f}")
print(f"Desv. Std DIFERENCIA: {df_pareado['diferencia'].std():.4f}")

In [None]:
# Realizar prueba t pareada
t_pareado, p_pareado_bilateral = stats.ttest_rel(df_pareado['despues'], df_pareado['antes'])

# Para prueba unilateral (cola derecha), dividir p-value entre 2
p_pareado_unilateral = p_pareado_bilateral / 2

print("\n" + "="*60)
print("RESULTADOS DE LA PRUEBA")
print("="*60)
print(f"Estad√≠stico t: {t_pareado:.4f}")
print(f"p-value (bilateral): {p_pareado_bilateral:.4f}")
print(f"p-value (unilateral derecha): {p_pareado_unilateral:.4f}")
print("="*60)

In [None]:
# Decisi√≥n (usando p-value unilateral)
print("\nüìä DECISI√ìN:")
if p_pareado_unilateral < alpha:
    print(f"   p-value ({p_pareado_unilateral:.4f}) < Œ± ({alpha})")
    print("   ‚úó RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: La intervenci√≥n S√ç tuvo efecto positivo")
    print(f"   Mejora promedio: {df_pareado['diferencia'].mean():.2f} puntos")
    print(f"   ({df_pareado['antes'].mean():.2f} ‚Üí {df_pareado['despues'].mean():.2f})")
else:
    print(f"   p-value ({p_pareado_unilateral:.4f}) ‚â• Œ± ({alpha})")
    print("   ‚úì NO RECHAZAMOS H‚ÇÄ")
    print(f"\nüí° CONCLUSI√ìN: No hay evidencia suficiente de mejora")

In [None]:
# Visualizaci√≥n de datos pareados
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gr√°fico de l√≠neas pareadas
for i in range(len(df_pareado)):
    axes[0].plot([1, 2], [df_pareado.iloc[i]['antes'], df_pareado.iloc[i]['despues']], 
                 'o-', color='gray', alpha=0.3)
axes[0].plot([1, 2], [df_pareado['antes'].mean(), df_pareado['despues'].mean()], 
             'ro-', linewidth=3, markersize=10, label='Promedio')
axes[0].set_xticks([1, 2])
axes[0].set_xticklabels(['Antes', 'Despu√©s'])
axes[0].set_ylabel('Satisfacci√≥n', fontsize=12)
axes[0].set_title('Cambio Individual Antes-Despu√©s', fontsize=13, fontweight='bold')
axes[0].legend()
axes[0].grid(alpha=0.3)

# Histograma de diferencias
axes[1].hist(df_pareado['diferencia'], bins=10, color='green', edgecolor='black', alpha=0.7)
axes[1].axvline(0, color='red', linestyle='--', linewidth=2, label='Sin cambio')
axes[1].axvline(df_pareado['diferencia'].mean(), color='blue', linestyle='--', linewidth=2, 
               label=f'Media = {df_pareado["diferencia"].mean():.2f}')
axes[1].set_xlabel('Diferencia (Despu√©s - Antes)', fontsize=12)
axes[1].set_ylabel('Frecuencia', fontsize=12)
axes[1].set_title('Distribuci√≥n de Diferencias', fontsize=13, fontweight='bold')
axes[1].legend()
axes[1].grid(alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

## 6. Comparaci√≥n de M√∫ltiples √Åreas (Todas vs Todas)

Si queremos comparar las **4 √°reas** simult√°neamente, necesitaremos ANOVA (Semana 2). 
Por ahora, veamos un resumen de todas las comparaciones dos a dos:

In [None]:
# Obtener todas las √°reas √∫nicas
areas = df['area'].unique()
print(f"√Åreas disponibles: {areas}")

# Crear tabla de comparaciones
from itertools import combinations

comparaciones = []
for area1, area2 in combinations(areas, 2):
    grupo1 = df[df['area'] == area1]['satisfaccion']
    grupo2 = df[df['area'] == area2]['satisfaccion']
    
    t_stat, p_val = stats.ttest_ind(grupo1, grupo2)
    
    comparaciones.append({
        '√Årea 1': area1,
        'Media 1': grupo1.mean(),
        '√Årea 2': area2,
        'Media 2': grupo2.mean(),
        'Diferencia': grupo1.mean() - grupo2.mean(),
        't-stat': t_stat,
        'p-value': p_val,
        'Significativo (Œ±=0.05)': '‚úì' if p_val < 0.05 else '‚úó'
    })

df_comparaciones = pd.DataFrame(comparaciones)
print("\nCOMPARACIONES ENTRE TODAS LAS √ÅREAS")
print("="*100)
print(df_comparaciones.to_string(index=False))

## 7. Reporte Ejecutivo de Pruebas de Hip√≥tesis

In [None]:
print("="*70)
print("REPORTE EJECUTIVO - PRUEBAS DE HIP√ìTESIS")
print("="*70)

print("\nüî¨ PRUEBA 1: Satisfacci√≥n vs Est√°ndar (8.0)")
print(f"   Resultado: {'Diferente de 8.0' if p_value < 0.05 else 'No diferente de 8.0'}")
print(f"   Media observada: {media_muestral:.2f}")
print(f"   p-value: {p_value:.4f}")

print("\nüî¨ PRUEBA 2: Norte vs Sur")
print(f"   Resultado: {'Diferencia significativa' if p_val < 0.05 else 'Sin diferencia significativa'}")
print(f"   Norte: {area_norte.mean():.2f} | Sur: {area_sur.mean():.2f}")
print(f"   p-value: {p_val:.4f}")
print(f"   Tama√±o del efecto (d): {d:.2f}")

print("\nüî¨ PRUEBA 3: Antes vs Despu√©s (Intervenci√≥n)")
print(f"   Resultado: {'Mejora significativa' if p_pareado_unilateral < 0.05 else 'Sin mejora significativa'}")
print(f"   Antes: {df_pareado['antes'].mean():.2f} | Despu√©s: {df_pareado['despues'].mean():.2f}")
print(f"   Mejora: +{df_pareado['diferencia'].mean():.2f} puntos")
print(f"   p-value: {p_pareado_unilateral:.4f}")

print("\n" + "="*70)
print("üí° RECOMENDACIONES:")
print("   1. Investigar causas de diferencias entre √°reas")
print("   2. Replicar buenas pr√°cticas del √°rea con mejor desempe√±o")
print("   3. Continuar monitoreando el impacto de intervenciones")
print("="*70)

## 8. Ejercicios Propuestos

### Ejercicio 1: Calidad de Atenci√≥n
La ONG afirma que su calidad de atenci√≥n promedio es de 8.5/10. Realiza una prueba de hip√≥tesis para verificarlo.

### Ejercicio 2: Comparaci√≥n por G√©nero
¬øExiste diferencia significativa en satisfacci√≥n entre hombres y mujeres?

### Ejercicio 3: Tiempo de Servicio
Divide a los beneficiarios en "nuevos" (<6 meses) y "antiguos" (‚â•6 meses). ¬øHay diferencia en satisfacci√≥n?

### Ejercicio 4: M√∫ltiples Comparaciones
Compara satisfacci√≥n entre las √°reas Este y Oeste.


In [None]:
# Tu c√≥digo aqu√≠


---

## Resumen

En este notebook aprendiste a:
- ‚úì Realizar pruebas t para una muestra
- ‚úì Realizar pruebas t para dos muestras independientes
- ‚úì Realizar pruebas t pareadas
- ‚úì Interpretar p-values y tomar decisiones estad√≠sticas
- ‚úì Calcular tama√±o del efecto (Cohen's d)
- ‚úì Verificar supuestos (test de Levene)
- ‚úì Aplicar pruebas en contexto de negocio

**Pr√≥ximo tema:** Prueba Ji-cuadrada, ANOVA y Regresi√≥n (Semana 2)
