# 2. Inferencia Estadística y Tests de Hipótesis

La inferencia nos permite sacar conclusiones sobre una población a partir de una muestra. El test de hipótesis es el marco formal para validar estas conclusiones.

## 2.1 Teorema Central del Límite (TCL)
Independientemente de la distribución de la población, la distribución de las medias de muestras tiende a ser normal si el tamaño de la muestra es suficiente.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Población exponencial (no normal)
poblacion = np.random.exponential(scale=1.0, size=10000)

media_muestras = []
n = 50 # Tamaño de muestra

for _ in range(1000):
    muestra = np.random.choice(poblacion, size=n)
    media_muestras.append(np.mean(muestra))

plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.hist(poblacion, bins=50, color='skyblue')
plt.title("Población (Exponencial)")

plt.subplot(1, 2, 2)
plt.hist(media_muestras, bins=50, color='orange')
plt.title(f"Distribución de Medias (n={n})")
plt.show()

## 2.2 T-Test de Student
Usado para comparar si la media de una muestra difiere significativamente de un valor teórico (o de otra muestra).

In [None]:
# Hipótesis Nula (H0): La media de la clase A es igual a la clase B
# Hipótesis Alternativa (H1): Las medias son diferentes

clase_A = np.random.normal(75, 10, 30)
clase_B = np.random.normal(82, 12, 30)

t_stat, p_val = stats.ttest_ind(clase_A, clase_B)

print(f"T-statistic: {t_stat:.4f}")
print(f"P-value: {p_val:.4f}")

alpha = 0.05
if p_val < alpha:
    print("Rechazamos H0: Hay diferencia significativa entre las clases.")
else:
    print("No rechazamos H0: No hay evidencia suficiente de diferencia.")

## 2.3 Intervalos de Confianza
Rango donde esperamos encontrar el verdadero parámetro poblacional con cierta probabilidad (nivel de confianza).

In [None]:
data = np.random.normal(loc=5, scale=2, size=100)

confianza = 0.95
grados_libertad = len(data) - 1
media, error_estandar = np.mean(data), stats.sem(data)

intervalo = stats.t.interval(confianza, grados_libertad, media, error_estandar)
print(f"Intervalo de confianza al 95%: {intervalo}")

## 2.4 Ejercicio: A/B Testing
Simula un A/B test donde:
- El grupo Control tiene una tasa de conversión del 10%.
- El grupo Tratamiento tiene una tasa de conversión del 12%.
- Ambos tienen 1000 usuarios.

Usa un `chi2_contingency` o un T-test para proporciones para determinar si la mejora es estadísticamente significativa.

In [None]:
# Datos simulados (1 = conversión, 0 = no conversión)
n_control, p_control = 1000, 0.10
n_tratamiento, p_tratamiento = 1000, 0.12

control = np.random.binomial(1, p_control, n_control)
tratamiento = np.random.binomial(1, p_tratamiento, n_tratamiento)

# TO-DO: Realizar test estadístico