# La Correcci√≥n de Bonferroni: Controlando el Error Familiar üõ°Ô∏è

---

## **# 1. El Problema: Inflaci√≥n del Error Tipo I ($\alpha$)**

En la estad√≠stica de series de tiempo y en la ciencia de datos en general, a menudo necesitamos realizar **m√∫ltiples pruebas de hip√≥tesis** simult√°neamente. Por ejemplo:
* Correr la **prueba de Ljung-Box** para la no autocorrelaci√≥n de residuos en 10, 20 o 30 *lags* diferentes.
* Comparar la media de ventas entre 50 tiendas distintas (50 comparaciones).
* Probar la significancia de 100 *features* diferentes en un modelo.

### **El Riesgo del Error Tipo I (Falso Positivo)**

Recordemos que el **Error Tipo I** ($\alpha$) es la probabilidad de **rechazar la Hip√≥tesis Nula ($H_0$) cuando en realidad es verdadera**. Generalmente fijamos este nivel en $\alpha = 0.05$ (o 5%).

Cuando realizamos **solo una prueba**, la probabilidad de cometer un falso positivo es del 5%.

Cuando realizamos **$m$ pruebas independientes**, la probabilidad de cometer *al menos un* Falso Positivo se dispara. Esto se conoce como la **Tasa de Error Familiar** (*Family-Wise Error Rate*, FWER).

### **F√≥rmula del Error Familiar (FWER)**

Si realizamos $m$ pruebas con un nivel de significancia individual $\alpha$, la probabilidad de cometer **al menos un Error Tipo I** es:

$$
\text{FWER} = 1 - (1 - \alpha)^m
$$

| N√∫mero de Pruebas ($m$) | $\alpha = 0.05$ | FWER (Riesgo real) |
| :--- | :--- | :--- |
| 1 | 0.05 | 5.0% |
| 5 | 0.05 | 22.6% |
| 20 | 0.05 | **64.2%** |

**Conclusi√≥n:** Si realizamos 20 pruebas de Ljung-Box con $\alpha=0.05$, tenemos m√°s del 64% de probabilidad de declarar err√≥neamente que **al menos uno** de esos *lags* es significativo, incluso si no lo es (un falso positivo).

---

## **# 2. La Correcci√≥n de Bonferroni**

La Correcci√≥n de Bonferroni es el m√©todo m√°s simple y conservador para controlar la Tasa de Error Familiar (FWER).

El m√©todo ajusta el nivel de significancia individual ($\alpha_{individual}$) para garantizar que la FWER total de todo el "experimento familiar" sea menor o igual al nivel de significancia deseado (ej. 0.05).

### **F√≥rmula de Bonferroni (El Nivel $\alpha$ Ajustado)**

Para mantener una FWER total de $\alpha_{deseado}$ al realizar $m$ pruebas, el nuevo nivel de significancia para **cada prueba individual** es:

$$
\alpha_{\text{Bonferroni}} = \frac{\alpha_{\text{deseado}}}{m}
$$

Donde:
* $\alpha_{\text{deseado}}$: El nivel de significancia que quieres para todo el experimento (ej. 0.05).
* $m$: El n√∫mero total de pruebas realizadas.
* $\alpha_{\text{Bonferroni}}$: El nuevo *p-valor umbral* que deben superar tus resultados.

### **Ejemplo Num√©rico**

Si quieres que tu **FWER** sea 0.05 y realizas $m=20$ pruebas:

$$
\alpha_{\text{Bonferroni}} = \frac{0.05}{20} = 0.0025
$$

**Regla de Decisi√≥n Ajustada:**
* Solo rechazar√°s la Hip√≥tesis Nula ($H_0$) de una prueba si su p-valor es **menor que $0.0025$** (en lugar de $0.05$).

---

## **# 3. Importancia y Limitaciones**

### **Importancia (Por qu√© la usamos)**

* **Control del FWER:** Garantiza que la probabilidad de encontrar *alg√∫n* falso positivo en tu conjunto de pruebas se mantenga en el nivel deseado (ej. 5%).
* **Simplicidad:** Es muy f√°cil de calcular e implementar.
* **Robustez:** Es universalmente aplicable, independientemente de si las pruebas son dependientes o independientes.

### **Limitaciones (El Trade-off del Cient√≠fico de Datos)**

La Correcci√≥n de Bonferroni es famosa por ser **demasiado conservadora**.

1.  **Aumento del Error Tipo II ($\beta$):** Al reducir dr√°sticamente el umbral $\alpha$ (de 0.05 a 0.0025, por ejemplo), se hace mucho m√°s dif√≠cil rechazar $H_0$. Esto aumenta la probabilidad de cometer un **Error Tipo II** (*False Negative*): **aceptar $H_0$ cuando en realidad es falsa** (perderte un patr√≥n o una diferencia real).
2.  **Modelos Alternativos:** Debido a esta conservatividad, en la pr√°ctica profesional a menudo se prefieren m√©todos menos estrictos pero m√°s potentes (que tienen un mejor equilibrio entre el Error Tipo I y el Tipo II), como el m√©todo de **Benjamini-Hochberg (BH)**, que controla la **Tasa de Descubrimiento Falso** (*False Discovery Rate*, FDR) en lugar del FWER.

In [1]:
import numpy as np

# 1. Par√°metros del experimento
alfa_deseado = 0.05  # Nivel de significancia del 5% para todo el 'experimento'
m_pruebas = 10       # N√∫mero de lags que probamos en el Ljung-Box

# 2. Calcular el umbral de Bonferroni
alfa_bonferroni = alfa_deseado / m_pruebas

print(f"N√∫mero de pruebas (m): {m_pruebas}")
print(f"Nivel de significancia ajustado (alfa_bonferroni): {alfa_bonferroni:.4f}")

# 3. Datos de ejemplo: p-valores de 10 pruebas de Ljung-Box (simulados)
p_valores_simulados = np.array([0.045, 0.003, 0.001, 0.150, 0.002, 0.060, 0.048, 0.0005, 0.200, 0.300])

print("\n--- Resultados ---")

for i, p_val in enumerate(p_valores_simulados):
    es_significativo_bonf = p_val < alfa_bonferroni
    es_significativo_normal = p_val < alfa_deseado
    
    # Decisi√≥n normal (riesgo alto de Falso Positivo)
    decision_normal = "RECHAZA H0 (Significativo)" if es_significativo_normal else "NO RECHAZA H0"
    
    # Decisi√≥n Bonferroni (controlando FWER)
    decision_bonf = "RECHAZA H0 (Significativo)" if es_significativo_bonf else "NO RECHAZA H0"
    
    print(f"Lag {i+1}: p-valor={p_val:.4f}")
    print(f"  > Normal (0.05): {decision_normal}")
    print(f"  > Bonferroni ({alfa_bonferroni:.4f}): {decision_bonf}")

# RESUMEN DEL EFECTO
print("\n--- Efecto del Ajuste ---")
print(f"Total de significativos (Normal): {sum(p_valores_simulados < alfa_deseado)}")
print(f"Total de significativos (Bonferroni): {sum(p_valores_simulados < alfa_bonferroni)}")

N√∫mero de pruebas (m): 10
Nivel de significancia ajustado (alfa_bonferroni): 0.0050

--- Resultados ---
Lag 1: p-valor=0.0450
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): NO RECHAZA H0
Lag 2: p-valor=0.0030
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): RECHAZA H0 (Significativo)
Lag 3: p-valor=0.0010
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): RECHAZA H0 (Significativo)
Lag 4: p-valor=0.1500
  > Normal (0.05): NO RECHAZA H0
  > Bonferroni (0.0050): NO RECHAZA H0
Lag 5: p-valor=0.0020
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): RECHAZA H0 (Significativo)
Lag 6: p-valor=0.0600
  > Normal (0.05): NO RECHAZA H0
  > Bonferroni (0.0050): NO RECHAZA H0
Lag 7: p-valor=0.0480
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): NO RECHAZA H0
Lag 8: p-valor=0.0005
  > Normal (0.05): RECHAZA H0 (Significativo)
  > Bonferroni (0.0050): RECHAZA H0 (Significativo)
Lag 9: p-valo