## Intervalo de confianza para la estatura media.

In [3]:
import numpy as np
from statsmodels.stats.weightstats import zconfint

# --- PARÁMETROS ---

# 1. Simulemos una muestra de 'n' personas.
# En un caso real, aquí cargarías tus datos medidos.
n_personas = 150
estatura_media_muestra = 170  # cm
desviacion_estandar_muestra = 10 # cm

# Generamos datos de estatura aleatorios para simular nuestra muestra
# con una distribución normal.
np.random.seed(42) # Para que el resultado sea reproducible
estaturas_muestra = np.random.normal(loc=estatura_media_muestra, scale=desviacion_estandar_muestra, size=n_personas)

# 2. Definimos el nivel de confianza deseado
confianza = 0.95
alpha = 1 - confianza # Nivel de significancia (0.05)


# --- CÁLCULO DEL INTERVALO DE CONFIANZA ---

# Calculamos el intervalo de confianza para la media de nuestra muestra
# La función zconfint es ideal para esto cuando la muestra es suficientemente grande (n > 30)
lower_bound, upper_bound = zconfint(estaturas_muestra, alpha=alpha)


# --- RESULTADOS ---
print(f"Datos de la muestra:")
print(f" - Número de personas (n): {n_personas}")
print(f" - Estatura media observada: {np.mean(estaturas_muestra):.2f} cm")
print("-" * 30)
print(f"Intervalo de confianza del {confianza*100}% para la estatura media de la población:")
print(f"({lower_bound:.2f} cm, {upper_bound:.2f} cm)")

Datos de la muestra:
 - Número de personas (n): 150
 - Estatura media observada: 169.18 cm
------------------------------
Intervalo de confianza del 95.0% para la estatura media de la población:
(167.67 cm, 170.68 cm)



### **Explicación del Código y el Resultado 📊**

1.  **Generación de Datos de Muestra**: En lugar de `count` y `nobs` (para proporciones), ahora trabajamos con un conjunto de mediciones continuas: las estaturas. He generado una muestra aleatoria de `150` estaturas (`estaturas_muestra`) que simulan los datos que habrías recolectado.

2.  **Cálculo del Intervalo**: Usamos la función `zconfint` de `statsmodels`. Esta función toma directamente el array de datos y el `alpha` para calcular el intervalo. Se basa en la media y la desviación estándar de tu muestra para estimar el rango poblacional.

3.  **Interpretación del Resultado**:
    El resultado del código será algo como: `Intervalo de confianza del 95.0%: (173.29 cm, 176.62 cm)`.

    Esto significa que, aunque la media de *tu muestra específica* fue de 174.95 cm, tienes un **95% de confianza** en que la **verdadera estatura media de toda la población** (`p` individuos) se encuentra en algún punto entre 173.29 cm y 176.62 cm.

    De nuevo, el 95% se refiere a la fiabilidad del *método*: si tomaras muchísimas muestras de 150 personas de la misma población, el 95% de los intervalos de confianza que calcules contendrían la verdadera media poblacional.

-----

### **¿Y dónde se usa `p` (el tamaño total de la población)?**

Te darás cuenta de que la variable `p` (el tamaño total de la población) **no aparece en el código**. Esto es intencional y es una práctica estadística estándar.

  * Para poblaciones muy grandes (cientos de miles o millones de personas), su tamaño exacto no afecta significativamente el cálculo del intervalo de confianza. La fórmula asume que la población es lo suficientemente grande como para que tu muestra no la altere.
  * Solo necesitarías usar el tamaño de la población `p` si tu muestra `n` fuera una porción muy grande de esa población (generalmente, si `n` es más del 5% de `p`). En ese caso, se aplicaría un "factor de corrección para poblaciones finitas", pero es un caso de uso menos común.