In [16]:
import math
import numpy as np
import pandas as pd
from scipy.stats import norm

In [5]:
estaturas = pd.DataFrame({
    'mujeres': {
        0: 105.23648976814002,
        1: 159.9830117505917,
        2: 157.8305504302989,
        3: 150.83684881246882,
        4: 126.27105585706886,
        5: 154.9637094434729,
        6: 156.78858214087086,
        7: 116.20647380041191,
        8: 149.52279949866352,
        9: 156.15767703493475,
        10: 132.98198988777585,
        11: 123.7628399998357,
        12: 124.49782540570595,
        13: 166.8592464433459,
        14: 145.43553030889598,
        15: 153.10134851133625,
        16: 153.98807742385543,
        17: 140.58610455904272,
        18: 114.38748439686606,
        19: 140.80540646900772,
        20: 148.08088091413083,
        21: 177.61362338787876,
        22: 129.99771039758343,
        23: 176.59140818650485,
        24: 150.7086669029377,
        25: 141.0953647486167,
        26: 121.73642896086676,
        27: 116.42452515516197,
        28: 134.15924551409262,
        29: 151.51845824802876,
        30: 110.26861026621191,
        31: 105.2269400737714,
        32: 137.1392901695799,
        33: 154.14118517255702,
        34: 100.49256540369242,
        35: np.nan,
        36: np.nan
    },
    'hombres': {
        0: 181.4449290423654,
        1: 166.2976131074829,
        2: 102.27359715197235,
        3: 167.90237103402615,
        4: 136.90651874919422,
        5: 129.52351360861212,
        6: 163.08200363989454,
        7: 160.46243152511306,
        8: 151.1630755731603,
        9: 147.4429693944985,
        10: 133.9246039452264,
        11: 148.28989086078946,
        12: 141.9965513224015,
        13: 150.3129481380456,
        14: 156.39230631047394,
        15: 116.63661033078097,
        16: 150.26485860568937,
        17: 120.95052560023032,
        18: 178.2243173539173,
        19: 188.32198228035122,
        20: 185.21569407591596,
        21: 156.1521087597357,
        22: 197.0163878314197,
        23: 167.79696059809066,
        24: 113.88584360526875,
        25: 115.3547684981022,
        26: 202.31765054911375,
        27: 145.54908310226165,
        28: 121.76152202580124,
        29: 159.06499291583896,
        30: 160.2235072669573,
        31: 127.93262547627091,
        32: 147.4674348019762,
        33: 190.9071300206706,
        34: 151.02560544898733,
        35: 158.13808139052708,
        36: 124.12334334210027
    }
})

In [10]:
estaturas_hombres = estaturas["hombres"][estaturas["hombres"].notnull()]

In [12]:
alpha = 0.05
mu = 168

El promedio de la estatura de los hombres es mayor a 168 cm  
Prueba de hipótesis unilateral superior para el promedio de las estaturas de los hombres

### 1. Datos
Los datos provienen de una m.a.s.i.i.d de estaturas de hombres donde nos interesa estudiar el promedio de estaturas $\alpha=0.05$
### 2. Supuestos  
Las estaturas siguen una distribución normal, donde no conocemos la varianza (pero se puede estudiar) y que tenemos una muestra grande $n=37$ para $n>30$
### 3. Hipótesis
* Hipótesis de Investigación: El promedio de las estaturas es mayor a 168 cm
* $H_a$: $\mu>168$cm
* $H_0$: $\mu\leq 168$cm  
Planteamos que $H_0$ es verdadera y queremos demostrar que es falsa
### 4. Estadístico de prueba
$Z = \frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}$
### 5. Distribución del estadístico de prueba
$Z$ es $N(0,1)$ cuando $n \rightarrow \infty$ utilizando TCL
### 6. Región de rechazo
Al ser unilateral
* $V.C. = Z_{0.95}$

In [24]:
# Valor crítico
vc_superior = norm.ppf(1 - alpha)
vc_superior

1.6448536269514722

Región de rechazo todos los $z$ del recorrdio de la v.a Z por arriba de 165 cm en valor
### 8. Decisión

In [11]:
x_mean = estaturas_hombres.mean()
x_mean

151.77692857522334

In [15]:
n = len(estaturas_hombres)
n

37

In [14]:
desv_estandar_estaturas_hombres = estaturas_hombres.std()
desv_estandar_estaturas_hombres

24.8093815712281

In [18]:
z = (x_mean - mu) / (desv_estandar_estaturas_hombres / math.sqrt(n))
z

-3.977571577335306

Como el valor esperado $(z)$ contra el valor crítico y se observa que el valor crítico es más grande que el valor del estadístico de prueba  
por lo tanto la hipótesis nula no es rechazada
### 9. Conclusión
Después de realizar la prueba de hipótesis para verificar que el promedio de las estaturas de hombres es mayor a 168 cm, encontramos que  
por el contrario, parece que bajo esta muestra el promedio de las estaturas está por debajo de 168 cm
### 10. P-valor

In [23]:
p_value = 1 - norm.cdf(z)
p_value

0.9999651886657668

Como $p_{value} > \alpha = 0.05$ (la muestra es significativa) y como no se rechazó la $H_0$ 

### 11. Intervalo de confianza

In [29]:
(
    x_mean - norm.ppf(1 - alpha) * (desv_estandar_estaturas_hombres / math.sqrt(n)), 
    x_mean + norm.ppf(1 - alpha) * (desv_estandar_estaturas_hombres / math.sqrt(n))
)

(145.06816737394448, 158.4856897765022)