**<p style="font-size: 35px; text-align: center">Hypothesis Testing</p>**



***<center>Miguel Ángel Vélez Guerra</center>***

<hr/>

![hypothesis](https://1.bp.blogspot.com/-VmonrwMeris/WlJS32GsTjI/AAAAAAAAI2c/3_QD9zHGpTQCfmh22NoA7hv_MrbmCSXMgCLcBGAs/s1600/hypothesis.png)

<hr />
<hr />

## Imports

In [21]:
#-------Importing from other folder------#

import sys
sys.path.insert(0, "../resources/")

import mstats

#-----------Miguel's statistics----------#

In [22]:
import scipy.stats as ss
import numpy as np

<hr/>
<hr/>

## 1. Pruebas de hipótesis de 2 colas para la media poblacional en muestras grandes
Se supone que el embotellador desea probar la hipótesis de que la media poblacional es de 16 onzas y selecciona un nivel de significancia del 5%. Debido a que se plantea la hipótesis de que μ = 16.

Si el embotellador selecciona una muestra de n = 50 botellas con una media de 16.357 onzas y una desviación estándar de 0.866 onzas.

<u>**Información dada**</u>

In [23]:
mu_embotellador = 16 # Hipótesis nula de la media poblacional
x__embotellador = 16.357 # Media muestral
s_embotellador = 0.866 # Desviación estándar muestral
n_embotellador = 50 # Tamaño de la muestra
alpha_embotellador = 0.05 # Nivel de significancia

<u> **Paso 1**</u>: Plantear hipótesis

**Ho:** u = 16                   

**Ha:** u ≠ 16

<u> **Paso 2**</u>: Nivel de significancia

In [24]:
alpha_embotellador

0.05

<u> **Paso 3**</u>: Valores críticos

In [25]:
crit_embotellador = mstats.crit_val_norm(alpha_embotellador, 'two') # Valores críticos
crit_embotellador

(-1.959963984540054, 1.959963984540054)

<u> **Paso 4**</u>: Estadístico de prueba (Z)

In [26]:
z_embotellador = mstats.get_z(x__embotellador, mu_embotellador, s_embotellador, n=n_embotellador)
z_embotellador

2.91497830119627

<u> **Paso 5**</u>: Decisión

In [27]:
mstats.reject_h0(crit_embotellador, z_embotellador, 'two')

True

**Si se rechaza la hipótesis nula**, teniendo en cuenta que el valor del estadístico de prueba *2.91497830119627* es mayor o menor que los valores críticos *-1.959963984540054, 1.959963984540054*.

<u>**Paso 6**</u>: Conclusión

Se puede afirmar con un nivel de significancia del *5%* que que el peso promedio de las botellas es **diferente** de 16 onzas.

<hr/>
<hr/>

## 2. Pruebas de hipótesis de 1 cola para la media poblacional en muestras grandes
En una reunión informativa para una oficina corporativa, el gerente del hotel Embassy Suites en Atlanta, reportó que el número promedio de habitaciones alquiladas por noches es de por lo menos 212. Es decir μ > 212. Uno de los funcionarios operativos considera que esta cifra puede estar algo subestimada. Una muestra de 150 noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que el gerente ha "inflado" su reporte, será amonestado severamente. A un nivel de confianza del 1%. ¿Cuál es el destino del gerente?

<u>**Información dada**</u>

In [28]:
mu_habitaciones = 212 # Hipótesis nula de la media poblacional
x__habitaciones = 201.3 # Media muestral
s_habitaciones = 45.5 # Desviación estándar muestral
n_habitaciones = 150 # Tamaño de la muestra
alpha_habitaciones = 0.01 # Nivel de significancia

<u> **Paso 1**</u>: Plantear hipótesis

**Ho:** u = 212                   

**Ha:** u < 212

<u> **Paso 2**</u>: Nivel de significancia

In [29]:
alpha_habitaciones

0.01

<u> **Paso 3**</u>: Valores críticos

In [30]:
crit_habitaciones = mstats.crit_val_norm(alpha_habitaciones, 'left')
crit_habitaciones

-2.3263478740408408

<u> **Paso 4**</u>: Estadístico de prueba (Z)

In [31]:
z_habitaciones = mstats.get_z(x__habitaciones, mu_habitaciones, s_habitaciones, n=n_habitaciones)
z_habitaciones

-2.8801692579977995

<u> **Paso 5**</u>: Decisión

In [32]:
mstats.reject_h0(crit_habitaciones, z_habitaciones, 'left')

True

**Si se rechaza la hipótesis nula** teniendo en cuenta que el valor del estadístico de prueba *-2.8801692579977995* es menor que el valor crítico *-2.3263478740408408*.

<u>**Paso 6**</u>: Conclusión

Con un nivel de significancia del *1%* podemos afirmar que el número promedio de habitaciones alquiladas por noche es **menor** de 212 habitaciones.

Por lo que podemos concluir, que el gerente será amonestado gravemente por "inflar" su reporte.

<hr/>
<hr/>

## 3. Valor p para prueba de 1 cola
Chuck Cash es el jefe de personal de una empresa. A partir de un breve análisis de los registros de los empleados, Chuck considera que los empleados tienen un promedio de más de 31000 USD en sus cuentas de pensiones. Al tomar como muestra 100 empleados, Chuck encuentra una media de 31366, con s = 1894. Se supone que Chuck desea calcular el valor p relacionado con esta prueba de cola a la derecha.

In [33]:
mu_empleados = 31000 # Hipótesis nula de la media poblacional
n_empleados = 100 # Tamaño de la muestra
x__empleados = 31366 # Promedio muestral
s_empleados = 1894 # Desviación estándar muestral

In [34]:
z_empleados = mstats.get_z(x__empleados, mu_empleados, s_empleados, n=n_empleados)
z_empleados

1.9324181626187962

In [None]:
p_empleados = mstats.get_p(z_empleados, 'left')
p_empleados

**R/** El mínimo nivel de significancia que puede tener Chuck es de **2.66%** para poder afirmar que los empleados tienen un promedio **de más de** 31000 USD en sus cuentas de pensiones.

<hr/>
<hr/>

## 4. Valor p para una prueba de 2 colas
Chuck Cash también sospecha que los empleados invierten un promedio de 100 UDD mensuales en el plan de opción de compra de acciones de la compañía. Al tomar como muestra 100 empleados, Chuck descubre una media de 106.81 USD con una desviación estándar de 36.60 USD. Ahora desea determinar el valor p relacionado con la prueba de hipótesis.

In [None]:
mu_acciones = 100 # Hipótesis nula de la media poblacional
n_acciones = 100 # Tamaño de la muestra
x__acciones = 106.81 # Promedio muestral
s_acciones = 36.6 # Desviación estándar muestral

In [None]:
z_acciones = mstats.get_z(x__acciones, mu_acciones, s_acciones, n=n_acciones)
z_acciones

In [None]:
p_acciones = mstats.get_p(z_acciones, 'two')
p_acciones

**R/** El mínimo nivel de significancia que puede tomar Chuck para determinar que los empleados invierten un promedio **diferente** de 100 USD mensuales en el plan de opción de compra de acciones de la compañía es de **6.27%**

<hr/>
<hr/>

## 5. Pruebas de hipótesis de 2 colas para la media poblacional en muestras pequeñas
Los estudiantes de una clase de estadística en State University cuestionan la afirmación de que McDonalds coloca 0.25 libras de carne en sus “Habueguesas de cuarto de libra”. Algunos estudiantes argumentan que en realidad se utiliza más, mientras otros insisten que menos. Para probar la afirmación publicitaria que el peso promedio es es de 0.25 libras, cada estudiante compra una hamburguesa de cuarto y la lleva a clase, en donde la pesan en una balanza suministrada por el instructor. Los resultados de la muestra son una media de 0.22 libras y una desviación estándar de 0.09. Si hay 25 estudiantes en clase, ¿a que conclusión llegarían a un nivel de significancia del 5%?

<u>**Información dada**</u>

In [None]:
mu_mcd = 0.25 # Hipótesis nula de la media poblacional
x__mcd = 0.22 # Promedio muestral
s_mcd = 0.09 # Desviación estándar muestral
n_mcd = 25 # Tamaño de la muestra
alpha_mcd = 0.05 # Nivel de significancia

<u> **Paso 1**</u>: Plantear hipótesis

**Ho:** u = 0.25                   

**Ha:** u ≠ 0.25

<u> **Paso 2**</u>: Nivel de significancia

In [None]:
alpha_mcd

<u> **Paso 3**</u>: Valores críticos