# Activida 5 - Módulo 5 - Inferencia Estadística
### TEST DE SIGNIFICANCIA
#### Autor: Nicolás Núñez

In [7]:
# Librerias requeridas
import pandas as pd
import numpy as np
import pingouin as pg
import scipy.stats as stats
import statistics as st

### Ejericio 1

Se sabe que la media del consumo de energía eléctrica en cierta provincia
es de 721 kwh.

Una empresa tecnológica de la región cree que sus empleados consumen
más que el promedio provincial. Recoge información sobre los consumos de
20 empleados escogidos al azar, y obtiene los siguientes datos:
$$\begin{array}{|ccccc|}
\hline
710 & 774 & 814 & 768 & 823\\
\hline
732 & 675 & 755 & 770 & 660\\
\hline
654 & 757 & 736 & 677 & 797\\
\hline
760 & 718 & 774 & 747 & 796\\
\hline
\end{array}$$
Si la distribución del consumo mensual de energía eléctrica es normal:


1. ¿Hay evidencias para afirmar que el promedio del consumo de energía
eléctrica hogareño de los empleados de la empresa es superior a la
media del consumo a nivel provincial? Usar un nivel de significación
del 10%.

**Respuesta**: Al no conocer la desviación estándar de los datos, procederemos con prueba de hipótesis con el estadístico T-student, para ello sean:
- $H_0$: $\mu\leq 721$
- $H_1$: $\mu>721$

es decir, una prueba de una cola. Bajo un nivel de significación del 10% se sigue lo siguiente:

In [48]:
# Datos
muestra = [710,774,814,768,823,
           732,675,755,770,660,
           654,757,736,677,797,
           760,718,774,747,796]
n = len(muestra)
S = st.stdev(muestra)
mu=721

# Nivel de significancia
alpha = .1

# Prueba de normalidad
print("Prueba de normalidad de los datos:")
display(pg.normality(data=muestra))

# Prueba T unilateral
t, p = stats.ttest_1samp(muestra, 721, alternative='greater')

# Evaluación hipótesis nula
if t>=stats.t.ppf(1-alpha,n-1):
    print("Rechazamos la hipótesis nula.")
else:
    print("No hay suficiente evidencia para rechazar la hipótesis nula.")

Prueba de normalidad de los datos:


Unnamed: 0,W,pval,normal
0,0.949116,0.353874,True


Rechazamos la hipótesis nula.


Dado que la hipótesis nula es rechazada, se acepta con un 10% de significancia la hipótesis alternativa, es decir, el promedio del consumo de energía
eléctrica hogareño de los empleados de la empresa es superior a la
media del consumo a nivel provincial.

2. ¿Cuál es el valor pp de la decisión?

In [25]:
print(f"El valor p de la prueba de hipótesis es {p:.4f}.")

El valor p de la prueba de hipótesis es 0.0223.


### Ejericio 2

Se quiere probar si la altura promedio de una muestra de estudiantes de una
universidad es significativamente diferente de la altura promedio general de
la población, que se sabe que es de 170 cm con una desviación estándar de
5 cm.

**Respuesta**: Faltan datos para este ejercicio, pues no está el tamaño muestral.

### Ejericio 3

Queremos evaluar si la proporción de estudiantes universitarios que
prefieren el aprendizaje en línea es diferente de 0.60, que es la proporción
declarada en un estudio anterior. Tomamos una muestra aleatoria de 200
estudiantes y encontramos que 120 de ellos prefieren el aprendizaje en
línea.

**Respuesta**: Se realizará una prueba de hipótesis para la proporción, para esto consideramos
- $H_0$: $p = 0.6$.
- $H_1$: $p \not= 0.6$.

De esta forma, a continuación se realiza la prueba con dos colas:

In [49]:
# Datos
n = 200
p = 120/200
q = 1-p
p0 = .6
q0 = 1-p0

# Nivel de significación
alpha = 0.05

# Estadistico z
z = (p-p0)/np.sqrt(p0*q0/n)

# Valores críticos
vc = stats.norm.ppf(alpha/2)

# Evaluación hipótesis nula
if abs(z)>=abs(vc):
    print("Rechazamos la hipótesis nula.")
else:
    print("No hay suficiente evidencia para rechazar la hipótesis nula.")

No hay suficiente evidencia para rechazar la hipótesis nula.


Con lo anterior, no podemos rechazar que la proporción de estudiantes quer prefieren el aprendizaje online sea 0.6 con un nivel de significación de 5%.

### Ejericio 4

Queremos determinar si la duración media de la batería de un tipo particular
de teléfono celular es diferente de 50 horas. Se toma una muestra aleatoria
de 25 teléfonos y se encuentra que la duración media de la batería es de 48
horas, con una desviación estándar muestral de 5 horas.

**Respuesta**: Dado que contamos con la desviación estándar muestral, haremos una prueba de hipótesis con el estadístico T-student de dos colas, para la cual se considerá:
- $H_0$: $\mu = 50$
- $H_1$: $\mu \not= 50$.

Lo anterior queda plasmado en el siguiente script:

In [37]:
# Datos
mu = 50
m = 48
s = 5
n = 25

# Estadístico T-student
t = (m-mu)/(s/np.sqrt(n))

# Nivel de significación
alpha = 0.05

# Valores críticos
vc1 = stats.t.ppf(alpha/2,n-1)
vc2 = stats.t.ppf(1-alpha/2,n-1)

# Evaluación hipótesis nula
if t>=vc2 or t<=vc1:
    print("Rechazamos la hipótesis nula.")
else:
    print("No hay suficiente evidencia para rechazar la hipótesis nula.")

No hay suficiente evidencia para rechazar la hipótesis nula.


### Ejericio 5

Supongamos que se quiere verificar si el peso promedio de los paquetes
entregados por una empresa de mensajería es diferente de 2.5 kg. Se toma
una muestra aleatoria de 50 paquetes y se encuentra que el peso promedio
es de 2.6 kg, con una desviación estándar poblacional conocida de 0.4 kg.

**Respuesta**: Dado que la desviación estándar poblacional es conocida se realizará una prueba de hipótesis bajo el estadístico normal. Para esto primero consideramos
- $H_0$: $\mu = 2.5$
- $H_1$: $\mu \not= 2.5$

El cálculo del estadístico correspondiente, y la comparación respecto al nivel de significación, el cuál será considerado igual a 5%, se implementa a continuación:

In [40]:
# Datos
mu = 2.5
n = 50
m = 2.6
sigma = 0.4

# Estadístico normal
z = (m-mu)/(sigma/np.sqrt(n))

# Valores críticos
alpha = 0.05
vc = stats.norm.ppf(alpha/2)

# Evaluación hipótesis nula
if abs(t)>=abs(vc):
    print("Rechazamos la hipótesis nula.")
else:
    print("No hay suficiente evidencia para rechazar la hipótesis nula.")

Rechazamos la hipótesis nula.


Dado que se rechaza la hipótesis nula con un nivel de significancia del 5%, entonces es posible afirmar que el peso promedio de los paquetes entregados es distinto a 2.5 [kg].