## Varianza Poblacional Conocida (Rechazo de Hipotesis a la derecha)

Un fabricante debe decidir si continua con el sistema de produccion actual o cambiarlo por uno nuevo. Se debe que el tiempo promedio que utiliza el sistema actual es de 4.5 minutos y una desviación estándar de 0.4 minutos. El fabricante reemplazaría el actual sistema de producción sólo si el nuevo sistema resulta más rápido en promedio y menos variabilidad que el nuevo. Si con el nuevo sistema una muestra de 16 tiempos ha dado una media de 4.285 y una desviación estándar de 0.208. ¿Cuál seria la decisión a tomar? Usar un nivel de significación de 0.05.

**Se empleara:**
$$
Z_c=\frac{\bar{x}-\mu_{\mathrm{hip}}}{\frac\sigma{\sqrt{n}}}
$$
$\mu_{\mathrm{hip}}=\mu_0$

Los parámetros relevantes son:
- Tamaño de muestra ($n$) = 16
- Media Poblacional ($\mu_{\mathrm{hip}}$) = 4.5
- Varianza Poblacional o desviacion estandar ( $\sigma$ ) = 0.4
- Media ($\bar{X}$) = 4.285 
- Nivel de significacion ($\alpha$) = 0.05

**Planteamos la hipotesis**
* $H_0:\mu\leq4.5$
* $H_1:\mu>4.5$ 

In [16]:
import scipy.stats as st
import math

# Asignando valores:
n = 16
Uhip = 4.5
O = 0.4
X = 4.285
a = 0.05
Za = 1-a

# Reemplazamos en la formula
Zc = round((X-Uhip)/(O/math.sqrt(n)),3)

# Calculamos Z
Z = round((st.norm.ppf(Za)),3)

# Como tenemos <= el rechazo esta a la derecha
if Zc<Z:
    respuesta=("Se acepta H0")
else:
    respuesta=("Se rechaza H0")

print(respuesta)
print("Zc =",Zc)
print("Za=",Za)
print("Z tabla =",Z)

Se acepta H0
Zc = -2.15
Za= 0.95
Z tabla = 1.645


Con un nivel de significación de 0.05, podemos concluir que se acepta HO.Por tanto el nuevo sistema presenta un promedio de produccion menor a 4.5 en base a la muestra extraida y el fabricante deberia mantener el actual sistema.

## Varianza poblacional desconocida (Rechazo de hipotesis a la izquierda)

El sindicato de empleados de una corporación asegura que la antiguedad promedio de los empleados es al menos de 12 años. En una muestra aleatoria de 49 trabajadores se encontró que Ia antiguedad promedio era de 11,5 años con una desviación típica de 1 año. Pruebe la afirmación del sindicato con un nivel de significación del 0,02.

**Se empleara:**
$$
Z_c=\frac{\bar{x}-\mu_{\mathrm{hip}}}{\frac{S}{\sqrt{n}}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n$) = 49
- Media Poblacional ($\mu_{\mathrm{hip}}$) = 12
- Desviacion estandar o muestral ($S$) = 1
- Media muestral ($\bar{X}$) = 11.5
- Nivel de significacion ($\alpha$) = 0.02

**Planteamos la hipotesis**
* $H_0:\mu\geq12$
* $H_1:\mu<12$ 

In [17]:
import scipy.stats as st
import math

# Asignando valores:
n = 49
Uhip = 12
S = 1
X = 11.5
a = 0.02
Za = 1-a

# Reemplazamos en la formula
Zc = round((X-Uhip)/(S/math.sqrt(n)),3)

# Calculamos Z
Z = round((st.norm.ppf(Za)),3)

# Como tenemos >= entonces el rechazo esta a la izquierda
if Zc>Z:
    respuesta=("Se acepta H0")
else:
    respuesta=("Se rechaza H0")

print(respuesta)
print("Zc =",Zc)
print("Za=",Za)
print("Z tabla =",Z)

Se rechaza H0
Zc = -3.5
Za= 0.98
Z tabla = 2.054


Con un nivel de significación de 0.02, podemos concluir que se rechaza Ho. Por tanto la antigüedad promedio de los empleados es menor a 12 años

## Prueba de hipótesis para la diferencia de medias con varianza conocida

Usted produce agua embotellada de una marca determinada y desea determinar si el consumo de agua promedio diaria en la costa Atlántica es superior al consumo en los Llanos Orientales.

$H_0:U_a<=U_b$

$H_1:U_a>U_b$

Para ello, realiza las siguientes muestras aleatorias: 150 individuos de la costa atlántica, con un promedio muestral de 280 mililitros de agua diario, y 120 individuos de los llanos, con un promedio muestral de 250 mililitros de agua diarios. Suponga desviaciones poblacionales de 30 mililitros para costa y 35 mililitros para los llanos. ¿Existe evidencia de mayor consumo en la costa? Pruebe a un nivel de significancia de 0.025.

**Se empleara:**
$$
Z_C=\frac{\bar{X}_1-\bar{X}_2-(\mu_1-\mu_2)_{hip}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n_1$) = 150 
- Media muestral ($\bar{X}_1$) = 280
- Desviacion estandar poblacional ($\sigma_1$) = 30
- Tamaño de muestra ($n_2$) = 120
- Media muestral ($\bar{X}_2$) = 250
- Desviacion estandar poblacional ($\sigma_2$) = 35
- Nivel de significacion ($\alpha$) = 0.025

In [9]:
import scipy.stats as st
import math

# Asignando valores:
n1=150
n2=120
x1=280
x2=250
u1=0
u2=0
o1=30
o2=35
a = 0.025
Za = 1-a

# Reemplazamos en la formula
Zc = round((x1-x2-(u1-u2))/(math.sqrt(o1**2/n1+o2**2/n2)),3)

# Calculamos Z
Z = round((st.norm.ppf(Za)),3)

# Como tenemos <= entonces el rechazo esta a la derecha
if Zc<Z:
    respuesta=("Se acepta H0")
else:
    respuesta=("Se rechaza H0")

print(respuesta)
print("Zc =",Zc)
print("Za=",Za)
print("Z tabla =",Z)

Se rechaza H0
Zc = 7.452
Za= 0.975
Z tabla = 1.96


Con un nivel de significacion de 0.025 existe evidencia muestral para afirmar que el consumo de litros promedio mensual de Ia costa atlantica es mayor al consumo promedio de litros de los Llanos orientales.

## Varianza Poblacional Desconocida (Hipotesis con rechazo a los extremos)

La empresa Industria SAC desea comparar los pesos promedio de los cereales de trigo y cereales de maíz que produce, para tal motivo usa una muestra aleatoria de 50 cereales de trigo y 70 de cereales de maíz. Se sabe que tanto para los cereales de trigo corno para los de maíz los pesos siguen una distribución normal. El promedio de la muestra de cereales de trigo es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio
de los pesos de la muestra de los cereales de maíz es de 85 libras y su desviación estándar es de 12.247 libras. Pruebe con un nivel de significación de 0.05 que no existe diferencia en los pesos promedios de cereales y maíz.

$H_0:\mu_1=\mu_2$

$H_1:\mu_1\neq\mu_2$

*Se empleara:*
$$
Z_C=\frac{\bar{X}_1-\bar{X}_2-(\mu_1-\mu_2)_{hip}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n_1$) = 50 
- Media muestral ($\bar{X}_1$) = 100
- Desviacion estandar poblacional ($S_1$) = 14.142
- Tamaño de muestra ($n_2$) = 70
- Media muestral ($\bar{X}_2$) = 85
- Desviacion estandar poblacional ($S_2$) = 12.247
- Nivel de significacion ($\alpha$) = 0.05

In [8]:
import scipy.stats as st
import math

# Asignando valores:
n1=50
n2=70
x1=100
x2=85
u1=0
u2=0
s1=14.142
s2=12.247
a = 0.05
Za1 = 1-(a/2)
Za2 = a/2

# Reemplazamos en la formula
Zc = round((x1-x2-(u1-u2))/(math.sqrt(s1**2/n1+s2**2/n2)),3)

# Calculamos Z
Z1 = round((st.norm.ppf(Za1)),3)
Z2 = round((st.norm.ppf(Za2)),3)

# Como tenemos = entonces la aceptacion esta en el centro
if Zc<Z1 and Zc>Z2:
    respuesta=("Se acepta H0")
else:
    respuesta=("Se rechaza H0")

print(respuesta)
print("Zc =",Zc)
print("Za1=",Za1)
print("Za2=",Za2)
print("Z1 tabla =",Z1)
print("Z2 tabla =",Z2)

Se rechaza H0
Zc = 6.052
Za1= 0.975
Za2= 0.025
Z1 tabla = 1.96
Z2 tabla = -1.96


## Varianza poblacional desconocida, pero diferentes ()
Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo de corriente equivalente. El departamento de ingeniería ha obtenido los datos siguientes:

<div align="center">

|Variables|Diseño A|Diseño B|
|:-:|:-:|:-:|
|$n$|15|10|
|$\bar{x}$|24.2|23.3|
|$S^2$|10|20|

</div>

Con un nivel de significación del 10%, se desea determinar **si existe alguna diferencia** significativa en el flujo de corriente promedio entre los dos diseños, donde se supone que las dos poblaciones son normales, pero no es posible suponer que las varianzas desconocidas $\sigma^2_1$ y y $\sigma^2_2$ sean iguales.

$H_0:\mu_1=\mu_2$

$H_1:\mu_1\neq\mu_2$

*Se empleara:*

**Grados de Libertad: V**
$$
V=\frac{\left(\frac{s_1}{n_1}^2+\frac{s_2^2}{n_2}\right)^2}{\frac{\left(\frac{s_1}{n_1}^2\right)^2}{n_1-1}+\frac{\left(\frac{s_2}{n_2}^2\right)^2}{n_2-1}}
$$
$$
T_{Cal}=\frac{\bar{X}_1-\bar{X}_2-(\mu_1-\mu_2)_{hip}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n_1$) = 15
- Media muestral ($\bar{X}_1$) = 24.2
- Desviacion estandar poblacional ($S^2_1$) = 10
- Tamaño de muestra ($n_2$) = 10
- Media muestral ($\bar{X}_2$) = 23.3
- Desviacion estandar poblacional ($S^2_2$) = 20
- Nivel de significacion ($\alpha$) = 0.1

In [17]:
import scipy.stats as st
import math

# Asignando valores:
n1 = 15
n2 = 10
x1 = 24.2
x2 = 23.3
u1 = 0
u2 = 0
s1 = 10
s2 = 20
a = 0.1
Ta1 = 1 - (a/2)
Ta2 = a/2

# Calculamos grados de libertad
V = round(((s1 / n1) + (s2 / n2))**2 / (((s1 / n1)**2 / (n1 - 1)) + ((s2/ n2)**2 / (n2 - 1))))

# Reemplazamos en la formula
Tc = round((x1 - x2 - (u1 - u2)) / math.sqrt(s1**2/n1 + s2**2/n2), 3)

# Calculamos Z
T1 = round(st.t.ppf(Ta1, df=V), 3)
T2 = round(st.t.ppf(Ta2, df=V), 3)

# Como tenemos = entonces la aceptacion está en el centro
if Tc < T1 and Tc > T2:
    respuesta = "Se acepta H0"
else:
    respuesta = "Se rechaza H0"

print(respuesta)
print("Grados de libertad =", V)
print("Tc =", Tc)
print("Ta1 =", Ta1)
print("Ta2 =", Ta2)
print("T1 tabla =", T1)
print("T2 tabla =", T2)

Se acepta H0
Grados de libertad = 15
Tc = 0.132
Ta1 = 0.95
Ta2 = 0.05
T1 tabla = 1.753
T2 tabla = -1.753


Con un nivel de significacion de 0.1 existe evidencia muestral para afirmar que no existe diferencia significativa entre los flujos de corriente promedio de los 2 diseños.

## Varianza poblacional desconocida, pero iguales

El encargado de la secciõn de tarjetas de crédito desea saber si existe diferencia
significativa en el promedio de saldos de tarjetas de crédito de dos sucursales. Se
eligieron muestras aleatorias e independientes de cada sucursal, cuya información se
presenta a continuación:

![tabla](../Images/tablaProbleS3.png)

Con un nivel de significación del 5% ¿**Existe diferencia significativa** entre ambos promedios? Asuma homogeneidad de varianzas.

$H_0:\mu_1=\mu_2$

$H_1:\mu_1\neq\mu_2$

*Se empleara:*

$$
{S_P}^2=\frac{(n_1-1){S_1}^2+(n_2-1){S_2}^2}{n_1+n_2-2}
$$
$$
T_C=\frac{\bar{X}_1-\bar{X}_2-(\mu_1-\mu_2)_{hip}}{\sqrt{Sp^2\left(\frac1{n_1}+\frac1{n_2}\right)}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n_1$) = 20
- Media muestral ($\bar{X}_1$) = 550
- Desviacion estandar poblacional ($S^2_1$) = 400
- Tamaño de muestra ($n_2$) = 20
- Media muestral ($\bar{X}_2$) = 570
- Desviacion estandar poblacional ($S^2_2$) = 324
- Nivel de significacion ($\alpha$) = 0.05

In [7]:
import scipy.stats as st
import math

# Asignando valores:
n1 = 20
n2 = 20
x1 = 550
x2 = 570
u1 = 0
u2 = 0
s1 = 400
s2 = 324
a = 0.05
Ta1 = a/2
Ta2 = 1 - (a/2)

# Calculamos grados de libertdad
gl = n1+n2-2

# Calculamos varianza ponderada Sp
Sp = round(((n1-1)*s1+(n2-1)*s2)/gl)

# Reemplazamos en la formula
Tc = round((x1 - x2 - (u1 - u2)) / math.sqrt(Sp*(1/n1 + 1/n2)), 3)

# Calculamos T
T1 = round(st.t.ppf(Ta1, df=gl), 3)
T2 = round(st.t.ppf(Ta2, df=gl), 3)

# Como tenemos = entonces la aceptacion está en el centro
if Tc > T1 and Tc < T2:
    respuesta = "Se acepta H0"
else:
    respuesta = "Se rechaza H0"

print(respuesta)
print("Varianza Ponderada =", Sp)
print("T calculado =", Tc)
print("Ta1 =", Ta1)
print("Ta2 =", Ta2)
print("T1 tabla =", T1)
print("T2 tabla =", T2)

Se rechaza H0
Varianza Ponderada = 362
T calculado = -3.324
Ta1 = 0.025
Ta2 = 0.975
T1 tabla = -2.024
T2 tabla = 2.024


Con un nivel de significacion de 0.05 existe evidencia muestral para afirmar que existe diferencia significativa entre los saldos promedios de tarjeta de las 2 sucursales.

# Taller N°2

Para determinar el costo medio mensual de la enseñanza en las universidades A y B, se toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al azar de 123 alumnos de la universidad B da un costo medio de S/. 675 y una desviación estándar de S/. 90. Con a = 0.01, verifique si el costo medio mensual de la enseñanza en las universidades A es mayor a la de B.

$H_0:U_a<=U_b$

$H_1:U_a>U_b$

**Se empleara:**
$$
Z_C=\frac{\bar{X}_1-\bar{X}_2-(\mu_1-\mu_2)_{hip}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}
$$

Los parámetros relevantes son:
- Tamaño de muestra ($n_1$) = 121
- Media muestral ($\bar{X}_1$) = 650
- Desviacion estandar poblacional ($\sigma_1$) = 70
- Tamaño de muestra ($n_2$) = 123
- Media muestral ($\bar{X}_2$) = 675
- Desviacion estandar poblacional ($\sigma_2$) = 90
- Nivel de significacion ($\alpha$) = 0.01

In [22]:
import scipy.stats as st
import math

# Asignando valores:
n1=121
n2=123
x1=650
x2=675
u1=0
u2=0
o1=70
o2=90
a = 0.01
Za = 1-a

# Reemplazamos en la formula
Zc = round((x1-x2-(u1-u2))/(math.sqrt(o1**2/n1+o2**2/n2)),3)

# Calculamos Z
Z = round((st.norm.ppf(Za)),3)

# Como tenemos <= entonces el rechazo esta a la derecha
if Zc<Z:
    respuesta=("Se acepta H0")
else:
    respuesta=("Se rechaza H0")

print(respuesta)
print("Zc =",Zc)
print("Za=",Za)
print("Z tabla =",Z)

Se acepta H0
Zc = -2.424
Za= 0.99
Z tabla = 2.326


Con un nivel de significacion de 0.01 existe evidencia muestral para afirmar que el costo medio mensual de la enseñanza en la universidad A es menor al costo medio de la universidad B.