# **Ecuaciones**

Estadística de prueba $z$:

$$z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$$

Aquí $δ=x$ y $z_{α/2}$. A partir de la Ecuación:

$$
β = Φ (z_{α/2} - \frac{δ\sqrt{n}}{σ} ) - Φ (z_{α/2} - \frac{δ\sqrt{n}}{σ})
$$

Ecuación para hallar el posible $n$:

$$
n≃ \frac{(z_{α∕2} + z_β)^2 σ^2}{δ^2}
$$

Estadístico de prueba $t$:

$$t_0= \frac{x−μ_0}{S/\sqrt{n}}$$

Estadístico de prueba $chi^2$:

$$χ^2_0 = \frac{(n-1)s^2}{σ^2_0}$$

In [None]:
#@title librerias
import numpy as np
from scipy.stats import norm
from scipy.stats import t
from scipy.stats import chi2

# **Ejemplo 1**

Los sistemas de escape de la tripulación aérea están impulsados por un propelente sólido. La tasa de combustión de este propelente es una característica importante del producto. Las especificaciones requieren que la tasa media de combustión debe ser de 50 centímetros por segundo. Sabemos que la desviación estándar de la tasa de combustión es $σ = 2$ centímetros por segundo. El experimentador decide especificar una probabilidad de error tipo I o nivel de significancia de $α = 0.05$ y selecciona una muestra aleatoria de $n = 25$ y obtiene un promedio de la tasa de combustión muestral de $x = 51.3$ centímetros por segundo. ¿Qué conclusiones deberían extraerse?

1. Parámetro de interés: El parámetro de interés es μ, la tasa de quema media.
2. Hipótesis nula: $H_0: μ = 50$ centímetros por segundo.
3. Hipótesis alternativa: $H_1: μ ≠ 50$ centímetros por segundo.
4. Estadística de prueba: La estadística de prueba es:

$$
z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}
$$

In [None]:
#@title 9.2

sigma = 2
n = 25
x_bar = 51.3
mu0 = 50
alpha = 0.05

Z0 = (x_bar - mu0) / (sigma / np.sqrt(n))

Zizq, Zder = (norm.ppf(alpha/2), norm.ppf(1 - alpha/2))

decision = "Reject H0" if (Z0 < Zizq or Z0 > Zder) else "Fail to Reject H0"

p_value = 2 * (1 - norm.cdf(abs(Z0)))

print("Ejercicio 1:")
print("Z0 =", Z0)
print("Valores críticos:", Zizq, Zder)
print("Decisión:", decision)
print("p-value =", p_value)


# **Ejemplo 2**

Considere el problema del propulsor de cohete en el Ejemplo 1. Suponga que la verdadera tasa de combustión es de 49 centímetros por segundo. ¿Cuál es $β$ para la prueba bilateral con $α=0.05$, $σ=2$ y $n=25$?

Aquí $δ=1$ y $zα/2$. A partir de la Ecuación:

$$
β = Φ (z_{α/2} - \frac{δ\sqrt{n}}{σ} ) - Φ (z_{α/2} - \frac{δ\sqrt{n}}{σ})
$$

La probabilidad es aproximadamente 0.3 que esta diferencia de 50 centímetros por segundo no será detectada. Es decir, la probabilidad es aproximadamente 0.3 que la prueba no rechazará la hipótesis nula cuando la verdadera tasa de combustión es de 49 centímetros por segundo.

**Parte 2:**

Supongamos que el analista desea diseñar la prueba de manera que, si la media verdadera de la tasa de quema difiere de 50 centímetros por segundo en hasta 1 centímetro por segundo, la prueba podrá detectar esto (es decir, rechazar $H_0:μ=50$) con una alta probabilidad, digamos, 0.90. Ahora notamos que $σ=2$, $δ=51-50=1$, $α=0.05$ y $β=0.10$. El tamaño de muestra requerido para detectar esta desviación de H0:μ=50 se encuentra mediante la Ecuación

$$
n≃ \frac{(z_{α∕2} + z_β)^2 σ^2}{δ^2}
$$

In [None]:
#@title 9.3

sigma = 2
n = 25
mu0 = 50
mu = 49
alpha = 0.05
d = abs(mu - mu0) / sigma

z_alpha2 = norm.ppf(1 - alpha/2)

# Cálculo de beta
beta = norm.cdf(z_alpha2 - d * np.sqrt(n)) - norm.cdf(-z_alpha2 - d * np.sqrt(n))
power = 1 - beta

print("\nEjercicio 2:")
print("d=", d)
print("Beta =", beta)
print("Power =", power)

power2 = 0.90
delta = abs(mu - mu0)
beta2 = 1 - power2
z_beta = norm.ppf(1 - beta2)
n2 = np.ceil(((z_alpha2 + z_beta)**2 * sigma**2) / delta**2)

print(z_beta)
print("Tamaño de muestra requerido para power 0.9:", n2)

# **Ejemplo 3**

Se realizó un experimento en el que se seleccionaron al azar 15 drivers producidos por un fabricante de palos en particular y se midieron sus coeficientes de restitución. En el experimento, las bolas de golf fueron disparadas desde un cañón de aire para que la velocidad de entrada y la tasa de giro de la bola pudieran ser controladas de manera precisa. Es de interés determinar si hay evidencia (con $α=0.05$) que apoye la afirmación de que el coeficiente medio de restitución excede 0.82. Las observaciones son las siguientes:

 $$0.8411, 0.8191, 0.8182, 0.8125, 0.8750,
 0.8580, 0.8532, 0.8483, 0.8276, 0.7983,
 0.8042, 0.8730, 0.8282, 0.8359, 0.8660$$

1. Parámetro de interés: El parámetro de interés es la media del coeficiente de restitución, $μ$.
2. Hipótesis nula: $H_0: μ=0.82$
3. Hipótesis alternativa: $H_1: μ>0.82$. Queremos rechazar $H_0$ si la media del coeficiente de restitución excede 0.82.
4. Estadístico de prueba: El estadístico de prueba es:

$$t_0= \frac{x−μ_0}{S/\sqrt{n}}$$

5. Rechaza $H_0$ si: Rechaza $H_0$ si el valor $P$ es menor que 0.05.

In [None]:
#@title 9.6

x=(0.8411, 0.8191, 0.8182, 0.8125, 0.8750, 0.8580, 0.8532, 0.8483, 0.8276, 0.7983,
 0.8042, 0.8730, 0.8282, 0.8359, 0.8660)

n = len(x)
x_bar = np.mean(x)
s = np.std(x, ddof=1)
mu0 = 0.82
alpha = 0.05
df = n - 1

T0 = (x_bar - mu0) / (s / np.sqrt(n))

Tcrit = t.ppf(1 - alpha, df)

decision = "Reject H0" if T0 > Tcrit else "Fail to Reject H0"

p_value = 1 - t.cdf(T0, df)

print("Ejercicio 3:")
print("t0 =", T0)
print("Valor crítico t:", Tcrit)
print("Decisión:", decision)
print("p-value =", p_value)


# **Ejemplo 4**

Considere el problema de prueba del palo de golf del Ejemplo 3. Si el coeficiente de restitución medio excede 0.82 en hasta 0.02, ¿es el tamaño de muestra $n = 15$ adecuado para asegurar que $H_0: μ=0.82$ será rechazado con una probabilidad de al menos 0.8? Para resolver este problema, usamos la desviación estándar muestral $s$ para estimar $σ$. Entonces,

$$d = |δ|/σ$$

Al referirnos a las curvas de características operativas en el Apéndice Gráfico VIIg (para $α=0.05$).

In [None]:
#@title 9.7
x = (0.8411, 0.8191, 0.8182, 0.8125, 0.8750, 0.8580, 0.8532, 0.8483, 0.8276, 0.7983,
 0.8042, 0.8730, 0.8282, 0.8359, 0.8660)

sigma = np.std(x, ddof=1)
n = len(x)
print(n)
delta = 0.02
d = abs(delta) / sigma  # d = |δ|/σ
alpha=0.05
df = n - 1

Tcrit = t.ppf(1 - alpha, df)

T1 = d * np.sqrt(n)

#beta = t.cdf(Tcrit - T1, df)
beta = 0.3
power = 1 - beta

print("\nEjercicio 4:")
print("d =", d)
print("Beta =", beta)
print("Power =", power)

# **Ejemplo 5**

Se utiliza una máquina de llenado automatizada para llenar botellas con detergente líquido. Una muestra aleatoria de 20 botellas resulta en una varianza de muestra del volumen de llenado de $s^2 = 0.0153(fl.oz)^2$. Si la varianza del volumen de llenado supera $0.01(fl.oz)^2$, una proporción inaceptable de botellas estará subllenadas o sobrellenadas. ¿Hay evidencia en los datos de la muestra que sugiera que el fabricante tiene un problema con botellas subllenadas o sobrellenadas? Use $α=0.05$ y asuma que el volumen de llenado tiene una distribución normal.

1. Parámetro de interés: El parámetro de interés es la varianza poblacional σ2.
2. Hipótesis nula: $H_0: σ2=0.01$
3. Hipótesis alternativa: $H_0: σ2>0.01$
4. Estadístico de prueba: El estadístico de prueba es:

$$χ^2_0 = \frac{(n-1)s^2}{σ^2_0}$$


In [None]:
#@title 9.8

n = 20
s2 = 0.0153
var = 0.01
alpha = 0.05

chi2_0 = (n - 1) * s2 / var

chi2_crit = chi2.ppf(1 - alpha, n - 1)

decision = "Reject H0" if chi2_0 > chi2_crit else "Fail to Reject H0"

p_value = 1 - chi2.cdf(chi2_0, n - 1)

print("Ejercicio 5:")
print("Chi^2 =", chi2_0)
print("Chi^2 crítico =", chi2_crit)
print("Decisión:", decision)
print("p-value =", p_value)


# **Ejemplo 6**

Considere el problema de llenado de botellas del Ejemplo 5. Si la varianza del proceso de llenado excede $0.01(fl.oz)^2$, demasiadas botellas estarán poco llenas. Así, el valor hipotetizado de la desviación estándar es $σ_0 = 0.10$. Supongamos que si la verdadera desviación estándar del proceso de llenado supera este valor en un 25%, nos gustaría detectar esto con una probabilidad de al menos 0.8. ¿Es el tamaño de la muestra de $n = 20$ adecuado? Para resolver este problema, note que requerimos:

$$ λ= \frac{σ}{σ_0}$$

Esto es el parámetro de la abscisa para la Gráfica VIIk. A partir de esta gráfica, con $n$ y $λ$ , encontrar $β$.

**Parte 2:**

Para reducir el error $β$, se debe utilizar un tamaño de muestra más grande. A partir de la curva característica de operación con $β=0.20$ y $λ=1.25$, encontramos que $n=75$, aproximadamente. Por lo tanto, si queremos que la prueba funcione como se requiere, el tamaño de la muestra debe ser al menos 75 botellas.

In [None]:
#@title 9.9

n = 20
sigma0 = 0.10
sigma = (sigma0 * 0.25) + sigma0
alpha = 0.05
df = n - 1

var0 = sigma0**2
var = sigma**2

lambda_ = abs(sigma / sigma0)

chi2_0 = (df) * (var) / (var0)
chi2_crit = chi2.ppf(1 - alpha, df)

beta = 0.6
power = 1 - beta

print("\nEjercicio 6:")
print("Lambda =", lambda_)
print("chi^2", chi2_0)
print("Chi^2 crítico =", chi2_crit)
print("Beta =", beta)
print("Potencia =", power)
