# Prueba de los Promedios
## Pruebas estadísticas para números pseudoaleatorios

---

### Supuesto

Se tiene una secuencia de números pseudoaleatorios:

$$u_i \sim U(0,1), \quad i = 0, 1, 2, \dots, N$$

Para que una secuencia sea considerada aleatoria, su **media** debe aproximarse al valor esperado de una distribución uniforme, que es $\frac{1}{2}$.

---

### Hipótesis

$$H_0: \mu = 0.5 = \frac{1}{2}$$

$$H_a: \mu \neq 0.5 = \frac{1}{2}$$

---

### Estadístico de prueba

La media muestral se calcula como:

$$\bar{X} = \frac{u_1 + u_2 + \dots + u_N}{N}$$

El estadístico de prueba $Z_0$ sigue una distribución normal estándar para $N \geq 30$:

$$Z_0 = \frac{\left(\bar{X} - \dfrac{1}{2}\right) \sqrt{N}}{\sqrt{\dfrac{1}{12}}}$$

---

### Criterio de decisión

Si $|Z_0| < Z_{\alpha/2}$, entonces **no se rechaza** $H_0$, es decir, los números son aleatorios.

Donde $\alpha$ es el nivel de significancia y $Z_{\alpha/2}$ es el valor crítico de la distribución normal estándar.

In [1]:
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import pandas as pd

## Datos de la Tabla 3.1

In [2]:
ui = np.array([
    0.78961, 0.05230, 0.10699, 0.55877, 0.14151,
    0.76086, 0.12079, 0.27738, 0.65726, 0.79269,
    0.80548, 0.82654, 0.29453, 0.20852, 0.42989,
    0.58518, 0.98611, 0.34488, 0.34358, 0.11537,
    0.89898, 0.57880, 0.67621, 0.05010, 0.00121,
    0.28269, 0.73059, 0.70119, 0.18284, 0.49962,
    0.38618, 0.76910, 0.68334, 0.55170, 0.10850,
    0.79982, 0.45679, 0.21631, 0.87616, 0.55743,
    0.58962, 0.33216, 0.03185, 0.61168, 0.09264,
    0.69623, 0.17028, 0.05475, 0.91512, 0.76262,
    0.29931, 0.30861, 0.83358, 0.51781, 0.03272,
    0.57410, 0.26593, 0.85903, 0.43308, 0.35286,
    0.24000, 0.65559, 0.38507, 0.90829, 0.94187,
    0.93655, 0.88809, 0.81772, 0.36982, 0.19904,
    0.54325, 0.62400, 0.09133, 0.41678, 0.33954,
    0.58244, 0.85853, 0.88752, 0.33729, 0.15506,
    0.23949, 0.53559, 0.33381, 0.49383, 0.75103,
    0.19962, 0.65002, 0.74579, 0.79113, 0.63453,
    0.19147, 0.40644, 0.08128, 0.73435, 0.22724,
    0.22287, 0.07281, 0.64183, 0.44267, 0.72102
])

## Media muestral

$$\bar{X} = \frac{1}{N} \sum_{i=1}^{N} u_i$$

In [3]:
N = len(ui)
X_barra = np.sum(ui) / N
print(f"X_barra = {X_barra:.6f}")

X_barra = 0.482344


## Estadístico de prueba $Z_0$

$$Z_0 = \frac{\left(\bar{X} - \dfrac{1}{2}\right) \sqrt{N}}{\sqrt{\dfrac{1}{12}}}$$

In [4]:
Z0 = (X_barra - 0.5) * np.sqrt(N) / np.sqrt(1/12)
print(f"Z0 = {Z0:.6f}")

Z0 = -0.611629


## Valor crítico $Z_{\alpha/2}$

Se usa $\alpha = 0.05$ como nivel de significancia. El valor crítico se obtiene de la distribución normal estándar con `scipy.stats`:

$$Z_{\alpha/2} = Z_{0.025} \approx 1.96$$

In [5]:
alpha = 0.05
z_alpha = stats.norm.ppf(1 - alpha/2)
print(f"z_alpha/2 = {z_alpha:.6f}")

z_alpha/2 = 1.959964


## P-valor

El p-valor indica la probabilidad de obtener un $Z_0$ tan extremo o más, asumiendo que $H_0$ es verdadera:

$$p = 2 \cdot P(Z > |Z_0|)$$

In [6]:
p_valor = 2 * stats.norm.sf(abs(Z0))
print(f"p-valor = {p_valor:.6f}")

p-valor = 0.540783


## Decisión

Según el criterio del pizarrón:

$$\text{Si } |Z_0| < Z_{\alpha/2} \Rightarrow \text{No se rechaza } H_0$$

$$\text{Si } |Z_0| \geq Z_{\alpha/2} \Rightarrow \text{Se rechaza } H_0$$

In [23]:
print(f"Resultados")
print(f"X_barra = {X_barra:.6f}")
print(f"Z0 = {Z0:.6f}")
print(f"|Z0| = {abs(Z0):.6f}")
print(f"z_a/2 = {z_alpha:.6f}")
print(f"p-valor = {p_valor:.6f}")

print(f"\nDecision")
if abs(Z0) < z_alpha:
    print(f"|Z0| = {abs(Z0):.4f} < z_alpha/2 = {z_alpha:.4f}")
    print("No se rechaza H0: los numeros son aleatorios")
else:
    print(f"|Z0| = {abs(Z0):.4f} >= z_alpha/2 = {z_alpha:.4f}")
    print("Se rechaza H0: los numeros NO son aleatorios")

Resultados
X_barra = 0.482344
Z0 = -0.611629
|Z0| = 0.611629
z_a/2 = 1.959964
p-valor = 0.540783

Decision
|Z0| = 0.6116 < z_alpha/2 = 1.9600
No se rechaza H0: los numeros son aleatorios
