Prueba de frecuencias

&emsp;Se busca determinar si un conjunto de números (idealmente pseudoaleatorios) se distribuye de forma uniforme a lo largo del intervalo $U(0, 1)$ con un nivel de confiabilidad $\alpha$

Para lograr el objetivo, primero se recurre a una prueba de hipótesis, donde definimos a: <br>
&emsp;$H_0$: Las frecuencias observadas son iguales a las esperadas. <br>
&emsp;$H_1$: Las frecuencias observadas no son iguales a las observadas.


In [None]:
#Para facilitar las cosas, importaré las librerías de numpy y scipy.stats ára facilitar los cálculos
import numpy as np
import scipy.stats as stats

In [None]:
#Lo siguiente será la lista de números que se usará de prueba para verificar que el código funciona
lista1 = [0.78961, 0.76086, 0.80548, 0.58518, 0.89898, 0.28269, 0.38618, 0.79982, 0.58962, 0.69623, 0.29931, 0.57410, 0.24000, 0.93655, 0.54325, 0.58244, 0.23949, 0.19962, 0.19147, 0.22287]
lista2 = [0.05230, 0.12079, 0.82654, 0.98611, 0.57880, 0.73059, 0.76910, 0.45679, 0.33216, 0.17028, 0.30861, 0.26593, 0.65559, 0.88809, 0.62400, 0.85853, 0.53559, 0.65002, 0.40644, 0.07281]
lista3 = [0.10699, 0.27738, 0.29453, 0.34488, 0.67621, 0.70119, 0.68334, 0.21631, 0.03185, 0.05475, 0.83358, 0.85903, 0.38507, 0.81772, 0.09133, 0.88752, 0.33381, 0.74579, 0.08128, 0.64183]
lista4 = [0.55877, 0.65726, 0.20852, 0.34358, 0.05010, 0.18284, 0.55170, 0.87616, 0.61168, 0.91512, 0.51781, 0.43308, 0.90829, 0.36982, 0.41678, 0.33729, 0.49383, 0.79113, 0.73435, 0.44267]
lista5 = [0.14151, 0.79269, 0.42989, 0.11537, 0.00121, 0.49962, 0.10850, 0.55743, 0.09264, 0.76262, 0.03272, 0.35286, 0.94187, 0.19904, 0.33954, 0.15506, 0.75103, 0.63453, 0.22724, 0.72102]
lista = lista1 + lista2 + lista3 + lista4 + lista5

#Este será el nivel de confiabilidad
a = 0.05

In [None]:
#Creamos la funcion que hará todos los cálculos, donde la variable "a" será el valor de confiabilidad
#La variable "datos" será una lista con el conjunto de números
def prueba_frecuencia(a, datos):

#1. Definimos el número de intervalos
    numintervalo = np.round(np.sqrt(len(datos))).astype(int)

#2. se determinan las frecuencias usando "np.histograms"
#Se usará np.linspace para definir los intervalos
    inter = np.linspace(0, 1, numintervalo+1)
    frecuencias, intervalos = np.histogram(datos, inter)

#3. Se determina la frecuencia ESPERADA
    esperada = len(datos) / numintervalo

#4. Calculamos el estadístico Chi-cuadrada
    chi = np.sum((frecuencias - esperada)**2 / esperada)

# 5. Saco el valor crítico de chi cuadrada con k-1 grados de libertad
    gradosl = numintervalo - 1
    chicritico = stats.chi2.ppf(1 - a, gradosl)

#6. Comparamos las frecuencias observadas con las esperadas
    for i in range(numintervalo):
        print("Intervalo: (", intervalos[i], ", ", intervalos[i+1], ") \n")
        print("\t frecuencia observada = ", frecuencias[i])
        print("\t frecuencia esperada = ", esperada, "\n")

#Conclusión
    print("Desición")
    if chi < chicritico:
        print("Como: ", chi, " < ", chicritico, ", Podemos decir que los numeros se distribuyen de forma uniforma en el intervalo (0, 1)")
    else:
        print("Como: ", chi, " >= ", chicritico, ", Podemos decir que los numeros NO se distribuyen de forma uniforma en el intervalo (0, 1)")



print(prueba_frecuencia(a, lista))