<a href="https://colab.research.google.com/github/David-gutierrez-rodriguez/Simulacion-I/blob/main/Prueba_X%5E2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [34]:
def X2(nums, k=5):
    """
    Función que realiza la prueba de Chi-Cuadrado para comprobar si los números siguen
    una distribución uniforme dividiendo el intervalo [0,1] en k clases.

    Parámetros:
    nums : list
        Lista de números aleatorios entre 0 y 1.
    k : int, opcional
        Número de intervalos en los que se dividirá [0,1] (por defecto 5).

    Retorna:
    df : DataFrame de pandas
        Tabla con los intervalos, frecuencias esperadas, frecuencias observadas y el
        estadístico de Chi-Cuadrado para cada intervalo.
    """
    import numpy as np
    import pandas as pd

    # Se generan los k+1 puntos que delimitan los intervalos en [0,1]
    bordes = np.linspace(0, 1, k + 1)

    # Se calculan las frecuencias observadas (fo) usando un histograma
    fo, _ = np.histogram(nums, bins=bordes)

    # Se calculan las frecuencias esperadas (fe), que deberían ser iguales en cada intervalo
    fe = [int(len(nums) / k) for _ in range(k)]

    # Se calcula el estadístico de Chi-Cuadrado para cada intervalo
    x2 = [(fo[i] - fe[i])**2 / fe[i] for i in range(k)]

    # Se crean etiquetas de los intervalos para mostrar en la tabla
    intervalos = [f"[{bordes[i]:.2f}, {bordes[i+1]:.2f})" for i in range(k)]

    # Se genera un DataFrame con los resultados
    df = pd.DataFrame({"Intervalo": intervalos, "fe": fe, "fo": fo, "x2": x2})

    return df

def PH(df, n, alpha):
    """
    Función que evalúa la hipótesis de que los números siguen una distribución uniforme
    utilizando la prueba de Chi-Cuadrado.

    Parámetros:
    df : DataFrame de pandas
        Tabla generada por X2(), que contiene los valores calculados de Chi-Cuadrado.
    n : int
        Número total de datos.
    alpha : float
        Nivel de significancia para la prueba de hipótesis.

    Retorna:
    Nada. Imprime si la muestra sigue o no una distribución uniforme.
    """
    from scipy.stats import chi2

    # Se obtiene el valor crítico de Chi-Cuadrado para n-1 grados de libertad
    x = chi2.ppf(1 - alpha, n - 1)

    # Se calcula el estadístico de prueba sumando los valores de x2 en la tabla
    x2 = df["x2"].sum()

    # Se compara el estadístico con el valor crítico
    if x2 >= x:
        print("Muestra no uniforme")
    else:
        print("Muestra uniforme")

In [35]:
# Lista de números aleatorios a evaluar
numeros = [0.048, 0.926, 0.368, 0.787, 0.298, 0.591, 0.007, 0.437, 0.594, 0.199, 0.478, 0.551, 0.178,
           0.086, 0.157, 0.166, 0.362, 0.411, 0.951, 0.401, 0.932, 0.533, 0.545, 0.772, 0.631]

In [36]:
# Se ejecuta la función X2 para obtener la tabla de Chi-Cuadrado
df = X2(numeros)

# Se muestra la tabla
display(df)

Unnamed: 0,Intervalo,fe,fo,x2
0,"[0.00, 0.20)",5,7,0.8
1,"[0.20, 0.40)",5,3,0.8
2,"[0.40, 0.60)",5,9,3.2
3,"[0.60, 0.80)",5,3,0.8
4,"[0.80, 1.00)",5,3,0.8


In [37]:
# Se realiza la prueba de hipótesis
PH(df, len(numeros), 0.05)

Muestra uniforme
