<a href="https://colab.research.google.com/github/vanecornejo/Simulaci-n-I/blob/main/Prueba%20Chi%20Cuadrada.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Prueba Chi-Cuadrada
La prueba Chi-Cuadrada es una prueba de ajuste, la cual es una prueba estadística que permite determinar si una muestra de datos se ajusta a una determinada distribución de probabilidad o no. Es decir, la prueba de bondad de ajuste sirve para verificar si los datos observados se ajustan a los datos esperados.
La prueba de bondad de ajuste utilizada es:

Ho := Los números siguen una distribución uniforme U(0,1)

H1 := No Ho

Los pasos para realizar esta prueba de bondad son:

*   Paso 1: Formular la hipótesis nula (H0) y la hipótesis alternativa (H1)
*   Paso 2:Seleccionar el nivel de significancia, en este caso, del 95%
*   Paso 3: Seleccionar el estadístico con la fórmula
*   Paso 4: Formular la regla de decisión (puntos críticos)

Se presenta el código comentado que realiza la prueba Chi-Cuadrada, realizada con la muestra 1 dada en clase.





In [2]:
import scipy.stats as stats #librería para calcular valores relacionados con la Chi-Cuadrada
from tabulate import tabulate  #librería para imprimir los datos en una tabla

datos = [0.048, 0.926, 0.368, 0.787, 0.298, 0.591, 0.007, 0.437, 0.594, 0.199, 0.478, 0.551, 0.178, 0.086, 0.157, 0.166, 0.362, 0.411, 0.951, 0.401, 0.932, 0.533, 0.545, 0.772, 0.631]
clases = 5

def prueba_chi(datos, clases):
    muestra = len(datos) # tamaño de la muestra

    # definimos los límites de los intervalos
    step = 1 / clases # tamaño de cada intervalo
    intervalos = [(i*step, (i+1)*step) for i in range(clases)]

    frecuencia = [0] * clases # inicializar la lista para contar la frecuencia observada en cada intervalo
    # contar cuántos valores caen en cada intervalo
    for num in datos:
        for i, (low, high) in enumerate(intervalos):
            if low <= num < high: # verifica si el número está dentro del intervalo actual
                frecuencia[i] += 1
                break

    fe = [muestra / clases] * clases # frecuencia esperada

    # calcular Chi-Cuadrado
    chi_cuadrada = sum((obs - exp) ** 2 / exp for obs, exp in zip(frecuencia, fe)) # fórmula
    df = clases - 1  # grados de libertad
    valor_critico = stats.chi2.ppf(0.95, df)  # valor crítico para un nivel de confianza del 95%
    p_value = 1 - stats.chi2.cdf(chi_cuadrada, df) # calcula el p-value comparando el estadístico obtenido con la distribución Chi-Cuadrado

    # para la tabla
    tabla = [[f"[{low:.2f}, {high:.2f})", obs, exp, obs - exp, (obs - exp) ** 2 / exp] for (low, high), obs, exp in zip(intervalos, frecuencia, fe)]
    headers = ["Intervalo", "Fo", "Fe", "Fo - Fe", "(Fo-Fe)^2 / Fe"]

    # imprimir resultados y tabla
    print(tabulate(tabla, headers=headers, tablefmt="grid"))
    print(f"\nEstadístico Chi-Cuadrado: {chi_cuadrada:.4f}")
    print(f"Valor Crítico (α=0.05): {valor_critico:.4f}")
    print(f"el p-value: {p_value:.4f}")

    # evaluar la hipótesis nula
    if chi_cuadrada < valor_critico:
        print("No se rechaza la hipótesis nula")
    else:
        print("Se rechaza la hipótesis nula")

prueba_chi(datos, clases) # llamar a la prueba


+--------------+------+------+-----------+------------------+
| Intervalo    |   Fo |   Fe |   Fo - Fe |   (Fo-Fe)^2 / Fe |
| [0.00, 0.20) |    7 |    5 |         2 |              0.8 |
+--------------+------+------+-----------+------------------+
| [0.20, 0.40) |    3 |    5 |        -2 |              0.8 |
+--------------+------+------+-----------+------------------+
| [0.40, 0.60) |    9 |    5 |         4 |              3.2 |
+--------------+------+------+-----------+------------------+
| [0.60, 0.80) |    3 |    5 |        -2 |              0.8 |
+--------------+------+------+-----------+------------------+
| [0.80, 1.00) |    3 |    5 |        -2 |              0.8 |
+--------------+------+------+-----------+------------------+

Estadístico Chi-Cuadrado: 6.4000
Valor Crítico (α=0.05): 9.4877
el p-value: 0.1712
No se rechaza la hipótesis nula
