<a href="https://colab.research.google.com/github/Andrea-24744/Simulaci-n-1/blob/main/Chi_cuadradada_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CHI-CUADRADA
*Santelices Medina Andrea*

<p style="text-align: justify;">Existen algunos métodos disponibles para verificar varios aspectos de la calidad de los números
pseudoaleatorios.</p>
<p style="text-align: justify;">Las dos propiedades más importantes esperadas en los números aleatorios son uniformidad e independencia. La prueba de uniformidad puede ser realizada usando las pruebas de bondad de ajuste disponibles. Por ejemplo, un número estadístico suficiente de números aleatorios pueden ser usados para verificar la distribución de los números contra la distribución uniforme teórica usando ya sea el método Chi-Cuadrada o el método Kolmogomorov-Smirnov(KS) para números aleatorios. Este tipo de prueba es denominada "Prueba de frecuencia"</p>
Para entender mejor la función de las pruebas de uniformidad, realicemos un ejemplo aplicando la de **Chi cuadrada:**

1. Agrupe los n números aleatorios en K-clases disjuntas de igual amplitud A.
2. Halle la frecuencia de cada clase $f_i$.
3. Calcule el estadístico $$X^2 = \sum_{i = 1}^{ k} \frac{(f_i - nA_i)^2}{nA_i}$$
Para n suficientemente grande este estadístico sigue la distribución $x^2$ con $(k-1)$ grados de libertad.
4. Determine el valor crítico $x^2_{\alpha,k-1}$ para un nivel de confianza $(1-\alpha)$ y $(k-1)$ grados de libertad. Si $x^2 > x^2_{\alpha,k-1}$ se rechaza $H_o$ (Hipótesis nula).

In [24]:
import numpy as np
import pandas as pd
from tabulate import tabulate
import scipy.stats as stats
def calcular_rangos_clase(datos, num_clases):
    n = len(datos)  # Tamaño de la muestra
    print(f"Total de datos en la muestra: {n}")  # Imprimir la longitud de la muestra
    #Como se sabe que sigue una distribución uniforme directamnete se considera de 0 a 1
    ancho_clase = (1 - 0) / num_clases
    clases = []
    #Definimos cuales seran los valores extremos de mis clases
    limites = [0 + i * ancho_clase for i in range(num_clases + 1)]

    #Ajustamos los limites con una diferencia de 0.0001 para no repertirse en al siguiene calse
    for i in range(num_clases):
        lim_inf = limites[i]
        lim_sup = limites[i + 1] - 0.0001 if i < num_clases - 1 else 1
        clases.append([lim_inf, lim_sup])

    return clases

def frecuencia_obs(datos, clases):
    return [len(datos)/num_clases]*num_clases # Define mi frecuencia observada
def frecuencia_espe(datos, clases):
   return [sum(lim_inf <= dato <= lim_sup for dato in datos) for lim_inf, lim_sup in clases] # Define mi frecuencia esperada

def resta(frecuencia_o, frecuencia_e):
   return [fo - fe for fo, fe in zip(frecuencia_o, frecuencia_e)] #Une dos columnas para restarlas entre ellas
def cuadrado(frecuencia_o, frecuencia_e):
   return [(fo - fe)**2 for fo, fe in zip(frecuencia_o, frecuencia_e)] #Eleva al cuadrado el resultado obtenido de la anterior resta
def final(frecuencia_o, frecuencia_e):
   return [((fo - fe)**2)/fe for fo, fe in zip(frecuencia_o, frecuencia_e)]

Lista = [
    0.048, 0.591, 0.478, 0.166, 0.932,
    0.926, 0.007, 0.551, 0.362, 0.533,
    0.368, 0.437, 0.178, 0.411, 0.545,
    0.787, 0.594, 0.086, 0.951, 0.772,
    0.298, 0.199, 0.157, 0.401, 0.631
]

num_clases = 5  # Definir el número de clases

# Calcular los rangos de clase
clases = calcular_rangos_clase(Lista, num_clases)

# Calcular frecuencias
frecuencias_e = frecuencia_espe(Lista, clases)
frecuencias_o = frecuencia_obs(Lista, clases)
resta = resta(frecuencias_o, frecuencias_e)
cuadrado = cuadrado(frecuencias_o, frecuencias_e)
final = final(frecuencias_o, frecuencias_e)
# Convertir en DataFrame para visualizar con tabulate
tabla = pd.DataFrame({
    "Límite Inferior": [clase[0] for clase in clases],
    "Límite Superior": [clase[1] for clase in clases],
    "Frecuencia observada": frecuencias_o,
    "Frecuencia esperada": frecuencias_e,
    "Fo - Fe": resta,
    "(Fo - Fe)^2": cuadrado,
    "(Fo - Fe)^2/Fe": final
})


# Imprimir la tabla en formato fancy grid
print(tabulate(tabla, headers="keys", tablefmt="fancy_grid", showindex=False))
chi_cuadrada = sum(final)
print(f"Suma de la última columna x^2: {chi_cuadrada}")
grados_lib = num_clases - 1
# Obtiene el valor crítico de la tabla de Chi
alpha = 0.05
chi_tabla = stats.chi2.ppf(1 - alpha, grados_lib)

print(f"Valor crítico de chi cuadrado x^2_a: {chi_tabla}")
if chi_cuadrada > chi_tabla:
    print(f"Se rechaza la hipótesis nula: Los datos no siguen una distribución uniforme. Pues {chi_cuadrada} > {chi_tabla}")
else:
    print(f"No se rechaza la hipótesis nula: Los datos siguen una distribución uniforme. Pues {chi_cuadrada} < {chi_tabla}")

Total de datos en la muestra: 25
╒═══════════════════╤═══════════════════╤════════════════════════╤═══════════════════════╤═══════════╤═══════════════╤══════════════════╕
│   Límite Inferior │   Límite Superior │   Frecuencia observada │   Frecuencia esperada │   Fo - Fe │   (Fo - Fe)^2 │   (Fo - Fe)^2/Fe │
╞═══════════════════╪═══════════════════╪════════════════════════╪═══════════════════════╪═══════════╪═══════════════╪══════════════════╡
│               0   │            0.1999 │                      5 │                     7 │        -2 │             4 │         0.571429 │
├───────────────────┼───────────────────┼────────────────────────┼───────────────────────┼───────────┼───────────────┼──────────────────┤
│               0.2 │            0.3999 │                      5 │                     3 │         2 │             4 │         1.33333  │
├───────────────────┼───────────────────┼────────────────────────┼───────────────────────┼───────────┼───────────────┼──────────────────┤
│