<a href="https://colab.research.google.com/github/DanielaJim07/Simulaci-n-I/blob/main/chi_cuadrada.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Chi cuadrado**


## Historia
La prueba de Chi-cuadrado (χ²) fue desarrollada por Karl Pearson en 1900. Se convirtió en una de las pruebas más importantes en estadística inferencial. Su propósito original era analizar la bondad de ajuste entre datos observados y esperados bajo ciertas hipótesis.

Desde su introducción, la prueba ha sido utilizada en diversos campos, incluyendo la genética (para verificar leyes de herencia mendeliana), economía, psicología y estudios de mercado.

## EJERCICIO
Elaborar la prueba de ajuste para los siguientes numeros aleatorios con un nivel de aceptacion del 95%

In [None]:
import numpy as np
import pandas as pd
from scipy.stats import chi2

# Lista de números pseudoaleatorios proporcionados
numeros_pseudoaleatorios = [
    0.0449, 0.1733, 0.5746, 0.049, 0.8406, 0.8349, 0.92, 0.2564,
    0.6015, 0.6694, 0.3972, 0.7025, 0.1055, 0.1247, 0.1977, 0.0125,
    0.63, 0.2531, 0.8297, 0.6483, 0.6972, 0.9582, 0.9085, 0.8524,
    0.5514, 0.0316, 0.3587, 0.7041, 0.5915, 0.2523, 0.2545, 0.3044,
    0.0207, 0.1067, 0.3857, 0.1746, 0.3362, 0.1589, 0.3727, 0.4145
]


# Número de intervalos (categorías)
intervalos = 5

# Definir los límites de los intervalos
divisiones = np.linspace(0, 1, intervalos + 1)

# Contar la frecuencia observada en cada intervalo
frecuencia_observada, _ = np.histogram(numeros_pseudoaleatorios, bins=divisiones)

# Frecuencia esperada (Fe) para cada categoría, asumiendo una distribución uniforme
frecuencia_esperada = [len(numeros_pseudoaleatorios) / intervalos] * intervalos

# Calcular Chi-cuadrado
chi_cuadrado = sum(((fo - fe) ** 2) / fe for fo, fe in zip(frecuencia_observada, frecuencia_esperada))

# Grados de libertad
gl = intervalos - 1

# Valor crítico de Chi-cuadrado con 95% de confianza
valor_critico = chi2.ppf(0.95, gl)

# Crear un DataFrame con los datos
df = pd.DataFrame({
    'Categoría': [f'{divisiones[i]:.2f} - {divisiones[i+1]:.2f}' for i in range(intervalos)],
    'Frecuencia Esperada (Fe)': frecuencia_esperada,
    'Frecuencia Observada (Fo)': frecuencia_observada,
    'Chi-cuadrado': [((fo - fe) ** 2) / fe for fo, fe in zip(frecuencia_observada, frecuencia_esperada)]
})

# Mostrar la tabla
print(df)
print(f'\nValor de Chi-cuadrado calculado: {chi_cuadrado:.5f}')
print(f'Valor crítico de Chi-cuadrado (95% confianza): {valor_critico:.5f}')

# Evaluar la hipótesis nula
if chi_cuadrado > valor_critico:
    print("Rechazamos la hipótesis nula: Los datos no siguen una distribución uniforme.")
else:
    print("No se puede rechazar la hipótesis nula: Los datos pueden seguir una distribución uniforme.")


     Categoría  Frecuencia Esperada (Fe)  Frecuencia Observada (Fo)  \
0  0.00 - 0.20                       8.0                         12   
1  0.20 - 0.40                       8.0                         10   
2  0.40 - 0.60                       8.0                          4   
3  0.60 - 0.80                       8.0                          7   
4  0.80 - 1.00                       8.0                          7   

   Chi-cuadrado  
0         2.000  
1         0.500  
2         2.000  
3         0.125  
4         0.125  

Valor de Chi-cuadrado calculado: 4.75000
Valor crítico de Chi-cuadrado (95% confianza): 9.48773
No se puede rechazar la hipótesis nula: Los datos pueden seguir una distribución uniforme.
