El test de bondad de ajuste es una tecnica estadistica que se utiliza para determinar si un conjunto de datos observados se ajusta a una distribucion teorica especifica. Es ampliamente utilizado en diversas areas como la investigacion cientifica, la ingenieria, y los negocios para validar suposiciones o modelos estadisticos sobre la distribucion de los datos subyacentes.

Tipos de Test de Bondad de Ajuste:

1- Chi-Cuadrado (X^2): Es uno de los tests mas comunes para realizar analisis de bondad de ajuste, especialmente util para datos categoricos. Compara las frecuencias observadas con las frecuencias esperadas bajo una hipotesis nula especifica.

2- Kolmogorov-Smirnov: Es un test no parametrico que se utiliza para comparar una muestra con una distribucion continua. Es particularmente util para comparar la distribucion acumulativa de una muestra con una distribucion teorica.

Procedimiento general:

El procedimiento general para realizar un test de bondad de ajuste incluye los siguientes pasos:

1- Definir hipotesis Nula y Alternativa:

- Hipotesis Nula (H0): No hay diferencia significativa entre las distribuciones observadas y esperadas, es decir, los datos siguen la distribucion especificada.
- Hipotesis Alternativa (H1): Hay una diferencia significativa entre las distribucioens observadas y esperadas, es decir, los datos no siguen la distribucion especificada.

2- Calcular estadisticas de prueba: Dependiendo del test elegido, calculas una estadistica que mide la diferencia entre las frecuencais observadas y esperadas. Por ejemplo, en el test de Chi-cuadrado, la estadistica se calcula como:

![image.png](attachment:image.png)

donde Oi son las frecuencias observadas y Ei son las frecuencias esperadas.

3- Determinar el valor P: el valor p es la probabilidad de observar una estadistica de prueba al menos tan extrema como la que fue observada, bajo la supoiscion de que la hipotesis nuna es cierta. Si el valor p es bajo (generalmente menos de 5%, o p < 0.05), se rechaza la hipotesis nula.

4- Tomar decisiones: Basado en el valor p y la significancia estadisitca deseada, decides aceptar o rechazar la hipotesis nula.



Supongamos que queremos verificar si los datos de un juego son justos (todos los resultados del 1 al 6 son igualmente probables). Aqui hay un ejemplo de como se podria realizar un test de Chi-cuadrado para esta situacion

1- Definir las categorias y las frecuencias esperadas:

- Primero, se necesita definir las categorias en las que se clasificaran los datos. Por ejemplo, si se esta analizando los resultados de lanzar un dado, las categorias serian los numeros 1, 2, 3, 4, 5 y 6.

- Luego, se determina la frecuencias esperada para cada categoria. Si el dado es justo, se esperaria que cada numero salga aproximadamente la misma cantidad de veces, es decir, 1/6 del total de lanzamientos para cada numero si lanzas el dado muchas veces.

2- Recopilar los datos (frecuencias observadas):

- Recopilas los datos observando o experimentando. En el caso del dado, esto significaria lanzar el dado un numero especifico de veces y registrar cuantas veces aparece cada numero.

3- Calcular el estadistico Chi-Cuadrado:

- El estadistico Chi-Cuadrado se calcula usando la siguiente formula:

![image.png](attachment:image.png)

- Donde Oi es la frecuencia observada para cada categoria, Ei es la frecuencia esperada, y la suma se realiza sobre todas las categorias.
- Este estadistico mide la discrepancia entre las frecuencias observadas y las esperadas. Cuanto mayor sea el valor del estadistico, mayor sera la evidencia de que las frecuencias observadas difieren de las esperadas.

4- Comparar con la distribucion Chi-Cuadrado:

- El valor calculado del estadistico se compara con un valor critico de la distribucion Chi-Cuadrado, que depende del nivel de significancia que se elija (comunmente 0.05 para una confianza del 95%) y los grados de libertad, que en el caso de bondad de ajuste son numeros de categorias - 1.

- Si el valor del estadistico calculado es mayor que el valor critico, se rechaza la hipotesis nula de que no hay diferencia significativa entre las observadas y las esperadas, lo que suigere que los datos no se ajustan a la distribucion esperada.

In [11]:
import numpy as np
from scipy.stats import chi2

categorias = [1, 2, 3, 4, 5, 6]

# Frecuencias observadas de lanzamientos de dados (supongamos 100 lanzamientos)
observados = np.array([10, 10, 12, 3, 20, 16])
# Frecuencias esperadas para un dado justo (todos los resultados son igualmente probables)
frecuencias_esperadas = np.full(len(categorias), sum(observados) / len(categorias))


estadistico = np.sum((observados - frecuencias_esperadas)**2 / frecuencias_esperadas)

print(f'Valor del estadistico chi-cuadrado: {estadistico}')

grados_libertad = len(categorias) - 1
valor_critico = chi2.ppf(1 - 0.05, grados_libertad)

print(f'Valor critico para un nivel de significancia de 0.05: {valor_critico}')


if estadistico > valor_critico:
    print("Datos no se ajustan a la distribucion esperada")
else:
    print("Datos se ajustan a la distribucion esperada")


Valor del estadistico chi-cuadrado: 14.267605633802816
Valor critico para un nivel de significancia de 0.05: 11.070497693516351
Datos no se ajustan a la distribucion esperada


En un test Chi-Cuadrado de bondad de ajuste, la distribucion esperada se determina a partir de las frecuencias esperadas que definimos basandose en alguna hipotesis o modelo teorico. Es decir, definis lo que esperarias ver si tus datos siguieran una distribucion ideal o teorica especifica

Determinando la distribucion esperada

1- Hipotesis sobre la distribucion

- Primero, se debe tener una hipotesis o modelo sobre como deberian distribuirse los datos en condiciones ideales o normales. Por ejemplo, si se esta tirando un dado justo, la hipotesis seria que cada numero tiene la misma probabilidad de salir, es decir, 1/6 para cada cara del dado.

2- Calculo de frecuencias esperadas:

- Las frecuencias esperadas se calculan en funcion del total de observaciones y la distribucion teoria. En el caso del dado, si lanzas el dado 60 veces, esperarias que cada numero salga 1/6 de 60, lo cual es 10 veces por numero.

- La formula seria: Frecuencia esperada = total de observaciones / numero de categorias. Si todas las categorias son igualmente probables.

3- Implementacion en el Test:

- Cuando se realiza el test chi-cuadrado, comparas las frecuencias observadas (lo que realmnete ocurrio en los datos) con estas frecuencias esperads oara evaluar si los datos se desvian significativamente de lo que la teoria predice.

Implementacion en IA

1- Validacion de datos

Antes de entrenar modelos de IA especialmente en aprendizaje automatico y aprendizaje profundo, es crucial validar que los datos no estan sesgados o distorcionados de maneras que podrian afectar negativamente el aprendizaje. El test Chi-Cuadrado puede ser utilizado para asegurar que las caracteristicas categoricas en un conjunto de datos esten distribuidas uniformemente o segun se espra.

2- Feature Engineering

En el proceso de creacion de caracteristicas (feature engineering), el test Chi-Cuadrado puede ayudar a identificar que variables categoricas son relevantes para predecir una variable objetivo. Esto es comun en la seleccion de caracteristicas, donde se desea reducir la dimensionalidad del dataset conservando solo las variables mas significativas.

3- Analasis de Sesgos

El test Chi-Cuadrado puede ser utilziado para detectar sesgos en los datos, lo cual es especialmente importante en aplicaciones de IA que involucran interaccion humana, como sistemas de recomendacion, motores de busqueda y reconocimiento facial. Asegurar que los sistemas de IA no perpetuen ni excarveben sesgos existentes en los datos es crucial para desarrollar tecnologias justas y eticas.

4- Validacion de modelos generativos

En modelos generativos, como los que se utlizan en procesamiento de lenguaje natural o generacion de imagenes, el test Chi-Cuadrado puede comparar la distribucion de las etiquetas generadas por el modelo contra las distribuciones esperadas para evaluar si el modelo esta aprendiendo a reproducir fielmente las caracteristicas del conjunto de datos original.

5- Evaluacion post-modelado

Despues de entrenar un modelo, es util veirifcar si las predicciones del modelo se distribuyen de manera esperada en diferentes subconjuntos del conjunto de datos. El test Chi-Cuadrado puede ser utilziado para evaluar si las predicciones se desvian de lo que se consideraria un comportamiento normal bajo la hipotesis nula.

Ejemplo de como utilizar el test Chi-Cuadrado para seleccionar caracteristicas en un modelo de clasificacion

In [12]:
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.datasets import load_iris

# Cargar datos
data = load_iris()
X, y = data.data, data.target

# Aplicar el test Chi-Cuadrado para seleccionar las 2 mejores características
chi_selector = SelectKBest(chi2, k=2)
X_kbest = chi_selector.fit_transform(X, y)

print("Características seleccionadas:", chi_selector.get_support())


ModuleNotFoundError: No module named 'sklearn'