<a href="https://colab.research.google.com/github/vanecornejo/Simulaci-n-I/blob/main/Prueba%20Kolmogorov%20Smirnov.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Prueba Kolmogorov Smirnov

La prueba de Kolmogorov-Smirnov es una prueba de bondad de ajuste no paramétrica que se emplea para obtener un indicador que le dé una idea al investigador de si dos distribuciones son distintas o si una distribución de probabilidad subyacente difiere de una distribución hipotética.

Pasos para realizar la prueba de Kolmogorov Smirnov:

*   Paso 1: Formular las hipótesis

Hipótesis nula (H0): La muestra proviene de la distribución teórica especificada.

Hipótesis alternativa (H1): La muestra no proviene de la distribución teórica especificada.

*   Paso 2: Ordenamos los valores de la muestra de menor a mayor
*   Paso 3: Calcular la función de distribución acumulativa (CDF) teórica y empírica con las fórmulas y realizar la prueba con nivel de confianza del 95%
*   Paso 4: Calcular D+, D- y D


Se presenta el código de la prueba Kolmogorov Smirnov para la muestra 1 dada en clase.

In [1]:
import numpy as np
from tabulate import tabulate
from scipy.stats import kstwobign # librería kstwobign para la distribución K-S

datos = [0.048,0.926,0.368,0.787,0.298,0.591,0.007,0.437,0.594,0.199,0.478,0.551,0.178,0.086,0.157,0.166,0.362,0.411,0.951,0.401,0.932,0.533,0.545,0.772,0.631]
ordenados = np.sort(datos) # ordenamos los datos de menor a mayor

# se calculan los valores de D+ y D-
n = len(ordenados) # tamaño de la muestra
D_mas = [(i+1)/n - ordenados[i] for i in range(n)] # calculamos los D+
D_menos = [ordenados[i] - (i)/n for i in range(n)] # calculamos los D-

resultados = [] # Creamos una lista de listas para almacenar los resultados

# llenamos la lista con los resultados obtenidos
for i in range(n):
    fila = [i+1, ordenados[i], D_mas[i], D_menos[i]]
    resultados.append(fila)

D_max = max(max(D_mas), max(D_menos)) # buscamos D, que es el máximo entre D+ y D-
K = kstwobign.ppf(1-0.05)/np.sqrt(n) # calculamos el valor crítico para un nivel de aceptación del 95%

# acomodamos e imprimimos los resultados en la tabla
encabezados = ["i", "x_i", "D+", "D-"]
print(tabulate(resultados, headers=encabezados, tablefmt="grid"))
print("Máximo entre D+ y D-:", D_max)
print("Valor crítico: ", K)

# Comparamos D con K para determinar si rechazamos o no rechazamos la hipótesis nula
if D_max < K:
    print("\nConclusión: Se acepta la hipótesis nula.")
else:
    print("\nConclusión: Se rechaza la hipótesis nula.")

+-----+-------+--------+--------+
|   i |   x_i |     D+ |     D- |
|   1 | 0.007 |  0.033 |  0.007 |
+-----+-------+--------+--------+
|   2 | 0.048 |  0.032 |  0.008 |
+-----+-------+--------+--------+
|   3 | 0.086 |  0.034 |  0.006 |
+-----+-------+--------+--------+
|   4 | 0.157 |  0.003 |  0.037 |
+-----+-------+--------+--------+
|   5 | 0.166 |  0.034 |  0.006 |
+-----+-------+--------+--------+
|   6 | 0.178 |  0.062 | -0.022 |
+-----+-------+--------+--------+
|   7 | 0.199 |  0.081 | -0.041 |
+-----+-------+--------+--------+
|   8 | 0.298 |  0.022 |  0.018 |
+-----+-------+--------+--------+
|   9 | 0.362 | -0.002 |  0.042 |
+-----+-------+--------+--------+
|  10 | 0.368 |  0.032 |  0.008 |
+-----+-------+--------+--------+
|  11 | 0.401 |  0.039 |  0.001 |
+-----+-------+--------+--------+
|  12 | 0.411 |  0.069 | -0.029 |
+-----+-------+--------+--------+
|  13 | 0.437 |  0.083 | -0.043 |
+-----+-------+--------+--------+
|  14 | 0.478 |  0.082 | -0.042 |
+-----+-------