<a href="https://colab.research.google.com/github/KatiaItzelCortes/EDP/blob/main/Prueba_Kolmogorov_Smirnov.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Prueba Kolmogorov-Smirnov

La prueba de Kolmogorov-Smirnov (K-S) es una prueba no paramétrica utilizada para determinar si una muestra proviene de una población con una distribución específica. En este caso, buscamos verificar si nuestros 100 datos siguen una Distribución Uniforme en el intervalo $[0, 1]$.

$H_0$: Los datos siguen una distribución uniforme $U(0,1)$.

$H_1$: Los datos no siguen una distribución uniforme.


Procedimiento

Ordenar los datos de menor a mayor: $x_{(1)} \leq x_{(2)} \leq \dots \leq x_{(n)}$.

Calcular el estadístico de diferencia superior: $D^+ = \max \left\{ \frac{i}{n} - x_{(i)} \right\}$.

Calcular el estadístico de diferencia inferior: $D^- = \max \left\{ x_{(i)} - \frac{i-1}{n} \right\}$.

Determinar el estadístico de prueba: $D = \max(D^+, D^-)$.

Comparar $D$ con el valor crítico $D_{\alpha, n}$ obtenido de las tablas de Kolmogorov-Smirnov.

In [2]:
import numpy as np
import scipy.stats as st

In [3]:
data = [
    0.78961, 0.05230, 0.10699, 0.55877, 0.14151, 0.76086, 0.12079, 0.27738, 0.65726, 0.79269,
    0.80548, 0.82654, 0.29453, 0.20852, 0.42989, 0.58518, 0.98611, 0.34488, 0.34358, 0.11537,
    0.89898, 0.57880, 0.67621, 0.05010, 0.00121, 0.28269, 0.73059, 0.70119, 0.18284, 0.49962,
    0.38618, 0.76910, 0.68334, 0.55170, 0.10850, 0.79882, 0.45679, 0.21631, 0.87616, 0.55743,
    0.58962, 0.33216, 0.03185, 0.61168, 0.09264, 0.69623, 0.17028, 0.05475, 0.91512, 0.76262,
    0.29931, 0.30861, 0.83358, 0.51781, 0.03272, 0.57410, 0.26593, 0.85903, 0.43308, 0.35286,
    0.24000, 0.65559, 0.38507, 0.90829, 0.94187, 0.93655, 0.88809, 0.81772, 0.36982, 0.19904,
    0.54325, 0.62400, 0.09133, 0.41678, 0.33954, 0.58244, 0.85853, 0.86752, 0.38729, 0.15506,
    0.23949, 0.53559, 0.33381, 0.49883, 0.75103, 0.19962, 0.65002, 0.74579, 0.79113, 0.63453,
    0.19147, 0.40644, 0.08128, 0.73435, 0.22724, 0.22287, 0.07281, 0.64183, 0.44267, 0.72102
]

In [6]:
def prueba_ks_tabla(data, alfa):
    data_sorted = np.sort(data)
    n = len(data)
    i = np.arange(1, n + 1)

    i_n = i / n
    i_1_n = (i - 1) / n
    d_mas_vec = i_n - data_sorted
    d_menos_vec = data_sorted - i_1_n

    print(f"{'i':<4} | {'x_i':<8} | {'(i-1)/n':<8} | {'i/n':<8} | {'D^-':<8} | {'D^+':<8}")
    print("-" * 60)

    for idx in range(n):
        print(f"{i[idx]:<4} | {data_sorted[idx]:.5f} | {i_1_n[idx]:.5f} | {i_n[idx]:.5f} | {d_menos_vec[idx]:.5f} | {d_mas_vec[idx]:.5f}")

    d_mas = np.max(d_mas_vec)
    d_menos = np.max(d_menos_vec)
    d_calc = max(d_mas, d_menos)
    d_critico = st.ksone.ppf(1 - alfa/2, n)

    print("-" * 60)
    print(f"\nResultados Finales:")
    print(f"D+ máximo: {d_mas:.5f}")
    print(f"D- máximo: {d_menos:.5f}")
    print(f"D calculado: {d_calc:.5f}")
    print(f"D crítico: {d_critico:.5f}")

    if d_calc < d_critico:
        print("No se rechaza H_0: Los datos son uniformes")
    else:
        print("Se rechaza H_0: Los datos NO son uniformes")

In [7]:
prueba_ks_tabla(data, 0.05)

i    | x_i      | (i-1)/n  | i/n      | D^-      | D^+     
------------------------------------------------------------
1    | 0.00121 | 0.00000 | 0.01000 | 0.00121 | 0.00879
2    | 0.03185 | 0.01000 | 0.02000 | 0.02185 | -0.01185
3    | 0.03272 | 0.02000 | 0.03000 | 0.01272 | -0.00272
4    | 0.05010 | 0.03000 | 0.04000 | 0.02010 | -0.01010
5    | 0.05230 | 0.04000 | 0.05000 | 0.01230 | -0.00230
6    | 0.05475 | 0.05000 | 0.06000 | 0.00475 | 0.00525
7    | 0.07281 | 0.06000 | 0.07000 | 0.01281 | -0.00281
8    | 0.08128 | 0.07000 | 0.08000 | 0.01128 | -0.00128
9    | 0.09133 | 0.08000 | 0.09000 | 0.01133 | -0.00133
10   | 0.09264 | 0.09000 | 0.10000 | 0.00264 | 0.00736
11   | 0.10699 | 0.10000 | 0.11000 | 0.00699 | 0.00301
12   | 0.10850 | 0.11000 | 0.12000 | -0.00150 | 0.01150
13   | 0.11537 | 0.12000 | 0.13000 | -0.00463 | 0.01463
14   | 0.12079 | 0.13000 | 0.14000 | -0.00921 | 0.01921
15   | 0.14151 | 0.14000 | 0.15000 | 0.00151 | 0.00849
16   | 0.15506 | 0.15000 | 0.16000 | 0.00506