<a href="https://colab.research.google.com/github/jose-luis-hernandez-amaya/Simulaci-n-1/blob/main/Prueba_de_Kolmogorov.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Prueba de Kolmogorov-Smirnov

La prueba de Kolmogorov-Smirnov se utiliza para comparar una muestra con una distribución de referencia contra una distribución esperada.
Y se ordenan de forma ascendente.

Las hipotesis son:

$$H_0 : X_n ∼ U(0,1) \\ H_1 : X_n \nsim U(0,1)$$

El estadistico de prueba es:

$$D^+ = max_{1<i<n}|\frac{1}{n} - x_i| \\ D^- = max_{1<i<n}|x_i - \frac{i-1}{n}| \\ D = max(D^+, D^-)$$

donde i es la posición de $x_i$

In [6]:
import numpy as np
import scipy.stats as st
import pandas as pd

In [7]:
def prueba_ks_manual(datos, alfa=0.05):
    n = len(datos)

    x = np.sort(datos) #Ordernar los números de forma ascendente

    i = np.arange(1, n + 1)  # Creamos un arreglo con las posiciones 'i' (desde 1 hasta n)

    D_plus_array = np.abs((i / n) - x)  #D+ = max | i/n - xi |
    D_plus = np.max(D_plus_array)

    D_minus_array = np.abs(x - ((i - 1) / n))  #D- = max | xi - (i-1)/n |
    D_minus = np.max(D_minus_array)

    D = max(D_plus, D_minus)  # Calculamos D

    d_critico = st.kstwo.ppf(1 - alfa, n)  # Usamos la distribución Kolmogorov-Smirnov de scipy para obtener el valor exacto de las tablas.

    print(f"Estadístico D+ calculado: {D_plus:.4f}")
    print(f"Estadístico D- calculado: {D_minus:.4f}")
    print(f"Estadístico D (Máximo):   {D:.4f}")
    print(f"Valor crítico d_({alfa},{n}): {d_critico:.4f}\n")

    #Si D < d_alpha,n no se rechaza H0
    if D < d_critico:
        print("Conclusión: D < d_critico.")
        print("NO se rechaza H_0. La muestra se ajusta a una U(0,1).")
    else:
        print("Conclusión: D >= d_critico.")
        print("SE RECHAZA H_0. La muestra NO se ajusta a una U(0,1).")

    tabla = pd.DataFrame({
        "i": i[:10],
        "x_i": x[:10],
        "|i/n - x_i|": D_plus_array[:10],
        "|x_i - (i-1)/n|": D_minus_array[:10]
    })
    print("\nVista previa de los primeros 10 cálculos")
    print(tabla.to_string(index=False))

In [8]:
np.random.seed(42)  # Numeros de prueba

data = [
0.78961, 0.05230, 0.10699, 0.55877, 0.14151,
0.76086, 0.12079, 0.27738, 0.65726, 0.79269,
0.80548, 0.82654, 0.29453, 0.20852, 0.42989,
0.58518, 0.98611, 0.34488, 0.34358, 0.11537,
0.89898, 0.57880, 0.67621, 0.05010, 0.00121,
0.28269, 0.73059, 0.70119, 0.18284, 0.49962,
0.38618, 0.76910, 0.68334, 0.55170, 0.10850,
0.79882, 0.45679, 0.21631, 0.87616, 0.55743,
0.58962, 0.33216, 0.03185, 0.61168, 0.09264,
0.69623, 0.17028, 0.05475, 0.91512, 0.76262,
0.29931, 0.30861, 0.83358, 0.51781, 0.03272,
0.57410, 0.26593, 0.85903, 0.43308, 0.35286,
0.24000, 0.65559, 0.38507, 0.90829, 0.94187,
0.93655, 0.88809, 0.81772, 0.36982, 0.19904,
0.54325, 0.62400, 0.09133, 0.41678, 0.33954,
0.58244, 0.85853, 0.86752, 0.38729, 0.15506,
0.23949, 0.53559, 0.33381, 0.49883, 0.75103,
0.19962, 0.65002, 0.74579, 0.79113, 0.63453,
0.19147, 0.40644, 0.08128, 0.73435, 0.22724,
0.22287, 0.07281, 0.64183, 0.44267, 0.72102
]

In [9]:
prueba_ks_manual(data, alfa=0.05)

Estadístico D+ calculado: 0.0564
Estadístico D- calculado: 0.0464
Estadístico D (Máximo):   0.0564
Valor crítico d_(0.05,100): 0.1340

Conclusión: D < d_critico.
NO se rechaza H_0. La muestra se ajusta a una U(0,1).

Vista previa de los primeros 10 cálculos
 i     x_i  |i/n - x_i|  |x_i - (i-1)/n|
 1 0.00121      0.00879          0.00121
 2 0.03185      0.01185          0.02185
 3 0.03272      0.00272          0.01272
 4 0.05010      0.01010          0.02010
 5 0.05230      0.00230          0.01230
 6 0.05475      0.00525          0.00475
 7 0.07281      0.00281          0.01281
 8 0.08128      0.00128          0.01128
 9 0.09133      0.00133          0.01133
10 0.09264      0.00736          0.00264
