<a href="https://colab.research.google.com/github/tamaravera14/SIMULACI-N-I/blob/main/PRUEBA_DE_KOLMOGOROV_SMIRNOV.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Prueba de Kolmogorov-Smirnov**
## Bazaldua Vera Tamara Alheli

## Kolmogorov - Smirnov
La **prueba de Kolmogórov-Smirnov**, nos devuelve un indicador para ayudarnos a de decidir si los datos de una determinada muestra se ajustan a una distribución de probabilidad, con las consecuencias que tiene este hecho de cara al análisis de datos.

Esta prueba surge de los aportes realizados por Nikolaevich Kolmogorov y Vladimir Ivanovich Smirnov. La contribución de **Kolmogorov** corresponde al **problema relacionado con una sola muestra**, mientras que la de **Smirnov** se ocupa de **responder al problema** respecto a dos muestras, tratando de **probar la hipótesis** de igualdad entre las poblaciones de origen de una con respecto a la de la otra.



---
**¿Para qué sirve?**


Determina si un conjunto de datos sigue una distribución específica (por ejemplo, normal, exponencial, uniforme, etc.).

Compara si dos muestras provienen de la misma distribución sin necesidad de asumir un tipo específico de distribución.

---
**Proceso:**

1. Ordena de menor a mayor el conjunto de datos.
2. Calcula los valores D+, D- y D:
    *   D+ = max { (i/n) - x_i}
    *   D- = max { x_i - ( (i-1)/n ) }
    *   D = max { D+, D- }
3. Determina el valor crítico d_(alpha,n) en la tabla de valores criticos de K-S para un nivel de significancia (1 - alpha) y un tamaño de la muestra n.

---
##**Si D > d_(aplha,n) se rechaza H0**
---

**Ventajas**

✔ No requiere que la distribución subyacente sea normal.

✔ Funciona para tamaños de muestra pequeños y grandes.

✔ Se puede usar para comparar dos muestras sin necesidad de asumir una distribución específica.

**Desventajas**

✘ Menos potente que otras pruebas (como la prueba de Shapiro-Wilk) cuando la distribución es cercana a la normal.

✘ Más sensible a diferencias en el centro de la distribución que en los extremos.

---

###**Código:**

In [1]:
from tabulate import tabulate
from matplotlib import pyplot as plt
import numpy as np
import scipy.stats as stats

x=[0.048, 0.591, 0.478, 0.166, 0.932,0.926, 0.007, 0.551, 0.362, 0.533,0.368, 0.437, 0.178, 0.411, 0.545,0.787, 0.594, 0.086, 0.951, 0.772,0.298, 0.199, 0.157, 0.401, 0.631]
x.sort()        # Ordena los datos de menor a mayor
n = len(x)      # Calcula la magnitud del vector, es decir, la cantidad de datos
d = []          # Lista que añade los datos para imprimirlos en una tabla
D_mas = []      # Lista que almacena los valores para determinar D+
D_menos = []    # Lista que almacena los valores para determinar D-
alpha = 0.05
resultados = [] #Lista que almacena las conclusiones o el analisis para definir el nivel de rechazo

def valor_critico_ks(alpha, n):
    # Calcula el valor crítico para la prueba de Kolmogorov-Smirnov
    return stats.kstwo.ppf(1 - alpha, n)

for i in range(n):
  i_n=(i+1)/n
  i1n=i/n
  dmas=abs(i_n-x[i])    # Calcula los valores para determinar D+
  dmenos=abs(x[i]-i1n)      # Calcula los valores para determinar D-
  d.append([i+1,x[i],i_n,dmas,dmenos])      #Añade los datos ["i", "Xi", "i/n" ,"|i/n - Xi|", "|Xi - (i-1)/n|"]
  D_mas.append(dmas)            # Añade los datos para determinar D+
  D_menos.append(dmenos)        # Añade los datos para determinar D-

maximo_Dmas = np.max(D_mas)       # Calcula D+
maximo_Dmenos = np.max(D_menos)       # Calcula D-
maximo_final = max(maximo_Dmas, maximo_Dmenos)      # Calcula el maximo valor de D+, D-

def Nivel_de_Aceptacion(valor_critico, maximo_final):
    if valor_critico < maximo_final:              # Evalua el valor critico y el valor estadistico
        print("\n \033[1mRechazar H0\033[1m")
    else:
        print("\n \033[1mNo rechazar H0\033[1m")

valor_critico = valor_critico_ks(alpha, n)      # Calcula el valor critico

resultados.append(["Resultados",maximo_Dmas,maximo_Dmenos,max(maximo_Dmas, maximo_Dmenos),valor_critico])     # Almacena los datos del analisis final

# Mostrar tabla
print("\033[1m''PRUEBA DE KOLMOGOROV SMIRNOV'' \033[1m \n\n ")
encabezados = ["i", "Xi", "i/n" ,"|i/n - Xi|", "|Xi - (i-1)/n|"]
print(tabulate(d, headers=encabezados, tablefmt="grid"))
print("\nAnalisis de datos:\n")
encabezados_1 = ["", "D+", "D-","Max{ D+, D- }","Valor critico","Se rechaza H0"]
print(tabulate(resultados, headers=encabezados_1, tablefmt="grid"))

Nivel_de_Aceptacion(valor_critico, maximo_final)

[1m''PRUEBA DE KOLMOGOROV SMIRNOV'' [1m 

 
+-----+-------+-------+--------------+------------------+
|   i |    Xi |   i/n |   |i/n - Xi| |   |Xi - (i-1)/n| |
|   1 | 0.007 |  0.04 |        0.033 |            0.007 |
+-----+-------+-------+--------------+------------------+
|   2 | 0.048 |  0.08 |        0.032 |            0.008 |
+-----+-------+-------+--------------+------------------+
|   3 | 0.086 |  0.12 |        0.034 |            0.006 |
+-----+-------+-------+--------------+------------------+
|   4 | 0.157 |  0.16 |        0.003 |            0.037 |
+-----+-------+-------+--------------+------------------+
|   5 | 0.166 |  0.2  |        0.034 |            0.006 |
+-----+-------+-------+--------------+------------------+
|   6 | 0.178 |  0.24 |        0.062 |            0.022 |
+-----+-------+-------+--------------+------------------+
|   7 | 0.199 |  0.28 |        0.081 |            0.041 |
+-----+-------+-------+--------------+------------------+
|   8 | 0.298 |  0.32 |   