# Ejercicio 5

## Prueba de Kolmogorov-Smirnov (K-S)

La **Prueba de K-S** es una prueba **no paramétrica** que compara una muestra de datos con una distribución de referencia (en este caso, la distribución uniforme).  

### **¿Cómo funciona?**  
La prueba calcula la estadística **D**, que mide la **máxima diferencia** entre:  
- La **función de distribución acumulada (CDF)** de la muestra.  
- La **CDF de la distribución de referencia**.  

Además, proporciona un **p-valor**, que indica si la muestra sigue la distribución de referencia.

### **Interpretación del p-valor:**

- **Si \( p > 0.05 \)**:  
  No hay evidencia suficiente para rechazar la hipótesis de que la muestra sigue la distribución de referencia.  
  *Esto sugiere que los datos podrían ajustarse bien a la distribución uniforme.*

- **Si \( p \leq 0.05 \)**:  
  Se rechaza la hipótesis de que la muestra sigue la distribución de referencia.  
  *Esto indica que los datos no se ajustan a la distribución uniforme.*  


In [91]:
import numpy as np
from scipy.stats import kstest, norm

# Generar 250 números con distribución normal
np.random.seed(42)  # Para reproducibilidad
datos_normales = np.random.normal(loc=0, scale=1, size=250)

# Definir los tamaños de los subconjuntos
tamanos_subconjuntos = [50, 100, 150, 200, 250]

# Aplicar la Prueba de K-S a cada subconjunto
for tamano in tamanos_subconjuntos:
    subconjunto = datos_normales[:tamano]
    estadistico_D, p_valor = kstest(subconjunto, 'uniform', args=(0, 1))  # Comparar con uniforme en [0, 1]
    print(f"Subconjunto de {tamano} datos:")
    print(f"  Estadístico D: {estadistico_D}")
    print(f"  p-valor: {p_valor}")
    if p_valor > 0.05:
        print("  No hay evidencia suficiente para rechazar que el subconjunto sigue una distribución uniforme.")
    else:
        print("  El subconjunto NO sigue una distribución uniforme.")
    print("-" * 50)

Subconjunto de 50 datos:
  Estadístico D: 0.6
  p-valor: 9.634070456142374e-18
  El subconjunto NO sigue una distribución uniforme.
--------------------------------------------------
Subconjunto de 100 datos:
  Estadístico D: 0.5448865433575392
  p-valor: 2.3126071208647338e-28
  El subconjunto NO sigue una distribución uniforme.
--------------------------------------------------
Subconjunto de 150 datos:
  Estadístico D: 0.5282198766908724
  p-valor: 1.485139097411313e-39
  El subconjunto NO sigue una distribución uniforme.
--------------------------------------------------
Subconjunto de 200 datos:
  Estadístico D: 0.5
  p-valor: 9.256385411205685e-47
  El subconjunto NO sigue una distribución uniforme.
--------------------------------------------------
Subconjunto de 250 datos:
  Estadístico D: 0.484
  p-valor: 1.943987931821234e-54
  El subconjunto NO sigue una distribución uniforme.
--------------------------------------------------


## Explicación del Código

### **Generación de datos:**
- Se generan **250 números** con distribución normal usando `np.random.normal`.
- La **media (`loc`)** es **0** y la **desviación estándar (`scale`)** es **1**.

### **Subconjuntos:**
- Se definen subconjuntos con los **primeros**:  
  - **50**, **100**, **150**, **200** y **250** datos.

### **Prueba de Kolmogorov-Smirnov (K-S):**
- Para cada subconjunto, se aplica la **prueba de K-S** usando `kstest`.
- La prueba compara el subconjunto con una distribución uniforme en el intervalo **[0,1]**.
- Se imprimen:
  - El **estadístico D** (máxima diferencia entre las CDFs).
  - El **p-valor**.

### **Interpretación del p-valor:**
- **Si \( p > 0.05 \)**:  
  No hay evidencia suficiente para rechazar que el subconjunto sigue una distribución uniforme.  
  *Esto sugiere que los datos podrían ajustarse a la distribución uniforme.*

- **Si \( p < 0.05 \)**:  
  Se rechaza la hipótesis de que el subconjunto sigue una distribución uniforme.  
  *Esto indica que los datos no se ajustan a la distribución uniforme.*  
