<a href="https://colab.research.google.com/github/LuisManuelCatzoliSoriano/Simulacion-I/blob/main/Pruebaderachas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Prueba de las rachas

Proponemos:
$$H_0: x_n\sim U(0,1)$$

y

$$H_a: x_n\not\sim U(0,1)$$

Como prueba para saber si un conjunto de datos proviene de la distribución $U(0,1)$.

Dada una muestra $x_n$ de prueba, los pasos a seguir para realizarla:

Paso 1:

Determine la secuencia $S$ de $0$ y $1$ así:

Si $x_i\leq x_{i-1}$ escribir $0$.

Si $x_i>x_{i-1}$ escribir $1$.

La secuencia $S$ contiene $n-1$ números.

Paso 2:

Calcular el número de rachas observadas de $C_0$:

Una racha viene dada por el número de ceros o unos consecutivos que la forman.

Paso 3:

Calcular el valor esperado y la varianza del número de rachas, así como el estadístico $Z_0$ mediante:

$$\mu_{C_0}=\frac{2n-1}{3}, \sigma^2_{C_0}=\frac{16n-29}{90}, Z_0=\frac{C_o-\mu_{C_0}}{\sigma_{C_0}}$$

Dado que $C_0$ sigue una distribución normal de media $\mu_{C_0}$ y varianza $\sigma^2_{C_0}$, y $Z_0$ una distribución normal $(0,1)$. El intervalo de aceptación es:

$$-Z_{\frac{\alpha}{2}}\leq Z_0\leq Z_{\frac{\alpha}{2}}$$

In [1]:
import numpy as np
import scipy.stats as stats
import pandas as pd
import requests
import ast

In [40]:
url = "https://raw.githubusercontent.com/LuisManuelCatzoliSoriano/Simulacion-I/refs/heads/main/data.txt"

response = requests.get(url) #Descarga el contenido del link
contenido = response.text #Transforma el contenido en un texto

lista = ast.literal_eval(contenido) #Transforma un texto en una lista

df = pd.DataFrame(lista, columns=["datos"]) #Crea un DataFrame a partir de la lista de números
df.head() #Muestra las primeras filas del DataFrame

Unnamed: 0,datos
0,0.78961
1,0.0523
2,0.10699
3,0.55877
4,0.14151


In [6]:
def pdr(data, alpha):
    n = len(data)

    # Paso 1: Determinar la secuencia S de 0 y 1
    S = []
    for i in range(1, n):
        if data[i] <= data[i-1]:
            S.append(0)
        else:
            S.append(1)

    print(f"Secuencia S (primeros 20 elementos): {S[:20]}...")
    print(f"Longitud de la secuencia S: {len(S)}")

    # Paso 2: Calcular el número de rachas observadas C_0
    C_0 = 1  # Inicializamos con 1 racha para el primer elemento
    for i in range(1, len(S)):
        if S[i] != S[i-1]:
            C_0 += 1

    # Paso 3: Calcular el valor esperado, la varianza y el estadístico Z_0
    mu_C0 = (2 * n - 1) / 3
    sigma2_C0 = (16 * n - 29) / 90

    # Asegurarse de que la varianza no sea negativa para la raíz cuadrada
    if sigma2_C0 < 0:
        print("Advertencia: La varianza calculada es negativa. Revise los datos o la fórmula.")
        sigma2_C0 = 0 # O manejar el error de otra forma

    sigma_C0 = np.sqrt(sigma2_C0)

    # Evitar división por cero si sigma_C0 es cero
    if sigma_C0 == 0:
        Z_0 = 0 # O manejar el error de otra forma, por ejemplo, levantando una excepción
        print("Advertencia: La desviación estándar es cero, lo que impide calcular Z_0. Asignando Z_0 = 0.")
    else:
        Z_0 = (C_0 - mu_C0) / sigma_C0

    # Calcular el valor crítico Z_{alpha/2} para un nivel de significancia dado
    Z_alpha_2 = stats.norm.ppf(1 - alpha / 2)

    print(f"Número de rachas observadas (C_0): {C_0}")
    print(f"Valor esperado de rachas (mu_C0): {mu_C0:.2f}")
    print(f"Varianza de rachas (sigma2_C0): {sigma2_C0:.2f}")
    print(f"Estadístico Z_0: {Z_0:.2f}")
    print(f"Valor crítico Z_{{alpha/2}}: ±{Z_alpha_2:.2f}")

    if -Z_alpha_2 <= Z_0 <= Z_alpha_2:
        print("No se rechaza la hipótesis nula. La muestra podría provenir de una distribución U(0,1).")
    else:
        print("Se rechaza la hipótesis nula. La muestra NO proviene de una distribución U(0,1).")

In [39]:
alpha_level = 0.05
pdr(df['datos'].tolist(), alpha_level)

Secuencia S (primeros 20 elementos): [0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1]...
Longitud de la secuencia S: 99
Número de rachas observadas (C_0): 60
Valor esperado de rachas (mu_C0): 66.33
Varianza de rachas (sigma2_C0): 17.46
Estadístico Z_0: -1.52
Valor crítico Z_{alpha/2}: ±1.96
No se rechaza la hipótesis nula. La muestra podría provenir de una distribución U(0,1).
