# Pruebas de corridas

Son pruebas estadísticas no paramétricas para verificar la aleatoriedad de datos. Utiliza series de datos para decidir si son aleatorios o no.

Una **corrida** se define como una serie de eventos similares. El número de tales eventos es la duración de la corrida.

#### Ejemplo: 

En un volado,
    
$$a, s, s, a, a, a, s, a ,s, s$$

¿Cuántas corridas hay?

#### Ejemplo: 

In [None]:
l = [1, 3, 9, 8, 0, 4, 6, 5, 2, 7]

In [None]:
m = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Hay varias formas de definir corridas, sin embargo, en todos los casos la formulación debe producir una secuencia dicotómica de valores. En nuestro caso, los valores por encima de la mediana se tratan como positivos y los valores por debajo de la mediana como negativos. Una corrida se define como una serie de valores consecutivos positivos o negativos.

El primer paso en la prueba de corridas es contar el número de corridas en la secuencia de datos.

Formulamos entonces la hipótesis nula y alternativa:

$H_0:$ La secuencia se produjo de forma aleatoria.

$H_1:$ La secuencia no se produjo de forma aleatoria.

Usamos el estadistico $Z$ como prueba:

$$Z = \frac{R - \bar{R}}{S_{R}}$$

donde $R$ es el número de corridas observadas, $\bar{R}$, definido como:

$$\bar{R}=\frac{2n_1 n_2}{n_1 + n_2} + 1$$

es el número de corridas esperadas. Y la desviación estándar del número de corridas es:

$$S_R^2 = \frac{2n_1 n_2 (2n_1 n_2 - n_1 - n_2)}{(n_1+n_2)^2 (n_1 + n_2 - 1)}$$

Y $n_1$ y $n_2$ son los números de valores positivos y negativos de la serie.

Entonces comparamos el valor del estadístico $Z$ calculado con el $Z_{crítico}$  para un nivel de confianza dado ($Z_{crítico} = 1.96$ para un nivel de confianza del 95%). La hipótesis nula se rechaza, es decir, se declara que los números no son aleatorios si $| Z |> Z_{crítico}$.

#### Para hacer un programa que haga la prueba de corridas

In [None]:
import random 
import math 
from statistics import mean, median

In [None]:
l= [946,1058,1133,869,927,742,1113,665,955,1288,1074,838,815,910,1193,
    1386,955,1187,891,1302,867,837,1138,868,969,737,1143,947,763,1029]

In [None]:
# Esta funcion implementa una prueba de corridas
def prueba_corridas(l):
    
    l_median = mean(l)  # Hacemos la prueba respecto a la media/mediana
    
    R, n1, n2 = 1, 0, 0   # iniciamos los contadores
        
    for i in range(len(l)):    
        
        # Aumentamos R cuando 2 entradas están una arriba y otra abajo de la media/mediana:
        if (l[i] >= l_median and l[i-1] < l_median) or (l[i] < l_median and l[i-1] >= l_median):
            R += 1
        # Contamos las que están arriba y las que están abajo
        if(l[i]) >= l_median:
            n1 += 1
        else:
            n2 += 1   
    # calculamos los parámetros y el estadistico
    R_exp = ((2*n1*n2)/(n1+n2))+1
    stan_dev = math.sqrt((2*n1*n2*(2*n1*n2-n1-n2))/(((n1+n2)**2)*(n1+n2-1))) 
  
    z = (R - R_exp)/stan_dev 
  
    return R, n1, n2, R_exp, z, stan_dev 

In [None]:
R = prueba_corridas(l)[0]
n1 = prueba_corridas(l)[1]
n2 = prueba_corridas(l)[2]
R_exp = abs(prueba_corridas(l)[3])
Z = abs(prueba_corridas(l)[4]) 
stan_dev = abs(prueba_corridas(l)[5])

print('Estadistico = ', Z)
print('  R = ', R, '  R_exp = ', R_exp, '\n n1 = ', n1, '\n n2 = ', n2, '\nVarianza = ', stan_dev**2)

### Ejercicio:

* Completar la función para que imprima todas las salidas de interés.
* Desordenar la lista y volver a aplicar la prueba de corridas. Comparar el resultado.
* Repetir el ejercicio con la lista l_1

In [None]:
l_1 = [0.809, 0.042,  0.432,  0.538,  0.225,  0.88,  0.688,  0.772,  0.036,  0.854, 0.397,  0.268,  0.821,  0.897,  
     0.07,  0.721,  0.087,  0.35,  0.779,  0.482, 0.136,  0.855,  0.453,  0.197,  0.444,  0.799,  0.809,  0.691,  
     0.545,  0.857, 0.692,  0.055,  0.348, 0.373,  0.436,  0.29,  0.015,  0.834,  0.599,  0.724,  0.564,  0.709,  
     0.946,  0.754,  0.677,  0.128,  0.012,  0.498,  0.6,  0.913]