## ¿Mejoró tu nueva rutina tu velocidad corriendo?
Es el quinto día del proyecto. Hoy es sábado. Vamos a cambiar un poco las cosas. Mientras corría por la mañana, decidí que mi proyecto de hoy involucraría algo de _running_ y algunos conceptos fundamentales de pruebas estadísticas. Hoy vamos a determinar si las diferencias entre dos grupos de datos son pura coincidencia o no; hoy vamos a determinar si una nueva rutina de entrenamiento de velocidad de verdad te está dando resultados. 

Imagina que has estado corriendo y has medido tu velocidad promedio en cada carrera. Si corres, sabes que los _runners_ medimos la velocidad en minutos por kilómetro. Por ejemplo, si has corrido 10 kilómetros en 60 minutos eso sería una velocidad promedio de seis minutos por kilómetro. Se escribiría así: 6´00´´/KM. Si has corrido esos 10 kilómetros en 45 minutos, tu velocidad promedio fue de 4´30´´/KM (cuatro minutos y medio por kilómetro).

Vamos a comparar a nivel estadístico los resultados de tus carreras anteriores al nuevo programa (un programa carísimo que vende el nuevo _influencer_ de moda) con los resultados de las carreras posteriores al programa. ¿Cómo? Usaremos algo llamado __la prueba _t___, que es un tipo de prueba estadística paramétrica que se utiliza cuando queremos comparar medias de uno o dos grupos, sobre todo cuando el tamaño de la muestra es pequeño y no conocemos la desviación estándar de la población. Usamos la prueba _t_ en estos casos porque se basa en la distribución _t_ de Student, que tiene en cuenta la variabilidad adicional en muestras pequeñas.

## Importación de las librerías que usaremos
Como siempre, `pandas` para manejo de datos. `SciPy` nos da las herramientas estadísticas necesarias.

In [1]:
# Here we go again.
import pandas as pd
from scipy import stats

## Creación de los datos
Como te decía en la introducción, supón que registraste tu velocidad promedio en min/km en todas tus carreras. La distancia de tus carreras a sido de 5 kilómetros. Corres 3 veces por semana y tienes los datos de cuatro meses. Dos meses antes del entrenamiento y dos meses después del entrenamiento. Eso nos da dos bloques de datos, cada uno de 12 carreras. Eso es 24 carreras en total. Vamos a agrupar la información en listas. Estará expresada en minutos decimales.

In [2]:
# Tus velocidades promedio antes del programa (12 registros).
antes = pd.Series([6.0, 6.2, 6.3, 6.1, 6.4, 6.0, 6.3, 6.5, 6.2, 6.4, 6.1, 6.3])

# Tus velocidades promedio después del programa (12 registros).
despues = pd.Series([5.8, 5.9, 6.0, 5.7, 5.8, 5.9, 6.0, 5.9, 5.8, 5.9, 5.7, 5.8])


## Planteamiento y teoría básica
Vamos a poner a prueba la idea de que el nuevo programa que estás haciendo no ha dado frutos. ¿Cómo podemos expresar esto de manera más analítica? A través de formularlo como hipótesis. Haremos uso de una hipótesis nula y una alternativa.

- Hipótesis nula: Tu tiempo promedio es igual antes y después del nuevo programa.

- Hipótesis alternativa: El tiempo bajó tras la nueva rutina, es decir, corriste más rápido.

En este caso la prueba _t_ nos permite comparar si dos medias (tiempos antes y después) son estadísticamente diferentes, tomando en cuenta la variabilidad y el tamaño de la muestra. Es decir, nos dirá si es poco probable que la diferencia que hay entre los registros se deba a una simple casualidad. Y si es poco probable que se deba a una casualidad, entonces es más probable que el programa haya funcionado.

## Aplicación de la prueba _t_

Vamos a aplicar la prueba _t_. Se puede usar para dos muestras independientes como las que tenemos. Como umbral de significación para pruebas como éstas se usa 0.5 (5%) generalmente. Aunque si se tratara de una prueba donde se necesita más precisión, como determinar que un nuevo medicamento no es dañino para la salud, podría disminuir hasta 0.01 (1%). Pero esto es _running_; no tiene caso ser tan precisos ni quisquillosos.

In [3]:
# Nuestro nivel se significación será el estándar para pruebas como ésta.
alpha = 0.05

# Prueba t para dos muestras independientes.
result = stats.ttest_ind(antes, despues, equal_var=False)

print("valor p:", result.pvalue)

if result.pvalue < alpha and despues.mean() < antes.mean():
    print("Rechazamos la hipótesis nula: la rutina mejoró significativamente la velocidad promedio.")
else:
    print("No podemos rechazar la hipótesis nula: no hay mejora significativa.")

print("Media antes:", antes.mean())
print("Media después:", despues.mean())


valor p: 1.410657230121452e-06
Rechazamos la hipótesis nula: la rutina mejoró significativamente la velocidad promedio.
Media antes: 6.233333333333333
Media después: 5.849999999999999


## Conclusión
Podemos rechazar la hipótesis nula. No has sido estafado. Al parecer el programa del _influencer_ ha dado frutos. 


Gracias a pruebas estadísticas como éstas podemos determinar si cambios en una página web generan más clicks, mayor tiempo de navegación o una mejor conversión, entre otras cosas. En este caso en particular uno podría ver la media antes (6.2) y la media después (5.8) y pensar: 'Bueno, es menor, ¿seguro funcionó, verdad?' Pero, ¿qué tan preciso podría ser eso, no? Con pruebas estadística como la prueba _t_ añadimos precisión y fundamento a nuestras conclusiones.