Cubriremos las pruebas de hipótesis para los promedios de  grupos y veremos cómo implementar cada una de estas pruebas en Python:

* Comparación de un grupo con un valor fijo.
* Comparación de dos grupos entre sí.
* Comparación de tres o más grupos entre sí.

En cada caso distinguimos entre dos casos. Si los datos tienen una distribución aproximadamente normal, se pueden utilizar las denominadas pruebas paramétricas. Estas pruebas son más sensibles que las pruebas no paramétricas, pero requieren que se cumplan ciertos supuestos. Si los datos no se distribuyen normalmente, o si solo están disponibles en forma clasificada, se deben utilizar las pruebas no paramétricas correspondientes.

# Distribución de una media muestral

## Prueba t de una muestra para un valor medio

Para comparar el valor medio de los datos distribuidos normalmente con un valor de referencia, normalmente usamos la prueba t de una muestra, que se basa en la distribución t.

Si conociéramos la media y la desviación estándar de una población distribuida normalmente, podríamos calcular el error estándar correspondiente y usar valores de la distribución normal para determinar la probabilidad de encontrar un cierto valor.

Sin embargo, en la práctica tenemos que estimar la media y la desviación estándar de la muestra; y la distribución t, que caracteriza la distribución de medias muestrales para datos distribuidos normalmente, se desvía ligeramente de la distribución normal.

##### a) Ejemplo

Como ejemplo, tomamos 100 datos distribuidos normalmente, con una media de 7 y una desviación estándar de 3. 

`¿Cuál es la probabilidad de encontrar un valor medio a una distancia de 0.5 o más de la media poblacional?`

* Tenemos una población, con un valor medio de 7 y una desviación estándar de 3.
* De esa población, un observador toma 100 muestras aleatorias. La media muestral es 7.10, cercana pero diferente de la media real. La desviación estándar muestral es 3.12 y el error estándar de la media es 0.312. Esto da una idea sobre la variabilidad de la población.
* Se sabe que la distribución de la media muestral sigue una distribución t, y que el error estándar de la media (SEM) caracteriza el ancho de esa distribución.
* ¿Qué tan probable es que la media real tenga un valor de $x_0$ (por ejemplo, 6.5)? Para averiguarlo, el valor debe transformarse restando la media muestral y dividiendo por el error estándar. Esto proporciona el estadístico t para esta prueba (1,93).

In [55]:
from scipy import stats
import numpy as np
import matplotlib.pyplot as plt
%matplotlib notebook
plt.style.use("seaborn")
normal = stats.norm(7, 3)
xn = normal.rvs(1000)
xn = np.sort(xn)
yn = normal.pdf(xn)

In [8]:
tsd = stats.t(99)
xt = tsd.rvs(1000)
xt = np.sort(xt)
yt = tsd.pdf(xt)

In [40]:
fig, ax = plt.subplots(1, 2, figsize=(10, 5))
ax[0].plot(xn, yn)
ax[0].scatter(7, 0, marker = "^", c='r')
ax[0].scatter(7.10, 0, marker = "^", c='y')

ax[1].plot(xt, yt)
ax[1].scatter(0, 0, marker = "^", c='r')
ax[1].scatter((7.10-7)/(0.312), 0, marker = "^", c='y')

<IPython.core.display.Javascript object>

<matplotlib.collections.PathCollection at 0x21118fa3b80>

In [49]:
2*tsd.cdf((6.5-7.10)/0.312)

0.057343807718370804

* El valor p correspondiente, que nos dice qué tan probable es que la media real tenga un valor de 6.5 o más extremo en relación con la media muestral: $2*CDF(t-statistic) = 0.057$, lo que significa que la diferencia con 6.5 simplemente no es significativa. El factor "2" proviene del hecho de que tenemos que verificar ambas colas, por lo que esta prueba se denomina prueba t de dos colas.
* La probabilidad de encontrar un valor de 6.5 o menos es la mitad p = 0.0285. Dado que en este caso solo miramos en una cola de la distribución, esto se llama prueba t de una cola.