# Pruebas t

Vamos a estudiar dos casos:
* Prueba t emparejada
* Prueba t no emparejada

## Prueba t emparejada

También es conocida como la prueba-$t$ de muestras dependientes. Se usa para determinar si la diferencia de las medias entre dos conjuntos de observaciones es cero. En este caso las observaciones se "miden" a través de un remuestreo (vamos a suponer que se realiza dos veces).




### Pruebas de hipótesis.

1. La $\color{red}{Hipótesis \ nula}$ asume que la diferencia de las medias verdaderas de los grupos emparejados es cero.

2. La $\color{blue}{Hipótesis \ alternativa}$ asume que la diferencia de las medias verdaderas de los grupos emparejados es distinto de cero.

La representación matemática es la siguiente:
* $H_0 : \mu_d =0$

* $H_A: \mu_d \neq 0$

#### Suposiciones:

a. La variable dependiente debe ser continua.

b. Las observaciones son independientes una de la otra.

c. La variable dependiente debe ser aproximadamente normalmente distribuída.

d. La variable dependiente debe ser libre de outliers.

### Procedimiento para realizar la prueba-t emparejada:

Sea $D$ la diferencia entre las dos muestras y sea $d_i$ la $i$-ésima observación en $D$. Sea $n$ el tamaño de la muestra. Definimos
$$\bar{d}=\frac{d_1 +\cdots + d_n}{n}.$$

La variable $\hat{\sigma}$ es la desviación estándar de las diferencias.

$T$ es el valor crítico de una distribución $t$ con $(n-1)$-grados de libertad.

$t$ es el estadístico $t$ para la muestra emparejada.



In [None]:
!pip install pingouin

Collecting pingouin
  Downloading pingouin-0.5.4-py2.py3-none-any.whl (198 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/198.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m [32m194.6/198.9 kB[0m [31m5.9 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m198.9/198.9 kB[0m [31m4.9 MB/s[0m eta [36m0:00:00[0m
Collecting pandas-flavor (from pingouin)
  Downloading pandas_flavor-0.6.0-py3-none-any.whl (7.2 kB)
Installing collected packages: pandas-flavor, pingouin
Successfully installed pandas-flavor-0.6.0 pingouin-0.5.4


Vamos a ver un ejemplo con datos sintéticos.

In [None]:
import numpy as np

In [None]:
np.random.seed(1)

# Creamos datos sintéticos

pre = np.random.randint(80, 96, 15)
post = np.random.randint(80, 91, 15)

Ahora, usamos el método **.ttest_rel()** en *scipy.stats* para obtener una prueba $t$-test emparejado.

In [None]:
import scipy.stats as st

In [None]:
st.ttest_rel(pre, post)

TtestResult(statistic=1.8371173070873836, pvalue=0.08750991125997247, df=14)

Vamos a comparar con **pingouin**

In [None]:
from pingouin import ttest

In [None]:
ttest(pre, post, paired=True)

Unnamed: 0,T,dof,alternative,p-val,CI95%,cohen-d,BF10,power
T-test,1.837117,14,two-sided,0.08751,"[-0.5, 6.5]",0.721668,1.006,0.738783
