# Esta seção lista os testes estatísticos que você pode usar para comparar amostras de dados.

## 1 - Teste de Student 
Teste t pode ser conduzido para:
- Comparar uma amostra com uma população
- Comparar duas amostras pareadas
- Comparar duas amostras independentes

Testa se as médias de duas amostras independentes são significativamente diferentes.

Premissas

- As observações em cada amostra são independentes e identicamente distribuídas (iid).
- As observações em cada amostra são normalmente distribuídas.
- As observações em cada amostra têm a mesma variação.

Interpretação

- H0: as médias das amostras são iguais.
- H1: os meios das amostras são desiguais.


In [1]:
# Example of the Student's t-test
from scipy.stats import ttest_ind
data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = ttest_ind(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))
if p > 0.05:
    print('Probably the same distribution')
else:
    print('Probably different distributions')

stat=-0.326, p=0.748
Probably the same distribution


## 2 - Teste t de Student emparelhado

Testa se as médias de duas amostras emparelhadas são significativamente diferentes.

Premissas

- As observações em cada amostra são independentes e identicamente distribuídas (iid).
- observações em cada amostra são normalmente distribuídas.
- As observações em cada amostra têm a mesma variação.
- As observações em cada amostra são pareadas.

Interpretação

- H0: as médias das amostras são iguais.
- H1: os meios das amostras são desiguais.

In [2]:
# Example of the Paired Student's t-test
from scipy.stats import ttest_rel
data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = ttest_rel(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))
if p > 0.05:
    print('Probably the same distribution')
else:
    print('Probably different distributions')

stat=-0.334, p=0.746
Probably the same distribution


## 3 - Teste de Análise de Variância (ANOVA)

Testa se as médias de duas ou mais amostras independentes são significativamente diferentes.

Premissas

- As observações em cada amostra são independentes e identicamente distribuídas (iid).
- As observações em cada amostra são normalmente distribuídas.
- As observações em cada amostra têm a mesma variação.

Interpretação

- H0: as médias das amostras são iguais.
- H1: um ou mais dos meios das amostras são desiguais.

In [3]:
from scipy.stats import f_oneway
data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
data3 = [-0.208, 0.696, 0.928, -1.148, -0.213, 0.229, 0.137, 0.269, -0.870, -1.204]
stat, p = f_oneway(data1, data2, data3)
print('stat=%.3f, p=%.3f' % (stat, p))
if p > 0.05:
    print('Probably the same distribution')
else:
    print('Probably different distributions')

stat=0.096, p=0.908
Probably the same distribution
