<a href="https://colab.research.google.com/github/leandracarneiro/estatistica/blob/main/teste_de_T_pareado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

O teste t pareado é uma análise estatística que compara as médias de duas amostras pareadas. É usado para verificar se a diferença entre as médias é diferente de zero ou de um valor alvo.

## **Quando usar o teste t pareado?**
Quando se quer comparar o mesmo conjunto de itens medidos em condições diferentes

Quando se quer comparar as diferenças entre dois tratamentos aplicados ao mesmo assunto

Quando se quer verificar se houve diferença entre o peso antes e depois de uma dieta

## **Como realizar o teste t pareado? **

Escolher Estat > Estatísticas Básicas > Teste t pareado

Comparar o valor-t a valores críticos da distribuição-t

Comparar o valor-p do teste

## Como interpretar os resultados?

Se o valor p for significativamente pequeno, há evidência forte para não aceitar a hipótese nula

Se o valor absoluto do valor t for maior do que o valor crítico, rejeita-se a hipótese nula

## **O que são amostras pareadas? **

São duas amostras em que cada observação da primeira amostra é pareada com uma observação da segunda amostra

In [None]:
# importar as bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import scipy.stats as stats
import statsmodels.stats.multicomp as stsmodels
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from statsmodels.stats.anova import AnovaRM

In [None]:
# caso a biblioteca scipy não esteja no servidor da Google
# instalar ela com o comando !pip (somente se der algum erro no bloco de cima)

# !pip install scipy

In [None]:
# Endereço do arquivo com a base de dados
arquivo = 'url do seu banco de ddos'

# Ler o arquivo
dados = pd.read_excel(arquivo)
dados

Exemplo 1: a média do peso do ultrassom é igual a média do peso ao nascer?

variáveis pareadas/relacionadas para o mesmo indivíduo (antes e após)

In [None]:
# Selecionar os nomes das variáveis  (PESO_US, PESO_NASCER)
varNumerica1 = 'PESO_US'
varNumerica2 = 'PESO_NASCER'

# Filtrar registros que sem nulos nas duas colunas
dados2 = dados.dropna(how = 'any', subset=[varNumerica1, varNumerica2])

# Selecionar os dois grupos
grupo1 = dados2.PESO_US
grupo2 = dados2.PESO_NASCER

In [None]:
# 1ª ETAPA - Estatística descritiva

# Estatística descritiva - Análise dos valores médios
mediaG1 = grupo1.mean()
mediaG2 = grupo2.mean()

print(f'Média do Grupo 1: {mediaG1:.3f}')
print(f'Média do Grupo 2: {mediaG2:.3f}')
print()

# _______________________________________________________________________________________
# 2º ETAPA - Realizar o teste de médias pareadas (antes e após) - 2 variáveis

# Teste t - teste de médias para variáveis pareadas (relacionadas)
# H0 = As médias são iguais
resultado = stats.ttest_rel(grupo1, grupo2)
print('Teste-t de média pareado')
print(f'p-value: {resultado.pvalue:.3f}')

# interpretação
if resultado.pvalue <= 0.05:
    print('Rejeita H0 => As médias são diferentes!')
else:
    print('Aceita H0 => As médias são iguais!')

# Se, statistic=array([-inf]) ==> INF siginifica que o valor da estatística do teste tende ao infinito (muito baixo)

# _______________________________________________________________________________________
print()
# Estatística descritiva - Análise Gráfica -> Mostrar 2 histogramas
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(grupo1, ax=ax1)
sns.histplot(grupo2, ax=ax2)
plt.tight_layout()

# para salvar/preparar a figura (depois baixar)
plt.savefig('FiguraAtividade_5.jpg', format='jpg', dpi=300)

Saiba mais: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_rel.html