## **Teste T Pareado usando Python**

Para testar se existe uma diferença significativa entre as médias das métricas das duas colunas 
**`ks.scores1`** e **`ks.scores2`**, podemos usar um **`teste t pareado`**. 
Este teste é adequado para comparar as médias de duas amostras emparelhadas, 
assumindo que as diferenças entre as amostras seguem uma distribuição normal.

### **Passos para realizar o Teste T Pareado:**

**1. Formulação das Hipóteses:**

- **`H0 (Hipótese Nula):`** A diferença entre as médias das métricas é zero ($𝜇_1 −𝜇_2 = 0$).
- **`H1 (Hipótese Alternativa):`** A diferença entre as médias das métricas não é zero ($𝜇_1 −𝜇_2$ != $0$).

**2. Cálculo da Diferença das Métricas:**

- Para cada par de valores das duas colunas, calcule a diferença.

**3. Aplicação do Teste T Pareado:**

- Utilize a diferença calculada para aplicar o **`teste t pareado`**.
- Calcule o **`valor p`** para determinar se as diferenças são estatisticamente significativas.

## **Implementação em Python:**

Vou demonstrar como você pode implementar isso usando a biblioteca **`scipy.stats`** para calcular o **teste t pareado**.

In [1]:
import pandas as pd
from scipy import stats

# Dados fornecidos: ks.scores
data = {
    "ks.scores1": [0.583983, 0.576596, 0.556730, 0.595138, 0.584564],
    "ks.scores2": [0.490242, 0.551584, 0.514383, 0.535587, 0.546064]
}

# Criar o DataFrame
df = pd.DataFrame(data)

# Calcular o teste T pareado
t_statistic, p_value = stats.ttest_rel(df['ks.scores1'], df['ks.scores2'])

# Exibir resultados
print("Estatística t:", t_statistic)
print("Valor p:", p_value)

# Avaliação do resultado
if p_value < 0.05:
    print("Rejeitamos a hipótese nula: Há diferença significativa entre as médias.")
else:
    print("Não rejeitamos a hipótese nula: Não há diferença significativa entre as médias.")


Estatística t: 4.378132332736648
Valor p: 0.011892242763488443
Rejeitamos a hipótese nula: Há diferença significativa entre as médias.
