<a href="https://colab.research.google.com/github/zjefersound/data-science-notebooks/blob/main/TesteAB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [11]:
import numpy as np
import pandas as pd
from scipy import stats

np.random.seed(42)

# Dados simulados de duas versões de um site
versao_A = np.random.normal(0.51, 0.03, 2000) # 0.12 média da distribuição normal (simula 12% taxa de conversão), desvio padrão 0.03
versao_B = np.random.normal(0.14, 0.03, 2000) # 0.14 média da distribuição normal (simula 14% taxa de conversão), desvio padrão 0.03

# Teste de normalidade
print("Shapiro-Wilk - versão A:", stats.shapiro(versao_A).pvalue) # p > 0,05, então os dados podem ser considerados normais
print("Shapiro-Wilk - versão B:", stats.shapiro(versao_B).pvalue) # p > 0,05, então os dados podem ser considerados normais

# Teste de homogeneidade de variância
print("Levene:", stats.levene(versao_A, versao_B).pvalue) # p > 0,05, as variâncias podem ser consideradas iguais

# Como as duas condições para testes paramétricos foram atendidas (normalidade e variâncias homogêneas), realizamos um teste t de Student para amostras independentes
t_stat, p_value = stats.ttest_ind(versao_A, versao_B)
print(f"Valor-p: {p_value:.4f}")

# Interpretação
if p_value < 0.05:
  print("Rejeitamos H0!")
  print("Diferença estatisticamente significativa!")
else:
  print("Não há evidência suficiente para concluir diferença.")

Shapiro-Wilk - versão A: 0.9086138010594381
Shapiro-Wilk - versão B: 0.7360156426535571
Levene: 0.2606958702205091
Valor-p: 0.0000
Rejeitamos H0!
Diferença estatisticamente significativa!
