# Teste de Hipótese — Avaliação Estatística do Experimento A/B

## Contexto Estatístico

Após a análise exploratória, foi observada uma diferença na taxa de conversão entre os grupos.

Nesta etapa, realizamos um teste estatístico para avaliar se essa diferença pode ser atribuída ao acaso ou se há evidência de um efeito real do anúncio.

## Formulação das Hipóteses

### Hipóteses

H0 (Hipótese Nula): p_ad = p_psa  
A taxa de conversão é igual entre os grupos.

H1 (Hipótese Alternativa): p_ad ≠ p_psa  
As taxas de conversão são diferentes.

Será utilizado teste bilateral com nível de significância de 5%.

## 3. Importação das Bibliotecas

In [1]:
# Importação das bibliotecas
import pandas as pd
import numpy as np
from scipy.stats import norm

In [2]:
df = pd.read_csv('../data/marketing_AB.csv')

## 4. Definição das Variáveis

In [3]:
# Tamanhos das amostras
n_ad = 564577
n_psa = 23524

# Conversões
conv_ad = 14423
conv_psa = 420

# Proporções observadas
p_ad = conv_ad / n_ad
p_psa = conv_psa / n_psa

p_ad, p_psa

(0.025546559636683747, 0.01785410644448223)

## 5. Proporção Combinada (Pooled)

In [4]:
p_pool = (conv_ad + conv_psa) / (n_ad + n_psa)
p_pool

0.02523886203220195

## 6. Cálculo do Erro Padrão

In [5]:
standard_error = np.sqrt(
    p_pool * (1 - p_pool) * (1/n_ad + 1/n_psa)
)

standard_error

np.float64(0.0010437410649006525)

## 7. Estatística Z

In [6]:
z_stat = (p_ad - p_psa) / standard_error
z_stat

np.float64(7.3700781265454145)

## 8. Cálculo do p-value (Bilateral)

In [7]:
p_value = 2 * (1 - norm.cdf(abs(z_stat)))
p_value

np.float64(1.7053025658242404e-13)

## 9. Intervalo de Confiança (95%)

In [8]:
se_diff = np.sqrt(
    (p_ad * (1 - p_ad) / n_ad) +
    (p_psa * (1 - p_psa) / n_psa)
)

diff = p_ad - p_psa

ci_lower = diff - 1.96 * se_diff
ci_upper = diff + 1.96 * se_diff

ci_lower, ci_upper

(np.float64(0.00595090043017032), np.float64(0.009434005954232714))

## 10. Decisão Estatística

In [9]:
alpha = 0.05

if p_value < alpha:
    print("Rejeitamos H0: há evidência estatística de diferença entre os grupos.")
else:
    print("Não rejeitamos H0: não há evidência estatística suficiente.")

Rejeitamos H0: há evidência estatística de diferença entre os grupos.


## Conclusão do Teste de Hipótese

O teste Z para duas proporções resultou em uma estatística Z de 7,37 e p-value inferior a 0,05, indicando evidência estatística robusta para rejeitar a hipótese nula de igualdade entre as taxas de conversão.

Portanto, há evidência de que a taxa de conversão do grupo exposto ao anúncio é estatisticamente superior à do grupo controle.

A diferença absoluta observada foi de aproximadamente 0,77 ponto percentual, representando um aumento relativo de cerca de 43%.

Embora a significância estatística seja elevada, é importante avaliar a magnitude do efeito sob a perspectiva de negócio, considerando custo da campanha e impacto financeiro esperado.