# Experimentos Estatísticos e Teste de Significância

O projeto de experimentos é um dos pilares da prática estatística, com aplicações em praticamente todas as áreas de pesquisa. O objetivo é projetar um experimento a fim de confirmar ou rejeitar uma hipótese

## 1. Testagem A/B

A testagem A/B é um método estatístico usado para comparar duas versões de algo (site, produto, estratégia de marketing) e verificar qual delas tem melhor desempenho

### Exemplo prático:

Imagine que você quer testar duas versões de um site (A e B) para ver qual gera mais conversões

In [4]:
import numpy as np 
import scipy.stats as stats
from statsmodels.stats.proportion import proportions_ztest

In [6]:
n_A, p_A = 1000, 0.12  # grupo A: 1000 usuários, 12% taxa de conversão
n_B, p_B = 1000, 0.14  # grupo B: 1000 usuários, 14% taxa de conversão

# simulação das conversões reais observadas
conversoes_A = np.random.binomial(n_A, p_A)
conversoes_B = np.random.binomial(n_B, p_B)

In [7]:
taxa_A = conversoes_A / n_A
taxa_B = conversoes_B / n_B

contagens = np.array([conversoes_A, conversoes_B])
tamanhos = np.array([n_A, n_B])

estatistica, p_valor = proportions_ztest(contagens, tamanhos)

In [8]:
print(f"Taxa de conversão A: {taxa_A:.2%}")
print(f"Taxa de conversão B: {taxa_B:.2%}")
print(f"P-valor: {p_valor:.4f}")

if p_valor < 0.05:
    print("Rejeitamos a hipótese nula: A versão B tem um impacto estatisticamente significativo.")
else:
    print("Não há evidências estatísticas para dizer que a versão B é melhor.")

Taxa de conversão A: 10.90%
Taxa de conversão B: 13.60%
P-valor: 0.0656
Não há evidências estatísticas para dizer que a versão B é melhor.


## 2. Testes de Hipótese

Um teste de hipótese avalia se uma afirmação sobre um conjunto de dados é verdadeira ou não

### Exemplo prático: 

Você quer saber se a média de altura dos alunos de uma escola é diferente de 1,70m

In [10]:
alturas = np.random.normal(1.72, 0.05, size=30)

t_stat, p_valor = stats.ttest_1samp(alturas, 1.70)

print(f"Estatística t: {t_stat}, P-valor: {p_valor}\n")

if p_valor < 0.05:
    print("Rejeitamos a hipótese nula: A média é significativamente diferente de 1,70m.")
else:
    print("Não há evidências suficientes para rejeitar a hipótese nula.")

Estatística t: 3.5402232460811884, P-valor: 0.0013712642302733755

Rejeitamos a hipótese nula: A média é significativamente diferente de 1,70m.


## 3. Reamostragem

A reamostragem é uma técnica usada para criar novas amostras a partir de uma amostra original. Isso é útil quando não temos acesso à população inteira

In [11]:
from sklearn.utils import resample

bootstrap_sample = resample(alturas, replace=True, n_samples=30, random_state=42)

print(f"Média original: {np.mean(alturas):.3f}")
print(f"Média da reamostragem: {np.mean(bootstrap_sample):.3f}")

Média original: 1.733
Média da reamostragem: 1.739


## 4. ANOVA (Análise de Variância)

ANOVA é usada para comparar médias de três ou mais grupos. Quanto maior a estatistica F, mais provável que haja uma diferença real entre os grupos.

In [12]:
grupo_A = np.random.normal(50, 10, 30)
grupo_B = np.random.normal(55, 10, 30)
grupo_C = np.random.normal(60, 10, 30)

f_stat, p_valor = stats.f_oneway(grupo_A, grupo_B, grupo_C)
print(f"ANOVA: Estatística F={f_stat}, P-valor={p_valor}")

ANOVA: Estatística F=8.377961329316134, P-valor=0.0004704640903561234


## 5. Teste de Qui-Quadrado

O teste de Qui-Quadrado avalia se há associação entre variáveis categóricas

In [13]:
# exemplo: 
#       Produto A   Produto B
# Homens    30        20
# Mulheres  10        40

tabela = np.array([[30, 20],  # homens
                   [10, 40]]) # mulheres

estatistica, p_valor, dof, esperados = stats.chi2_contingency(tabela)

print(f"Estatística Qui-Quadrado: {estatistica:.4f}")
print(f"P-valor: {p_valor:.4f}")
print(f"Graus de liberdade: {dof}")
print("Frequências esperadas:")
print(esperados)

if p_valor < 0.05:
    print("Rejeitamos a hipótese nula: Existe associação entre gênero e preferência de produto.")
else:
    print("Não há evidências estatísticas para afirmar que gênero e preferência estão associadas.")

Estatística Qui-Quadrado: 15.0417
P-valor: 0.0001
Graus de liberdade: 1
Frequências esperadas:
[[20. 30.]
 [20. 30.]]
Rejeitamos a hipótese nula: Existe associação entre gênero e preferência de produto.


-----

### Conclusão

- Testes de hipótese ajudam a verificar se uma afirmação sobre um conjunto de dados é verdadeira.
  
- A/B Testing compara grupos para identificar melhorias.
  
- ANOVA e Testes t comparam médias de grupos.
  
- Reamostragem é uma técnica para avaliar significância estatística sem suposições paramétricas.
  
- Qui-Quadrado analisa relações entre variáveis categóricas.