# Fundamentos de Testes de Hipótese
Neste notebook, abordaremos a construção de testes de hipótese clássicos, como o Teste T, comparando as diferenças entre duas médias usando dados simulados.

In [2]:
import numpy as np
from scipy import stats

## Parâmetros de controle do experimento - Altere esses valores para testar novos cenários
x1    =  15000  # Média de erro modelo A
x2    =  13500  # Média de erro modelo B
s1    =  5000   # Desvio padrão de erro modelo A
s2    =  4800   # Desvio padrão de erro modelo B
n1    =  500    # Tamanho da amostra modelo A
n2    =  500    # Tamanho da amostra modelo B
alpha =  0.05   # Nível de significância

# Define uma semente aleatória para garantir que os resultados sejam sempre os mesmos.
np.random.seed(28)

# Simulação dos erros de cada modelo para nA e nB previsões através de dados sintéticos aleatórios
# Modelo Antigo (A): Erro médio de xA com desvio padrão de sA
erros_modelo_A = np.random.normal(loc=x1, scale=s1, size=n1)

# Novo Modelo (B): Erro médio de xB com desvio padrão de sB
erros_modelo_B = np.random.normal(loc=x2, scale=s2, size=n2)

# Vamos verificar as médias observadas em nossa simulação
media_erros_A = np.mean(erros_modelo_A)
media_erros_B = np.mean(erros_modelo_B)

print(f"Média de Erro do Modelo A: R$ {media_erros_A:,.2f}")
print(f"Média de Erro do Modelo B: R$ {media_erros_B:,.2f}")
print(f"Diferença observada: R$ {media_erros_A - media_erros_B:,.2f}")

Média de Erro do Modelo A: R$ 14,879.74
Média de Erro do Modelo B: R$ 13,478.44
Diferença observada: R$ 1,401.31


In [3]:
# H₀: as médias são iguais
# H₁: as médias são diferentes
t_stat, p_valor = stats.ttest_ind(erros_modelo_A, erros_modelo_B)

print(f"Valor-p calculado: {p_valor:.6f}")

if p_valor <= alpha:
    print("Conclusão: Rejeitamos a H₀. O novo modelo tem uma redução de erro estatisticamente significativa.")
else:
    print("Conclusão: Falhamos em rejeitar a H₀. Não há evidência suficiente de que o novo modelo é melhor.")

Valor-p calculado: 0.000005
Conclusão: Rejeitamos a H₀. O novo modelo tem uma redução de erro estatisticamente significativa.


In [4]:
# Calculando o Intervalo de Confiança para a diferença das médias
diferenca_medias = media_erros_A - media_erros_B
nA, nB = len(erros_modelo_A), len(erros_modelo_B)
sA, sB = np.std(erros_modelo_A, ddof=1), np.std(erros_modelo_B, ddof=1)

# Graus de liberdade
gl = nA + nB - 2

# Erro padrão da diferença
erro_padrao_diff = np.sqrt((sA**2 / nA) + (sB**2 / nB))

# A probabilidade acumulada (ou percentile) para o nível de significância estabelecido
q = 1 - alpha / 2

# t-crítico para o q equivalente ao nível de significância estabelecido
t_critico = stats.t.ppf(q, df=gl)

# Margem de erro
margem_erro = t_critico * erro_padrao_diff

# Limites do intervalo
limite_inferior = diferenca_medias - margem_erro
limite_superior = diferenca_medias + margem_erro

print(f"A melhoria estimada é de R$ {diferenca_medias:,.2f}.")
print(f"O Intervalo de Confiança de {(1-alpha)*100:,.0f}% para essa melhoria é: [R$ {limite_inferior:,.2f}, R$ {limite_superior:,.2f}]")

A melhoria estimada é de R$ 1,401.31.
O Intervalo de Confiança de 95% para essa melhoria é: [R$ 802.94, R$ 1,999.67]
