In [None]:
import numpy as np
import pandas as pd
from statsmodels.stats.weightstats import ztest
import matplotlib.pyplot as plt
from scipy.stats import norm

# 1. Dados Estatísticos para Simulação (Valores típicos deste tipo de exercício)
# Assumiremos Desvio Padrão Populacional (sigma) conhecido ou que a amostra é grande (n > 30) para usar o Teste Z.
# Dados Simulados (podem ser substituídos por dados reais, se disponíveis)

np.random.seed(42) # Para reprodutibilidade

# Estratégia A: Média mais baixa
media_A = 75
std_A = 8
n_A = 50
notas_A = np.random.normal(loc=media_A, scale=std_A, size=n_A)

# Estratégia B: Média ligeiramente mais alta
media_B = 80
std_B = 7
n_B = 50
notas_B = np.random.normal(loc=media_B, scale=std_B, size=n_B)

# 2. Resumo dos Dados
print("--- Estatísticas das Amostras ---")
print(f"Estratégia A | Média: {notas_A.mean():.2f} | Desvio Padrão: {notas_A.std():.2f} | N: {n_A}")
print(f"Estratégia B | Média: {notas_B.mean():.2f} | Desvio Padrão: {notas_B.std():.2f} | N: {n_B}")

# Realiza o Teste Z para duas amostras (sem desvio padrão populacional conhecido, ztest usa o desvio padrão combinado da amostra)
# value=0 indica a diferença sob H0 (Média A - Média B = 0)
# alternative='larger' testa H1 (Média B > Média A, ou seja, diferença > 0)
estatistica_z, p_value_unilateral = ztest(x1=notas_B, x2=notas_A, value=0, alternative='larger')

# Nível de significância
alpha = 0.05

print("--- Resultado do Teste Z (Unilateral) ---")
print(f"Estatística Z: {estatistica_z:.4f}")
print(f"Valor P: {p_value_unilateral:.4f}")

# Decisão da Hipótese
if p_value_unilateral < alpha:
    decisao = "Rejeitar H0"
    justificativa = "O Valor P é menor que o nível de significância (0.05)."
else:
    decisao = "Não Rejeitar H0"
    justificativa = "O Valor P é maior que o nível de significância (0.05)."

print(f"\nDecisão Estatística: {decisao}")
print(f"Justificativa: {justificativa}")

# 1. Cria o eixo x para a distribuição
z_scores = np.linspace(-3, 4, 100)

# 2. Calcula a densidade (curva normal padrão)
pdf_z = norm.pdf(z_scores, loc=0, scale=1)

plt.figure(figsize=(10, 6))
plt.plot(z_scores, pdf_z, color='blue', label='Distribuição sob H0 (Diferença de Médias = 0)')

# 3. Desenha a área crítica (p_value)
# Encontra o valor crítico Z para alpha = 0.05 (unilateral)
z_critico = norm.ppf(1 - alpha)
z_limites = np.linspace(z_critico, 4, 100)
plt.fill_between(z_limites, norm.pdf(z_limites), color='red', alpha=0.3, label='Região de Rejeição (α=0.05)')

# 4. Plota a estatística Z calculada
plt.axvline(estatistica_z, color='red', linestyle='--', linewidth=2, label=f'Estatística Z Observada ({estatistica_z:.2f})')
plt.scatter(estatistica_z, norm.pdf(estatistica_z), color='red', s=50)

plt.title('Gráfico da Distribuição Z e Região de Rejeição (Teste Unilateral)')
plt.xlabel('Estatística Z')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True, linestyle='--', alpha=0.6)
plt.show()

# Observação: Se o ponto Z (linha vermelha tracejada) cair dentro da área vermelha (Região de Rejeição), rejeitamos H0.

# Conclusão do Projeto
alpha = 0.05

print("\n--- Conclusão do Teste T de Duas Amostras ---")
print(f"Nível de Significância (α): {alpha}")
print(f"Estatística Z: {estatistica_z:.4f}")
print(f"Valor P (Unilateral): {p_value_unilateral:.4f}")

print("\n### Análise e Impacto de Negócio")

if p_value_unilateral < alpha:
    print(f"1. Decisão Estatística: Rejeitamos a Hipótese Nula (H0).")
    print("2. Justificativa: O Valor P (a probabilidade de o resultado ter ocorrido por acaso) é extremamente baixo, menor que o nível de significância de 0.05.")
    print("\n3. Conclusão de Negócio: Existe uma **diferença estatisticamente significativa** nas notas. A **Estratégia B** tem um desempenho médio **comprovadamente superior** à Estratégia A. A escola deve considerar a implementação da Estratégia B em larga escala.")
else:
    print(f"1. Decisão Estatística: Não Rejeitamos a Hipótese Nula (H0).")
    print("2. Justificativa: O Valor P é maior que o nível de significância de 0.05.")
    print("\n3. Conclusão de Negócio: Não há evidências estatísticas suficientes para afirmar que a Estratégia B é melhor que a Estratégia A. Ambas as estratégias são consideradas igualmente eficazes, em média.")