# üî¨ Testes de Hip√≥tese: O Detetive da Estat√≠stica!
## *Tirando Conclus√µes com Confian√ßa - M√≥dulo 8 de 10*

### **Pedro Nunes Guth** | Expert em IA & Matem√°tica AWS

---

Ea√™ pessoal! üöÄ

T√°, mas o que √© um **teste de hip√≥tese**? Imagina que voc√™ √© um detetive investigando se um suspeito √© culpado ou inocente. Voc√™ n√£o pode ter 100% de certeza, mas precisa tomar uma decis√£o baseada nas evid√™ncias, certo?

√â exatamente isso que fazemos com testes de hip√≥tese! A gente formula duas teorias:
- **H‚ÇÄ (Hip√≥tese Nula)**: "O suspeito √© inocente" (status quo)
- **H‚ÇÅ (Hip√≥tese Alternativa)**: "O suspeito √© culpado" (o que queremos provar)

E a√≠? **Bora** desvendar esse mist√©rio estat√≠stico! üïµÔ∏è‚Äç‚ôÇÔ∏è

In [None]:
# Setup inicial - Imports que vamos usar nessa jornada!
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import norm, t, chi2
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes visuais - deixando tudo liiindo!
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("üéØ Bibliotecas carregadas! Vamos come√ßar nossa investiga√ß√£o estat√≠stica!")

## üß† Fundamentos: O que S√£o Testes de Hip√≥tese?

T√°, vamos por partes! Nos m√≥dulos anteriores a gente viu:
- **M√≥dulo 7**: Como usar amostras para falar sobre popula√ß√µes (Teorema do Limite Central)
- **M√≥dulo 2**: Distribui√ß√µes de probabilidade (Normal, t-Student...)

Agora vamos **juntar tudo isso** para tomar decis√µes!

### A Estrutura de um Teste de Hip√≥tese:

```mermaid
graph TD
    A[Formula√ß√£o das Hip√≥teses] --> B[Escolha do Teste Estat√≠stico]
    B --> C[Coleta de Dados]
    C --> D[C√°lculo da Estat√≠stica de Teste]
    D --> E[C√°lculo do Valor-p]
    E --> F[Decis√£o: Rejeitar ou N√£o H‚ÇÄ]
    F --> G[Interpreta√ß√£o dos Resultados]
```

### **Dica do Pedro**: 
Lembra do filme "12 Homens e uma Senten√ßa"? O j√∫ri assume que o r√©u √© inocente (H‚ÇÄ) at√© que as evid√™ncias provem o contr√°rio. √â exatamente assim que funciona!

## üìä As Hip√≥teses: Nula vs Alternativa

### Hip√≥tese Nula (H‚ÇÄ):
- √â o **status quo**, a situa√ß√£o atual
- "N√£o h√° diferen√ßa", "N√£o h√° efeito", "S√£o iguais"
- √â o que **assumimos ser verdade** at√© prova em contr√°rio

### Hip√≥tese Alternativa (H‚ÇÅ ou H‚Çê):
- √â o que **queremos provar**
- "H√° diferen√ßa", "H√° efeito", "S√£o diferentes"
- Pode ser **bilateral** (‚â†) ou **unilateral** (> ou <)

### Exemplos Brasileir√≠ssimos:

**Exemplo 1 - Churrasco vs Feijoada:**
- H‚ÇÄ: "Churrasco e feijoada t√™m a mesma prefer√™ncia" (Œº‚ÇÅ = Œº‚ÇÇ)
- H‚ÇÅ: "Churrasco √© mais preferido que feijoada" (Œº‚ÇÅ > Œº‚ÇÇ)

**Exemplo 2 - Nota do ENEM:**
- H‚ÇÄ: "A m√©dia nacional do ENEM √© 500 pontos" (Œº = 500)
- H‚ÇÅ: "A m√©dia nacional do ENEM √© diferente de 500 pontos" (Œº ‚â† 500)

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-08_img_01.png)

In [None]:
# Vamos simular dados para o exemplo do ENEM
np.random.seed(42)

# Simulando notas do ENEM de uma amostra de estudantes
# Vamos fingir que a m√©dia real √© 520 (mas n√£o sabemos isso!)
notas_enem = np.random.normal(loc=520, scale=100, size=1000)

# Estat√≠sticas descritivas
media_amostral = np.mean(notas_enem)
desvio_amostral = np.std(notas_enem, ddof=1)  # ddof=1 para amostra
n = len(notas_enem)

print(f"üìä Dados da nossa amostra:")
print(f"   Tamanho da amostra (n): {n}")
print(f"   M√©dia amostral (xÃÑ): {media_amostral:.2f}")
print(f"   Desvio padr√£o amostral (s): {desvio_amostral:.2f}")
print(f"")
print(f"ü§î Nossa pergunta:")
print(f"   H‚ÇÄ: Œº = 500 (a m√©dia √© 500)")
print(f"   H‚ÇÅ: Œº ‚â† 500 (a m√©dia √© diferente de 500)")

## üéØ A Matem√°tica dos Testes: Estat√≠sticas de Teste

Agora vem a parte **maneira**! Como transformar nossos dados em evid√™ncia?

### Teste t para Uma Amostra:

A f√≥rmula da **estat√≠stica t** √©:

$$t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}$$

Onde:
- $\bar{x}$ = m√©dia amostral
- $\mu_0$ = valor hipot√©tico da m√©dia populacional (H‚ÇÄ)
- $s$ = desvio padr√£o amostral
- $n$ = tamanho da amostra

### Por que essa f√≥rmula funciona?

Lembra do **M√≥dulo 7** onde falamos sobre o Teorema do Limite Central? A distribui√ß√£o das m√©dias amostrais segue uma normal com:

$$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$$

Quando **padronizamos** isso (como faz√≠amos com o Z-score), obtemos a estat√≠stica t!

### **Dica do Pedro**: 
A estat√≠stica t √© como um **"medidor de surpresa"**. Quanto maior o |t|, mais surpreendente √© nosso resultado se H‚ÇÄ fosse verdade!

In [None]:
# Calculando a estat√≠stica t manualmente
mu_0 = 500  # Valor da hip√≥tese nula
x_bar = media_amostral  # M√©dia amostral
s = desvio_amostral     # Desvio padr√£o amostral
n = len(notas_enem)     # Tamanho da amostra

# F√≥rmula da estat√≠stica t
t_estatistica = (x_bar - mu_0) / (s / np.sqrt(n))

# Graus de liberdade
graus_liberdade = n - 1

print(f"üßÆ Calculando a estat√≠stica t:")
print(f"")
print(f"   t = (xÃÑ - Œº‚ÇÄ) / (s / ‚àön)")
print(f"   t = ({x_bar:.2f} - {mu_0}) / ({s:.2f} / ‚àö{n})")
print(f"   t = {x_bar - mu_0:.2f} / {s/np.sqrt(n):.2f}")
print(f"   t = {t_estatistica:.4f}")
print(f"")
print(f"   Graus de liberdade: {graus_liberdade}")

# Comparando com a fun√ß√£o do scipy
t_scipy, p_valor_scipy = stats.ttest_1samp(notas_enem, mu_0)
print(f"")
print(f"‚úÖ Conferindo com scipy.stats:")
print(f"   Estat√≠stica t: {t_scipy:.4f}")
print(f"   Valor-p: {p_valor_scipy:.6f}")

## üé™ O Valor-p: A Estrela do Show!

T√°, mas o que diabos √© esse **valor-p** que todo mundo fala?

### Defini√ß√£o Formal:
O **valor-p** √© a probabilidade de obtermos um resultado **igual ou mais extremo** que o observado, **assumindo que H‚ÇÄ √© verdadeira**.

### Traduzindo para o Portugu√™s Claro:
"Se a hip√≥tese nula fosse verdade, qual seria a chance de eu ver dados t√£o malucos quanto esses?"

### F√≥rmula Matem√°tica:
Para um teste bilateral:

$$p = 2 \times P(T \geq |t_{obs}|)$$

Onde $T$ segue uma distribui√ß√£o t-Student com $n-1$ graus de liberdade.

### Interpreta√ß√£o:
- **p ‚â§ 0.05**: "Cara, isso √© muito improv√°vel! Vou rejeitar H‚ÇÄ"
- **p > 0.05**: "Hmm, pode ser coincid√™ncia. N√£o vou rejeitar H‚ÇÄ"

### **Dica do Pedro**: 
O valor-p N√ÉO √© a probabilidade de H‚ÇÄ ser verdadeira! √â a probabilidade dos dados, dado que H‚ÇÄ √© verdadeira. Diferen√ßa crucial!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-08_img_02.png)

In [None]:
# Visualizando o conceito de valor-p
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gr√°fico 1: Distribui√ß√£o t e nossa estat√≠stica
x = np.linspace(-4, 4, 1000)
y = stats.t.pdf(x, df=graus_liberdade)

ax1.plot(x, y, 'b-', linewidth=2, label=f'Distribui√ß√£o t (gl={graus_liberdade})')
ax1.axvline(t_estatistica, color='red', linestyle='--', linewidth=2, 
           label=f'Nossa estat√≠stica t = {t_estatistica:.3f}')
ax1.axvline(-t_estatistica, color='red', linestyle='--', linewidth=2, alpha=0.7)

# Sombreando a √°rea do valor-p
x_right = x[x >= abs(t_estatistica)]
y_right = stats.t.pdf(x_right, df=graus_liberdade)
x_left = x[x <= -abs(t_estatistica)]
y_left = stats.t.pdf(x_left, df=graus_liberdade)

ax1.fill_between(x_right, y_right, alpha=0.3, color='red', label=f'Valor-p = {p_valor_scipy:.4f}')
ax1.fill_between(x_left, y_left, alpha=0.3, color='red')

ax1.set_title('Distribui√ß√£o t e Valor-p (Teste Bilateral)')
ax1.set_xlabel('Estat√≠stica t')
ax1.set_ylabel('Densidade')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Gr√°fico 2: Histograma dos dados originais
ax2.hist(notas_enem, bins=50, density=True, alpha=0.7, color='skyblue', 
         edgecolor='black', label='Dados da Amostra')
ax2.axvline(media_amostral, color='red', linestyle='-', linewidth=2, 
           label=f'M√©dia Amostral = {media_amostral:.1f}')
ax2.axvline(mu_0, color='green', linestyle='--', linewidth=2, 
           label=f'H‚ÇÄ: Œº = {mu_0}')

ax2.set_title('Distribui√ß√£o das Notas do ENEM')
ax2.set_xlabel('Nota')
ax2.set_ylabel('Densidade')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"üéØ Interpreta√ß√£o:")
print(f"   Se H‚ÇÄ fosse verdade (Œº = 500), a chance de ver")
print(f"   uma estat√≠stica t t√£o extrema quanto {t_estatistica:.3f}")
print(f"   seria de apenas {p_valor_scipy:.4f} ({p_valor_scipy*100:.2f}%)")

## ‚öñÔ∏è Tomando a Decis√£o: N√≠vel de Signific√¢ncia

Agora vem a **hora da verdade**! Como decidir se rejeitamos H‚ÇÄ ou n√£o?

### N√≠vel de Signific√¢ncia (Œ±):
√â o nosso **"limite de toler√¢ncia"** para erro. Geralmente usamos:
- **Œ± = 0.05** (5%): Padr√£o na maioria das √°reas
- **Œ± = 0.01** (1%): Para decis√µes mais cr√≠ticas
- **Œ± = 0.10** (10%): Para an√°lises explorat√≥rias

### Regra de Decis√£o:
- Se **p-valor ‚â§ Œ±**: Rejeitamos H‚ÇÄ (resultado "estatisticamente significativo")
- Se **p-valor > Œ±**: N√£o rejeitamos H‚ÇÄ (n√£o temos evid√™ncia suficiente)

### Os Dois Tipos de Erro:

| Realidade ‚Üí | H‚ÇÄ √© Verdadeira | H‚ÇÄ √© Falsa |
|-------------|-----------------|------------|
| **N√£o Rejeitamos H‚ÇÄ** | ‚úÖ Decis√£o Correta | ‚ùå **Erro Tipo II** (Œ≤) |
| **Rejeitamos H‚ÇÄ** | ‚ùå **Erro Tipo I** (Œ±) | ‚úÖ Decis√£o Correta |

### **Dica do Pedro**: 
Lembra do sistema judici√°rio? Erro Tipo I √© condenar um inocente, Erro Tipo II √© absolver um culpado. Qual √© pior? Depende do contexto!

In [None]:
# Fun√ß√£o para realizar teste de hip√≥tese completo
def teste_hipotese_completo(dados, mu_0, alpha=0.05, teste='bilateral'):
    """
    Realiza um teste de hip√≥tese completo para uma amostra
    
    Par√¢metros:
    - dados: array com os dados da amostra
    - mu_0: valor da hip√≥tese nula
    - alpha: n√≠vel de signific√¢ncia
    - teste: 'bilateral', 'menor' ou 'maior'
    """
    
    n = len(dados)
    x_bar = np.mean(dados)
    s = np.std(dados, ddof=1)
    
    # Estat√≠stica t
    t_stat = (x_bar - mu_0) / (s / np.sqrt(n))
    gl = n - 1
    
    # Valor-p dependendo do tipo de teste
    if teste == 'bilateral':
        p_valor = 2 * (1 - stats.t.cdf(abs(t_stat), gl))
        hipotese_alt = f"Œº ‚â† {mu_0}"
    elif teste == 'maior':
        p_valor = 1 - stats.t.cdf(t_stat, gl)
        hipotese_alt = f"Œº > {mu_0}"
    else:  # teste == 'menor'
        p_valor = stats.t.cdf(t_stat, gl)
        hipotese_alt = f"Œº < {mu_0}"
    
    # Decis√£o
    decisao = "Rejeitar H‚ÇÄ" if p_valor <= alpha else "N√£o rejeitar H‚ÇÄ"
    significativo = "Sim" if p_valor <= alpha else "N√£o"
    
    # Resultados
    print(f"üìä TESTE DE HIP√ìTESE - RESULTADOS COMPLETOS")
    print(f"="*50)
    print(f"Dados da Amostra:")
    print(f"  ‚Ä¢ Tamanho (n): {n}")
    print(f"  ‚Ä¢ M√©dia (xÃÑ): {x_bar:.3f}")
    print(f"  ‚Ä¢ Desvio Padr√£o (s): {s:.3f}")
    print(f"")
    print(f"Hip√≥teses:")
    print(f"  ‚Ä¢ H‚ÇÄ: Œº = {mu_0}")
    print(f"  ‚Ä¢ H‚ÇÅ: {hipotese_alt}")
    print(f"")
    print(f"Estat√≠sticas do Teste:")
    print(f"  ‚Ä¢ Estat√≠stica t: {t_stat:.4f}")
    print(f"  ‚Ä¢ Graus de liberdade: {gl}")
    print(f"  ‚Ä¢ Valor-p: {p_valor:.6f}")
    print(f"  ‚Ä¢ N√≠vel de signific√¢ncia (Œ±): {alpha}")
    print(f"")
    print(f"Decis√£o:")
    print(f"  ‚Ä¢ {decisao}")
    print(f"  ‚Ä¢ Estatisticamente significativo: {significativo}")
    
    return {
        'estatistica_t': t_stat,
        'p_valor': p_valor,
        'decisao': decisao,
        'significativo': significativo
    }

# Testando nossa fun√ß√£o com os dados do ENEM
resultado = teste_hipotese_completo(notas_enem, mu_0=500, alpha=0.05)

## üîÑ Tipos de Testes: Bilateral vs Unilateral

Dependendo da nossa **pergunta de pesquisa**, podemos ter diferentes tipos de teste:

### 1. Teste Bilateral (Two-tailed):
- **H‚ÇÅ**: Œº ‚â† Œº‚ÇÄ ("√© diferente de")
- Testamos se h√° diferen√ßa **em qualquer dire√ß√£o**
- Dividimos Œ± entre as duas caudas da distribui√ß√£o

### 2. Teste Unilateral Direito:
- **H‚ÇÅ**: Œº > Œº‚ÇÄ ("√© maior que")
- Testamos apenas se √© **significativamente maior**
- Todo Œ± fica na cauda direita

### 3. Teste Unilateral Esquerdo:
- **H‚ÇÅ**: Œº < Œº‚ÇÄ ("√© menor que")
- Testamos apenas se √© **significativamente menor**
- Todo Œ± fica na cauda esquerda

### Quando usar cada um?
- **Bilateral**: "Quero saber se h√° diferen√ßa" (mais comum)
- **Unilateral**: "Tenho uma dire√ß√£o espec√≠fica em mente"

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-08_img_03.png)

In [None]:
# Comparando os tr√™s tipos de teste com um exemplo
# Vamos simular que um novo m√©todo de ensino foi testado
np.random.seed(123)
notas_novo_metodo = np.random.normal(loc=515, scale=95, size=150)

print("üéì EXEMPLO: Efic√°cia de um Novo M√©todo de Ensino")
print("="*60)
print("Contexto: Testamos se um novo m√©todo de ensino melhora as notas.")
print("M√©dia hist√≥rica: 500 pontos")
print(f"M√©dia com novo m√©todo: {np.mean(notas_novo_metodo):.2f} pontos")
print()

# Teste 1: Bilateral
print("üîÑ TESTE BILATERAL:")
print("   H‚ÇÄ: Œº = 500 (m√©todo n√£o faz diferen√ßa)")
print("   H‚ÇÅ: Œº ‚â† 500 (m√©todo faz alguma diferen√ßa)")
resultado_bilateral = teste_hipotese_completo(notas_novo_metodo, 500, 0.05, 'bilateral')
print()

print("‚û°Ô∏è TESTE UNILATERAL DIREITO:")
print("   H‚ÇÄ: Œº ‚â§ 500 (m√©todo n√£o melhora)")
print("   H‚ÇÅ: Œº > 500 (m√©todo melhora as notas)")
resultado_direito = teste_hipotese_completo(notas_novo_metodo, 500, 0.05, 'maior')
print()

In [None]:
# Visualizando a diferen√ßa entre os tipos de teste
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

# Par√¢metros para os gr√°ficos
x = np.linspace(-4, 4, 1000)
y = stats.t.pdf(x, df=149)  # 150-1 graus de liberdade
t_calculado = (np.mean(notas_novo_metodo) - 500) / (np.std(notas_novo_metodo, ddof=1) / np.sqrt(150))

# Teste Bilateral
axes[0].plot(x, y, 'b-', linewidth=2)
axes[0].axvline(t_calculado, color='red', linestyle='--', linewidth=2, label=f't = {t_calculado:.3f}')
axes[0].axvline(-1.96, color='green', linestyle=':', linewidth=1, label='Cr√≠tico (¬±1.96)')
axes[0].axvline(1.96, color='green', linestyle=':', linewidth=1)

# Regi√£o cr√≠tica bilateral
x_crit_left = x[x <= -1.96]
x_crit_right = x[x >= 1.96]
axes[0].fill_between(x_crit_left, stats.t.pdf(x_crit_left, 149), alpha=0.3, color='red')
axes[0].fill_between(x_crit_right, stats.t.pdf(x_crit_right, 149), alpha=0.3, color='red')

axes[0].set_title('Teste Bilateral\n(Œ±/2 = 0.025 em cada cauda)')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Teste Unilateral Direito
axes[1].plot(x, y, 'b-', linewidth=2)
axes[1].axvline(t_calculado, color='red', linestyle='--', linewidth=2, label=f't = {t_calculado:.3f}')
axes[1].axvline(1.645, color='green', linestyle=':', linewidth=1, label='Cr√≠tico (1.645)')

# Regi√£o cr√≠tica direita
x_crit_right = x[x >= 1.645]
axes[1].fill_between(x_crit_right, stats.t.pdf(x_crit_right, 149), alpha=0.3, color='red')

axes[1].set_title('Teste Unilateral Direito\n(Œ± = 0.05 na cauda direita)')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

# Teste Unilateral Esquerdo
axes[2].plot(x, y, 'b-', linewidth=2)
axes[2].axvline(t_calculado, color='red', linestyle='--', linewidth=2, label=f't = {t_calculado:.3f}')
axes[2].axvline(-1.645, color='green', linestyle=':', linewidth=1, label='Cr√≠tico (-1.645)')

# Regi√£o cr√≠tica esquerda
x_crit_left = x[x <= -1.645]
axes[2].fill_between(x_crit_left, stats.t.pdf(x_crit_left, 149), alpha=0.3, color='red')

axes[2].set_title('Teste Unilateral Esquerdo\n(Œ± = 0.05 na cauda esquerda)')
axes[2].legend()
axes[2].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"üîç Observa√ß√£o:")
print(f"Com a mesma estat√≠stica t = {t_calculado:.3f}:")
print(f"  ‚Ä¢ Teste bilateral: Rejeita H‚ÇÄ? {abs(t_calculado) > 1.96}")
print(f"  ‚Ä¢ Teste unilateral direito: Rejeita H‚ÇÄ? {t_calculado > 1.645}")
print(f"  ‚Ä¢ Teste unilateral esquerdo: Rejeita H‚ÇÄ? {t_calculado < -1.645}")

## üéØ Exerc√≠cio Pr√°tico 1: Teste do Cafezinho

**Contexto**: Uma cafeteria afirma que seus clientes gastam em m√©dia R$ 25,00 por visita. Voc√™ suspeita que gastam mais que isso e coletou dados de 80 clientes.

**Sua miss√£o**:
1. Formule as hip√≥teses (H‚ÇÄ e H‚ÇÅ)
2. Escolha o tipo de teste apropriado
3. Calcule a estat√≠stica de teste
4. Determine o valor-p
5. Tome uma decis√£o com Œ± = 0.05

**Dica do Pedro**: Pense bem no tipo de teste! Voc√™ tem uma suspeita **espec√≠fica** sobre a dire√ß√£o da diferen√ßa?

In [None]:
# Dados do exerc√≠cio do cafezinho
np.random.seed(456)
gastos_cafeteria = np.random.normal(loc=27.5, scale=8.2, size=80)

print("‚òï EXERC√çCIO: Teste do Cafezinho")
print("="*40)
print(f"Dados coletados: {len(gastos_cafeteria)} clientes")
print(f"Gasto m√©dio observado: R$ {np.mean(gastos_cafeteria):.2f}")
print(f"Desvio padr√£o: R$ {np.std(gastos_cafeteria, ddof=1):.2f}")
print(f"Afirma√ß√£o da cafeteria: R$ 25,00")
print()

# COMPLETE O C√ìDIGO ABAIXO:
# 1. Formule as hip√≥teses
print("1Ô∏è‚É£ Hip√≥teses:")
print("   H‚ÇÄ: _______________")  # Complete aqui
print("   H‚ÇÅ: _______________")  # Complete aqui
print()

# 2. Que tipo de teste usar?
tipo_teste = "___"  # 'bilateral', 'maior' ou 'menor'?
print(f"2Ô∏è‚É£ Tipo de teste: {tipo_teste}")
print()

# 3. Execute o teste
# resultado = teste_hipotese_completo(gastos_cafeteria, ?, ?, ?)

print("\nü§î Pense nas respostas e depois execute o teste!")

In [None]:
# SOLU√á√ÉO DO EXERC√çCIO DO CAFEZINHO
print("‚òï SOLU√á√ÉO: Teste do Cafezinho")
print("="*40)

# 1. Hip√≥teses corretas
print("1Ô∏è‚É£ Hip√≥teses:")
print("   H‚ÇÄ: Œº ‚â§ 25 (gastos s√£o no m√°ximo R$ 25,00)")
print("   H‚ÇÅ: Œº > 25 (gastos s√£o maiores que R$ 25,00)")
print()

# 2. Tipo de teste
print("2Ô∏è‚É£ Tipo de teste: UNILATERAL DIREITO")
print("   Justificativa: Temos suspeita espec√≠fica de que gastam MAIS")
print()

# 3. Executando o teste
resultado_cafe = teste_hipotese_completo(gastos_cafeteria, mu_0=25, alpha=0.05, teste='maior')

print(f"\nüí° Interpreta√ß√£o:")
if resultado_cafe['significativo'] == 'Sim':
    print(f"   ‚úÖ H√° evid√™ncia estat√≠stica suficiente para afirmar que")
    print(f"      os clientes gastam mais que R$ 25,00 por visita!")
else:
    print(f"   ‚ùå N√£o h√° evid√™ncia estat√≠stica suficiente para afirmar que")
    print(f"      os clientes gastam mais que R$ 25,00 por visita.")

## üìà Outros Testes Importantes: Al√©m do Teste t

O teste t √© **maneiro**, mas n√£o √© o √∫nico! Vamos ver outros testes importantes:

### 1. Teste Z (Para Amostras Grandes):
Quando $n \geq 30$ e conhecemos $\sigma$ populacional:

$$Z = \frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}$$

### 2. Teste Chi-Quadrado (Para Vari√¢ncias):
Para testar se a vari√¢ncia populacional √© igual a um valor espec√≠fico:

$$\chi^2 = \frac{(n-1)s^2}{\sigma_0^2}$$

### 3. Teste de Propor√ß√£o:
Para testar propor√ß√µes (ex: % de aprova√ß√£o):

$$Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$

### Quando usar cada um?
- **Teste t**: M√©dias com œÉ desconhecido (mais comum)
- **Teste Z**: M√©dias com œÉ conhecido ou n muito grande
- **Chi-quadrado**: Vari√¢ncias ou testes de independ√™ncia
- **Propor√ß√£o**: Percentuais, taxas, probabilidades

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-08_img_04.png)

In [None]:
# Exemplo pr√°tico: Teste de Propor√ß√£o
# Cen√°rio: Uma empresa diz que 80% dos clientes est√£o satisfeitos
# Pesquisa: 250 clientes, 190 satisfeitos

def teste_proporcao(sucessos, n, p0, alpha=0.05, teste='bilateral'):
    """
    Realiza teste de hip√≥tese para propor√ß√£o
    """
    # Propor√ß√£o amostral
    p_hat = sucessos / n
    
    # Estat√≠stica Z
    z_stat = (p_hat - p0) / np.sqrt(p0 * (1 - p0) / n)
    
    # Valor-p
    if teste == 'bilateral':
        p_valor = 2 * (1 - norm.cdf(abs(z_stat)))
    elif teste == 'maior':
        p_valor = 1 - norm.cdf(z_stat)
    else:  # menor
        p_valor = norm.cdf(z_stat)
    
    # Decis√£o
    decisao = "Rejeitar H‚ÇÄ" if p_valor <= alpha else "N√£o rejeitar H‚ÇÄ"
    
    return {
        'p_amostral': p_hat,
        'z_estatistica': z_stat,
        'p_valor': p_valor,
        'decisao': decisao
    }

# Dados do problema
clientes_satisfeitos = 190
total_clientes = 250
proporcao_alegada = 0.80

print("üìä TESTE DE PROPOR√á√ÉO: Satisfa√ß√£o do Cliente")
print("="*50)
print(f"Amostra: {clientes_satisfeitos}/{total_clientes} clientes satisfeitos")
print(f"Propor√ß√£o amostral: {clientes_satisfeitos/total_clientes:.3f} (76%)")
print(f"Alega√ß√£o da empresa: {proporcao_alegada:.3f} (80%)")
print()

print("Hip√≥teses:")
print(f"  H‚ÇÄ: p = 0.80 (80% dos clientes est√£o satisfeitos)")
print(f"  H‚ÇÅ: p ‚â† 0.80 (propor√ß√£o √© diferente de 80%)")
print()

# Executando o teste
resultado_prop = teste_proporcao(clientes_satisfeitos, total_clientes, proporcao_alegada)

print(f"Resultados:")
print(f"  Estat√≠stica Z: {resultado_prop['z_estatistica']:.4f}")
print(f"  Valor-p: {resultado_prop['p_valor']:.6f}")
print(f"  Decis√£o: {resultado_prop['decisao']}")

# Interpreta√ß√£o
if resultado_prop['p_valor'] <= 0.05:
    print(f"\n‚úÖ Conclus√£o: H√° evid√™ncia estat√≠stica de que a propor√ß√£o")
    print(f"   de clientes satisfeitos √© diferente de 80%.")
else:
    print(f"\n‚ùå Conclus√£o: N√£o h√° evid√™ncia estat√≠stica suficiente para")
    print(f"   afirmar que a propor√ß√£o √© diferente de 80%.")

## ‚ö†Ô∏è Cuidados e Interpreta√ß√µes: Evitando Pegadinhas

T√°, agora vamos para a parte **crucial**: como N√ÉO cair nas pegadinhas dos testes de hip√≥tese!

### 1. O que o valor-p N√ÉO √©:
- ‚ùå **N√ÉO** √© a probabilidade de H‚ÇÄ ser verdadeira
- ‚ùå **N√ÉO** √© a probabilidade de ter cometido um erro
- ‚ùå **N√ÉO** √© o "tamanho" do efeito

### 2. O que "estatisticamente significativo" N√ÉO significa:
- ‚ùå **N√ÉO** significa "importante na pr√°tica"
- ‚ùå **N√ÉO** significa "grande diferen√ßa"
- ‚ùå **N√ÉO** significa "certeza absoluta"

### 3. Interpreta√ß√£o Correta:
- ‚úÖ "H√° evid√™ncia estat√≠stica suficiente para..."
- ‚úÖ "Os dados s√£o inconsistentes com H‚ÇÄ"
- ‚úÖ "Rejeitamos H‚ÇÄ ao n√≠vel de 5%"

### 4. Signific√¢ncia vs Import√¢ncia Pr√°tica:
Com amostras **muito grandes**, diferen√ßas **min√∫sculas** podem ser estatisticamente significativas, mas **irrelevantes** na pr√°tica!

### **Dica do Pedro**: 
Lembra da frase: "Todos os modelos est√£o errados, mas alguns s√£o √∫teis"? Com testes de hip√≥tese: "Toda H‚ÇÄ √© falsa, mas algumas s√£o √∫teis aproxima√ß√µes!"



In [None]:
# Demonstrando o problema da signific√¢ncia vs import√¢ncia pr√°tica
np.random.seed(789)

# Simulando dois cen√°rios: amostra pequena vs grande
print("üîç SIGNIFIC√ÇNCIA vs IMPORT√ÇNCIA PR√ÅTICA")
print("="*50)

# Cen√°rio 1: Amostra pequena, diferen√ßa grande
print("üìä Cen√°rio 1: Amostra Pequena (n=30)")
amostra_pequena = np.random.normal(loc=505, scale=100, size=30)  # Diferen√ßa de 5 pontos
t1, p1 = stats.ttest_1samp(amostra_pequena, 500)
print(f"   M√©dia amostral: {np.mean(amostra_pequena):.2f}")
print(f"   Diferen√ßa da H‚ÇÄ: {np.mean(amostra_pequena) - 500:.2f} pontos")
print(f"   Valor-p: {p1:.6f}")
print(f"   Significativo (Œ±=0.05): {'Sim' if p1 < 0.05 else 'N√£o'}")
print()

# Cen√°rio 2: Amostra grande, diferen√ßa pequena
print("üìä Cen√°rio 2: Amostra Grande (n=10000)")
amostra_grande = np.random.normal(loc=501, scale=100, size=10000)  # Diferen√ßa de apenas 1 ponto!
t2, p2 = stats.ttest_1samp(amostra_grande, 500)
print(f"   M√©dia amostral: {np.mean(amostra_grande):.2f}")
print(f"   Diferen√ßa da H‚ÇÄ: {np.mean(amostra_grande) - 500:.2f} pontos")
print(f"   Valor-p: {p2:.6f}")
print(f"   Significativo (Œ±=0.05): {'Sim' if p2 < 0.05 else 'N√£o'}")
print()

print("üí° LI√á√ÉO IMPORTANTE:")
print(f"   O Cen√°rio 2 √© estatisticamente significativo, mas a diferen√ßa")
print(f"   pr√°tica √© m√≠nima (apenas 1 ponto vs 5 pontos do Cen√°rio 1).")
print(f"   ")
print(f"   Sempre considere:")
print(f"   ‚Ä¢ Signific√¢ncia estat√≠stica (valor-p)")
print(f"   ‚Ä¢ Signific√¢ncia pr√°tica (tamanho do efeito)")
print(f"   ‚Ä¢ Contexto do problema")

# Visualizando a diferen√ßa
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gr√°fico 1: Amostra pequena
ax1.hist(amostra_pequena, bins=15, alpha=0.7, color='lightblue', edgecolor='black')
ax1.axvline(np.mean(amostra_pequena), color='red', linestyle='-', linewidth=2, 
           label=f'M√©dia = {np.mean(amostra_pequena):.1f}')
ax1.axvline(500, color='green', linestyle='--', linewidth=2, label='H‚ÇÄ: Œº = 500')
ax1.set_title(f'Amostra Pequena (n=30)\np-valor = {p1:.4f}')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Gr√°fico 2: Amostra grande
ax2.hist(amostra_grande, bins=50, alpha=0.7, color='lightcoral', edgecolor='black')
ax2.axvline(np.mean(amostra_grande), color='red', linestyle='-', linewidth=2, 
           label=f'M√©dia = {np.mean(amostra_grande):.1f}')
ax2.axvline(500, color='green', linestyle='--', linewidth=2, label='H‚ÇÄ: Œº = 500')
ax2.set_title(f'Amostra Grande (n=10000)\np-valor = {p2:.6f}')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## üéØ Exerc√≠cio Pr√°tico 2: An√°lise Completa

**Cen√°rio Real**: Voc√™ trabalha em uma empresa de delivery e quer saber se o tempo m√©dio de entrega mudou ap√≥s uma nova log√≠stica. 

**Dados Hist√≥ricos**: Tempo m√©dio = 35 minutos
**Nova Amostra**: 200 entregas ap√≥s a mudan√ßa

**Sua An√°lise Deve Incluir**:
1. Formula√ß√£o das hip√≥teses
2. An√°lise explorat√≥ria dos dados
3. Verifica√ß√£o das suposi√ß√µes do teste
4. Execu√ß√£o do teste apropriado
5. Interpreta√ß√£o dos resultados
6. Discuss√£o sobre signific√¢ncia pr√°tica

**Desafio Extra**: E se voc√™ quiser testar especificamente se o tempo **diminuiu**? Como isso mudaria sua an√°lise?

In [None]:
# Dados para o exerc√≠cio do delivery
np.random.seed(2024)

# Simulando tempos de entrega ap√≥s nova log√≠stica
# (Vamos simular uma melhoria real de ~3 minutos)
tempos_entrega = np.random.normal(loc=32, scale=8, size=200)

print("üöö EXERC√çCIO COMPLETO: An√°lise do Delivery")
print("="*50)
print(f"Contexto: Nova log√≠stica implementada")
print(f"Tempo hist√≥rico m√©dio: 35 minutos")
print(f"Amostra atual: {len(tempos_entrega)} entregas")
print()

# 1. AN√ÅLISE EXPLORAT√ìRIA
print("1Ô∏è‚É£ AN√ÅLISE EXPLORAT√ìRIA:")
print(f"   M√©dia: {np.mean(tempos_entrega):.2f} min")
print(f"   Mediana: {np.median(tempos_entrega):.2f} min")
print(f"   Desvio Padr√£o: {np.std(tempos_entrega, ddof=1):.2f} min")
print(f"   M√≠nimo: {np.min(tempos_entrega):.2f} min")
print(f"   M√°ximo: {np.max(tempos_entrega):.2f} min")
print()

# COMPLETE SUA AN√ÅLISE AQUI:
print("2Ô∏è‚É£ SUAS HIP√ìTESES:")
print("   H‚ÇÄ: _______________")
print("   H‚ÇÅ: _______________")
print()

print("3Ô∏è‚É£ TIPO DE TESTE ESCOLHIDO: _______________")
print()

print("4Ô∏è‚É£ EXECUTE O TESTE E INTERPRETE OS RESULTADOS!")

# Visualiza√ß√£o dos dados
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Histograma
ax1.hist(tempos_entrega, bins=20, alpha=0.7, color='lightgreen', edgecolor='black')
ax1.axvline(np.mean(tempos_entrega), color='red', linestyle='-', linewidth=2, 
           label=f'Nova M√©dia = {np.mean(tempos_entrega):.1f} min')
ax1.axvline(35, color='blue', linestyle='--', linewidth=2, 
           label='M√©dia Hist√≥rica = 35 min')
ax1.set_title('Distribui√ß√£o dos Tempos de Entrega')
ax1.set_xlabel('Tempo (minutos)')
ax1.set_ylabel('Frequ√™ncia')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Box plot
ax2.boxplot(tempos_entrega, vert=True)
ax2.axhline(35, color='blue', linestyle='--', linewidth=2, 
           label='M√©dia Hist√≥rica = 35 min')
ax2.set_title('Box Plot - Tempos de Entrega')
ax2.set_ylabel('Tempo (minutos)')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# SOLU√á√ÉO COMPLETA DO EXERC√çCIO DO DELIVERY
print("üöö SOLU√á√ÉO COMPLETA: An√°lise do Delivery")
print("="*50)

# 2. Hip√≥teses
print("2Ô∏è‚É£ HIP√ìTESES:")
print("   H‚ÇÄ: Œº = 35 (tempo m√©dio n√£o mudou)")
print("   H‚ÇÅ: Œº ‚â† 35 (tempo m√©dio mudou) - TESTE BILATERAL")
print()
print("   Alternativa para teste unilateral:")
print("   H‚ÇÄ: Œº ‚â• 35 (tempo n√£o diminuiu)")
print("   H‚ÇÅ: Œº < 35 (tempo diminuiu) - TESTE UNILATERAL ESQUERDO")
print()

# 3. Teste bilateral
print("3Ô∏è‚É£ TESTE BILATERAL:")
resultado_delivery_bi = teste_hipotese_completo(tempos_entrega, mu_0=35, alpha=0.05, teste='bilateral')
print()

# 4. Teste unilateral (se quisermos testar se diminuiu)
print("4Ô∏è‚É£ TESTE UNILATERAL (H‚ÇÅ: Œº < 35):")
resultado_delivery_uni = teste_hipotese_completo(tempos_entrega, mu_0=35, alpha=0.05, teste='menor')
print()

# 5. An√°lise da signific√¢ncia pr√°tica
diferenca_pratica = np.mean(tempos_entrega) - 35
print("5Ô∏è‚É£ SIGNIFIC√ÇNCIA PR√ÅTICA:")
print(f"   Diferen√ßa observada: {diferenca_pratica:.2f} minutos")
print(f"   Percentual de melhoria: {abs(diferenca_pratica)/35*100:.1f}%")
print()
if abs(diferenca_pratica) >= 2:
    print("   ‚úÖ A diferen√ßa parece ter import√¢ncia pr√°tica!")
    print("      Uma redu√ß√£o de ~3 minutos pode impactar satisfa√ß√£o.")
else:
    print("   ‚ö†Ô∏è A diferen√ßa pode n√£o ter import√¢ncia pr√°tica significativa.")

print()
print("6Ô∏è‚É£ CONCLUS√ÉO FINAL:")
if resultado_delivery_bi['significativo'] == 'Sim':
    print("   ‚úÖ H√° evid√™ncia estat√≠stica forte de que a nova log√≠stica")
    print("      alterou o tempo m√©dio de entrega.")
    if diferenca_pratica < 0:
        print("   üöÄ Especificamente, os dados sugerem uma MELHORIA!")
        print(f"      Redu√ß√£o m√©dia: {abs(diferenca_pratica):.1f} minutos")
else:
    print("   ‚ùå N√£o h√° evid√™ncia estat√≠stica suficiente de mudan√ßa")
    print("      no tempo m√©dio de entrega.")

## üîó Conex√µes com o Curso: Juntando os Pontos

**Liiindo!** Agora vamos conectar tudo que vimos at√© agora:

### M√≥dulos Anteriores que Usamos:

**M√≥dulo 1 (Medidas de Centralidade)**:
- M√©dia amostral ($\bar{x}$) √© nosso estimador principal
- Desvio padr√£o (s) mede a variabilidade dos dados

**M√≥dulo 2 (Distribui√ß√µes)**:
- Distribui√ß√£o Normal: base dos nossos testes
- Distribui√ß√£o t-Student: quando œÉ √© desconhecido

**M√≥dulo 7 (Amostragem e TLC)**:
- Teorema do Limite Central: $\bar{X} \sim N(\mu, \sigma^2/n)$
- Erro padr√£o: $SE = \frac{s}{\sqrt{n}}$

### Preparando para os Pr√≥ximos M√≥dulos:

**M√≥dulo 9 (Intervalos de Confian√ßa)**:
- Teste de hip√≥tese e IC s√£o **duas faces da mesma moeda**
- Se Œº‚ÇÄ estiver fora do IC 95%, rejeitamos H‚ÇÄ (Œ± = 0.05)

**M√≥dulo 10 (Valida√ß√£o de Modelos)**:
- Testes de hip√≥tese para avaliar performance de modelos
- Comparar acur√°cias, testar diferen√ßas entre modelos

```mermaid
graph LR
    A[M√≥dulo 7: TLC] --> B[M√≥dulo 8: Testes]
    B --> C[M√≥dulo 9: IC]
    B --> D[M√≥dulo 10: Valida√ß√£o]
    E[M√≥dulo 2: Distribui√ß√µes] --> B
    F[M√≥dulo 1: Estat√≠sticas] --> B
```

In [None]:
# Demonstrando a conex√£o entre Testes de Hip√≥tese e Intervalos de Confian√ßa
from scipy import stats

# Usando os dados do ENEM novamente
print("üîó CONEX√ÉO: Testes de Hip√≥tese ‚Üî Intervalos de Confian√ßa")
print("="*60)

# Dados do teste
media = np.mean(notas_enem)
desvio = np.std(notas_enem, ddof=1)
n = len(notas_enem)
alpha = 0.05

# Teste de hip√≥tese (j√° fizemos)
t_stat = (media - 500) / (desvio / np.sqrt(n))
p_valor = 2 * (1 - stats.t.cdf(abs(t_stat), n-1))

# Intervalo de confian√ßa (pr√©via do M√≥dulo 9!)
t_critico = stats.t.ppf(1 - alpha/2, n-1)
margem_erro = t_critico * (desvio / np.sqrt(n))
ic_inferior = media - margem_erro
ic_superior = media + margem_erro

print(f"üìä TESTE DE HIP√ìTESE (H‚ÇÄ: Œº = 500):")
print(f"   Estat√≠stica t: {t_stat:.4f}")
print(f"   Valor-p: {p_valor:.6f}")
print(f"   Decis√£o: {'Rejeitar H‚ÇÄ' if p_valor < alpha else 'N√£o rejeitar H‚ÇÄ'}")
print()

print(f"üìè INTERVALO DE CONFIAN√áA 95%:")
print(f"   IC: [{ic_inferior:.2f}, {ic_superior:.2f}]")
print(f"   500 est√° no IC? {'N√£o' if 500 < ic_inferior or 500 > ic_superior else 'Sim'}")
print()

print(f"üéØ CONEX√ÉO M√ÅGICA:")
if p_valor < alpha:
    print(f"   ‚Ä¢ Rejeitamos H‚ÇÄ (p < 0.05)")
    print(f"   ‚Ä¢ 500 N√ÉO est√° no IC 95%")
    print(f"   ‚û°Ô∏è Ambos chegam √† MESMA conclus√£o!")
else:
    print(f"   ‚Ä¢ N√£o rejeitamos H‚ÇÄ (p ‚â• 0.05)")
    print(f"   ‚Ä¢ 500 EST√Å no IC 95%")
    print(f"   ‚û°Ô∏è Ambos chegam √† MESMA conclus√£o!")

# Visualiza√ß√£o da conex√£o
fig, ax = plt.subplots(figsize=(12, 6))

# Plotando o IC
ax.errorbar(media, 0, xerr=margem_erro, fmt='o', capsize=10, capthick=3, 
           color='blue', markersize=8, linewidth=3, label=f'IC 95%: [{ic_inferior:.1f}, {ic_superior:.1f}]')

# Marcando pontos importantes
ax.axvline(500, color='red', linestyle='--', linewidth=2, label='H‚ÇÄ: Œº = 500')
ax.axvline(media, color='green', linestyle='-', linewidth=2, label=f'M√©dia Amostral: {media:.1f}')

# Configura√ß√µes do gr√°fico
ax.set_xlim(ic_inferior - 10, ic_superior + 10)
ax.set_ylim(-0.5, 0.5)
ax.set_xlabel('Nota ENEM')
ax.set_title('Conex√£o: Teste de Hip√≥tese ‚Üî Intervalo de Confian√ßa')
ax.legend()
ax.grid(True, alpha=0.3)

# Removendo y-axis (n√£o √© relevante aqui)
ax.set_yticks([])

plt.tight_layout()
plt.show()

## üéì Resumo e Pr√≥ximos Passos

**Parab√©ns!** üéâ Voc√™ dominou os **Testes de Hip√≥tese**! 

### üéØ O que Aprendemos Hoje:

1. **Conceitos Fundamentais**:
   - H‚ÇÄ (hip√≥tese nula) vs H‚ÇÅ (hip√≥tese alternativa)
   - Estat√≠stica de teste e sua distribui√ß√£o
   - Valor-p e sua interpreta√ß√£o correta

2. **Tipos de Teste**:
   - Bilateral: Œº ‚â† Œº‚ÇÄ
   - Unilateral direito: Œº > Œº‚ÇÄ  
   - Unilateral esquerdo: Œº < Œº‚ÇÄ

3. **Diferentes Testes**:
   - Teste t (m√©dias, œÉ desconhecido)
   - Teste Z (m√©dias, œÉ conhecido)
   - Teste de propor√ß√£o

4. **Interpreta√ß√£o Cuidadosa**:
   - Signific√¢ncia estat√≠stica ‚â† Import√¢ncia pr√°tica
   - Erro Tipo I vs Erro Tipo II
   - Limita√ß√µes e cuidados

### üöÄ Prepara√ß√£o para o M√≥dulo 9:
No pr√≥ximo m√≥dulo vamos ver **Intervalos de Confian√ßa** - a outra face da moeda dos testes de hip√≥tese!

### üîß Para Casa:
Pratique com dados reais! Pegue qualquer dataset e formule suas pr√≥prias hip√≥teses.

### **Dica Final do Pedro**: 
Teste de hip√≥tese √© como ser detetive: voc√™ nunca "prova" que o suspeito √© culpado, apenas re√∫ne evid√™ncias suficientes para uma decis√£o confiante. **Bora** para o pr√≥ximo caso! üïµÔ∏è‚Äç‚ôÇÔ∏è



In [None]:
# Fun√ß√£o final: Resumo visual de tudo que aprendemos
def resumo_visual_testes():
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
    
    # 1. Distribui√ß√£o t e regi√µes cr√≠ticas
    x = np.linspace(-4, 4, 1000)
    y = stats.t.pdf(x, df=30)
    
    ax1.plot(x, y, 'b-', linewidth=2, label='Distribui√ß√£o t')
    ax1.fill_between(x[x <= -1.96], stats.t.pdf(x[x <= -1.96], 30), 
                    alpha=0.3, color='red', label='Regi√£o cr√≠tica')
    ax1.fill_between(x[x >= 1.96], stats.t.pdf(x[x >= 1.96], 30), 
                    alpha=0.3, color='red')
    ax1.set_title('Teste Bilateral (Œ± = 0.05)')
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # 2. Rela√ß√£o entre n e poder do teste
    tamanhos_amostra = np.array([10, 30, 50, 100, 200, 500])
    poder_teste = 1 - stats.norm.cdf(1.96 - 0.5 * np.sqrt(tamanhos_amostra) / 10)
    
    ax2.plot(tamanhos_amostra, poder_teste, 'ro-', linewidth=2, markersize=6)
    ax2.set_xlabel('Tamanho da Amostra (n)')
    ax2.set_ylabel('Poder do Teste')
    ax2.set_title('Poder do Teste vs Tamanho da Amostra')
    ax2.grid(True, alpha=0.3)
    ax2.set_ylim(0, 1)
    
    # 3. Tipos de erro
    categorias = ['Erro Tipo I\n(Œ±)', 'Erro Tipo II\n(Œ≤)', 'Decis√£o\nCorreta']
    valores = [0.05, 0.20, 0.75]
    cores = ['red', 'orange', 'green']
    
    ax3.bar(categorias, valores, color=cores, alpha=0.7)
    ax3.set_ylabel('Probabilidade')
    ax3.set_title('Tipos de Erro em Testes de Hip√≥tese')
    ax3.set_ylim(0, 1)
    for i, v in enumerate(valores):
        ax3.text(i, v + 0.02, f'{v:.2f}', ha='center', va='bottom')
    ax3.grid(True, alpha=0.3)
    
    # 4. Evolu√ß√£o do valor-p com diferentes efeitos
    efeitos = np.linspace(0, 1, 50)
    p_valores = 2 * (1 - stats.norm.cdf(efeitos * np.sqrt(100)))
    
    ax4.plot(efeitos, p_valores, 'purple', linewidth=3)
    ax4.axhline(0.05, color='red', linestyle='--', linewidth=2, label='Œ± = 0.05')
    ax4.axhline(0.01, color='orange', linestyle='--', linewidth=2, label='Œ± = 0.01')
    ax4.set_xlabel('Tamanho do Efeito')
    ax4.set_ylabel('Valor-p')
    ax4.set_title('Valor-p vs Tamanho do Efeito (n=100)')
    ax4.legend()
    ax4.grid(True, alpha=0.3)
    ax4.set_yscale('log')
    
    plt.tight_layout()
    plt.show()

# Executando o resumo visual
print("üìä RESUMO VISUAL: Conceitos Principais dos Testes de Hip√≥tese")
print("="*60)
resumo_visual_testes()

print("\nüéØ F√ìRMULAS PRINCIPAIS PARA LEMBRAR:")
print("   ‚Ä¢ Estat√≠stica t: t = (xÃÑ - Œº‚ÇÄ) / (s/‚àön)")
print("   ‚Ä¢ Valor-p bilateral: p = 2 √ó P(T ‚â• |t|)")
print("   ‚Ä¢ Erro padr√£o: SE = s/‚àön")
print("   ‚Ä¢ Graus de liberdade: gl = n - 1")

print("\nüöÄ PR√ìXIMO: M√≥dulo 9 - Intervalos de Confian√ßa!")
print("   Onde vamos descobrir n√£o apenas SE algo √© diferente,")
print("   mas ONDE provavelmente est√° o valor verdadeiro!")