# üî¨ Exerc√≠cios Pr√°ticos: Teste de Hip√≥teses

Este notebook cont√©m exerc√≠cios pr√°ticos sobre testes de hip√≥teses estat√≠sticos, incluindo testes t, qui-quadrado e ANOVA.

## Refer√™ncias Te√≥ricas

Os exerc√≠cios s√£o baseados em:
- **Montgomery, D.C.; Runger, G.C. (2018).** *Applied Statistics and Probability for Engineers*. 7. ed. Hoboken: Wiley.
- **Field, A. (2018).** *Discovering Statistics Using IBM SPSS Statistics*. 5. ed. London: SAGE.
- **Cohen, J. (1988).** *Statistical Power Analysis for the Behavioral Sciences*. 2. ed. Hillsdale: LEA.

In [None]:
# Bibliotecas necess√°rias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import norm, t as t_dist, chi2, f as f_dist
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
np.random.seed(42)

## Exerc√≠cio 1: Teste t para Uma Amostra

### Problema
Uma f√°brica afirma que seus parafusos t√™m di√¢metro m√©dio de 8mm. Um inspetor coleta 25 parafusos e mede os di√¢metros. Testar se a m√©dia populacional √© realmente 8mm.

### Fundamento Te√≥rico
O **teste t de Student** (Gosset, 1908) √© usado quando:
- A vari√¢ncia populacional √© desconhecida
- A amostra √© pequena (n < 30) ou popula√ß√£o √© normal

Estat√≠stica de teste:
$$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

onde $\bar{x}$ √© a m√©dia amostral, $\mu_0$ √© o valor hipot√©tico, $s$ √© o desvio padr√£o amostral, e $n$ √© o tamanho da amostra.

**Refer√™ncia:** Montgomery & Runger (2018), Cap√≠tulo 9.

In [None]:
# Solu√ß√£o do Exerc√≠cio 1

# Dados simulados
np.random.seed(123)
n = 25
mu_real = 8.05  # M√©dia real (ligeiramente diferente do especificado)
diametros = np.random.normal(mu_real, 0.15, n)

# Hip√≥teses
mu_0 = 8.0  # Valor especificado
alpha = 0.05

print("="*70)
print("TESTE T PARA UMA AMOSTRA")
print("="*70)
print(f"\nH‚ÇÄ: Œº = {mu_0}mm (m√©dia √© {mu_0}mm como especificado)")
print(f"H‚ÇÅ: Œº ‚â† {mu_0}mm (m√©dia √© diferente de {mu_0}mm)")
print(f"\nN√≠vel de signific√¢ncia: Œ± = {alpha}")

# Estat√≠sticas descritivas
x_bar = diametros.mean()
s = diametros.std(ddof=1)
se = s / np.sqrt(n)

print(f"\n--- Dados da Amostra ---")
print(f"Tamanho (n): {n}")
print(f"M√©dia amostral (xÃÑ): {x_bar:.4f} mm")
print(f"Desvio padr√£o (s): {s:.4f} mm")
print(f"Erro padr√£o (SE): {se:.4f} mm")

# Calcular estat√≠stica t
t_calculado = (x_bar - mu_0) / se
gl = n - 1  # graus de liberdade

# Valor cr√≠tico e p-valor
t_critico = t_dist.ppf(1 - alpha/2, gl)
p_valor = 2 * (1 - t_dist.cdf(abs(t_calculado), gl))

print(f"\n--- Teste de Hip√≥tese ---")
print(f"Estat√≠stica t: {t_calculado:.4f}")
print(f"Graus de liberdade: {gl}")
print(f"Valor cr√≠tico (bilateral): ¬±{t_critico:.4f}")
print(f"Valor-p: {p_valor:.4f}")

# Decis√£o
print(f"\n--- Decis√£o ---")
if p_valor < alpha:
    print(f"‚úó p-valor ({p_valor:.4f}) < Œ± ({alpha})")
    print(f"   REJEITAMOS H‚ÇÄ")
    print(f"   Conclus√£o: H√° evid√™ncia significativa de que a m√©dia √© diferente de {mu_0}mm")
else:
    print(f"‚úì p-valor ({p_valor:.4f}) ‚â• Œ± ({alpha})")
    print(f"   N√ÉO REJEITAMOS H‚ÇÄ")
    print(f"   Conclus√£o: N√£o h√° evid√™ncia suficiente para dizer que a m√©dia difere de {mu_0}mm")

# Intervalo de confian√ßa
ic_lower = x_bar - t_critico * se
ic_upper = x_bar + t_critico * se
print(f"\nIntervalo de Confian√ßa 95%: [{ic_lower:.4f}, {ic_upper:.4f}]")

# Tamanho do efeito (d de Cohen)
d_cohen = (x_bar - mu_0) / s
print(f"\nTamanho do efeito (d de Cohen): {d_cohen:.4f}")
if abs(d_cohen) < 0.2:
    tamanho = "pequeno"
elif abs(d_cohen) < 0.5:
    tamanho = "m√©dio"
else:
    tamanho = "grande"
print(f"Interpreta√ß√£o: Efeito {tamanho} (Cohen, 1988)")

# Verificar com scipy
t_stat_scipy, p_valor_scipy = stats.ttest_1samp(diametros, mu_0)
print(f"\n--- Verifica√ß√£o com scipy.stats ---")
print(f"t = {t_stat_scipy:.4f}, p = {p_valor_scipy:.4f} ‚úì")

# Visualiza√ß√£o
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gr√°fico 1: Distribui√ß√£o dos dados
axes[0].hist(diametros, bins=10, alpha=0.7, color='skyblue', edgecolor='black')
axes[0].axvline(x_bar, color='blue', linestyle='--', linewidth=2, label=f'M√©dia amostral: {x_bar:.3f}')
axes[0].axvline(mu_0, color='red', linestyle='--', linewidth=2, label=f'Valor hipot√©tico: {mu_0}')
axes[0].set_xlabel('Di√¢metro (mm)', fontsize=11)
axes[0].set_ylabel('Frequ√™ncia', fontsize=11)
axes[0].set_title('Distribui√ß√£o dos Di√¢metros', fontsize=12, fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Gr√°fico 2: Distribui√ß√£o t e regi√£o de rejei√ß√£o
x = np.linspace(-4, 4, 1000)
y = t_dist.pdf(x, gl)
axes[1].plot(x, y, 'b-', linewidth=2, label='Distribui√ß√£o t')
axes[1].axvline(t_calculado, color='red', linestyle='--', linewidth=2, label=f't calculado: {t_calculado:.3f}')
axes[1].axvline(-t_critico, color='green', linestyle=':', linewidth=1.5, label=f't cr√≠tico: ¬±{t_critico:.3f}')
axes[1].axvline(t_critico, color='green', linestyle=':', linewidth=1.5)

# Regi√£o de rejei√ß√£o
x_left = x[x < -t_critico]
x_right = x[x > t_critico]
axes[1].fill_between(x_left, t_dist.pdf(x_left, gl), alpha=0.3, color='red', label='Regi√£o de rejei√ß√£o')
axes[1].fill_between(x_right, t_dist.pdf(x_right, gl), alpha=0.3, color='red')

axes[1].set_xlabel('Estat√≠stica t', fontsize=11)
axes[1].set_ylabel('Densidade', fontsize=11)
axes[1].set_title(f'Teste t (gl={gl}, Œ±={alpha})', fontsize=12, fontweight='bold')
axes[1].legend(fontsize=9)
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## Exerc√≠cio 2: Teste t para Duas Amostras Independentes

### Problema
Comparar o desempenho m√©dio de dois grupos de estudantes: um que recebeu tutoria online e outro que teve aulas presenciais.

### Fundamento Te√≥rico
O **teste t para amostras independentes** compara as m√©dias de dois grupos n√£o relacionados.

Estat√≠stica de teste (vari√¢ncias iguais):
$$t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$$

onde $s_p$ √© o desvio padr√£o combinado (pooled).

**Refer√™ncia:** Field (2018), Cap√≠tulo 10.

In [None]:
# Solu√ß√£o do Exerc√≠cio 2

# Dados simulados
np.random.seed(456)
grupo_online = np.random.normal(75, 10, 30)
grupo_presencial = np.random.normal(80, 10, 30)

# Hip√≥teses
alpha = 0.05

print("="*70)
print("TESTE T PARA DUAS AMOSTRAS INDEPENDENTES")
print("="*70)
print(f"\nH‚ÇÄ: Œº‚ÇÅ = Œº‚ÇÇ (m√©dias s√£o iguais)")
print(f"H‚ÇÅ: Œº‚ÇÅ ‚â† Œº‚ÇÇ (m√©dias s√£o diferentes)")
print(f"\nN√≠vel de signific√¢ncia: Œ± = {alpha}")

# Estat√≠sticas descritivas
print(f"\n--- Estat√≠sticas Descritivas ---")
print(f"\nGrupo Online:")
print(f"  n‚ÇÅ = {len(grupo_online)}")
print(f"  xÃÑ‚ÇÅ = {grupo_online.mean():.2f}")
print(f"  s‚ÇÅ = {grupo_online.std(ddof=1):.2f}")

print(f"\nGrupo Presencial:")
print(f"  n‚ÇÇ = {len(grupo_presencial)}")
print(f"  xÃÑ‚ÇÇ = {grupo_presencial.mean():.2f}")
print(f"  s‚ÇÇ = {grupo_presencial.std(ddof=1):.2f}")

# Teste de Levene para homogeneidade de vari√¢ncias
stat_levene, p_levene = stats.levene(grupo_online, grupo_presencial)
print(f"\n--- Teste de Levene (Homogeneidade de Vari√¢ncias) ---")
print(f"Estat√≠stica: {stat_levene:.4f}")
print(f"p-valor: {p_levene:.4f}")

if p_levene > 0.05:
    print("‚úì Vari√¢ncias homog√™neas (usar teste t padr√£o)")
    equal_var = True
else:
    print("‚úó Vari√¢ncias n√£o homog√™neas (usar corre√ß√£o de Welch)")
    equal_var = False

# Teste t
t_stat, p_valor = stats.ttest_ind(grupo_online, grupo_presencial, equal_var=equal_var)

print(f"\n--- Teste t para Amostras Independentes ---")
print(f"Estat√≠stica t: {t_stat:.4f}")
print(f"Valor-p: {p_valor:.4f}")

# Decis√£o
print(f"\n--- Decis√£o ---")
if p_valor < alpha:
    print(f"‚úó p-valor ({p_valor:.4f}) < Œ± ({alpha})")
    print(f"   REJEITAMOS H‚ÇÄ")
    print(f"   H√° diferen√ßa significativa entre os grupos")
else:
    print(f"‚úì p-valor ({p_valor:.4f}) ‚â• Œ± ({alpha})")
    print(f"   N√ÉO REJEITAMOS H‚ÇÄ")
    print(f"   N√£o h√° evid√™ncia de diferen√ßa significativa")

# Tamanho do efeito (d de Cohen)
mean_diff = grupo_presencial.mean() - grupo_online.mean()
pooled_std = np.sqrt(((len(grupo_online)-1)*grupo_online.var(ddof=1) + 
                       (len(grupo_presencial)-1)*grupo_presencial.var(ddof=1)) / 
                      (len(grupo_online) + len(grupo_presencial) - 2))
d_cohen = mean_diff / pooled_std

print(f"\nDiferen√ßa de m√©dias: {mean_diff:.2f}")
print(f"d de Cohen: {d_cohen:.4f}")
if abs(d_cohen) < 0.2:
    print("Tamanho do efeito: pequeno")
elif abs(d_cohen) < 0.5:
    print("Tamanho do efeito: m√©dio")
elif abs(d_cohen) < 0.8:
    print("Tamanho do efeito: m√©dio-grande")
else:
    print("Tamanho do efeito: grande")

# Visualiza√ß√£o
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gr√°fico 1: Boxplot
data_plot = pd.DataFrame({
    'Nota': np.concatenate([grupo_online, grupo_presencial]),
    'Grupo': ['Online']*len(grupo_online) + ['Presencial']*len(grupo_presencial)
})

sns.boxplot(x='Grupo', y='Nota', data=data_plot, ax=axes[0], palette='Set2')
sns.swarmplot(x='Grupo', y='Nota', data=data_plot, ax=axes[0], color='black', alpha=0.3, size=3)
axes[0].set_title('Compara√ß√£o de Desempenho', fontsize=12, fontweight='bold')
axes[0].set_ylabel('Nota', fontsize=11)
axes[0].grid(True, alpha=0.3, axis='y')

# Gr√°fico 2: Distribui√ß√µes
axes[1].hist(grupo_online, bins=15, alpha=0.5, label='Online', color='skyblue', edgecolor='black')
axes[1].hist(grupo_presencial, bins=15, alpha=0.5, label='Presencial', color='lightcoral', edgecolor='black')
axes[1].axvline(grupo_online.mean(), color='blue', linestyle='--', linewidth=2)
axes[1].axvline(grupo_presencial.mean(), color='red', linestyle='--', linewidth=2)
axes[1].set_xlabel('Nota', fontsize=11)
axes[1].set_ylabel('Frequ√™ncia', fontsize=11)
axes[1].set_title('Distribui√ß√£o das Notas', fontsize=12, fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## Exerc√≠cio 3: Teste Qui-Quadrado de Independ√™ncia

### Problema
Investigar se h√° associa√ß√£o entre g√™nero e prefer√™ncia por tipo de filme (a√ß√£o, romance, com√©dia).

### Fundamento Te√≥rico
O **teste qui-quadrado** (œá¬≤) de Pearson testa independ√™ncia entre vari√°veis categ√≥ricas:

$$\chi^2 = \sum_{i,j} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$$

onde $O_{ij}$ s√£o frequ√™ncias observadas e $E_{ij}$ s√£o frequ√™ncias esperadas sob independ√™ncia.

**Refer√™ncia:** Field (2018), Cap√≠tulo 18.

In [None]:
# Solu√ß√£o do Exerc√≠cio 3

# Dados: Tabela de conting√™ncia
dados = pd.DataFrame({
    'A√ß√£o': [45, 25],
    'Romance': [20, 50],
    'Com√©dia': [35, 25]
}, index=['Masculino', 'Feminino'])

print("="*70)
print("TESTE QUI-QUADRADO DE INDEPEND√äNCIA")
print("="*70)
print(f"\nH‚ÇÄ: G√™nero e prefer√™ncia de filme s√£o independentes")
print(f"H‚ÇÅ: G√™nero e prefer√™ncia de filme s√£o associados")
print(f"\nN√≠vel de signific√¢ncia: Œ± = 0.05")

# Frequ√™ncias observadas
print("\n--- Frequ√™ncias Observadas ---")
print(dados)
print(f"\nTotal: {dados.values.sum()}")

# Teste qui-quadrado
chi2_stat, p_valor, gl, freq_esperadas = stats.chi2_contingency(dados)

# Frequ√™ncias esperadas
print("\n--- Frequ√™ncias Esperadas (sob H‚ÇÄ) ---")
df_esperadas = pd.DataFrame(freq_esperadas, 
                             index=dados.index, 
                             columns=dados.columns)
print(df_esperadas.round(2))

# Resultados do teste
print(f"\n--- Teste Qui-Quadrado ---")
print(f"Estat√≠stica œá¬≤: {chi2_stat:.4f}")
print(f"Graus de liberdade: {gl}")
print(f"Valor-p: {p_valor:.4f}")

# Valor cr√≠tico
alpha = 0.05
chi2_critico = chi2.ppf(1-alpha, gl)
print(f"Valor cr√≠tico (Œ±=0.05): {chi2_critico:.4f}")

# Decis√£o
print(f"\n--- Decis√£o ---")
if p_valor < alpha:
    print(f"‚úó p-valor ({p_valor:.4f}) < Œ± ({alpha})")
    print(f"   REJEITAMOS H‚ÇÄ")
    print(f"   H√° associa√ß√£o significativa entre g√™nero e prefer√™ncia")
else:
    print(f"‚úì p-valor ({p_valor:.4f}) ‚â• Œ± ({alpha})")
    print(f"   N√ÉO REJEITAMOS H‚ÇÄ")
    print(f"   N√£o h√° evid√™ncia de associa√ß√£o")

# Res√≠duos padronizados
residuos = (dados.values - freq_esperadas) / np.sqrt(freq_esperadas)
df_residuos = pd.DataFrame(residuos, 
                            index=dados.index, 
                            columns=dados.columns)

print("\n--- Res√≠duos Padronizados ---")
print(df_residuos.round(2))
print("\nInterpreta√ß√£o: |res√≠duo| > 2 indica contribui√ß√£o forte para œá¬≤")

# Visualiza√ß√£o
fig, axes = plt.subplots(1, 3, figsize=(16, 4))

# Gr√°fico 1: Frequ√™ncias observadas
dados.plot(kind='bar', ax=axes[0], color=['#FF6B6B', '#4ECDC4', '#FFE66D'], edgecolor='black')
axes[0].set_title('Frequ√™ncias Observadas', fontsize=12, fontweight='bold')
axes[0].set_xlabel('G√™nero', fontsize=11)
axes[0].set_ylabel('Frequ√™ncia', fontsize=11)
axes[0].legend(title='Tipo de Filme', fontsize=9)
axes[0].set_xticklabels(axes[0].get_xticklabels(), rotation=0)
axes[0].grid(True, alpha=0.3, axis='y')

# Gr√°fico 2: Frequ√™ncias esperadas
df_esperadas.plot(kind='bar', ax=axes[1], color=['#FF6B6B', '#4ECDC4', '#FFE66D'], 
                   alpha=0.7, edgecolor='black')
axes[1].set_title('Frequ√™ncias Esperadas (sob H‚ÇÄ)', fontsize=12, fontweight='bold')
axes[1].set_xlabel('G√™nero', fontsize=11)
axes[1].set_ylabel('Frequ√™ncia', fontsize=11)
axes[1].legend(title='Tipo de Filme', fontsize=9)
axes[1].set_xticklabels(axes[1].get_xticklabels(), rotation=0)
axes[1].grid(True, alpha=0.3, axis='y')

# Gr√°fico 3: Heatmap de res√≠duos
sns.heatmap(df_residuos, annot=True, fmt='.2f', cmap='RdBu_r', center=0, 
             cbar_kws={'label': 'Res√≠duo Padronizado'}, ax=axes[2],
             vmin=-3, vmax=3, linewidths=1, linecolor='black')
axes[2].set_title('Res√≠duos Padronizados', fontsize=12, fontweight='bold')
axes[2].set_xlabel('Tipo de Filme', fontsize=11)
axes[2].set_ylabel('G√™nero', fontsize=11)

plt.tight_layout()
plt.show()

# Tamanho do efeito (V de Cram√©r)
n_total = dados.values.sum()
min_dim = min(dados.shape[0] - 1, dados.shape[1] - 1)
cramer_v = np.sqrt(chi2_stat / (n_total * min_dim))
print(f"\nV de Cram√©r: {cramer_v:.4f}")
if cramer_v < 0.1:
    print("Tamanho do efeito: muito pequeno")
elif cramer_v < 0.3:
    print("Tamanho do efeito: pequeno")
elif cramer_v < 0.5:
    print("Tamanho do efeito: m√©dio")
else:
    print("Tamanho do efeito: grande")

## Exerc√≠cio 4: ANOVA (An√°lise de Vari√¢ncia)

### Problema
Comparar o efeito de tr√™s diferentes fertilizantes no crescimento de plantas.

### Fundamento Te√≥rico
A **ANOVA** (Fisher, 1925) testa se h√° diferen√ßa entre m√©dias de tr√™s ou mais grupos:

$$F = \frac{MS_{between}}{MS_{within}} = \frac{SS_{between}/(k-1)}{SS_{within}/(N-k)}$$

onde $k$ √© o n√∫mero de grupos e $N$ √© o tamanho total da amostra.

**Refer√™ncia:** Montgomery & Runger (2018), Cap√≠tulo 13.

In [None]:
# Solu√ß√£o do Exerc√≠cio 4

# Dados simulados: Crescimento de plantas (cm) com 3 fertilizantes
np.random.seed(789)
fertilizante_A = np.random.normal(20, 3, 15)
fertilizante_B = np.random.normal(24, 3, 15)
fertilizante_C = np.random.normal(22, 3, 15)

# Criar DataFrame
df = pd.DataFrame({
    'Crescimento': np.concatenate([fertilizante_A, fertilizante_B, fertilizante_C]),
    'Fertilizante': ['A']*15 + ['B']*15 + ['C']*15
})

print("="*70)
print("ANOVA - AN√ÅLISE DE VARI√ÇNCIA")
print("="*70)
print(f"\nH‚ÇÄ: Œº_A = Œº_B = Œº_C (todas as m√©dias s√£o iguais)")
print(f"H‚ÇÅ: Pelo menos uma m√©dia √© diferente")
print(f"\nN√≠vel de signific√¢ncia: Œ± = 0.05")

# Estat√≠sticas descritivas
print("\n--- Estat√≠sticas Descritivas ---")
print(df.groupby('Fertilizante')['Crescimento'].describe().round(2))

# ANOVA
grupos = [fertilizante_A, fertilizante_B, fertilizante_C]
f_stat, p_valor = stats.f_oneway(*grupos)

print(f"\n--- ANOVA ---")
print(f"Estat√≠stica F: {f_stat:.4f}")
print(f"Valor-p: {p_valor:.4f}")

# Decis√£o
alpha = 0.05
print(f"\n--- Decis√£o ---")
if p_valor < alpha:
    print(f"‚úó p-valor ({p_valor:.4f}) < Œ± ({alpha})")
    print(f"   REJEITAMOS H‚ÇÄ")
    print(f"   H√° diferen√ßa significativa entre os fertilizantes")
else:
    print(f"‚úì p-valor ({p_valor:.4f}) ‚â• Œ± ({alpha})")
    print(f"   N√ÉO REJEITAMOS H‚ÇÄ")
    print(f"   N√£o h√° evid√™ncia de diferen√ßa entre os fertilizantes")

# Tamanho do efeito (eta¬≤)
grand_mean = df['Crescimento'].mean()
ss_total = ((df['Crescimento'] - grand_mean) ** 2).sum()
ss_between = sum([len(g) * (g.mean() - grand_mean)**2 for g in grupos])
eta_squared = ss_between / ss_total

print(f"\nEta¬≤ (Œ∑¬≤): {eta_squared:.4f}")
if eta_squared < 0.01:
    print("Tamanho do efeito: pequeno")
elif eta_squared < 0.06:
    print("Tamanho do efeito: m√©dio")
else:
    print("Tamanho do efeito: grande")

# Testes post-hoc (se ANOVA significativa)
if p_valor < alpha:
    print("\n--- Testes Post-Hoc (Tukey HSD) ---")
    from scipy.stats import tukey_hsd
    result = tukey_hsd(*grupos)
    print("\nCompara√ß√µes par a par:")
    comparacoes = [('A', 'B'), ('A', 'C'), ('B', 'C')]
    for i, (g1, g2) in enumerate(comparacoes):
        diff = abs(grupos[ord(g1)-ord('A')].mean() - grupos[ord(g2)-ord('A')].mean())
        print(f"  {g1} vs {g2}: diferen√ßa = {diff:.2f} cm")

# Visualiza√ß√£o
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gr√°fico 1: Boxplot
sns.boxplot(x='Fertilizante', y='Crescimento', data=df, ax=axes[0], palette='Set3')
sns.swarmplot(x='Fertilizante', y='Crescimento', data=df, ax=axes[0], color='black', alpha=0.4, size=4)
axes[0].set_title('Crescimento por Fertilizante', fontsize=12, fontweight='bold')
axes[0].set_ylabel('Crescimento (cm)', fontsize=11)
axes[0].grid(True, alpha=0.3, axis='y')

# Gr√°fico 2: M√©dias com IC
medias = df.groupby('Fertilizante')['Crescimento'].mean()
erros = df.groupby('Fertilizante')['Crescimento'].sem() * 1.96

axes[1].bar(medias.index, medias.values, alpha=0.7, color=['#FF6B6B', '#4ECDC4', '#FFE66D'], 
             edgecolor='black', linewidth=1.5)
axes[1].errorbar(medias.index, medias.values, yerr=erros.values, fmt='none', 
                  color='black', capsize=10, capthick=2)
axes[1].set_title('M√©dias com IC 95%', fontsize=12, fontweight='bold')
axes[1].set_ylabel('Crescimento m√©dio (cm)', fontsize=11)
axes[1].set_xlabel('Fertilizante', fontsize=11)
axes[1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

## üìö Resumo e Conclus√µes

### Conceitos-Chave Aprendidos

1. **Teste t para Uma Amostra**:
   - Compara m√©dia amostral com valor hipot√©tico
   - Usa distribui√ß√£o t de Student
   - Apropriado para amostras pequenas (n < 30)
   - Refer√™ncia: **Montgomery & Runger (2018)**

2. **Teste t para Amostras Independentes**:
   - Compara m√©dias de dois grupos n√£o relacionados
   - Verificar homogeneidade de vari√¢ncias (teste de Levene)
   - Calcular tamanho do efeito (d de Cohen)
   - Refer√™ncia: **Field (2018)**

3. **Teste Qui-Quadrado**:
   - Testa independ√™ncia entre vari√°veis categ√≥ricas
   - Compara frequ√™ncias observadas vs esperadas
   - V de Cram√©r mede for√ßa da associa√ß√£o
   - Refer√™ncia: **Field (2018)**

4. **ANOVA**:
   - Compara m√©dias de 3+ grupos
   - Particiona vari√¢ncia em componentes
   - Testes post-hoc identificam diferen√ßas espec√≠ficas
   - Refer√™ncia: **Montgomery & Runger (2018)**

### Boas Pr√°ticas

1. **Sempre verificar pressupostos**:
   - Normalidade (teste de Shapiro-Wilk, Q-Q plot)
   - Homogeneidade de vari√¢ncias (teste de Levene)
   - Independ√™ncia das observa√ß√µes

2. **Reportar completamente**:
   - Estat√≠stica de teste
   - Valor-p
   - Tamanho do efeito
   - Intervalos de confian√ßa

3. **Interpretar corretamente**:
   - p-valor N√ÉO √© a probabilidade de H‚ÇÄ ser verdadeira
   - Signific√¢ncia estat√≠stica ‚â† import√¢ncia pr√°tica
   - N√£o rejeitar H‚ÇÄ ‚â† aceitar H‚ÇÄ

### Escolha do Teste Apropriado

| Situa√ß√£o | Teste Apropriado |
|----------|------------------|
| Comparar m√©dia com valor fixo | Teste t uma amostra |
| Comparar 2 grupos independentes | Teste t independente |
| Comparar 2 grupos pareados | Teste t pareado |
| Comparar 3+ grupos | ANOVA |
| Vari√°veis categ√≥ricas | Qui-quadrado |
| Dados n√£o-normais | Testes n√£o-param√©tricos |

### Refer√™ncias Bibliogr√°ficas

**MONTGOMERY, Douglas C.; RUNGER, George C.** *Applied Statistics and Probability for Engineers*. 7. ed. Hoboken: Wiley, 2018.
- Refer√™ncia completa sobre testes de hip√≥teses aplicados

**FIELD, Andy.** *Discovering Statistics Using IBM SPSS Statistics*. 5. ed. London: SAGE Publications, 2018.
- Abordagem acess√≠vel com exemplos pr√°ticos

**COHEN, Jacob.** *Statistical Power Analysis for the Behavioral Sciences*. 2. ed. Hillsdale: Lawrence Erlbaum Associates, 1988.
- Refer√™ncia definitiva sobre tamanho do efeito e poder estat√≠stico

**WASSERSTEIN, Ronald L.; LAZAR, Nicole A.** The ASA Statement on p-Values: Context, Process, and Purpose. *The American Statistician*, v. 70, n. 2, p. 129-133, 2016.
- Guia oficial sobre interpreta√ß√£o de p-valores

**FISHER, Ronald A.** *Statistical Methods for Research Workers*. Edinburgh: Oliver and Boyd, 1925.
- Obra fundamental que introduziu ANOVA e testes de signific√¢ncia