# 📘 Roteiro de Estudo — Distribuição Qui-quadrado (χ²)
### 🎯 Objetivo Geral
Compreender a distribuição Qui-quadrado e suas principais aplicações em inferência estatística:
- Testes de aderência (bondade de ajuste);
- Testes de independência;
- Inferência sobre variância.

## 🧠 Intuição da Distribuição Qui-quadrado
Seja $Z_1, Z_2, ..., Z_k$ variáveis independentes com $Z_i \sim \mathcal{N}(0,1)$. Então:
$$ \chi^2_k = Z_1^2 + Z_2^2 + \cdots + Z_k^2 $$
A distribuição Qui-quadrado com $k$ graus de liberdade é assimétrica à direita, mas se torna mais simétrica com o aumento de $k$.

## 🧪 Atividade 1: Visualização da Distribuição Qui-quadrado

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import chi2

gls = [1, 2, 3, 5, 10, 20]
x = np.linspace(0, 40, 500)

plt.figure(figsize=(10, 6))
for df in gls:
    plt.plot(x, chi2.pdf(x, df), label=f"k = {df}")
plt.title("Distribuição Qui-quadrado para diferentes graus de liberdade")
plt.xlabel("x")
plt.ylabel("Densidade de probabilidade")
plt.legend()
plt.grid(True)
plt.show()

### ✅ Respostas
1. Aumentar os graus de liberdade desloca o pico da distribuição para a direita e a curva torna-se mais simétrica.
2. Para $k \geq 10$ a distribuição se aproxima de uma forma mais parecida com uma curva normal.

## 📏 Atividade 2: Teste de Aderência

In [None]:
from scipy.stats import chisquare

observado = np.array([8, 10, 9, 7, 11, 5])
esperado = np.array([8.33] * 6)

stat, p_valor = chisquare(f_obs=observado, f_exp=esperado)
print(f"Estatística do teste: {stat:.2f}")
print(f"Valor-p: {p_valor:.4f}")

### ✅ Respostas
1. $H_0$: As frequências seguem uma distribuição uniforme. $H_1$: As frequências não seguem uma distribuição uniforme.
2. Se o valor-p for menor que 0,05, rejeitamos $H_0$.
3. O valor-p indica se há evidência suficiente para concluir que a roleta é viciada.

## 🔢 Atividade 3: Tabelas de Contingência

In [None]:
import pandas as pd
from scipy.stats import chi2_contingency

tabela = pd.DataFrame([[20, 30, 10], [25, 35, 5]])
chi2_stat, p_valor, dof, esperados = chi2_contingency(tabela)

print(f"Estatística do teste: {chi2_stat:.2f}")
print(f"Graus de liberdade: {dof}")
print(f"Valor-p: {p_valor:.4f}")

### ✅ Respostas
1. $H_0$: As variáveis são independentes. $H_1$: As variáveis são associadas.
2. Um valor-p pequeno rejeita $H_0$, sugerindo associação.
3. Para saber qual célula contribuiu mais, devemos examinar os resíduos padronizados ou comparar $\frac{(O - E)^2}{E}$ de cada célula.

## 📚 Resumo e Discussão
| Aplicação                         | Hipótese nula                          | Estatística                          |
|----------------------------------|----------------------------------------|--------------------------------------|
| Aderência                        | Distribuição dos dados é a esperada    | $\sum \frac{(O - E)^2}{E}$           |
| Independência em tabelas         | As variáveis são independentes         | $\sum \frac{(O - E)^2}{E}$           |
| Inferência sobre variância       | $\sigma^2 = \sigma_0^2$                | $\frac{(n-1)S^2}{\sigma_0^2}$        |