# Estatística: Uma Jornada Didática

Bem-vindo ao universo da estatística! Prepare-se para uma aventura divertida e esclarecedora, onde cada conceito será apresentado de forma clara, objetiva e com exemplos práticos. Vamos juntos transformar números em conhecimento!

---

## 1. Fundamentos da Estatística

### 1.1 O que é Estatística?
A estatística é a ciência que coleta, organiza, analisa e interpreta dados para extrair informações e tomar decisões. Ela se divide em três grandes áreas:

- **Estatística Descritiva**: Resume e apresenta dados.
- **Estatística Probabilística**: Modela a incerteza usando probabilidades.
- **Estatística Inferencial**: Faz previsões e inferências sobre populações a partir de amostras.

### 1.2 Dados: A Matéria-Prima da Estatística

Os dados são registros de observações, medições ou respostas que descrevem características de fenômenos do mundo real.

**Características dos dados:**
- Origem: Experimentos, pesquisas, sensores, sistemas de informação.
- Formato: Numéricos (quantitativos) ou categóricos (qualitativos), estruturados ou não.
- Propósito: Análises, decisões, previsões, descoberta de padrões.
- Qualidade: Depende da precisão, completude e representatividade.

**Exemplo:**
| Nome | Idade | Gênero | Altura (cm) |
|------|-------|--------|-------------|
| Ana  | 23    | F      | 165         |
| João | 30    | M      | 178         |

### 1.3 População e Amostra
- **População**: Todos os elementos com uma característica comum.
- **Amostra**: Subconjunto representativo da população.

---

## 2. Classificação dos Dados

### 2.1 Tipos de Variáveis
- **Quantitativas**: Medidas numéricas (ex.: altura, peso, idade).
- **Qualitativas**: Categorias ou qualidades (ex.: cor dos olhos, gênero).

### 2.2 Tipos de Dados
- **Nominais**: Categóricos sem ordem (ex.: cores, gênero).
- **Ordinais**: Categóricos com ordem (ex.: níveis de satisfação).
- **Intervalares**: Numéricos com intervalos iguais, sem zero absoluto (ex.: temperatura em Celsius).
- **De Razão**: Numéricos com zero absoluto (ex.: peso, altura).

### 2.3 Estrutura dos Dados
- **Estruturados**: Tabelas (ex.: bancos de dados).
- **Não Estruturados**: Textos, imagens, vídeos.
- **Semi-Estruturados**: Alguma organização (ex.: JSON, XML).

---

## 3. Técnicas de Amostragem

A amostragem permite analisar uma parte da população para obter informações sem examinar todos os elementos.

### 3.1 Amostragem Aleatória Simples
Todos têm a mesma chance de serem escolhidos.
- Vantagem: Simples.
- Desvantagem: Pode ser ineficiente para populações grandes.

### 3.2 Amostragem Estratificada
Divide a população em grupos semelhantes (estratos) e seleciona amostras de cada um.
- Vantagem: Maior precisão.
- Desvantagem: Requer conhecimento prévio.

### 3.3 Amostragem por Conglomerados
Divide em grupos, seleciona alguns e inclui todos os elementos desses grupos.
- Vantagem: Reduz custos.
- Desvantagem: Pode introduzir viés.

### 3.4 Amostragem Sistemática
Seleciona elementos em intervalos regulares.
- Vantagem: Simples.
- Desvantagem: Pode haver viés se houver padrão.

### 3.5 Amostragem por Conveniência
Seleciona quem está mais acessível.
- Vantagem: Rápida e barata.
- Desvantagem: Alta chance de viés.

---

## 4. Distribuição de Frequências

Organiza e resume dados mostrando quantas vezes cada valor ou intervalo ocorre.

**Passos para criar uma distribuição de frequências:**
1. Coletar os dados.
2. Determinar intervalos de classe.
3. Contar as frequências.
4. Calcular frequências relativas.
5. Calcular frequências acumuladas.
6. Apresentar em tabela ou gráfico.

**Exemplo:**
| Valor | Frequência |
|-------|-----------|
| 5     | 2         |
| 10    | 3         |
| 15    | 5         |
| 20    | 4         |
| 25    | 1         |

---

## 5. Representações Gráficas

### 5.1 Histogramas
Gráfico de barras para dados quantitativos. As barras são adjacentes.

### 5.2 Gráficos de Barras
Para dados categóricos. Barras separadas.

### 5.3 Polígonos de Frequência
Conecta os pontos médios das barras do histograma.

### 5.4 Ogivas
Mostra a frequência acumulada.

### 5.5 Gráfico de Pareto
Combina barras e linha para mostrar frequência e impacto acumulado.

---

## 6. Medidas de Tendência Central

### 6.1 Média
Soma dos valores dividida pelo número de elementos.

**Fórmulas:**
- Média Populacional: $\mu = \frac{\sum x_i}{N}$
- Média Amostral: $\bar{x} = \frac{\sum x_i}{n}$

**Exemplo:**
Dados: 5, 10, 15, 20, 25
$$\bar{x} = \frac{5 + 10 + 15 + 20 + 25}{5} = 15$$

#### Média Ponderada
Cada valor tem um peso.
$$\bar{x}_p = \frac{\sum w_i x_i}{\sum w_i}$$

**Exemplo:**
Valores: 5, 10, 15, 20, 25 | Pesos: 1, 2, 3, 4, 5

#### Média para Distribuição de Frequências
$$\bar{x} = \frac{\sum f_i x_i}{\sum f_i}$$

**Exemplo:**
| Valor | Frequência |
|-------|-----------|
| 5     | 2         |
| 10    | 3         |
| 15    | 5         |
| 20    | 4         |
| 25    | 1         |

$$\bar{x} = \frac{220}{15} \approx 14.67$$

---

## 7. Medidas de Dispersão

### 7.1 Desvio Padrão
Indica o quanto os valores se afastam da média.

**Fórmulas:**
- Populacional: $\sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{N}}$
- Amostral: $s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n - 1}}$

**Exemplo:**
Dados: 5, 10, 15, 20, 25
$$s = \sqrt{\frac{250}{4}} \approx 7.91$$

#### Desvio Padrão para Dados Agrupados
$$s = \sqrt{\frac{\sum f_i (x_i - \bar{x})^2}{\sum f_i - 1}}$$

**Exemplo:**
| Valor | Frequência |
|-------|-----------|
| 5     | 2         |
| 10    | 3         |
| 15    | 5         |
| 20    | 4         |
| 25    | 1         |

$$s \approx 5.82$$

---

## 8. Probabilidade

A probabilidade quantifica a chance de ocorrência de eventos.

### 8.1 Conceitos Básicos
- **Experimento Aleatório**: Resultado incerto (ex.: lançar um dado).
- **Espaço Amostral**: Todos os resultados possíveis.
- **Evento**: Subconjunto do espaço amostral.
- **Probabilidade**: $P(A) = \frac{\text{resultados favoráveis}}{\text{total de resultados}}$

### 8.2 Propriedades
1. Não Negatividade: $P(A) \geq 0$
2. Normalização: Soma das probabilidades = 1
3. Complementaridade: $P(A') = 1 - P(A)$
4. Adição: $P(A \cup B) = P(A) + P(B)$ (mutuamente exclusivos)
5. Multiplicação: $P(A \cap B) = P(A) \times P(B)$ (independentes)

### 8.3 Regras de Probabilidade
- **Adição**: $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
- **Multiplicação**: $P(A \cap B) = P(A) \times P(B|A)$
- **Condicional**: $P(A|B) = \frac{P(A \cap B)}{P(B)}$
- **Teorema de Bayes**: $P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$

---

## 9. Distribuições de Probabilidade Discretas

### 9.1 Distribuição Binomial
Modela o número de sucessos em n experimentos independentes.

**Fórmula:**
$$P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}$$

**Exemplo:**
Moeda lançada 10 vezes, probabilidade de 6 caras:
$$P(X = 6) \approx 0.205$$

### 9.2 Distribuição de Poisson
Modela o número de eventos em um intervalo fixo.

**Fórmula:**
$$P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}$$

**Exemplo:**
Central recebe em média 5 chamadas/hora, probabilidade de receber 3 chamadas:
$$P(X = 3) \approx 0.1404$$


# Teoria do Limite Central:
A média de várias amostras de uma população tende a seguir uma distribuição normal, independentemente da distribuição original dos dados.

### Implicações
- Permite fazer inferências sobre a população a partir da amostra.
- Fundamenta testes de hipóteses e intervalos de confiança.


# Intervalos de Confiança:
Estimativa do intervalo onde a verdadeira média populacional provavelmente se encontra.

### Fórmulas:
- Para a média populacional: $\bar{x} \pm z \frac{\sigma}{\sqrt{n}}$
- Para a média amostral: $\bar{x} \pm t \frac{s}{\sqrt{n}}$

### Exemplo:
Uma amostra de 100 alunos teve média de notas 75 e desvio padrão 10. Qual o intervalo de confiança de 95% para a média populacional?

1. **Encontrar o valor crítico (z ou t)**:
   - Para 95% de confiança e 99 graus de liberdade, $t \approx 1.984$.

2. **Calcular o erro padrão**:
   $$EP = \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{100}} = 1$$

3. **Calcular o intervalo**:
   $$IC = 75 \pm 1.984 \times 1 = [73.016, 76.984]$$

O intervalo de confiança de 95% para a média populacional é de aproximadamente [73.02, 76.98].




---

## Estratégia de Melhoria Didática

1. **Adicionar mais exemplos práticos**: Use situações do cotidiano para ilustrar conceitos.
2. **Inserir gráficos e tabelas visuais**: Utilize diagramas para facilitar a compreensão.
3. **Propor exercícios interativos**: Estimule o leitor a aplicar os conceitos.
4. **Utilizar linguagem acessível e divertida**: Torne o aprendizado leve e envolvente.
5. **Destacar dicas e curiosidades**: Enriquecer o conteúdo com fatos interessantes.

---

## Ações Aplicadas

- Reorganização do conteúdo em tópicos e subtópicos.
- Inclusão de exemplos, tabelas e sugestões de gráficos.
- Redação fluida, objetiva e divertida.
- Estratégia de melhoria didática para tornar o material ainda mais rico.

Agora, aproveite sua jornada pelo mundo da estatística!


---

## 12. Exercícios Práticos 🎯

### Exercício 1: Medidas de Tendência Central
Calcule a média, mediana e moda dos seguintes dados:
**Notas dos alunos:** 7, 8, 6, 9, 7, 8, 10, 7, 6, 8

### Exercício 2: Medidas de Dispersão
Para os dados do exercício 1, calcule:
a) Variância
b) Desvio padrão
c) Coeficiente de variação

### Exercício 3: Probabilidade
Em uma turma de 30 alunos, 18 são mulheres e 12 são homens. Se escolhermos um aluno aleatoriamente:
a) Qual a probabilidade de ser mulher?
b) Qual a probabilidade de ser homem?

### Exercício 4: Distribuição Binomial
Uma moeda é lançada 8 vezes. Qual a probabilidade de obter exatamente 3 caras?

---

## 13. Resumo Visual 📊

### Fluxograma de Escolha de Gráficos
```
Dados Categóricos → Gráfico de Barras ou Pizza
Dados Quantitativos → Histograma ou Boxplot
Frequência Acumulada → Ogiva
Comparação de Importância → Pareto
```

### Tabela Resumo: Quando Usar Cada Medida
| Situação | Tendência Central | Dispersão |
|----------|------------------|-----------|
| Dados simétricos | Média | Desvio Padrão |
| Dados assimétricos | Mediana | Amplitude Interquartil |
| Dados categóricos | Moda | - |
| Comparar grupos | Coeficiente de Variação | Coeficiente de Variação |

---

## 14. Dicas de Ouro 💡

### Para Memorizar Fórmulas:
- **Variância**: "Média dos quadrados das diferenças"
- **Desvio Padrão**: "Raiz da variância"
- **Probabilidade**: "Favoráveis sobre Total"

### Checklist de Análise:
✅ Identifique o tipo de variável
✅ Escolha a medida de tendência central apropriada
✅ Calcule a medida de dispersão
✅ Interprete os resultados no contexto
✅ Visualize com gráficos adequados

### Erros Comuns a Evitar:
❌ Usar média com dados muito assimétricos
❌ Esquecer de ordenar dados para calcular mediana
❌ Confundir população com amostra nas fórmulas
❌ Interpretar correlação como causação

---

## 15. Conexões com o Mundo Real 🌍

### Estatística no Cotidiano:
- **Medicina**: Eficácia de medicamentos
- **Esportes**: Análise de performance
- **Marketing**: Segmentação de clientes
- **Política**: Pesquisas eleitorais
- **Qualidade**: Controle de processos

### Profissões que Usam Estatística:
- Cientista de Dados
- Analista de Business Intelligence
- Pesquisador
- Economista
- Epidemiologista

---

## Estratégia de Melhoria Didática Aplicada ✨

### Melhorias Implementadas:
1. ✅ **Estrutura hierárquica clara** com numeração progressiva
2. ✅ **Exemplos práticos** em cada conceito
3. ✅ **Tabelas organizadas** para facilitar visualização
4. ✅ **Fórmulas destacadas** com explicações
5. ✅ **Exercícios práticos** para fixação
6. ✅ **Dicas e curiosidades** para engajamento
7. ✅ **Resumos visuais** para síntese
8. ✅ **Conexões com aplicações reais**
9. ✅ **Linguagem acessível e divertida**
10. ✅ **Elementos visuais** (emojis, caixas de destaque)

### Próximos Passos Sugeridos:
- Adicionar gráficos interativos
- Incluir datasets reais para prática
- Criar quiz interativo
- Desenvolver simulações
- Adicionar vídeos explicativos

---

## Parabéns! 🎉

Você completou sua jornada pelos fundamentos da estatística! Agora você possui o conhecimento necessário para:
- Coletar e organizar dados
- Calcular medidas descritivas
- Interpretar probabilidades
- Fazer inferências estatísticas
- Escolher gráficos adequados

**Continue praticando e explorando!** A estatística é uma ferramenta poderosa para entender o mundo ao nosso redor. 📈📉📊

Agora, aproveite sua jornada pelo mundo da estatística!

In [1]:
import numpy as np
import math
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from scipy import stats
import ipywidgets as widgets
from ipywidgets import interact, interactive, fixed, interact_manual
from IPython.display import display, clear_output
import warnings
warnings.filterwarnings('ignore')

# Configurações de estilo
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("📊 Bibliotecas carregadas com sucesso!")
print("🎮 Pronto para criar visualizações interativas!")

📊 Bibliotecas carregadas com sucesso!
🎮 Pronto para criar visualizações interativas!


In [2]:
# 🎯 DEMONSTRAÇÃO INTERATIVA: MEDIDAS DE TENDÊNCIA CENTRAL

def demonstrar_tendencia_central(dados_str="5, 10, 15, 20, 25", adicionar_outlier=False, outlier_valor=100):
    """
    Demonstração interativa das medidas de tendência central
    """
    try:
        # Converter string para lista de números
        dados = [float(x.strip()) for x in dados_str.split(',')]
        
        # Adicionar outlier se solicitado
        if adicionar_outlier:
            dados.append(outlier_valor)
        
        # Calcular medidas
        media = np.mean(dados)
        mediana = np.median(dados)
        
        # Calcular moda
        from collections import Counter
        contador = Counter(dados)
        freq_max = max(contador.values())
        modas = [k for k, v in contador.items() if v == freq_max]
        
        if len(modas) == len(dados):
            moda_str = "Amodal (sem moda)"
        elif len(modas) == 1:
            moda_str = f"Unimodal: {modas[0]}"
        elif len(modas) == 2:
            moda_str = f"Bimodal: {modas}"
        else:
            moda_str = f"Multimodal: {modas}"
        
        # Criar gráfico
        fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
        
        # Gráfico 1: Histograma com medidas
        ax1.hist(dados, bins=min(10, len(set(dados))), alpha=0.7, color='skyblue', edgecolor='black')
        ax1.axvline(media, color='red', linestyle='--', linewidth=2, label=f'Média: {media:.2f}')
        ax1.axvline(mediana, color='green', linestyle='--', linewidth=2, label=f'Mediana: {mediana:.2f}')
        
        if len(modas) == 1 and len(modas) < len(dados):
            ax1.axvline(modas[0], color='orange', linestyle='--', linewidth=2, label=f'Moda: {modas[0]}')
        
        ax1.set_title('📊 Distribuição dos Dados', fontsize=14, fontweight='bold')
        ax1.set_xlabel('Valores')
        ax1.set_ylabel('Frequência')
        ax1.legend()
        ax1.grid(True, alpha=0.3)
        
        # Gráfico 2: Box Plot
        ax2.boxplot(dados, vert=True, patch_artist=True, 
                   boxprops=dict(facecolor='lightblue', alpha=0.7))
        ax2.set_title('📦 Box Plot', fontsize=14, fontweight='bold')
        ax2.set_ylabel('Valores')
        ax2.grid(True, alpha=0.3)
        
        plt.tight_layout()
        plt.show()
        
        # Exibir resultados
        print("🎯 RESULTADOS DAS MEDIDAS DE TENDÊNCIA CENTRAL")
        print("=" * 50)
        print(f"📊 Dados: {dados}")
        print(f"📈 Média: {media:.2f}")
        print(f"📊 Mediana: {mediana:.2f}")
        print(f"🎯 {moda_str}")
        print(f"📏 Tamanho da amostra: {len(dados)}")
        
        # Análise interpretativa
        print("\n🧠 INTERPRETAÇÃO:")
        print("=" * 30)
        
        if abs(media - mediana) < 0.1:
            print("✅ Distribuição aproximadamente simétrica (média ≈ mediana)")
        elif media > mediana:
            print("📈 Distribuição assimétrica à direita (média > mediana)")
            print("   → Presença de valores altos puxando a média para cima")
        else:
            print("📉 Distribuição assimétrica à esquerda (média < mediana)")
            print("   → Presença de valores baixos puxando a média para baixo")
        
        if adicionar_outlier:
            print(f"⚠️  Outlier detectado: {outlier_valor}")
            print("   → Observe como afeta mais a média que a mediana!")
            
    except Exception as e:
        print(f"❌ Erro: {e}")
        print("💡 Dica: Use números separados por vírgula (ex: 1, 2, 3, 4, 5)")

# Interface interativa
print("🎮 CONTROLES INTERATIVOS - MEDIDAS DE TENDÊNCIA CENTRAL")
print("=" * 60)

interact(demonstrar_tendencia_central,
         dados_str=widgets.Text(
             value="5, 10, 15, 20, 25",
             description="Dados:",
             style={'description_width': 'initial'}
         ),
         adicionar_outlier=widgets.Checkbox(
             value=False,
             description="Adicionar Outlier"
         ),
         outlier_valor=widgets.IntSlider(
             value=100,
             min=50,
             max=200,
             description="Valor do Outlier:",
             style={'description_width': 'initial'}
         )
);

🎮 CONTROLES INTERATIVOS - MEDIDAS DE TENDÊNCIA CENTRAL


interactive(children=(Text(value='5, 10, 15, 20, 25', description='Dados:', style=TextStyle(description_width=…

In [3]:
# 📏 DEMONSTRAÇÃO INTERATIVA: MEDIDAS DE DISPERSÃO

def demonstrar_dispersao(dados_str="5, 10, 15, 20, 25", mostrar_calculos=True):
    """
    Demonstração interativa das medidas de dispersão
    """
    try:
        # Converter string para lista de números
        dados = [float(x.strip()) for x in dados_str.split(',')]
        dados_array = np.array(dados)
        
        # Calcular medidas
        media = np.mean(dados_array)
        variancia_pop = np.var(dados_array, ddof=0)  # População
        variancia_am = np.var(dados_array, ddof=1)   # Amostra
        desvio_pop = np.std(dados_array, ddof=0)     # População
        desvio_am = np.std(dados_array, ddof=1)      # Amostra
        amplitude = np.max(dados_array) - np.min(dados_array)
        cv = (desvio_am / media) * 100 if media != 0 else 0
        
        # Criar visualização
        fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
        
        # Gráfico 1: Dados com desvios da média
        ax1.scatter(range(len(dados)), dados, s=100, alpha=0.7, color='blue')
        ax1.axhline(media, color='red', linestyle='--', linewidth=2, label=f'Média: {media:.2f}')
        
        # Mostrar desvios
        for i, valor in enumerate(dados):
            ax1.plot([i, i], [media, valor], color='gray', linestyle='-', alpha=0.5)
            ax1.annotate(f'{valor-media:.1f}', xy=(i, (valor+media)/2), 
                        ha='center', fontsize=10, color='red')
        
        ax1.fill_between(range(len(dados)), media-desvio_am, media+desvio_am, 
                        alpha=0.2, color='yellow', label=f'±1 Desvio Padrão')
        ax1.set_title('📊 Desvios em Relação à Média', fontsize=14, fontweight='bold')
        ax1.set_xlabel('Posição')
        ax1.set_ylabel('Valor')
        ax1.legend()
        ax1.grid(True, alpha=0.3)
        
        # Gráfico 2: Comparação de dispersões
        dados_baixa_disp = np.random.normal(media, desvio_am/3, 50)
        dados_alta_disp = np.random.normal(media, desvio_am*2, 50)
        
        ax2.hist(dados_baixa_disp, alpha=0.5, label=f'Baixa Dispersão (σ={desvio_am/3:.1f})', 
                bins=15, color='green')
        ax2.hist(dados_alta_disp, alpha=0.5, label=f'Alta Dispersão (σ={desvio_am*2:.1f})', 
                bins=15, color='red')
        ax2.axvline(media, color='black', linestyle='--', linewidth=2, label='Média')
        ax2.set_title('🎯 Comparação de Dispersões', fontsize=14, fontweight='bold')
        ax2.set_xlabel('Valores')
        ax2.set_ylabel('Frequência')
        ax2.legend()
        ax2.grid(True, alpha=0.3)
        
        # Gráfico 3: Contribuição para variância
        desvios_quad = [(x - media)**2 for x in dados]
        ax3.bar(range(len(dados)), desvios_quad, alpha=0.7, color='orange')
        ax3.set_title('🔥 Contribuição de cada valor para a Variância', fontsize=14, fontweight='bold')
        ax3.set_xlabel('Posição')
        ax3.set_ylabel('(valor - média)²')
        for i, v in enumerate(desvios_quad):
            ax3.text(i, v + max(desvios_quad)*0.01, f'{v:.1f}', ha='center', fontsize=10)
        ax3.grid(True, alpha=0.3)
        
        # Gráfico 4: Box plot com quartis
        box_data = ax4.boxplot(dados, vert=True, patch_artist=True,
                              boxprops=dict(facecolor='lightblue', alpha=0.7))
        
        # Adicionar informações dos quartis
        q1, q2, q3 = np.percentile(dados, [25, 50, 75])
        iqr = q3 - q1
        
        ax4.text(1.1, q1, f'Q1: {q1:.1f}', fontsize=12, va='center')
        ax4.text(1.1, q2, f'Q2: {q2:.1f}', fontsize=12, va='center')
        ax4.text(1.1, q3, f'Q3: {q3:.1f}', fontsize=12, va='center')
        ax4.text(1.1, q3 + iqr*0.1, f'IQR: {iqr:.1f}', fontsize=12, va='center', weight='bold')
        
        ax4.set_title('📦 Box Plot com Quartis', fontsize=14, fontweight='bold')
        ax4.set_ylabel('Valores')
        ax4.grid(True, alpha=0.3)
        
        plt.tight_layout()
        plt.show()
        
        # Exibir resultados
        print("📏 RESULTADOS DAS MEDIDAS DE DISPERSÃO")
        print("=" * 50)
        print(f"📊 Dados: {dados}")
        print(f"📈 Média: {media:.3f}")
        print(f"📐 Amplitude: {amplitude:.3f}")
        print(f"🔢 Variância (População): {variancia_pop:.3f}")
        print(f"🔢 Variância (Amostra): {variancia_am:.3f}")
        print(f"📏 Desvio Padrão (População): {desvio_pop:.3f}")
        print(f"📏 Desvio Padrão (Amostra): {desvio_am:.3f}")
        print(f"📊 Coeficiente de Variação: {cv:.1f}%")
        
        if mostrar_calculos:
            print("\n🧮 CÁLCULOS PASSO A PASSO:")
            print("=" * 40)
            print("1️⃣ Variância (Amostra):")
            print(f"   s² = Σ(xᵢ - x̄)² / (n-1)")
            print(f"   s² = {sum(desvios_quad):.3f} / {len(dados)-1}")
            print(f"   s² = {variancia_am:.3f}")
            print("\n2️⃣ Desvio Padrão:")
            print(f"   s = √(s²) = √{variancia_am:.3f} = {desvio_am:.3f}")
            print("\n3️⃣ Coeficiente de Variação:")
            print(f"   CV = (s / x̄) × 100% = ({desvio_am:.3f} / {media:.3f}) × 100% = {cv:.1f}%")
        
        # Interpretação
        print("\n🧠 INTERPRETAÇÃO:")
        print("=" * 30)
        if cv < 15:
            print("✅ Baixa variabilidade (CV < 15%)")
        elif cv < 30:
            print("⚠️ Variabilidade moderada (15% ≤ CV < 30%)")
        else:
            print("🔴 Alta variabilidade (CV ≥ 30%)")
            
        print(f"📊 Em média, os dados se afastam {desvio_am:.2f} unidades da média")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
        print("💡 Dica: Use números separados por vírgula (ex: 1, 2, 3, 4, 5)")

# Interface interativa
print("🎮 CONTROLES INTERATIVOS - MEDIDAS DE DISPERSÃO")
print("=" * 55)

interact(demonstrar_dispersao,
         dados_str=widgets.Text(
             value="5, 10, 15, 20, 25",
             description="Dados:",
             style={'description_width': 'initial'}
         ),
         mostrar_calculos=widgets.Checkbox(
             value=True,
             description="Mostrar Cálculos"
         )
);

🎮 CONTROLES INTERATIVOS - MEDIDAS DE DISPERSÃO


interactive(children=(Text(value='5, 10, 15, 20, 25', description='Dados:', style=TextStyle(description_width=…

In [4]:
# 🎲 DEMONSTRAÇÃO INTERATIVA: DISTRIBUIÇÕES DE PROBABILIDADE

def demonstrar_distribuicoes(distribuicao="Normal", parametro1=0, parametro2=1, n_amostras=1000):
    """
    Demonstração interativa de diferentes distribuições de probabilidade
    """
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
    
    try:
        if distribuicao == "Normal":
            # Distribuição Normal
            mu, sigma = parametro1, parametro2
            x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100)
            y = stats.norm.pdf(x, mu, sigma)
            amostras = np.random.normal(mu, sigma, n_amostras)
            
            ax1.plot(x, y, 'b-', linewidth=2, label=f'Normal(μ={mu}, σ={sigma})')
            ax1.fill_between(x, y, alpha=0.3)
            
            # Regra 68-95-99.7
            ax1.axvline(mu, color='red', linestyle='--', label='Média')
            ax1.axvline(mu - sigma, color='orange', linestyle=':', alpha=0.7)
            ax1.axvline(mu + sigma, color='orange', linestyle=':', alpha=0.7, label='±1σ (68%)')
            ax1.axvline(mu - 2*sigma, color='green', linestyle=':', alpha=0.7)
            ax1.axvline(mu + 2*sigma, color='green', linestyle=':', alpha=0.7, label='±2σ (95%)')
            
            info_text = f"μ = {mu}, σ = {sigma}\\n68% dos dados: [{mu-sigma:.1f}, {mu+sigma:.1f}]\\n95% dos dados: [{mu-2*sigma:.1f}, {mu+2*sigma:.1f}]"
            
        elif distribuicao == "Binomial":
            # Distribuição Binomial
            n, p = int(parametro1), parametro2
            x = np.arange(0, n+1)
            y = stats.binom.pmf(x, n, p)
            amostras = np.random.binomial(n, p, n_amostras)
            
            ax1.bar(x, y, alpha=0.7, color='skyblue', edgecolor='black')
            ax1.plot(x, y, 'ro-', linewidth=2, markersize=6)
            
            media_binom = n * p
            var_binom = n * p * (1 - p)
            info_text = f"n = {n}, p = {p}\\nE[X] = {media_binom:.1f}\\nVar(X) = {var_binom:.1f}"
            
        elif distribuicao == "Poisson":
            # Distribuição Poisson
            lambda_param = parametro1
            x = np.arange(0, int(lambda_param + 5*np.sqrt(lambda_param)))
            y = stats.poisson.pmf(x, lambda_param)
            amostras = np.random.poisson(lambda_param, n_amostras)
            
            ax1.bar(x, y, alpha=0.7, color='lightgreen', edgecolor='black')
            ax1.plot(x, y, 'ro-', linewidth=2, markersize=6)
            
            info_text = f"λ = {lambda_param}\\nE[X] = Var(X) = {lambda_param}"
            
        elif distribuicao == "Exponencial":
            # Distribuição Exponencial
            lambda_param = parametro1
            x = np.linspace(0, 5/lambda_param, 100)
            y = stats.expon.pdf(x, scale=1/lambda_param)
            amostras = np.random.exponential(1/lambda_param, n_amostras)
            
            ax1.plot(x, y, 'b-', linewidth=2)
            ax1.fill_between(x, y, alpha=0.3, color='purple')
            
            info_text = f"λ = {lambda_param}\\nE[X] = {1/lambda_param:.2f}\\nVar(X) = {1/lambda_param**2:.2f}"
        
        ax1.set_title(f'📊 Distribuição {distribuicao}', fontsize=14, fontweight='bold')
        ax1.set_xlabel('x')
        ax1.set_ylabel('Probabilidade')
        ax1.legend()
        ax1.grid(True, alpha=0.3)
        ax1.text(0.02, 0.98, info_text, transform=ax1.transAxes, fontsize=11,
                verticalalignment='top', bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.8))
        
        # Histograma das amostras
        ax2.hist(amostras, bins=50, density=True, alpha=0.7, color='coral', edgecolor='black')
        ax2.set_title(f'📈 Histograma de {n_amostras} Amostras', fontsize=14, fontweight='bold')
        ax2.set_xlabel('Valor')
        ax2.set_ylabel('Densidade')
        ax2.grid(True, alpha=0.3)
        
        # Estatísticas das amostras
        media_amostra = np.mean(amostras)
        std_amostra = np.std(amostras, ddof=1)
        ax2.axvline(media_amostra, color='red', linestyle='--', linewidth=2, 
                   label=f'Média amostral: {media_amostra:.2f}')
        ax2.legend()
        
        # Q-Q Plot
        if distribuicao == "Normal":
            stats.probplot(amostras, dist="norm", plot=ax3)
        else:
            # Para outras distribuições, comparar com normal
            stats.probplot(amostras, dist="norm", plot=ax3)
        ax3.set_title('📐 Q-Q Plot (vs Normal)', fontsize=14, fontweight='bold')
        ax3.grid(True, alpha=0.3)
        
        # Box Plot
        box_data = ax4.boxplot(amostras, patch_artist=True,
                              boxprops=dict(facecolor='lightblue', alpha=0.7))
        ax4.set_title('📦 Box Plot das Amostras', fontsize=14, fontweight='bold')
        ax4.set_ylabel('Valores')
        ax4.grid(True, alpha=0.3)
        
        # Adicionar estatísticas no box plot
        q1, q2, q3 = np.percentile(amostras, [25, 50, 75])
        ax4.text(1.1, q1, f'Q1: {q1:.2f}', fontsize=10, va='center')
        ax4.text(1.1, q2, f'Q2: {q2:.2f}', fontsize=10, va='center')
        ax4.text(1.1, q3, f'Q3: {q3:.2f}', fontsize=10, va='center')
        
        plt.tight_layout()
        plt.show()
        
        # Exibir estatísticas
        print(f"📊 ESTATÍSTICAS DA DISTRIBUIÇÃO {distribuicao.upper()}")
        print("=" * 50)
        print(f"🎯 Parâmetros: {info_text.replace(chr(10), ', ')}")
        print(f"📈 Média das amostras: {media_amostra:.4f}")
        print(f"📏 Desvio padrão das amostras: {std_amostra:.4f}")
        print(f"🔢 Número de amostras: {n_amostras}")
        
        # Teste de normalidade (Shapiro-Wilk)
        if len(amostras) <= 5000:  # Limite do teste
            estatistica, p_valor = stats.shapiro(amostras[:5000])
            print(f"\n🧪 Teste de Normalidade (Shapiro-Wilk):")
            print(f"   Estatística: {estatistica:.4f}")
            print(f"   p-valor: {p_valor:.4f}")
            if p_valor > 0.05:
                print("   ✅ Os dados seguem distribuição normal (p > 0.05)")
            else:
                print("   ❌ Os dados NÃO seguem distribuição normal (p ≤ 0.05)")
        
    except Exception as e:
        print(f"❌ Erro: {e}")

# Interface interativa para distribuições
print("🎮 CONTROLES INTERATIVOS - DISTRIBUIÇÕES DE PROBABILIDADE")
print("=" * 65)

# Função para atualizar parâmetros baseado na distribuição
def criar_interface_distribuicoes():
    distribuicao_widget = widgets.Dropdown(
        options=['Normal', 'Binomial', 'Poisson', 'Exponencial'],
        value='Normal',
        description='Distribuição:'
    )
    
    param1_widget = widgets.FloatSlider(
        value=0, min=-5, max=5, step=0.1,
        description='μ (média):',
        style={'description_width': 'initial'}
    )
    
    param2_widget = widgets.FloatSlider(
        value=1, min=0.1, max=3, step=0.1,
        description='σ (desvio):',
        style={'description_width': 'initial'}
    )
    
    n_amostras_widget = widgets.IntSlider(
        value=1000, min=100, max=5000, step=100,
        description='N° amostras:',
        style={'description_width': 'initial'}
    )
    
    def atualizar_parametros(dist):
        if dist == 'Normal':
            param1_widget.description = 'μ (média):'
            param1_widget.min, param1_widget.max = -5, 5
            param1_widget.value = 0
            param2_widget.description = 'σ (desvio):'
            param2_widget.min, param2_widget.max = 0.1, 3
            param2_widget.value = 1
        elif dist == 'Binomial':
            param1_widget.description = 'n (tentativas):'
            param1_widget.min, param1_widget.max = 1, 50
            param1_widget.value = 10
            param2_widget.description = 'p (probabilidade):'
            param2_widget.min, param2_widget.max = 0.01, 0.99
            param2_widget.value = 0.5
        elif dist == 'Poisson':
            param1_widget.description = 'λ (taxa):'
            param1_widget.min, param1_widget.max = 0.1, 20
            param1_widget.value = 3
            param2_widget.description = 'Não usado'
            param2_widget.value = 1
        elif dist == 'Exponencial':
            param1_widget.description = 'λ (taxa):'
            param1_widget.min, param1_widget.max = 0.1, 5
            param1_widget.value = 1
            param2_widget.description = 'Não usado'
            param2_widget.value = 1
    
    # Configurar observador para mudança de distribuição
    distribuicao_widget.observe(lambda change: atualizar_parametros(change['new']), names='value')
    
    # Interface interativa
    return interact(demonstrar_distribuicoes,
                   distribuicao=distribuicao_widget,
                   parametro1=param1_widget,
                   parametro2=param2_widget,
                   n_amostras=n_amostras_widget)

criar_interface_distribuicoes();

🎮 CONTROLES INTERATIVOS - DISTRIBUIÇÕES DE PROBABILIDADE


interactive(children=(Dropdown(description='Distribuição:', options=('Normal', 'Binomial', 'Poisson', 'Exponen…

In [6]:
# 🎯 DEMONSTRAÇÃO INTERATIVA: TEOREMA DO LIMITE CENTRAL

def demonstrar_limite_central(distribuicao_original="Uniforme", tamanho_amostra=30, 
                             n_amostras=1000, parametro=5):
    """
    Demonstração do Teorema do Limite Central
    """
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
    
    # Gerar distribuição original
    if distribuicao_original == "Uniforme":
        populacao = np.random.uniform(0, parametro, 10000)
        dist_name = f"Uniforme(0, {parametro})"
    elif distribuicao_original == "Exponencial":
        populacao = np.random.exponential(parametro, 10000)
        dist_name = f"Exponencial(λ={1/parametro:.2f})"
    elif distribuicao_original == "Beta":
        populacao = np.random.beta(2, parametro, 10000)
        dist_name = f"Beta(2, {parametro})"
    elif distribuicao_original == "Bimodal":
        pop1 = np.random.normal(2, 1, 5000)
        pop2 = np.random.normal(8, 1, 5000)
        populacao = np.concatenate([pop1, pop2])
        dist_name = "Bimodal"
    
    # Gráfico 1: Distribuição original
    ax1.hist(populacao, bins=50, density=True, alpha=0.7, color='lightcoral', edgecolor='black')
    ax1.set_title(f'📊 Distribuição Original: {dist_name}', fontsize=14, fontweight='bold')
    ax1.set_xlabel('Valor')
    ax1.set_ylabel('Densidade')
    ax1.axvline(np.mean(populacao), color='red', linestyle='--', linewidth=2, 
               label=f'μ = {np.mean(populacao):.2f}')
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # Gerar amostras e calcular médias
    medias_amostrais = []
    for _ in range(n_amostras):
        amostra = np.random.choice(populacao, tamanho_amostra, replace=True)
        medias_amostrais.append(np.mean(amostra))
    
    medias_amostrais = np.array(medias_amostrais)
    
    # Gráfico 2: Distribuição das médias amostrais
    ax2.hist(medias_amostrais, bins=50, density=True, alpha=0.7, color='lightgreen', 
             edgecolor='black', label='Médias Amostrais')
    
    # Sobrepor curva normal teórica
    mu_teorico = np.mean(populacao)
    sigma_teorico = np.std(populacao, ddof=1) / np.sqrt(tamanho_amostra)
    x_teorico = np.linspace(np.min(medias_amostrais), np.max(medias_amostrais), 100)
    y_teorico = stats.norm.pdf(x_teorico, mu_teorico, sigma_teorico)
    
    ax2.plot(x_teorico, y_teorico, 'r-', linewidth=3, 
             label=f'Normal Teórica\\nμ={mu_teorico:.2f}, σ={sigma_teorico:.3f}')    
    ax2.axvline(np.mean(medias_amostrais), color='blue', linestyle='--', linewidth=2,
               label=f'Média das médias: {np.mean(medias_amostrais):.2f}')
    
    ax2.set_title(f'📈 Distribuição das Médias Amostrais (n={tamanho_amostra})', 
                 fontsize=14, fontweight='bold')
    ax2.set_xlabel('Média Amostral')
    ax2.set_ylabel('Densidade')
    ax2.legend()
    ax2.grid(True, alpha=0.3)
    
    # Gráfico 3: Q-Q Plot para testar normalidade
    stats.probplot(medias_amostrais, dist="norm", plot=ax3)
    ax3.set_title('📐 Q-Q Plot: Teste de Normalidade', fontsize=14, fontweight='bold')
    ax3.grid(True, alpha=0.3)
    
    # Gráfico 4: Evolução da distribuição com diferentes tamanhos de amostra
    tamanhos = [1, 5, 10, 30, 100]
    cores = ['red', 'orange', 'yellow', 'green', 'blue']
    
    for i, tam in enumerate(tamanhos):
        if tam <= tamanho_amostra:
            medias_temp = []
            for _ in range(500):  # Menos amostras para performance
                amostra_temp = np.random.choice(populacao, tam, replace=True)
                medias_temp.append(np.mean(amostra_temp))
            
            ax4.hist(medias_temp, bins=30, density=True, alpha=0.4, 
                    color=cores[i], label=f'n={tam}')
    
    ax4.set_title('🔄 Evolução para Normalidade', fontsize=14, fontweight='bold')
    ax4.set_xlabel('Média Amostral')
    ax4.set_ylabel('Densidade')
    ax4.legend()
    ax4.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Testes estatísticos
    print("🎯 TEOREMA DO LIMITE CENTRAL - RESULTADOS")
    print("=" * 50)
    print(f"📊 Distribuição Original: {dist_name}")
    print(f"👥 Tamanho da amostra (n): {tamanho_amostra}")
    print(f"🔢 Número de amostras: {n_amostras}")
    print(f"📈 Média da população: {np.mean(populacao):.4f}")
    print(f"📏 Desvio padrão da população: {np.std(populacao, ddof=1):.4f}")
    print(f"📊 Média das médias amostrais: {np.mean(medias_amostrais):.4f}")
    print(f"📏 Desvio padrão das médias: {np.std(medias_amostrais, ddof=1):.4f}")
    print(f"🎯 Erro padrão teórico: {sigma_teorico:.4f}")
    
    # Teste de normalidade
    if len(medias_amostrais) <= 5000:
        estatistica, p_valor = stats.shapiro(medias_amostrais[:5000])
        print(f"\n🧪 Teste de Normalidade das Médias (Shapiro-Wilk):")
        print(f"   Estatística: {estatistica:.6f}")
        print(f"   p-valor: {p_valor:.6f}")
        if p_valor > 0.05:
            print("   ✅ As médias seguem distribuição normal (p > 0.05)")
        else:
            print("   ⚠️ As médias podem não seguir distribuição normal (p ≤ 0.05)")
    
    # Teste Kolmogorov-Smirnov
    estatistica_ks, p_valor_ks = stats.kstest(medias_amostrais, 
                                             lambda x: stats.norm.cdf(x, mu_teorico, sigma_teorico))
    print(f"\n🔍 Teste Kolmogorov-Smirnov (vs Normal teórica):")
    print(f"   Estatística: {estatistica_ks:.6f}")
    print(f"   p-valor: {p_valor_ks:.6f}")
    
    print(f"\n💡 INTERPRETAÇÃO:")
    print("=" * 30)
    if tamanho_amostra >= 30:
        print("✅ n ≥ 30: TLC garante aproximação normal das médias")
    else:
        print("⚠️ n < 30: TLC pode ainda não ser totalmente efetivo")
    
    diferenca_media = abs(np.mean(medias_amostrais) - np.mean(populacao))
    if diferenca_media < 0.1:
        print("✅ Média das médias ≈ média populacional (sem viés)")
    else:
        print("⚠️ Pequena diferença entre médias (normal em amostras pequenas)")

# Interface interativa para TLC
print("🎮 CONTROLES INTERATIVOS - TEOREMA DO LIMITE CENTRAL")
print("=" * 60)

interact(demonstrar_limite_central,
         distribuicao_original=widgets.Dropdown(
             options=['Uniforme', 'Exponencial', 'Beta', 'Bimodal'],
             value='Uniforme',
             description='Distribuição:'
         ),
         tamanho_amostra=widgets.IntSlider(
             value=30, min=1, max=100, step=1,
             description='Tamanho amostra:',
             style={'description_width': 'initial'}
         ),
         n_amostras=widgets.IntSlider(
             value=1000, min=100, max=2000, step=100,
             description='N° amostras:',
             style={'description_width': 'initial'}
         ),
         parametro=widgets.FloatSlider(
             value=5, min=1, max=10, step=0.5,
             description='Parâmetro:',
             style={'description_width': 'initial'}
         )
);

🎮 CONTROLES INTERATIVOS - TEOREMA DO LIMITE CENTRAL


interactive(children=(Dropdown(description='Distribuição:', options=('Uniforme', 'Exponencial', 'Beta', 'Bimod…

In [7]:
# 🧪 DEMONSTRAÇÃO INTERATIVA: TESTES DE HIPÓTESES

def demonstrar_teste_hipoteses(media_h0=100, media_amostra=105, desvio_padrao=15, 
                              tamanho_amostra=25, nivel_significancia=0.05, 
                              tipo_teste="Bilateral"):
    """
    Demonstração interativa de testes de hipóteses para a média
    """
    # Calcular estatística do teste
    erro_padrao = desvio_padrao / np.sqrt(tamanho_amostra)
    estatistica_t = (media_amostra - media_h0) / erro_padrao
    
    # Graus de liberdade
    gl = tamanho_amostra - 1
    
    # Calcular p-valor baseado no tipo de teste
    if tipo_teste == "Bilateral":
        p_valor = 2 * (1 - stats.t.cdf(abs(estatistica_t), gl))
        regiao_critica = f"t < {stats.t.ppf(nivel_significancia/2, gl):.3f} ou t > {stats.t.ppf(1-nivel_significancia/2, gl):.3f}"
    elif tipo_teste == "Unilateral Direita":
        p_valor = 1 - stats.t.cdf(estatistica_t, gl)
        regiao_critica = f"t > {stats.t.ppf(1-nivel_significancia, gl):.3f}"
    else:  # Unilateral Esquerda
        p_valor = stats.t.cdf(estatistica_t, gl)
        regiao_critica = f"t < {stats.t.ppf(nivel_significancia, gl):.3f}"
    
    # Decisão
    rejeitar_h0 = p_valor < nivel_significancia
    
    # Criar visualização
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
    
    # Gráfico 1: Distribuição t com região crítica
    x = np.linspace(-4, 4, 1000)
    y = stats.t.pdf(x, gl)
    
    ax1.plot(x, y, 'b-', linewidth=2, label=f'Distribuição t (gl={gl})')
    
    # Colorir região crítica
    if tipo_teste == "Bilateral":
        t_crit_esq = stats.t.ppf(nivel_significancia/2, gl)
        t_crit_dir = stats.t.ppf(1-nivel_significancia/2, gl)
        
        x_crit_esq = x[x <= t_crit_esq]
        y_crit_esq = stats.t.pdf(x_crit_esq, gl)
        ax1.fill_between(x_crit_esq, y_crit_esq, alpha=0.3, color='red', 
                        label=f'Região Crítica (α/2 = {nivel_significancia/2:.3f})')
        
        x_crit_dir = x[x >= t_crit_dir]
        y_crit_dir = stats.t.pdf(x_crit_dir, gl)
        ax1.fill_between(x_crit_dir, y_crit_dir, alpha=0.3, color='red')
        
    elif tipo_teste == "Unilateral Direita":
        t_crit = stats.t.ppf(1-nivel_significancia, gl)
        x_crit = x[x >= t_crit]
        y_crit = stats.t.pdf(x_crit, gl)
        ax1.fill_between(x_crit, y_crit, alpha=0.3, color='red', 
                        label=f'Região Crítica (α = {nivel_significancia:.3f})')
    else:
        t_crit = stats.t.ppf(nivel_significancia, gl)
        x_crit = x[x <= t_crit]
        y_crit = stats.t.pdf(x_crit, gl)
        ax1.fill_between(x_crit, y_crit, alpha=0.3, color='red', 
                        label=f'Região Crítica (α = {nivel_significancia:.3f})')
    
    # Marcar estatística calculada
    ax1.axvline(estatistica_t, color='orange', linestyle='--', linewidth=3, 
               label=f'Estatística t = {estatistica_t:.3f}')
    
    ax1.set_title(f'🎯 Teste de Hipóteses - Distribuição t', fontsize=14, fontweight='bold')
    ax1.set_xlabel('Estatística t')
    ax1.set_ylabel('Densidade')
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # Gráfico 2: Distribuição da amostra vs H0
    x_dist = np.linspace(media_h0 - 4*erro_padrao, media_h0 + 4*erro_padrao, 1000)
    y_h0 = stats.norm.pdf(x_dist, media_h0, erro_padrao)
    y_amostra = stats.norm.pdf(x_dist, media_amostra, erro_padrao)
    
    ax2.plot(x_dist, y_h0, 'b-', linewidth=2, label=f'H₀: μ = {media_h0}')
    ax2.plot(x_dist, y_amostra, 'r-', linewidth=2, label=f'Amostra: x̄ = {media_amostra}')
    
    ax2.axvline(media_h0, color='blue', linestyle='--', alpha=0.7)
    ax2.axvline(media_amostra, color='red', linestyle='--', alpha=0.7)
    
    ax2.set_title('📊 Comparação: H₀ vs Amostra', fontsize=14, fontweight='bold')
    ax2.set_xlabel('Média')
    ax2.set_ylabel('Densidade')
    ax2.legend()
    ax2.grid(True, alpha=0.3)
    
    # Gráfico 3: Poder do teste (simulação)
    medias_alternativas = np.linspace(media_h0 - 20, media_h0 + 20, 100)
    poder = []
    
    for media_alt in medias_alternativas:
        t_stat = (media_alt - media_h0) / erro_padrao
        if tipo_teste == "Bilateral":
            p_val_sim = 2 * (1 - stats.t.cdf(abs(t_stat), gl))
        elif tipo_teste == "Unilateral Direita":
            p_val_sim = 1 - stats.t.cdf(t_stat, gl)
        else:
            p_val_sim = stats.t.cdf(t_stat, gl)
        
        poder.append(1 if p_val_sim < nivel_significancia else 0)
    
    ax3.plot(medias_alternativas, poder, 'g-', linewidth=2)
    ax3.axvline(media_h0, color='blue', linestyle='--', label=f'H₀: μ = {media_h0}')
    ax3.axvline(media_amostra, color='red', linestyle='--', label=f'Amostra: x̄ = {media_amostra}')
    ax3.set_title('⚡ Função Poder do Teste', fontsize=14, fontweight='bold')
    ax3.set_xlabel('Média Verdadeira')
    ax3.set_ylabel('Probabilidade de Rejeitar H₀')
    ax3.legend()
    ax3.grid(True, alpha=0.3)
    
    # Gráfico 4: Intervalo de confiança
    margem_erro = stats.t.ppf(1-nivel_significancia/2, gl) * erro_padrao
    ic_inferior = media_amostra - margem_erro
    ic_superior = media_amostra + margem_erro
    
    ax4.errorbar([1], [media_amostra], yerr=[[margem_erro], [margem_erro]], 
                fmt='ro', capsize=10, capthick=3, markersize=10, 
                label=f'IC {(1-nivel_significancia)*100:.0f}%: [{ic_inferior:.1f}, {ic_superior:.1f}]')
    
    ax4.axhline(media_h0, color='blue', linestyle='--', linewidth=2, 
               label=f'H₀: μ = {media_h0}')
    
    # Verificar se H0 está no IC
    h0_no_ic = ic_inferior <= media_h0 <= ic_superior
    cor_fundo = 'lightgreen' if h0_no_ic else 'lightcoral'
    ax4.axhspan(ic_inferior, ic_superior, alpha=0.2, color=cor_fundo)
    
    ax4.set_xlim(0.5, 1.5)
    ax4.set_ylim(min(ic_inferior, media_h0) - 5, max(ic_superior, media_h0) + 5)
    ax4.set_title(f'📏 Intervalo de Confiança {(1-nivel_significancia)*100:.0f}%', 
                 fontsize=14, fontweight='bold')
    ax4.set_ylabel('Média')
    ax4.set_xticks([])
    ax4.legend()
    ax4.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Exibir resultados
    print("🧪 RESULTADOS DO TESTE DE HIPÓTESES")
    print("=" * 50)
    print(f"🎯 H₀: μ = {media_h0}")
    if tipo_teste == "Bilateral":
        print(f"🎯 H₁: μ ≠ {media_h0}")
    elif tipo_teste == "Unilateral Direita":
        print(f"🎯 H₁: μ > {media_h0}")
    else:
        print(f"🎯 H₁: μ < {media_h0}")
    
    print(f"📊 Média da amostra: {media_amostra}")
    print(f"📏 Desvio padrão: {desvio_padrao}")
    print(f"👥 Tamanho da amostra: {tamanho_amostra}")
    print(f"🎚️ Nível de significância: {nivel_significancia}")
    print(f"📐 Erro padrão: {erro_padrao:.4f}")
    print(f"📈 Estatística t: {estatistica_t:.4f}")
    print(f"🔍 p-valor: {p_valor:.6f}")
    print(f"⚠️ Região crítica: {regiao_critica}")
    
    print(f"\n🎯 DECISÃO:")
    print("=" * 20)
    if rejeitar_h0:
        print(f"❌ Rejeitar H₀ (p-valor = {p_valor:.6f} < α = {nivel_significancia})")
        print("✅ Evidência estatisticamente significativa contra H₀")
    else:
        print(f"✅ Não rejeitar H₀ (p-valor = {p_valor:.6f} ≥ α = {nivel_significancia})")
        print("⚠️ Não há evidência suficiente contra H₀")
    
    print(f"\n📏 INTERVALO DE CONFIANÇA {(1-nivel_significancia)*100:.0f}%:")
    print(f"   [{ic_inferior:.3f}, {ic_superior:.3f}]")
    
    if ic_inferior <= media_h0 <= ic_superior:
        print("✅ H₀ está dentro do IC (consistente com não rejeição)")
    else:
        print("❌ H₀ está fora do IC (consistente com rejeição)")

# Interface interativa para testes de hipóteses
print("🎮 CONTROLES INTERATIVOS - TESTES DE HIPÓTESES")
print("=" * 55)

interact(demonstrar_teste_hipoteses,
         media_h0=widgets.FloatSlider(
             value=100, min=50, max=150, step=1,
             description='μ₀ (H₀):',
             style={'description_width': 'initial'}
         ),
         media_amostra=widgets.FloatSlider(
             value=105, min=50, max=150, step=0.5,
             description='x̄ (amostra):',
             style={'description_width': 'initial'}
         ),
         desvio_padrao=widgets.FloatSlider(
             value=15, min=5, max=30, step=1,
             description='σ:',
             style={'description_width': 'initial'}
         ),
         tamanho_amostra=widgets.IntSlider(
             value=25, min=5, max=100, step=1,
             description='n:',
             style={'description_width': 'initial'}
         ),
         nivel_significancia=widgets.Dropdown(
             options=[0.01, 0.05, 0.10],
             value=0.05,
             description='α:',
             style={'description_width': 'initial'}
         ),
         tipo_teste=widgets.Dropdown(
             options=['Bilateral', 'Unilateral Direita', 'Unilateral Esquerda'],
             value='Bilateral',
             description='Tipo de teste:',
             style={'description_width': 'initial'}
         )
);

🎮 CONTROLES INTERATIVOS - TESTES DE HIPÓTESES


interactive(children=(FloatSlider(value=100.0, description='μ₀ (H₀):', max=150.0, min=50.0, step=1.0, style=Sl…

In [8]:
# 🎲 SIMULADOR DE DADOS E GERADOR DE EXERCÍCIOS

def simulador_dados_interativo(tipo_dados="Vendas Mensais", n_observacoes=50, 
                               ruido=0.1, trend=True, sazonalidade=False):
    """
    Simulador de dados realistas para prática
    """
    np.random.seed(42)  # Para reproducibilidade
    
    if tipo_dados == "Vendas Mensais":
        # Simular vendas com tendência e sazonalidade
        x = np.arange(n_observacoes)
        base = 1000
        tendencia = 50 * x if trend else np.zeros(n_observacoes)
        sazon = 200 * np.sin(2 * np.pi * x / 12) if sazonalidade else np.zeros(n_observacoes)
        ruido_real = np.random.normal(0, base * ruido, n_observacoes)
        dados = base + tendencia + sazon + ruido_real
        dados = np.maximum(dados, 0)  # Vendas não podem ser negativas
        titulo = "💰 Vendas Mensais (R$)"
        
    elif tipo_dados == "Notas de Alunos":
        # Simular notas com distribuição aproximadamente normal
        dados = np.random.normal(7.5, 1.5, n_observacoes)
        dados = np.clip(dados, 0, 10)  # Notas entre 0 e 10
        titulo = "📚 Notas dos Alunos"
        
    elif tipo_dados == "Altura de Pessoas":
        # Simular alturas com distribuição normal
        dados = np.random.normal(170, 10, n_observacoes)
        dados = np.maximum(dados, 140)  # Altura mínima realística
        titulo = "📏 Altura de Pessoas (cm)"
        
    elif tipo_dados == "Tempo de Atendimento":
        # Simular tempos com distribuição exponencial
        dados = np.random.exponential(5, n_observacoes)
        titulo = "⏱️ Tempo de Atendimento (min)"
        
    elif tipo_dados == "Defeitos por Lote":
        # Simular contagem de defeitos (Poisson)
        dados = np.random.poisson(3, n_observacoes)
        titulo = "🔧 Defeitos por Lote"
        
    # Criar DataFrame
    df = pd.DataFrame({
        'Observacao': range(1, n_observacoes + 1),
        'Valor': dados
    })
    
    # Análise estatística
    media = np.mean(dados)
    mediana = np.median(dados)
    desvio = np.std(dados, ddof=1)
    minimo = np.min(dados)
    maximo = np.max(dados)
    q1, q3 = np.percentile(dados, [25, 75])
    
    # Criar visualizações
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
    
    # Gráfico 1: Série temporal ou sequencial
    ax1.plot(df['Observacao'], df['Valor'], marker='o', linewidth=2, markersize=4)
    ax1.set_title(f'{titulo} - Sequência dos Dados', fontsize=14, fontweight='bold')
    ax1.set_xlabel('Observação')
    ax1.set_ylabel('Valor')
    ax1.grid(True, alpha=0.3)
    
    # Gráfico 2: Histograma
    ax2.hist(dados, bins=min(20, n_observacoes//3), alpha=0.7, color='skyblue', 
             edgecolor='black', density=True)
    ax2.axvline(media, color='red', linestyle='--', linewidth=2, label=f'Média: {media:.2f}')
    ax2.axvline(mediana, color='green', linestyle='--', linewidth=2, label=f'Mediana: {mediana:.2f}')
    ax2.set_title('📊 Distribuição dos Dados', fontsize=14, fontweight='bold')
    ax2.set_xlabel('Valor')
    ax2.set_ylabel('Densidade')
    ax2.legend()
    ax2.grid(True, alpha=0.3)
    
    # Gráfico 3: Box Plot
    box_data = ax3.boxplot(dados, patch_artist=True,
                          boxprops=dict(facecolor='lightcoral', alpha=0.7))
    ax3.set_title('📦 Box Plot', fontsize=14, fontweight='bold')
    ax3.set_ylabel('Valor')
    ax3.grid(True, alpha=0.3)
    
    # Adicionar informações no box plot
    ax3.text(1.1, q1, f'Q1: {q1:.1f}', fontsize=11, va='center')
    ax3.text(1.1, mediana, f'Q2: {mediana:.1f}', fontsize=11, va='center', weight='bold')
    ax3.text(1.1, q3, f'Q3: {q3:.1f}', fontsize=11, va='center')
    
    # Gráfico 4: Q-Q Plot
    stats.probplot(dados, dist="norm", plot=ax4)
    ax4.set_title('📐 Q-Q Plot (Normalidade)', fontsize=14, fontweight='bold')
    ax4.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Exibir estatísticas detalhadas
    print(f"📊 ANÁLISE ESTATÍSTICA - {titulo.upper()}")
    print("=" * 60)
    print(f"📈 Número de observações: {n_observacoes}")
    print(f"📊 Média: {media:.3f}")
    print(f"📊 Mediana: {mediana:.3f}")
    print(f"📏 Desvio Padrão: {desvio:.3f}")
    print(f"📐 Variância: {desvio**2:.3f}")
    print(f"📊 Coeficiente de Variação: {(desvio/media)*100:.1f}%")
    print(f"📉 Mínimo: {minimo:.3f}")
    print(f"📈 Máximo: {maximo:.3f}")
    print(f"📊 Amplitude: {maximo - minimo:.3f}")
    print(f"📦 Q1 (25%): {q1:.3f}")
    print(f"📦 Q3 (75%): {q3:.3f}")
    print(f"📦 IQR: {q3 - q1:.3f}")
    
    # Teste de normalidade
    if n_observacoes >= 8:
        stat_shapiro, p_shapiro = stats.shapiro(dados)
        print(f"\\n🧪 Teste de Normalidade (Shapiro-Wilk):")
        print(f"   Estatística: {stat_shapiro:.6f}")
        print(f"   p-valor: {p_shapiro:.6f}")
        if p_shapiro > 0.05:
            print("   ✅ Dados seguem distribuição normal (p > 0.05)")
        else:
            print("   ❌ Dados NÃO seguem distribuição normal (p ≤ 0.05)")
    
    # Sugestões de exercícios
    print(f"\\n🎯 EXERCÍCIOS SUGERIDOS:")
    print("=" * 35)
    print("1️⃣ Calcule manualmente a média e compare com o resultado")
    print("2️⃣ Identifique possíveis outliers usando a regra IQR")
    print("3️⃣ Construa um intervalo de confiança de 95% para a média")
    print("4️⃣ Teste se a média é significativamente diferente de um valor específico")
    print("5️⃣ Compare esta amostra com outra gerada com parâmetros diferentes")
    
    # Retornar dados para uso posterior
    return df

# Função para gerar exercícios automáticos
def gerar_exercicio_automatico():
    """
    Gera um exercício aleatório com dados e pergunta
    """
    tipos_exercicio = [
        "Teste de hipóteses para média",
        "Intervalo de confiança",
        "Comparação de duas amostras",
        "Análise de correlação"
    ]
    
    tipo = np.random.choice(tipos_exercicio)
    
    if tipo == "Teste de hipóteses para média":
        # Gerar dados e pergunta
        media_real = np.random.uniform(50, 150)
        desvio = np.random.uniform(10, 25)
        n = np.random.randint(20, 51)
        dados = np.random.normal(media_real, desvio, n)
        media_testada = media_real + np.random.uniform(-10, 10)
        
        print("🎯 EXERCÍCIO AUTOMÁTICO - TESTE DE HIPÓTESES")
        print("=" * 50)
        print(f"Uma empresa afirma que a média de {tipo.lower()} é {media_testada:.1f}.")
        print(f"Com base na amostra de {n} observações abaixo, teste esta afirmação.")
        print(f"Use α = 0.05")
        print(f"\\nDados da amostra:")
        print([f"{x:.1f}" for x in dados[:10]], "..." if n > 10 else "")
        print(f"\\n📊 Média da amostra: {np.mean(dados):.3f}")
        print(f"📏 Desvio padrão da amostra: {np.std(dados, ddof=1):.3f}")
        
        return dados, media_testada
    
    return None, None

# Interface interativa do simulador
print("🎮 SIMULADOR DE DADOS INTERATIVO")
print("=" * 40)

interact(simulador_dados_interativo,
         tipo_dados=widgets.Dropdown(
             options=['Vendas Mensais', 'Notas de Alunos', 'Altura de Pessoas', 
                     'Tempo de Atendimento', 'Defeitos por Lote'],
             value='Vendas Mensais',
             description='Tipo de dados:'
         ),
         n_observacoes=widgets.IntSlider(
             value=50, min=20, max=200, step=10,
             description='N° observações:',
             style={'description_width': 'initial'}
         ),
         ruido=widgets.FloatSlider(
             value=0.1, min=0.0, max=0.5, step=0.05,
             description='Nível de ruído:',
             style={'description_width': 'initial'}
         ),
         trend=widgets.Checkbox(
             value=True,
             description='Incluir tendência'
         ),
         sazonalidade=widgets.Checkbox(
             value=False,
             description='Incluir sazonalidade'
         )
);

🎮 SIMULADOR DE DADOS INTERATIVO


interactive(children=(Dropdown(description='Tipo de dados:', options=('Vendas Mensais', 'Notas de Alunos', 'Al…

In [9]:
# 🧮 CALCULADORA ESTATÍSTICA INTERATIVA

def calculadora_estatistica(dados_str="5, 10, 15, 20, 25", calcular="Todas as medidas"):
    """
    Calculadora estatística completa com interface interativa
    """
    try:
        # Converter string para lista de números
        dados = [float(x.strip()) for x in dados_str.split(',')]
        dados_array = np.array(dados)
        n = len(dados)
        
        # Calcular todas as medidas
        resultados = {}
        
        # Medidas de tendência central
        resultados['media'] = np.mean(dados_array)
        resultados['mediana'] = np.median(dados_array)
        
        # Moda
        from collections import Counter
        contador = Counter(dados)
        freq_max = max(contador.values())
        modas = [k for k, v in contador.items() if v == freq_max]
        
        if len(modas) == len(dados):
            resultados['moda'] = "Amodal"
        else:
            resultados['moda'] = modas[0] if len(modas) == 1 else modas
        
        # Medidas de dispersão
        resultados['variancia_pop'] = np.var(dados_array, ddof=0)
        resultados['variancia_am'] = np.var(dados_array, ddof=1)
        resultados['desvio_pop'] = np.std(dados_array, ddof=0)
        resultados['desvio_am'] = np.std(dados_array, ddof=1)
        resultados['amplitude'] = np.max(dados_array) - np.min(dados_array)
        resultados['cv'] = (resultados['desvio_am'] / resultados['media']) * 100
        
        # Medidas de posição
        resultados['q1'] = np.percentile(dados_array, 25)
        resultados['q2'] = np.percentile(dados_array, 50)  # = mediana
        resultados['q3'] = np.percentile(dados_array, 75)
        resultados['iqr'] = resultados['q3'] - resultados['q1']
        resultados['p10'] = np.percentile(dados_array, 10)
        resultados['p90'] = np.percentile(dados_array, 90)
        
        # Medidas de forma
        resultados['assimetria'] = stats.skew(dados_array)
        resultados['curtose'] = stats.kurtosis(dados_array)
        
        # Criar visualização
        fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))
        
        # Gráfico 1: Estatísticas resumo visual
        medidas = ['Média', 'Mediana', 'Q1', 'Q3']
        valores = [resultados['media'], resultados['mediana'], 
                  resultados['q1'], resultados['q3']]
        cores = ['red', 'green', 'orange', 'purple']
        
        bars = ax1.bar(medidas, valores, color=cores, alpha=0.7, edgecolor='black')
        ax1.set_title('📊 Medidas de Tendência Central e Posição', fontsize=14, fontweight='bold')
        ax1.set_ylabel('Valor')
        
        # Adicionar valores nas barras
        for bar, valor in zip(bars, valores):
            height = bar.get_height()
            ax1.text(bar.get_x() + bar.get_width()/2., height + max(valores)*0.01,
                    f'{valor:.2f}', ha='center', va='bottom', fontweight='bold')
        
        ax1.grid(True, alpha=0.3)
        
        # Gráfico 2: Histograma com estatísticas
        ax2.hist(dados, bins=min(10, len(set(dados))), alpha=0.7, 
                color='skyblue', edgecolor='black', density=True)
        ax2.axvline(resultados['media'], color='red', linestyle='--', linewidth=2, 
                   label=f'Média: {resultados["media"]:.2f}')
        ax2.axvline(resultados['mediana'], color='green', linestyle='--', linewidth=2, 
                   label=f'Mediana: {resultados["mediana"]:.2f}')
        
        # Adicionar curva normal para comparação
        x_norm = np.linspace(min(dados), max(dados), 100)
        y_norm = stats.norm.pdf(x_norm, resultados['media'], resultados['desvio_am'])
        ax2.plot(x_norm, y_norm, 'r-', alpha=0.6, label='Normal aproximada')
        
        ax2.set_title('📈 Distribuição dos Dados', fontsize=14, fontweight='bold')
        ax2.set_xlabel('Valor')
        ax2.set_ylabel('Densidade')
        ax2.legend()
        ax2.grid(True, alpha=0.3)
        
        # Gráfico 3: Box plot detalhado
        box_data = ax3.boxplot(dados, patch_artist=True, vert=True,
                              boxprops=dict(facecolor='lightblue', alpha=0.7),
                              medianprops=dict(color='red', linewidth=2))
        
        # Detectar outliers
        outliers = []
        limite_inf = resultados['q1'] - 1.5 * resultados['iqr']
        limite_sup = resultados['q3'] + 1.5 * resultados['iqr']
        
        for valor in dados:
            if valor < limite_inf or valor > limite_sup:
                outliers.append(valor)
        
        ax3.set_title(f'📦 Box Plot (Outliers: {len(outliers)})', fontsize=14, fontweight='bold')
        ax3.set_ylabel('Valor')
        
        # Adicionar informações dos quartis
        ax3.text(1.1, resultados['q1'], f'Q1: {resultados["q1"]:.1f}', fontsize=11, va='center')
        ax3.text(1.1, resultados['mediana'], f'Q2: {resultados["mediana"]:.1f}', 
                fontsize=11, va='center', weight='bold')
        ax3.text(1.1, resultados['q3'], f'Q3: {resultados["q3"]:.1f}', fontsize=11, va='center')
        ax3.text(1.1, limite_sup, f'Lim.Sup: {limite_sup:.1f}', fontsize=10, va='center', 
                style='italic', color='gray')
        ax3.text(1.1, limite_inf, f'Lim.Inf: {limite_inf:.1f}', fontsize=10, va='center', 
                style='italic', color='gray')
        
        ax3.grid(True, alpha=0.3)
        
        # Gráfico 4: Medidas de dispersão
        dispersao_nomes = ['Amplitude', 'Variância', 'Desvio Padrão', 'IQR']
        dispersao_valores = [resultados['amplitude'], resultados['variancia_am'], 
                            resultados['desvio_am'], resultados['iqr']]
        
        # Normalizar valores para visualização (diferentes escalas)
        dispersao_norm = [v/max(dispersao_valores) for v in dispersao_valores]
        
        bars_disp = ax4.bar(dispersao_nomes, dispersao_norm, 
                           color=['coral', 'gold', 'lightgreen', 'plum'], 
                           alpha=0.7, edgecolor='black')
        
        ax4.set_title('📏 Medidas de Dispersão (Normalizadas)', fontsize=14, fontweight='bold')
        ax4.set_ylabel('Valor Normalizado')
        
        # Adicionar valores reais nas barras
        for i, (bar, valor_real) in enumerate(zip(bars_disp, dispersao_valores)):
            height = bar.get_height()
            ax4.text(bar.get_x() + bar.get_width()/2., height + 0.02,
                    f'{valor_real:.2f}', ha='center', va='bottom', fontweight='bold', fontsize=10)
        
        ax4.grid(True, alpha=0.3)
        plt.xticks(rotation=45)
        
        plt.tight_layout()
        plt.show()
        
        # Exibir resultados baseado na seleção
        print("🧮 CALCULADORA ESTATÍSTICA - RESULTADOS")
        print("=" * 50)
        print(f"📊 Dados analisados: {dados}")
        print(f"📈 Tamanho da amostra: {n}")
        
        if calcular in ["Todas as medidas", "Tendência Central"]:
            print(f"\\n📊 MEDIDAS DE TENDÊNCIA CENTRAL:")
            print(f"   Média: {resultados['media']:.4f}")
            print(f"   Mediana: {resultados['mediana']:.4f}")
            print(f"   Moda: {resultados['moda']}")
        
        if calcular in ["Todas as medidas", "Dispersão"]:
            print(f"\\n📏 MEDIDAS DE DISPERSÃO:")
            print(f"   Amplitude: {resultados['amplitude']:.4f}")
            print(f"   Variância (população): {resultados['variancia_pop']:.4f}")
            print(f"   Variância (amostra): {resultados['variancia_am']:.4f}")
            print(f"   Desvio Padrão (população): {resultados['desvio_pop']:.4f}")
            print(f"   Desvio Padrão (amostra): {resultados['desvio_am']:.4f}")
            print(f"   Coeficiente de Variação: {resultados['cv']:.2f}%")
        
        if calcular in ["Todas as medidas", "Posição"]:
            print(f"\\n📦 MEDIDAS DE POSIÇÃO:")
            print(f"   Q1 (25%): {resultados['q1']:.4f}")
            print(f"   Q2 (50% - Mediana): {resultados['q2']:.4f}")
            print(f"   Q3 (75%): {resultados['q3']:.4f}")
            print(f"   IQR: {resultados['iqr']:.4f}")
            print(f"   P10: {resultados['p10']:.4f}")
            print(f"   P90: {resultados['p90']:.4f}")
        
        if calcular in ["Todas as medidas", "Forma"]:
            print(f"\\n📐 MEDIDAS DE FORMA:")
            print(f"   Assimetria: {resultados['assimetria']:.4f}")
            if abs(resultados['assimetria']) < 0.5:
                print("      → Distribuição aproximadamente simétrica")
            elif resultados['assimetria'] > 0.5:
                print("      → Distribuição assimétrica à direita")
            else:
                print("      → Distribuição assimétrica à esquerda")
            
            print(f"   Curtose: {resultados['curtose']:.4f}")
            if abs(resultados['curtose']) < 0.5:
                print("      → Curtose normal (mesocúrtica)")
            elif resultados['curtose'] > 0.5:
                print("      → Distribuição pontiaguda (leptocúrtica)")
            else:
                print("      → Distribuição achatada (platicúrtica)")
        
        if len(outliers) > 0:
            print(f"\\n⚠️ OUTLIERS DETECTADOS:")
            print(f"   Valores: {outliers}")
            print(f"   Critério: Fora do intervalo [Q1-1.5×IQR, Q3+1.5×IQR]")
        
        return resultados
        
    except Exception as e:
        print(f"❌ Erro: {e}")
        print("💡 Dica: Use números separados por vírgula (ex: 1, 2, 3, 4, 5)")
        return None

# 🎯 QUIZ INTERATIVO DE ESTATÍSTICA

def quiz_estatistica():
    """
    Quiz interativo para testar conhecimentos
    """
    perguntas = [
        {
            "pergunta": "Qual medida é mais afetada por outliers?",
            "opcoes": ["A) Média", "B) Mediana", "C) Moda", "D) Quartis"],
            "resposta": "A",
            "explicacao": "A média é sensível a valores extremos (outliers) porque usa todos os valores no cálculo."
        },
        {
            "pergunta": "Em uma distribuição normal, qual porcentagem dos dados está dentro de 1 desvio padrão da média?",
            "opcoes": ["A) 50%", "B) 68%", "C) 95%", "D) 99.7%"],
            "resposta": "B",
            "explicacao": "Pela regra 68-95-99.7, aproximadamente 68% dos dados estão dentro de 1σ da média."
        },
        {
            "pergunta": "O que indica um p-valor de 0.03 em um teste de hipóteses com α = 0.05?",
            "opcoes": ["A) Aceitar H₀", "B) Rejeitar H₀", "C) Inconclusivo", "D) Erro no cálculo"],
            "resposta": "B",
            "explicacao": "p-valor (0.03) < α (0.05), portanto rejeitamos H₀."
        }
    ]
    
    pergunta = np.random.choice(perguntas)
    
    print("🎯 QUIZ DE ESTATÍSTICA")
    print("=" * 30)
    print(f"❓ {pergunta['pergunta']}")
    print()
    for opcao in pergunta['opcoes']:
        print(f"   {opcao}")
    print()
    
    resposta_usuario = input("Digite sua resposta (A, B, C ou D): ").upper().strip()
    
    if resposta_usuario == pergunta['resposta']:
        print("\\n✅ CORRETO! Parabéns!")
    else:
        print(f"\\n❌ INCORRETO. A resposta correta é: {pergunta['resposta']}")
    
    print(f"\\n💡 Explicação: {pergunta['explicacao']}")
    
    return resposta_usuario == pergunta['resposta']

# Interface da calculadora
print("🎮 CALCULADORA ESTATÍSTICA INTERATIVA")
print("=" * 45)

interact(calculadora_estatistica,
         dados_str=widgets.Text(
             value="5, 10, 15, 20, 25",
             description="Dados:",
             style={'description_width': 'initial'},
             layout=widgets.Layout(width='400px')
         ),
         calcular=widgets.Dropdown(
             options=['Todas as medidas', 'Tendência Central', 'Dispersão', 'Posição', 'Forma'],
             value='Todas as medidas',
             description='Calcular:',
             style={'description_width': 'initial'}
         )
);

🎮 CALCULADORA ESTATÍSTICA INTERATIVA


interactive(children=(Text(value='5, 10, 15, 20, 25', description='Dados:', layout=Layout(width='400px'), styl…

# 🎮 GUIA DOS RECURSOS INTERATIVOS

## 🎯 Demonstrações Disponíveis

### 1️⃣ **Medidas de Tendência Central**
- **Função**: `demonstrar_tendencia_central()`
- **Recursos**: 
  - Visualização de média, mediana e moda
  - Efeito de outliers
  - Interpretação automática da distribuição
- **Controles**: Dados personalizados, outliers ajustáveis

### 2️⃣ **Medidas de Dispersão**
- **Função**: `demonstrar_dispersao()`
- **Recursos**: 
  - Variância e desvio padrão com cálculos passo a passo
  - Visualização da contribuição de cada valor
  - Comparação de diferentes níveis de dispersão
- **Controles**: Dados personalizados, mostrar/ocultar cálculos

### 3️⃣ **Distribuições de Probabilidade**
- **Função**: `demonstrar_distribuicoes()`
- **Recursos**: 
  - Normal, Binomial, Poisson, Exponencial
  - Comparação teoria vs. prática
  - Q-Q plots e testes de normalidade
- **Controles**: Tipo de distribuição, parâmetros, número de amostras

### 4️⃣ **Teorema do Limite Central**
- **Função**: `demonstrar_limite_central()`
- **Recursos**: 
  - Demonstração visual da convergência para normalidade
  - Diferentes distribuições originais
  - Evolução com diferentes tamanhos de amostra
- **Controles**: Distribuição original, tamanho da amostra, parâmetros

### 5️⃣ **Testes de Hipóteses**
- **Função**: `demonstrar_teste_hipoteses()`
- **Recursos**: 
  - Testes bilaterais e unilaterais
  - Visualização de regiões críticas
  - Função poder do teste
  - Intervalos de confiança
- **Controles**: Hipóteses, parâmetros, nível de significância

### 6️⃣ **Simulador de Dados**
- **Função**: `simulador_dados_interativo()`
- **Recursos**: 
  - Dados realistas (vendas, notas, alturas, etc.)
  - Análise automática completa
  - Sugestões de exercícios
- **Controles**: Tipo de dados, tamanho, ruído, tendência

### 7️⃣ **Calculadora Estatística**
- **Função**: `calculadora_estatistica()`
- **Recursos**: 
  - Cálculo completo de todas as medidas
  - Detecção de outliers
  - Visualizações automáticas
- **Controles**: Dados personalizados, seleção de medidas

---

## 🚀 Como Usar Este Material

### Para Estudantes:
1. **Comece pelas demonstrações básicas** (tendência central e dispersão)
2. **Experimente com diferentes dados** para ver como as medidas mudam
3. **Use o simulador** para praticar com dados realistas
4. **Teste seus conhecimentos** com a calculadora estatística

### Para Professores:
1. **Use as demonstrações em aula** para explicar conceitos
2. **Gere exercícios automáticos** com o simulador
3. **Customize os parâmetros** para diferentes cenários
4. **Mostre a teoria na prática** com visualizações interativas

### Para Autodidatas:
1. **Siga a sequência das demonstrações**
2. **Pratique mudando os parâmetros**
3. **Compare resultados teóricos vs. práticos**
4. **Use as interpretações automáticas** para entender os resultados

---

## 💡 Dicas de Uso

### ✅ Boas Práticas:
- Comece com dados simples e vá aumentando a complexidade
- Compare sempre os resultados teóricos com os simulados
- Use as interpretações automáticas para entender os conceitos
- Experimente diferentes parâmetros para ver o impacto

### ⚠️ Limitações:
- Alguns cálculos são aproximados para fins didáticos
- Testes estatísticos têm limitações de tamanho de amostra
- Visualizações são otimizadas para compreensão, não precisão máxima

### 🔧 Troubleshooting:
- **Erro nos dados**: Use números separados por vírgula
- **Gráficos não aparecem**: Execute as células de importação primeiro
- **Performance lenta**: Reduza o número de amostras/observações

---

## 🎯 Próximos Passos

### Funcionalidades Futuras:
- [ ] Análise de regressão interativa
- [ ] Testes não-paramétricos
- [ ] Análise de séries temporais
- [ ] Machine Learning básico
- [ ] Dashboards interativos

### Melhorias Planejadas:
- [ ] Mais tipos de distribuições
- [ ] Exercícios com correção automática
- [ ] Exportação de relatórios
- [ ] Integração com bases de dados reais

---

## 🤝 Contribuições

Este material é open-source! Sugestões de melhorias:
- Novos tipos de demonstrações
- Exercícios adicionais
- Correções de bugs
- Melhorias na interface

**Divirta-se explorando o mundo da estatística de forma interativa!** 🎉📊📈"