# 📊 Distribuições de Probabilidade: O Mapa dos Dados

## *Entendendo como a Matemática Descreve o Mundo Real*

---

**Pedro Nunes Guth** | *Módulo 2 de 10 - Estatística para IA*

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_01.png)

Tá, galera! No módulo anterior vocês aprenderam sobre média, mediana e desvio padrão - que são tipo as **características** dos nossos dados, né? Agora vamos subir um level! 

Bora entender como os dados se **comportam** no mundo real através das distribuições de probabilidade! 🚀

## 🎯 O Que São Distribuições de Probabilidade?

Cara, imagina que você é um detetive dos dados! As distribuições são tipo **mapas** que mostram onde seus dados mais gostam de "morar". 

Sabe quando você vai no shopping e tem aqueles mapinhas mostrando "Você está aqui"? As distribuições fazem isso com os dados - elas mostram:

- **Onde** os valores mais aparecem
- **Como** eles se espalham
- **Qual** a probabilidade de encontrar cada valor

### Por Que Isso É Importante para IA?

Liiindo! Quando você entende como seus dados se comportam, você consegue:
- Fazer **predições** mais precisas
- Detectar **anomalias** (dados estranhos)
- Escolher os **algoritmos** certos
- Entender se seu modelo tá funcionando bem

**🎯 Dica do Pedro:** No módulo anterior vimos que a média e desvio padrão descrevem os dados. Agora vamos ver como essas medidas se conectam com as distribuições!

In [None]:
# Setup inicial - Vamos preparar nosso laboratório de distribuições!
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
import pandas as pd
from scipy.special import comb
import warnings
warnings.filterwarnings('ignore')

# Configuração para gráficos mais bonitos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("🔥 Bibliotecas carregadas! Bora explorar as distribuições!")
print("📊 NumPy, Matplotlib, SciPy e Seaborn prontos para ação!")

## 🏗️ Anatomia de Uma Distribuição

Antes de partir pro ataque, vamos entender as peças do quebra-cabeça!

### Os Ingredientes Básicos:

```mermaid
graph TD
    A[Distribuição de Probabilidade] --> B[Função de Densidade/Massa]
    A --> C[Parâmetros]
    A --> D[Suporte]
    B --> E[Probabilidade de cada valor]
    C --> F[Média, Desvio, etc.]
    D --> G[Onde os valores podem existir]
```

### Tipos de Distribuições:

**🔢 Discretas:** Como contar pessoas na fila do pão de açúcar
- Valores "contáveis": 0, 1, 2, 3...
- Exemplo: Número de cliques, vendas por dia

**📏 Contínuas:** Como medir altura ou temperatura
- Valores "infinitos": qualquer número real
- Exemplo: Tempo de resposta, peso, temperatura

**🎯 Dica do Pedro:** Lembra da diferença entre média e mediana? Aqui é parecido - discrete é "contável", contínua é "mensurável"!

In [None]:
# Vamos criar um exemplo visual da diferença entre discreto e contínuo
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Distribuição Discreta - Número de cafés por dia
cafes = np.arange(0, 11)
prob_cafes = [0.05, 0.1, 0.15, 0.2, 0.25, 0.15, 0.05, 0.03, 0.01, 0.005, 0.005]

ax1.bar(cafes, prob_cafes, alpha=0.7, color='brown')
ax1.set_title('📊 DISCRETA: Número de Cafés por Dia\n(Só valores inteiros!)', fontsize=14, pad=20)
ax1.set_xlabel('Número de Cafés')
ax1.set_ylabel('Probabilidade')
ax1.grid(True, alpha=0.3)

# Distribuição Contínua - Tempo para tomar cada café
tempo = np.linspace(0, 20, 1000)
prob_tempo = stats.gamma.pdf(tempo, a=2, scale=2)

ax2.plot(tempo, prob_tempo, linewidth=3, color='orange')
ax2.fill_between(tempo, prob_tempo, alpha=0.3, color='orange')
ax2.set_title('📈 CONTÍNUA: Tempo para Tomar Café\n(Qualquer valor real!)', fontsize=14, pad=20)
ax2.set_xlabel('Tempo (minutos)')
ax2.set_ylabel('Densidade de Probabilidade')
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("☕ Discreto: 1, 2, 3 cafés (não existe 2.5 cafés!)")
print("⏱️ Contínuo: 3.2, 3.24, 3.241... minutos (infinitas possibilidades!)")

## 🔔 Distribuição Normal (Gaussiana): A Rainha das Distribuições

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_02.png)

Tá, essa aqui é a **celebridade** das distribuições! A Normal (ou Gaussiana) aparece em TUDO:
- Altura das pessoas
- Notas de provas
- Erros de medição
- Ruído em sinais

### A Matemática Por Trás (Descomplicada!):

A função de densidade da Normal é:

$$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

**Calma!** Parece assustador, mas vamos quebrar:

- $\mu$ (mi): a **média** - onde o pico da curva fica
- $\sigma$ (sigma): o **desvio padrão** - quão "espalhada" a curva é
- $\pi$ e $e$: constantes matemáticas (aquelas que já conhecemos)
- O resto é pra fazer a curva ter aquela forma de sino linda!

### Por Que Ela É Tão Especial?

1. **Simétrica**: Meta dos valores abaixo da média, metade acima
2. **Regra 68-95-99.7**: A famosa regra dos desvios padrão
3. **Teorema do Limite Central**: Somas de muitas variáveis → Normal
4. **Matemática fácil**: Muitas operações ficam simples

**🎯 Dica do Pedro:** Lembra da média e desvio padrão do módulo 1? Eles são exatamente os parâmetros μ e σ da Normal!

In [None]:
# Vamos criar a Normal do zero e ver como μ e σ afetam a curva

def densidade_normal(x, mu, sigma):
    """Implementação própria da densidade Normal - matemática pura!"""
    coef = 1 / (sigma * np.sqrt(2 * np.pi))
    expoente = -0.5 * ((x - mu) / sigma) ** 2
    return coef * np.exp(expoente)

# Testando diferentes parâmetros
x = np.linspace(-10, 10, 1000)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Efeito da MÉDIA (μ)
for mu in [-2, 0, 2]:
    y = densidade_normal(x, mu, 1)
    ax1.plot(x, y, linewidth=3, label=f'μ = {mu}, σ = 1')
    ax1.axvline(mu, color='red', linestyle='--', alpha=0.5)

ax1.set_title('🎯 Efeito da MÉDIA (μ)\nMuda onde o pico fica!', fontsize=14)
ax1.set_xlabel('Valores (x)')
ax1.set_ylabel('Densidade')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Efeito do DESVIO PADRÃO (σ)
for sigma in [0.5, 1, 2]:
    y = densidade_normal(x, 0, sigma)
    ax2.plot(x, y, linewidth=3, label=f'μ = 0, σ = {sigma}')

ax2.set_title('📏 Efeito do DESVIO PADRÃO (σ)\nMuda quão espalhada fica!', fontsize=14)
ax2.set_xlabel('Valores (x)')
ax2.set_ylabel('Densidade')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("🎯 μ (média): Move a curva pra esquerda ou direita")
print("📏 σ (desvio): Deixa a curva mais 'gorda' ou mais 'magra'")
print("\n🔥 Nossa implementação bateu com a teoria!")

In [None]:
# A famosa Regra 68-95-99.7 na prática!
mu, sigma = 0, 1  # Normal padrão
x = np.linspace(-4, 4, 1000)
y = stats.norm.pdf(x, mu, sigma)

fig, ax = plt.subplots(figsize=(14, 8))

# Plotar a curva
ax.plot(x, y, 'black', linewidth=3, label='Normal(0,1)')

# Áreas coloridas para cada regra
# 68% - 1 desvio padrão
x1 = x[(x >= -1) & (x <= 1)]
y1 = stats.norm.pdf(x1, mu, sigma)
ax.fill_between(x1, y1, alpha=0.3, color='green', label='68% (±1σ)')

# 95% - 2 desvios padrão
x2 = x[(x >= -2) & (x <= 2) & ((x <= -1) | (x >= 1))]
y2 = stats.norm.pdf(x2, mu, sigma)
ax.fill_between(x2, y2, alpha=0.3, color='yellow', label='95% (±2σ)')

# 99.7% - 3 desvios padrão
x3 = x[(x >= -3) & (x <= 3) & ((x <= -2) | (x >= 2))]
y3 = stats.norm.pdf(x3, mu, sigma)
ax.fill_between(x3, y3, alpha=0.3, color='red', label='99.7% (±3σ)')

# Linhas verticais nos desvios
for i in range(-3, 4):
    ax.axvline(i, color='gray', linestyle='--', alpha=0.5)
    ax.text(i, -0.02, f'{i}σ', ha='center', va='top')

ax.set_title('🎯 A Regra 68-95-99.7 da Normal\n"A Regra de Ouro da Estatística"', fontsize=16, pad=20)
ax.set_xlabel('Desvios Padrão (σ)')
ax.set_ylabel('Densidade')
ax.legend(fontsize=12)
ax.grid(True, alpha=0.3)

# Anotações explicativas
ax.annotate('68% dos dados\nestão aqui!', xy=(0, 0.2), xytext=(0, 0.3),
            arrowprops=dict(arrowstyle='->', color='green'),
            fontsize=12, ha='center', color='green', weight='bold')

plt.tight_layout()
plt.show()

print("🎯 REGRA 68-95-99.7:")
print("   📊 68% dos dados estão dentro de ±1 desvio padrão")
print("   📊 95% dos dados estão dentro de ±2 desvios padrão")
print("   📊 99.7% dos dados estão dentro de ±3 desvios padrão")
print("\n🔥 Isso significa que valores além de ±3σ são MUITO raros!")

## 🎲 Distribuição Binomial: O Cara-ou-Coroa Turbinado

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_03.png)

Tá, imagina que você vai jogar moeda 10 vezes. Quantas caras você vai tirar? A Binomial responde isso!

Ela modela situações de **"sucesso ou fracasso"**:
- Conversões em site (clicou ou não clicou)
- Vendas (comprou ou não comprou) 
- Emails (spam ou não spam)
- Testes A/B (versão A ou B funcionou)

### A Matemática (Mais Simples que Parece!):

$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$

Opa, vamos quebrar essa fórmula:

- $n$: número total de tentativas (jogadas de moeda)
- $k$: número de sucessos que queremos (quantas caras)
- $p$: probabilidade de sucesso em cada tentativa (0.5 para moeda justa)
- $\binom{n}{k}$: combinação - "de quantas formas posso escolher k sucessos em n tentativas"

### Os Parâmetros:
- **Média:** $\mu = np$ 
- **Variância:** $\sigma^2 = np(1-p)$
- **Desvio Padrão:** $\sigma = \sqrt{np(1-p)}$

**🎯 Dica do Pedro:** Quando n é grande e p não é muito próximo de 0 ou 1, a Binomial fica parecida com a Normal! Isso vai ser útil nos próximos módulos!

In [None]:
# Implementando a Binomial do zero - matemática pura!

def combinacao(n, k):
    """Calcula C(n,k) = n! / (k!(n-k)!)"""
    if k > n or k < 0:
        return 0
    return int(comb(n, k))

def prob_binomial(n, k, p):
    """Calcula P(X=k) na distribuição Binomial"""
    return combinacao(n, k) * (p ** k) * ((1 - p) ** (n - k))

# Exemplo prático: Site de e-commerce
# 100 visitantes por dia, 5% de conversão
n_visitantes = 100
prob_conversao = 0.05

# Calculando probabilidades para diferentes números de vendas
vendas_possiveis = np.arange(0, 21)  # de 0 a 20 vendas
probabilidades = [prob_binomial(n_visitantes, k, prob_conversao) for k in vendas_possiveis]

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Nossa implementação
ax1.bar(vendas_possiveis, probabilidades, alpha=0.7, color='blue')
ax1.set_title('🛒 Nossa Implementação\nVendas Diárias (100 visitantes, 5% conversão)', fontsize=12)
ax1.set_xlabel('Número de Vendas')
ax1.set_ylabel('Probabilidade')
ax1.grid(True, alpha=0.3)

# Comparando com SciPy
prob_scipy = stats.binom.pmf(vendas_possiveis, n_visitantes, prob_conversao)
ax2.bar(vendas_possiveis, prob_scipy, alpha=0.7, color='red')
ax2.set_title('📊 SciPy (Verificação)\nMesmo resultado!', fontsize=12)
ax2.set_xlabel('Número de Vendas')
ax2.set_ylabel('Probabilidade')
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando estatísticas
media = n_visitantes * prob_conversao
variancia = n_visitantes * prob_conversao * (1 - prob_conversao)
desvio = np.sqrt(variancia)

print(f"📊 ESTATÍSTICAS DO E-COMMERCE:")
print(f"   🎯 Média de vendas por dia: {media:.1f}")
print(f"   📏 Desvio padrão: {desvio:.1f}")
print(f"   🎲 Probabilidade de exatamente 5 vendas: {prob_binomial(n_visitantes, 5, prob_conversao):.3f}")
print(f"   🔥 Nossas fórmulas batem com o SciPy!")

In [None]:
# Vamos ver como diferentes parâmetros afetam a Binomial
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
axes = axes.ravel()

# Cenários diferentes
cenarios = [
    {'n': 10, 'p': 0.5, 'titulo': 'Moeda Justa\n(n=10, p=0.5)', 'cor': 'blue'},
    {'n': 20, 'p': 0.3, 'titulo': 'Conversão Baixa\n(n=20, p=0.3)', 'cor': 'red'},
    {'n': 50, 'p': 0.1, 'titulo': 'Evento Raro\n(n=50, p=0.1)', 'cor': 'green'},
    {'n': 100, 'p': 0.8, 'titulo': 'Alta Probabilidade\n(n=100, p=0.8)', 'cor': 'orange'}
]

for i, cenario in enumerate(cenarios):
    n, p = cenario['n'], cenario['p']
    k_values = np.arange(0, n + 1)
    probabilities = stats.binom.pmf(k_values, n, p)
    
    axes[i].bar(k_values, probabilities, alpha=0.7, color=cenario['cor'])
    axes[i].set_title(cenario['titulo'], fontsize=12)
    axes[i].set_xlabel('Número de Sucessos (k)')
    axes[i].set_ylabel('Probabilidade')
    axes[i].grid(True, alpha=0.3)
    
    # Marcar a média
    media = n * p
    axes[i].axvline(media, color='black', linestyle='--', 
                   label=f'Média = {media:.1f}')
    axes[i].legend()

plt.suptitle('🎲 Como os Parâmetros Afetam a Distribuição Binomial', fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

print("🔍 OBSERVAÇÕES IMPORTANTES:")
print("   📊 Quando p=0.5, a distribuição fica simétrica")
print("   📈 Quando n aumenta, a distribuição fica mais 'suave'")
print("   ⚖️ Quando p é muito pequeno ou muito grande, fica assimétrica")
print("   🎯 A média sempre fica em n×p")

## ⚡ Distribuição de Poisson: A Especialista em Eventos Raros

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_04.png)

A Poisson é tipo a **especialista em contar eventos raros** que acontecem no tempo ou espaço:

- Número de emails por hora
- Acidentes de trânsito por dia
- Cliques em anúncios por minuto
- Bugs encontrados em código
- Chegada de clientes numa loja

### A Matemática (Mais Simples Ainda!):

$$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

Olha só que clean! Ela só tem **um parâmetro**:

- $\lambda$ (lambda): taxa média de ocorrência do evento
- $k$: número de eventos que queremos calcular
- $e$: número de Euler (~2.718)
- $k!$: fatorial de k

### Características Especiais:
- **Média:** $\mu = \lambda$
- **Variância:** $\sigma^2 = \lambda$ 
- **Desvio Padrão:** $\sigma = \sqrt{\lambda}$

Liiindo! Na Poisson, a média e variância são **iguais**!

**🎯 Dica do Pedro:** A Poisson é tipo um "limite" da Binomial quando n é muito grande e p é muito pequeno, mas n×p se mantém constante!

In [None]:
# Implementando Poisson do zero e vendo ela em ação!

def fatorial(n):
    """Calcula n! de forma recursiva"""
    if n <= 1:
        return 1
    return n * fatorial(n - 1)

def prob_poisson(k, lam):
    """Calcula P(X=k) na distribuição de Poisson"""
    return (lam ** k) * np.exp(-lam) / fatorial(k)

# Exemplo prático: Sistema de monitoramento de site
# Em média, 3 erros por hora
lambda_erros = 3

# Calculando probabilidades para diferentes números de erros
erros_possiveis = np.arange(0, 15)
prob_nossa = [prob_poisson(k, lambda_erros) for k in erros_possiveis]
prob_scipy = stats.poisson.pmf(erros_possiveis, lambda_erros)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Nossa implementação
ax1.bar(erros_possiveis, prob_nossa, alpha=0.7, color='purple')
ax1.set_title('⚡ Nossa Poisson\nErros por Hora (λ=3)', fontsize=12)
ax1.set_xlabel('Número de Erros')
ax1.set_ylabel('Probabilidade')
ax1.axvline(lambda_erros, color='red', linestyle='--', label=f'Média = {lambda_erros}')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Comparação com SciPy
ax2.bar(erros_possiveis, prob_scipy, alpha=0.7, color='orange')
ax2.set_title('📊 SciPy (Verificação)\nPerfeito!', fontsize=12)
ax2.set_xlabel('Número de Erros')
ax2.set_ylabel('Probabilidade')
ax2.axvline(lambda_erros, color='red', linestyle='--', label=f'Média = {lambda_erros}')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando algumas probabilidades interessantes
prob_0_erros = prob_poisson(0, lambda_erros)
prob_mais_5_erros = sum([prob_poisson(k, lambda_erros) for k in range(6, 20)])

print(f"🖥️ MONITORAMENTO DO SISTEMA:")
print(f"   📊 Taxa média: {lambda_erros} erros/hora")
print(f"   ✅ Prob. de 0 erros em 1h: {prob_0_erros:.3f} ({prob_0_erros*100:.1f}%)")
print(f"   🚨 Prob. de mais de 5 erros: {prob_mais_5_erros:.3f} ({prob_mais_5_erros*100:.1f}%)")
print(f"   🎯 Desvio padrão: {np.sqrt(lambda_erros):.2f}")
print(f"\n🔥 Poisson é perfeita para eventos raros!")

In [None]:
# Vamos ver como λ (lambda) afeta a forma da Poisson
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
axes = axes.ravel()

lambdas = [0.5, 2, 5, 10]
cores = ['blue', 'red', 'green', 'purple']
cenarios = [
    'Eventos Muito Raros\n(λ=0.5)',
    'Eventos Raros\n(λ=2)', 
    'Eventos Moderados\n(λ=5)',
    'Eventos Frequentes\n(λ=10)'
]

for i, (lam, cor, cenario) in enumerate(zip(lambdas, cores, cenarios)):
    # Ajustar o range baseado no lambda
    max_k = min(25, int(lam + 4 * np.sqrt(lam) + 5))
    k_values = np.arange(0, max_k)
    probabilities = stats.poisson.pmf(k_values, lam)
    
    axes[i].bar(k_values, probabilities, alpha=0.7, color=cor)
    axes[i].set_title(cenario, fontsize=12)
    axes[i].set_xlabel('Número de Eventos (k)')
    axes[i].set_ylabel('Probabilidade')
    axes[i].grid(True, alpha=0.3)
    
    # Marcar média e desvio
    axes[i].axvline(lam, color='black', linestyle='--', 
                   label=f'Média = {lam}')
    axes[i].axvline(lam + np.sqrt(lam), color='gray', linestyle=':', 
                   alpha=0.7, label=f'Média + σ')
    axes[i].legend()

plt.suptitle('⚡ Como λ (Lambda) Muda a Distribuição de Poisson', fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

print("🔍 PADRÕES DA POISSON:")
print("   📈 Quanto maior λ, mais 'espalhada' fica a distribuição")
print("   📊 Para λ pequeno, a maior probabilidade é em k=0")
print("   ⚖️ Para λ grande, a distribuição fica mais simétrica")
print("   🎯 A moda (pico) fica sempre próxima de λ")

## 🔄 Conectando as Distribuições

Tá, agora vem a parte mais dahora! As distribuições não são ilhas isoladas - elas se conectam de formas incríveis!

```mermaid
graph LR
    A[Binomial] -->|n grande, p pequeno| B[Poisson]
    A -->|n grande, p moderado| C[Normal]
    B -->|λ grande| C
    D[Dados Reais] --> E{Que tipo?}
    E -->|Contínuo, simétrico| C
    E -->|Discreto, sucessos| A
    E -->|Eventos raros| B
```

### As Conexões Mágicas:

1. **Binomial → Poisson:** Quando n fica muito grande e p muito pequeno, mas n×p = λ
2. **Poisson → Normal:** Quando λ fica grande, a Poisson vira Normal
3. **Binomial → Normal:** Quando n é grande e p não é extremo

**🎯 Dica do Pedro:** Essas conexões são fundamentais para entender quando usar cada distribuição e como elas aparecem na IA!

In [None]:
# Vamos ver as conexões na prática - é liiindo!
fig, axes = plt.subplots(2, 3, figsize=(18, 12))

# Linha 1: Binomial → Poisson
# Fixando λ = np = 5, mas mudando n e p
lambda_fixo = 5
scenarios_binom_poisson = [
    {'n': 25, 'p': 0.2},
    {'n': 100, 'p': 0.05},
    {'n': 500, 'p': 0.01}
]

for i, scenario in enumerate(scenarios_binom_poisson):
    n, p = scenario['n'], scenario['p']
    k_values = np.arange(0, 20)
    
    # Binomial
    prob_binom = stats.binom.pmf(k_values, n, p)
    axes[0, i].bar(k_values - 0.2, prob_binom, width=0.4, alpha=0.7, 
                   color='blue', label=f'Binomial(n={n}, p={p})')
    
    # Poisson
    prob_poisson = stats.poisson.pmf(k_values, lambda_fixo)
    axes[0, i].bar(k_values + 0.2, prob_poisson, width=0.4, alpha=0.7, 
                   color='red', label=f'Poisson(λ={lambda_fixo})')
    
    axes[0, i].set_title(f'Binomial vs Poisson\nn={n}, p={p}, λ={lambda_fixo}', fontsize=10)
    axes[0, i].legend()
    axes[0, i].grid(True, alpha=0.3)

# Linha 2: Aproximação Normal
approximations = [
    {'type': 'Binomial', 'n': 100, 'p': 0.3, 'color': 'blue'},
    {'type': 'Poisson', 'lambda': 20, 'color': 'red'},
    {'type': 'Normal', 'mu': 30, 'sigma': 5, 'color': 'green'}
]

x_cont = np.linspace(0, 60, 1000)

for i, approx in enumerate(approximations):
    if approx['type'] == 'Binomial':
        n, p = approx['n'], approx['p']
        k_values = np.arange(0, n+1)
        prob_discrete = stats.binom.pmf(k_values, n, p)
        axes[1, i].bar(k_values, prob_discrete, alpha=0.7, color=approx['color'])
        
        # Aproximação normal
        mu_approx = n * p
        sigma_approx = np.sqrt(n * p * (1 - p))
        normal_approx = stats.norm.pdf(x_cont, mu_approx, sigma_approx)
        axes[1, i].plot(x_cont, normal_approx, 'black', linewidth=2, 
                       label='Aproximação Normal')
        axes[1, i].set_title(f'Binomial({n}, {p})\nμ={mu_approx}, σ={sigma_approx:.1f}')
        
    elif approx['type'] == 'Poisson':
        lam = approx['lambda']
        k_values = np.arange(0, int(lam + 4*np.sqrt(lam)))
        prob_discrete = stats.poisson.pmf(k_values, lam)
        axes[1, i].bar(k_values, prob_discrete, alpha=0.7, color=approx['color'])
        
        # Aproximação normal
        normal_approx = stats.norm.pdf(x_cont, lam, np.sqrt(lam))
        axes[1, i].plot(x_cont, normal_approx, 'black', linewidth=2,
                       label='Aproximação Normal')
        axes[1, i].set_title(f'Poisson({lam})\nμ={lam}, σ={np.sqrt(lam):.1f}')
        
    else:  # Normal
        mu, sigma = approx['mu'], approx['sigma']
        normal_curve = stats.norm.pdf(x_cont, mu, sigma)
        axes[1, i].plot(x_cont, normal_curve, color=approx['color'], linewidth=3)
        axes[1, i].fill_between(x_cont, normal_curve, alpha=0.3, color=approx['color'])
        axes[1, i].set_title(f'Normal({mu}, {sigma})\nA distribuição contínua')
    
    axes[1, i].legend()
    axes[1, i].grid(True, alpha=0.3)

plt.suptitle('🔄 As Conexões Mágicas Entre Distribuições', fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print("🔗 CONEXÕES OBSERVADAS:")
print("   📊 Linha 1: Binomial converge para Poisson quando n↑ e p↓")
print("   📈 Linha 2: Ambas convergem para Normal quando os parâmetros são grandes")
print("   🎯 Essas aproximações são fundamentais na estatística!")

## 🎯 Aplicações Práticas na IA

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_05.png)

Agora vem a parte que mais amo: como essas distribuições aparecem **de verdade** na IA!

### 🔔 Normal na IA:
- **Inicialização de pesos** em redes neurais
- **Ruído** em dados de sensores
- **Erros de predição** em modelos bem calibrados
- **Gradientes** durante o treinamento

### 🎲 Binomial na IA:
- **Classificação binária** (spam/não spam)
- **A/B testing** (qual versão é melhor)
- **Dropout** em redes neurais
- **Validação cruzada** (acerto/erro)

### ⚡ Poisson na IA:
- **Sistemas de recomendação** (cliques por hora)
- **Detecção de anomalias** (eventos raros)
- **Processamento de linguagem** (palavras por documento)
- **Séries temporais** (eventos por período)

**🎯 Dica do Pedro:** No próximo módulo vamos ver como essas distribuições se conectam com probabilidade condicional e Bayes!

In [None]:
# Exemplo prático: Sistema de detecção de spam
# Vamos simular um sistema real de machine learning!

np.random.seed(42)  # Para resultados reproduzíveis

# Simulando dados de um sistema de email
print("📧 SISTEMA DE DETECÇÃO DE SPAM")
print("="*50)

# 1. Normal: Tempo de processamento (em ms)
tempo_processamento = np.random.normal(loc=150, scale=25, size=1000)
tempo_processamento = np.maximum(tempo_processamento, 0)  # Não pode ser negativo

# 2. Binomial: Classificação (spam=1, ham=0)
# Assumindo 15% de spam
n_emails = 1000
prob_spam = 0.15
classificacoes = np.random.binomial(1, prob_spam, n_emails)

# 3. Poisson: Número de emails suspeitos por hora
lambda_suspeitos = 2.5
horas = 24
emails_suspeitos_por_hora = np.random.poisson(lambda_suspeitos, horas)

# Visualizando o sistema completo
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Tempo de processamento (Normal)
ax1.hist(tempo_processamento, bins=50, alpha=0.7, color='blue', density=True)
x_temp = np.linspace(tempo_processamento.min(), tempo_processamento.max(), 100)
y_temp = stats.norm.pdf(x_temp, 150, 25)
ax1.plot(x_temp, y_temp, 'red', linewidth=2, label='Normal(150, 25)')
ax1.set_title('⏱️ Tempo de Processamento\n(Distribuição Normal)', fontsize=12)
ax1.set_xlabel('Tempo (ms)')
ax1.set_ylabel('Densidade')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 2. Classificações (Binomial agregada)
spam_counts = np.sum(classificacoes.reshape(-1, 50), axis=1)  # Grupos de 50 emails
ax2.hist(spam_counts, bins=15, alpha=0.7, color='red')
ax2.set_title('🎯 Spam por Lote (50 emails)\n(Distribuição Binomial)', fontsize=12)
ax2.set_xlabel('Número de Spams')
ax2.set_ylabel('Frequência')
ax2.axvline(50 * prob_spam, color='black', linestyle='--', 
           label=f'Esperado = {50*prob_spam:.1f}')
ax2.legend()
ax2.grid(True, alpha=0.3)

# 3. Emails suspeitos por hora (Poisson)
ax3.bar(range(24), emails_suspeitos_por_hora, alpha=0.7, color='purple')
ax3.set_title('🚨 Emails Suspeitos por Hora\n(Distribuição de Poisson)', fontsize=12)
ax3.set_xlabel('Hora do Dia')
ax3.set_ylabel('Emails Suspeitos')
ax3.axhline(lambda_suspeitos, color='red', linestyle='--', 
           label=f'Média = {lambda_suspeitos}')
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Dashboard de métricas
ax4.axis('off')
metrics_text = f"""
📊 MÉTRICAS DO SISTEMA:

⏱️ PROCESSAMENTO:
   • Tempo médio: {np.mean(tempo_processamento):.1f} ms
   • Desvio padrão: {np.std(tempo_processamento):.1f} ms
   • 95% dos emails < {np.percentile(tempo_processamento, 95):.1f} ms

🎯 CLASSIFICAÇÃO:
   • Taxa de spam: {np.mean(classificacoes)*100:.1f}%
   • Total de spams: {np.sum(classificacoes)}/{len(classificacoes)}
   • Esperado: {prob_spam*100:.1f}%

🚨 DETECÇÃO:
   • Suspeitos/hora: {np.mean(emails_suspeitos_por_hora):.1f}
   • Máximo em 1h: {np.max(emails_suspeitos_por_hora)}
   • Horas sem suspeitos: {np.sum(emails_suspeitos_por_hora == 0)}/24
"""
ax4.text(0.1, 0.9, metrics_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightgray', alpha=0.8))

plt.suptitle('📧 Sistema Real de Detecção de Spam\nTrês Distribuições Trabalhando Juntas!', 
             fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print("\n🔥 INSIGHTS DO SISTEMA:")
print(f"   📊 Normal: Tempos seguem padrão previsível - bom para SLA!")
print(f"   🎲 Binomial: Taxa de spam está dentro do esperado")
print(f"   ⚡ Poisson: Distribuição de suspeitos ajuda a detectar picos anômalos")

## 💪 Exercício Prático 1: Escolhendo a Distribuição Certa

Bora praticar! Vou dar alguns cenários e você precisa:
1. Identificar qual distribuição usar
2. Estimar os parâmetros
3. Calcular probabilidades interessantes

**🎯 Dica do Pedro:** Pense nas características de cada distribuição que vimos!

In [None]:
# EXERCÍCIO 1: Análise de diferentes cenários
print("💪 EXERCÍCIO: IDENTIFICANDO DISTRIBUIÇÕES")
print("=" * 50)

cenarios = [
    {
        'nome': '🏪 E-commerce',
        'descricao': 'Em um site, 2% dos visitantes fazem compra. Recebemos 500 visitantes por dia.',
        'pergunta': 'Qual a probabilidade de ter exatamente 8 vendas?',
        'distribuicao': 'Binomial',
        'parametros': {'n': 500, 'p': 0.02},
        'calculo': lambda: stats.binom.pmf(8, 500, 0.02)
    },
    {
        'nome': '📞 Call Center', 
        'descricao': 'Um call center recebe em média 4 ligações por minuto.',
        'pergunta': 'Qual a probabilidade de receber mais de 6 ligações em 1 minuto?',
        'distribuicao': 'Poisson',
        'parametros': {'lambda': 4},
        'calculo': lambda: 1 - stats.poisson.cdf(6, 4)
    },
    {
        'nome': '⚖️ Medições',
        'descricao': 'Medições de temperatura seguem Normal com média 25°C e desvio 3°C.',
        'pergunta': 'Qual a probabilidade de medir entre 22°C e 28°C?',
        'distribuicao': 'Normal',
        'parametros': {'mu': 25, 'sigma': 3},
        'calculo': lambda: stats.norm.cdf(28, 25, 3) - stats.norm.cdf(22, 25, 3)
    }
]

# Resolvendo cada cenário
for i, cenario in enumerate(cenarios, 1):
    print(f"\n{i}. {cenario['nome']}")
    print(f"   📝 Situação: {cenario['descricao']}")
    print(f"   ❓ Pergunta: {cenario['pergunta']}")
    print(f"   🎯 Distribuição: {cenario['distribuicao']}")
    
    # Parâmetros
    params_str = ', '.join([f"{k}={v}" for k, v in cenario['parametros'].items()])
    print(f"   🔧 Parâmetros: {params_str}")
    
    # Resultado
    resultado = cenario['calculo']()
    print(f"   ✅ Resposta: {resultado:.4f} ({resultado*100:.2f}%)")
    
print("\n" + "="*50)
print("🎯 DICAS PARA IDENTIFICAR:")
print("   🔔 Normal: dados contínuos, simétricos, 'comportados'")
print("   🎲 Binomial: contagem de sucessos em n tentativas")
print("   ⚡ Poisson: contagem de eventos raros por período")

# DESAFIO EXTRA: Agora é sua vez!
print("\n🚀 DESAFIO EXTRA:")
print("Cenário: Uma IA faz 1000 predições por dia, com 92% de acerto.")
print("Pergunta: Qual a probabilidade de acertar menos de 900?")
print("\n💭 Pense: Qual distribuição usar? Quais os parâmetros?")
print("🔍 Dica: É contagem de sucessos em tentativas fixas...")

## 🧠 Exercício Prático 2: Simulação Monte Carlo

Agora vamos fazer algo mais avançado! Vamos usar **simulação Monte Carlo** para validar nossas distribuições teóricas.

A ideia é: se a teoria estiver certa, simulações devem dar resultados similares!

**🎯 Dica do Pedro:** Monte Carlo é uma técnica poderosíssima em IA - vamos ver um gostinho dela aqui!

In [None]:
# EXERCÍCIO 2: Simulação vs Teoria
print("🎲 MONTE CARLO: SIMULAÇÃO VS TEORIA")
print("=" * 50)

np.random.seed(123)  # Para resultados reproduzíveis
n_simulacoes = 100000

# Cenário: Sistema de recomendação
# - 1000 usuários por hora
# - 3% clicam nas recomendações
# - Queremos simular um dia (24 horas)

usuarios_por_hora = 1000
prob_clique = 0.03
horas = 24

print(f"📊 CENÁRIO: Sistema de Recomendação")
print(f"   👥 Usuários por hora: {usuarios_por_hora}")
print(f"   🖱️ Probabilidade de clique: {prob_clique*100}%")
print(f"   ⏰ Período: {horas} horas")

# SIMULAÇÃO: Gerando dados "reais"
cliques_simulados = []
for _ in range(n_simulacoes):
    # Para cada simulação, gerar 24 horas de dados
    cliques_dia = []
    for hora in range(horas):
        # Binomial: quantos cliques nesta hora?
        cliques_hora = np.random.binomial(usuarios_por_hora, prob_clique)
        cliques_dia.append(cliques_hora)
    cliques_simulados.append(cliques_dia)

cliques_simulados = np.array(cliques_simulados)

# TEORIA: O que esperamos?
media_teorica = usuarios_por_hora * prob_clique
variancia_teorica = usuarios_por_hora * prob_clique * (1 - prob_clique)
desvio_teorico = np.sqrt(variancia_teorica)

# COMPARAÇÃO
media_simulada = np.mean(cliques_simulados)
desvio_simulado = np.std(cliques_simulados)

fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Distribuição de cliques por hora (uma simulação)
exemplo_dia = cliques_simulados[0]
ax1.bar(range(24), exemplo_dia, alpha=0.7, color='blue')
ax1.axhline(media_teorica, color='red', linestyle='--', 
           label=f'Média Teórica = {media_teorica:.1f}')
ax1.set_title('📈 Cliques por Hora (Exemplo de 1 Dia)', fontsize=12)
ax1.set_xlabel('Hora do Dia')
ax1.set_ylabel('Número de Cliques')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 2. Histograma de todas as simulações
ax2.hist(cliques_simulados.flatten(), bins=50, alpha=0.7, 
         density=True, color='green', label='Simulação')

# Sobrepor a distribuição binomial teórica
x_teorico = np.arange(int(media_teorica - 4*desvio_teorico), 
                      int(media_teorica + 4*desvio_teorico))
y_teorico = stats.binom.pmf(x_teorico, usuarios_por_hora, prob_clique)
ax2.bar(x_teorico, y_teorico, alpha=0.5, color='red', 
        width=0.8, label='Teoria (Binomial)')

ax2.set_title('📊 Distribuição de Cliques: Simulação vs Teoria', fontsize=12)
ax2.set_xlabel('Número de Cliques')
ax2.set_ylabel('Densidade/Probabilidade')
ax2.legend()
ax2.grid(True, alpha=0.3)

# 3. Convergência da média
medias_cumulativas = np.cumsum(cliques_simulados.flatten()) / np.arange(1, len(cliques_simulados.flatten()) + 1)
sample_points = np.logspace(2, np.log10(len(medias_cumulativas)), 1000).astype(int)
ax3.plot(sample_points, medias_cumulativas[sample_points-1], 'blue', linewidth=2)
ax3.axhline(media_teorica, color='red', linestyle='--', 
           label=f'Média Teórica = {media_teorica:.1f}')
ax3.set_title('🎯 Convergência da Média (Lei dos Grandes Números)', fontsize=12)
ax3.set_xlabel('Número de Amostras')
ax3.set_ylabel('Média Cumulativa')
ax3.set_xscale('log')
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Comparação numérica
ax4.axis('off')
comparison_text = f"""
🔬 SIMULAÇÃO vs TEORIA:

📊 MÉDIA:
   Teoria:    {media_teorica:.2f}
   Simulação: {media_simulada:.2f}
   Diferença: {abs(media_teorica - media_simulada):.4f}

📏 DESVIO PADRÃO:
   Teoria:    {desvio_teorico:.2f}
   Simulação: {desvio_simulado:.2f}
   Diferença: {abs(desvio_teorico - desvio_simulado):.4f}

✅ VALIDAÇÃO:
   Erro médio: {abs(media_teorica - media_simulada)/media_teorica*100:.3f}%
   Erro desvio: {abs(desvio_teorico - desvio_simulado)/desvio_teorico*100:.3f}%
   
🎯 CONCLUSÃO:
   {'✅ Teoria validada!' if abs(media_teorica - media_simulada) < 0.1 else '❌ Verificar teoria'}
"""
ax4.text(0.1, 0.9, comparison_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightblue', alpha=0.8))

plt.suptitle('🎲 Monte Carlo: Validando Nossas Distribuições', fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print(f"\n🔥 RESULTADO: {n_simulacoes:,} simulações confirmam nossa teoria!")
print(f"📊 A distribuição binomial modela perfeitamente este sistema!")

## 🎓 Resumo: O Mapa dos Dados Completo

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estatística-para-ia-modulo-02_img_06.png)

Liiindo! Vocês acabaram de dominar o **mapa dos dados**! Vamos recapitular essa jornada incrível:

### 🗺️ O Que Aprendemos:

```mermaid
graph TD
    A[Distribuições de Probabilidade] --> B[Normal/Gaussiana]
    A --> C[Binomial]
    A --> D[Poisson]
    B --> E[Dados contínuos<br/>Simétrica<br/>μ e σ]
    C --> F[Sucessos/fracassos<br/>n tentativas<br/>p probabilidade]
    D --> G[Eventos raros<br/>λ taxa média<br/>Tempo/espaço]
    E --> H[IA: Pesos, erros, gradientes]
    F --> I[IA: Classificação, A/B tests]
    G --> J[IA: Anomalias, cliques, NLP]
```

### 📚 Conceitos-Chave:

1. **Distribuições são mapas** que mostram onde os dados "moram"
2. **Normal:** A rainha - simétrica, ubíqua, matemática elegante
3. **Binomial:** Contagem de sucessos em tentativas fixas
4. **Poisson:** Especialista em eventos raros
5. **Conexões:** As distribuições se transformam umas nas outras!
6. **Aplicações:** Cada uma tem seu lugar especial na IA

### 🔗 Conexão com o Curso:
- **Módulo 1:** Usamos μ e σ que calculamos como parâmetros das distribuições
- **Módulo 3:** Vamos usar essas distribuições com probabilidade condicional e Bayes
- **Módulos futuros:** Base para regressão, testes de hipótese e validação

**🎯 Dica Final do Pedro:** Essas três distribuições cobrem 80% dos casos reais em IA. Domine elas e você terá uma base sólida para entender modelos mais complexos!

In [None]:
# Visualização final: O mapa completo das distribuições
fig = plt.figure(figsize=(18, 12))

# Layout customizado
gs = fig.add_gridspec(3, 4, height_ratios=[1, 1, 0.3], width_ratios=[1, 1, 1, 1])

# Normal
ax1 = fig.add_subplot(gs[0, 0:2])
x_norm = np.linspace(-4, 4, 1000)
y_norm = stats.norm.pdf(x_norm, 0, 1)
ax1.fill_between(x_norm, y_norm, alpha=0.3, color='blue')
ax1.plot(x_norm, y_norm, 'blue', linewidth=3)
ax1.set_title('🔔 NORMAL (Gaussiana)\n"A Rainha das Distribuições"', fontsize=14, pad=20)
ax1.set_ylabel('Densidade')
ax1.grid(True, alpha=0.3)
ax1.text(0, 0.2, 'Contínua\nSimétrica\nμ, σ', ha='center', va='center', 
         bbox=dict(boxstyle='round', facecolor='lightblue'))

# Binomial
ax2 = fig.add_subplot(gs[0, 2:])
n, p = 20, 0.3
x_binom = np.arange(0, n+1)
y_binom = stats.binom.pmf(x_binom, n, p)
ax2.bar(x_binom, y_binom, alpha=0.7, color='red')
ax2.set_title('🎲 BINOMIAL\n"Cara ou Coroa Turbinado"', fontsize=14, pad=20)
ax2.set_ylabel('Probabilidade')
ax2.grid(True, alpha=0.3)
ax2.text(n*p, max(y_binom)*0.7, 'Discreta\nSucessos\nn, p', ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='lightcoral'))

# Poisson
ax3 = fig.add_subplot(gs[1, 0:2])
lam = 4
x_pois = np.arange(0, 15)
y_pois = stats.poisson.pmf(x_pois, lam)
ax3.bar(x_pois, y_pois, alpha=0.7, color='green')
ax3.set_title('⚡ POISSON\n"Especialista em Eventos Raros"', fontsize=14, pad=20)
ax3.set_xlabel('Eventos')
ax3.set_ylabel('Probabilidade')
ax3.grid(True, alpha=0.3)
ax3.text(lam, max(y_pois)*0.7, 'Discreta\nEventos raros\nλ', ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='lightgreen'))

# Aplicações em IA
ax4 = fig.add_subplot(gs[1, 2:])
ax4.axis('off')
aplicacoes_text = """
🤖 APLICAÇÕES EM IA:

🔔 NORMAL:
   • Inicialização de pesos
   • Ruído em sensores
   • Erros de predição
   • Gradientes

🎲 BINOMIAL:
   • Classificação binária
   • A/B testing
   • Dropout
   • Validação cruzada

⚡ POISSON:
   • Sistemas de recomendação
   • Detecção de anomalias
   • Processamento de linguagem
   • Séries temporais
"""
ax4.text(0.05, 0.95, aplicacoes_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightyellow', alpha=0.8))

# Resumo final
ax5 = fig.add_subplot(gs[2, :])
ax5.axis('off')
resumo_text = """
🎯 RESUMO EXECUTIVO: Distribuições são o DNA dos dados! Normal para o contínuo e simétrico, Binomial para sucessos/fracassos, Poisson para eventos raros.
Elas se conectam entre si e formam a base matemática de toda IA. Dominar essas três é ter 80% do conhecimento necessário para entender como os dados se comportam! 🚀
"""
ax5.text(0.5, 0.5, resumo_text, fontsize=12, ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='gold', alpha=0.7))

plt.suptitle('🗺️ O MAPA COMPLETO DAS DISTRIBUIÇÕES DE PROBABILIDADE', 
             fontsize=18, y=0.98, weight='bold')
plt.tight_layout()
plt.show()

print("🎓 PARABÉNS! Vocês dominaram o Módulo 2!")
print("📊 Agora vocês sabem como os dados se comportam no mundo real!")
print("🚀 Próximo módulo: Probabilidade Condicional e Teorema de Bayes!")
print("\n🔥 Vamos usar essas distribuições para construir sistemas inteligentes!")