# üìä Distribui√ß√µes de Probabilidade: O Mapa dos Dados

## *Entendendo como a Matem√°tica Descreve o Mundo Real*

---

**Pedro Nunes Guth** | *M√≥dulo 2 de 10 - Estat√≠stica para IA*

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_01.png)

T√°, galera! No m√≥dulo anterior voc√™s aprenderam sobre m√©dia, mediana e desvio padr√£o - que s√£o tipo as **caracter√≠sticas** dos nossos dados, n√©? Agora vamos subir um level! 

Bora entender como os dados se **comportam** no mundo real atrav√©s das distribui√ß√µes de probabilidade! üöÄ

## üéØ O Que S√£o Distribui√ß√µes de Probabilidade?

Cara, imagina que voc√™ √© um detetive dos dados! As distribui√ß√µes s√£o tipo **mapas** que mostram onde seus dados mais gostam de "morar". 

Sabe quando voc√™ vai no shopping e tem aqueles mapinhas mostrando "Voc√™ est√° aqui"? As distribui√ß√µes fazem isso com os dados - elas mostram:

- **Onde** os valores mais aparecem
- **Como** eles se espalham
- **Qual** a probabilidade de encontrar cada valor

### Por Que Isso √â Importante para IA?

Liiindo! Quando voc√™ entende como seus dados se comportam, voc√™ consegue:
- Fazer **predi√ß√µes** mais precisas
- Detectar **anomalias** (dados estranhos)
- Escolher os **algoritmos** certos
- Entender se seu modelo t√° funcionando bem

**üéØ Dica do Pedro:** No m√≥dulo anterior vimos que a m√©dia e desvio padr√£o descrevem os dados. Agora vamos ver como essas medidas se conectam com as distribui√ß√µes!

In [None]:
# Setup inicial - Vamos preparar nosso laborat√≥rio de distribui√ß√µes!
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
import pandas as pd
from scipy.special import comb
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√£o para gr√°ficos mais bonitos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("üî• Bibliotecas carregadas! Bora explorar as distribui√ß√µes!")
print("üìä NumPy, Matplotlib, SciPy e Seaborn prontos para a√ß√£o!")

## üèóÔ∏è Anatomia de Uma Distribui√ß√£o

Antes de partir pro ataque, vamos entender as pe√ßas do quebra-cabe√ßa!

### Os Ingredientes B√°sicos:

```mermaid
graph TD
    A[Distribui√ß√£o de Probabilidade] --> B[Fun√ß√£o de Densidade/Massa]
    A --> C[Par√¢metros]
    A --> D[Suporte]
    B --> E[Probabilidade de cada valor]
    C --> F[M√©dia, Desvio, etc.]
    D --> G[Onde os valores podem existir]
```

### Tipos de Distribui√ß√µes:

**üî¢ Discretas:** Como contar pessoas na fila do p√£o de a√ß√∫car
- Valores "cont√°veis": 0, 1, 2, 3...
- Exemplo: N√∫mero de cliques, vendas por dia

**üìè Cont√≠nuas:** Como medir altura ou temperatura
- Valores "infinitos": qualquer n√∫mero real
- Exemplo: Tempo de resposta, peso, temperatura

**üéØ Dica do Pedro:** Lembra da diferen√ßa entre m√©dia e mediana? Aqui √© parecido - discrete √© "cont√°vel", cont√≠nua √© "mensur√°vel"!

In [None]:
# Vamos criar um exemplo visual da diferen√ßa entre discreto e cont√≠nuo
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Distribui√ß√£o Discreta - N√∫mero de caf√©s por dia
cafes = np.arange(0, 11)
prob_cafes = [0.05, 0.1, 0.15, 0.2, 0.25, 0.15, 0.05, 0.03, 0.01, 0.005, 0.005]

ax1.bar(cafes, prob_cafes, alpha=0.7, color='brown')
ax1.set_title('üìä DISCRETA: N√∫mero de Caf√©s por Dia\n(S√≥ valores inteiros!)', fontsize=14, pad=20)
ax1.set_xlabel('N√∫mero de Caf√©s')
ax1.set_ylabel('Probabilidade')
ax1.grid(True, alpha=0.3)

# Distribui√ß√£o Cont√≠nua - Tempo para tomar cada caf√©
tempo = np.linspace(0, 20, 1000)
prob_tempo = stats.gamma.pdf(tempo, a=2, scale=2)

ax2.plot(tempo, prob_tempo, linewidth=3, color='orange')
ax2.fill_between(tempo, prob_tempo, alpha=0.3, color='orange')
ax2.set_title('üìà CONT√çNUA: Tempo para Tomar Caf√©\n(Qualquer valor real!)', fontsize=14, pad=20)
ax2.set_xlabel('Tempo (minutos)')
ax2.set_ylabel('Densidade de Probabilidade')
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("‚òï Discreto: 1, 2, 3 caf√©s (n√£o existe 2.5 caf√©s!)")
print("‚è±Ô∏è Cont√≠nuo: 3.2, 3.24, 3.241... minutos (infinitas possibilidades!)")

## üîî Distribui√ß√£o Normal (Gaussiana): A Rainha das Distribui√ß√µes

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_02.png)

T√°, essa aqui √© a **celebridade** das distribui√ß√µes! A Normal (ou Gaussiana) aparece em TUDO:
- Altura das pessoas
- Notas de provas
- Erros de medi√ß√£o
- Ru√≠do em sinais

### A Matem√°tica Por Tr√°s (Descomplicada!):

A fun√ß√£o de densidade da Normal √©:

$$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

**Calma!** Parece assustador, mas vamos quebrar:

- $\mu$ (mi): a **m√©dia** - onde o pico da curva fica
- $\sigma$ (sigma): o **desvio padr√£o** - qu√£o "espalhada" a curva √©
- $\pi$ e $e$: constantes matem√°ticas (aquelas que j√° conhecemos)
- O resto √© pra fazer a curva ter aquela forma de sino linda!

### Por Que Ela √â T√£o Especial?

1. **Sim√©trica**: Meta dos valores abaixo da m√©dia, metade acima
2. **Regra 68-95-99.7**: A famosa regra dos desvios padr√£o
3. **Teorema do Limite Central**: Somas de muitas vari√°veis ‚Üí Normal
4. **Matem√°tica f√°cil**: Muitas opera√ß√µes ficam simples

**üéØ Dica do Pedro:** Lembra da m√©dia e desvio padr√£o do m√≥dulo 1? Eles s√£o exatamente os par√¢metros Œº e œÉ da Normal!

In [None]:
# Vamos criar a Normal do zero e ver como Œº e œÉ afetam a curva

def densidade_normal(x, mu, sigma):
    """Implementa√ß√£o pr√≥pria da densidade Normal - matem√°tica pura!"""
    coef = 1 / (sigma * np.sqrt(2 * np.pi))
    expoente = -0.5 * ((x - mu) / sigma) ** 2
    return coef * np.exp(expoente)

# Testando diferentes par√¢metros
x = np.linspace(-10, 10, 1000)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Efeito da M√âDIA (Œº)
for mu in [-2, 0, 2]:
    y = densidade_normal(x, mu, 1)
    ax1.plot(x, y, linewidth=3, label=f'Œº = {mu}, œÉ = 1')
    ax1.axvline(mu, color='red', linestyle='--', alpha=0.5)

ax1.set_title('üéØ Efeito da M√âDIA (Œº)\nMuda onde o pico fica!', fontsize=14)
ax1.set_xlabel('Valores (x)')
ax1.set_ylabel('Densidade')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Efeito do DESVIO PADR√ÉO (œÉ)
for sigma in [0.5, 1, 2]:
    y = densidade_normal(x, 0, sigma)
    ax2.plot(x, y, linewidth=3, label=f'Œº = 0, œÉ = {sigma}')

ax2.set_title('üìè Efeito do DESVIO PADR√ÉO (œÉ)\nMuda qu√£o espalhada fica!', fontsize=14)
ax2.set_xlabel('Valores (x)')
ax2.set_ylabel('Densidade')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("üéØ Œº (m√©dia): Move a curva pra esquerda ou direita")
print("üìè œÉ (desvio): Deixa a curva mais 'gorda' ou mais 'magra'")
print("\nüî• Nossa implementa√ß√£o bateu com a teoria!")

In [None]:
# A famosa Regra 68-95-99.7 na pr√°tica!
mu, sigma = 0, 1  # Normal padr√£o
x = np.linspace(-4, 4, 1000)
y = stats.norm.pdf(x, mu, sigma)

fig, ax = plt.subplots(figsize=(14, 8))

# Plotar a curva
ax.plot(x, y, 'black', linewidth=3, label='Normal(0,1)')

# √Åreas coloridas para cada regra
# 68% - 1 desvio padr√£o
x1 = x[(x >= -1) & (x <= 1)]
y1 = stats.norm.pdf(x1, mu, sigma)
ax.fill_between(x1, y1, alpha=0.3, color='green', label='68% (¬±1œÉ)')

# 95% - 2 desvios padr√£o
x2 = x[(x >= -2) & (x <= 2) & ((x <= -1) | (x >= 1))]
y2 = stats.norm.pdf(x2, mu, sigma)
ax.fill_between(x2, y2, alpha=0.3, color='yellow', label='95% (¬±2œÉ)')

# 99.7% - 3 desvios padr√£o
x3 = x[(x >= -3) & (x <= 3) & ((x <= -2) | (x >= 2))]
y3 = stats.norm.pdf(x3, mu, sigma)
ax.fill_between(x3, y3, alpha=0.3, color='red', label='99.7% (¬±3œÉ)')

# Linhas verticais nos desvios
for i in range(-3, 4):
    ax.axvline(i, color='gray', linestyle='--', alpha=0.5)
    ax.text(i, -0.02, f'{i}œÉ', ha='center', va='top')

ax.set_title('üéØ A Regra 68-95-99.7 da Normal\n"A Regra de Ouro da Estat√≠stica"', fontsize=16, pad=20)
ax.set_xlabel('Desvios Padr√£o (œÉ)')
ax.set_ylabel('Densidade')
ax.legend(fontsize=12)
ax.grid(True, alpha=0.3)

# Anota√ß√µes explicativas
ax.annotate('68% dos dados\nest√£o aqui!', xy=(0, 0.2), xytext=(0, 0.3),
            arrowprops=dict(arrowstyle='->', color='green'),
            fontsize=12, ha='center', color='green', weight='bold')

plt.tight_layout()
plt.show()

print("üéØ REGRA 68-95-99.7:")
print("   üìä 68% dos dados est√£o dentro de ¬±1 desvio padr√£o")
print("   üìä 95% dos dados est√£o dentro de ¬±2 desvios padr√£o")
print("   üìä 99.7% dos dados est√£o dentro de ¬±3 desvios padr√£o")
print("\nüî• Isso significa que valores al√©m de ¬±3œÉ s√£o MUITO raros!")

## üé≤ Distribui√ß√£o Binomial: O Cara-ou-Coroa Turbinado

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_03.png)

T√°, imagina que voc√™ vai jogar moeda 10 vezes. Quantas caras voc√™ vai tirar? A Binomial responde isso!

Ela modela situa√ß√µes de **"sucesso ou fracasso"**:
- Convers√µes em site (clicou ou n√£o clicou)
- Vendas (comprou ou n√£o comprou) 
- Emails (spam ou n√£o spam)
- Testes A/B (vers√£o A ou B funcionou)

### A Matem√°tica (Mais Simples que Parece!):

$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$

Opa, vamos quebrar essa f√≥rmula:

- $n$: n√∫mero total de tentativas (jogadas de moeda)
- $k$: n√∫mero de sucessos que queremos (quantas caras)
- $p$: probabilidade de sucesso em cada tentativa (0.5 para moeda justa)
- $\binom{n}{k}$: combina√ß√£o - "de quantas formas posso escolher k sucessos em n tentativas"

### Os Par√¢metros:
- **M√©dia:** $\mu = np$ 
- **Vari√¢ncia:** $\sigma^2 = np(1-p)$
- **Desvio Padr√£o:** $\sigma = \sqrt{np(1-p)}$

**üéØ Dica do Pedro:** Quando n √© grande e p n√£o √© muito pr√≥ximo de 0 ou 1, a Binomial fica parecida com a Normal! Isso vai ser √∫til nos pr√≥ximos m√≥dulos!

In [None]:
# Implementando a Binomial do zero - matem√°tica pura!

def combinacao(n, k):
    """Calcula C(n,k) = n! / (k!(n-k)!)"""
    if k > n or k < 0:
        return 0
    return int(comb(n, k))

def prob_binomial(n, k, p):
    """Calcula P(X=k) na distribui√ß√£o Binomial"""
    return combinacao(n, k) * (p ** k) * ((1 - p) ** (n - k))

# Exemplo pr√°tico: Site de e-commerce
# 100 visitantes por dia, 5% de convers√£o
n_visitantes = 100
prob_conversao = 0.05

# Calculando probabilidades para diferentes n√∫meros de vendas
vendas_possiveis = np.arange(0, 21)  # de 0 a 20 vendas
probabilidades = [prob_binomial(n_visitantes, k, prob_conversao) for k in vendas_possiveis]

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Nossa implementa√ß√£o
ax1.bar(vendas_possiveis, probabilidades, alpha=0.7, color='blue')
ax1.set_title('üõí Nossa Implementa√ß√£o\nVendas Di√°rias (100 visitantes, 5% convers√£o)', fontsize=12)
ax1.set_xlabel('N√∫mero de Vendas')
ax1.set_ylabel('Probabilidade')
ax1.grid(True, alpha=0.3)

# Comparando com SciPy
prob_scipy = stats.binom.pmf(vendas_possiveis, n_visitantes, prob_conversao)
ax2.bar(vendas_possiveis, prob_scipy, alpha=0.7, color='red')
ax2.set_title('üìä SciPy (Verifica√ß√£o)\nMesmo resultado!', fontsize=12)
ax2.set_xlabel('N√∫mero de Vendas')
ax2.set_ylabel('Probabilidade')
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando estat√≠sticas
media = n_visitantes * prob_conversao
variancia = n_visitantes * prob_conversao * (1 - prob_conversao)
desvio = np.sqrt(variancia)

print(f"üìä ESTAT√çSTICAS DO E-COMMERCE:")
print(f"   üéØ M√©dia de vendas por dia: {media:.1f}")
print(f"   üìè Desvio padr√£o: {desvio:.1f}")
print(f"   üé≤ Probabilidade de exatamente 5 vendas: {prob_binomial(n_visitantes, 5, prob_conversao):.3f}")
print(f"   üî• Nossas f√≥rmulas batem com o SciPy!")

In [None]:
# Vamos ver como diferentes par√¢metros afetam a Binomial
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
axes = axes.ravel()

# Cen√°rios diferentes
cenarios = [
    {'n': 10, 'p': 0.5, 'titulo': 'Moeda Justa\n(n=10, p=0.5)', 'cor': 'blue'},
    {'n': 20, 'p': 0.3, 'titulo': 'Convers√£o Baixa\n(n=20, p=0.3)', 'cor': 'red'},
    {'n': 50, 'p': 0.1, 'titulo': 'Evento Raro\n(n=50, p=0.1)', 'cor': 'green'},
    {'n': 100, 'p': 0.8, 'titulo': 'Alta Probabilidade\n(n=100, p=0.8)', 'cor': 'orange'}
]

for i, cenario in enumerate(cenarios):
    n, p = cenario['n'], cenario['p']
    k_values = np.arange(0, n + 1)
    probabilities = stats.binom.pmf(k_values, n, p)
    
    axes[i].bar(k_values, probabilities, alpha=0.7, color=cenario['cor'])
    axes[i].set_title(cenario['titulo'], fontsize=12)
    axes[i].set_xlabel('N√∫mero de Sucessos (k)')
    axes[i].set_ylabel('Probabilidade')
    axes[i].grid(True, alpha=0.3)
    
    # Marcar a m√©dia
    media = n * p
    axes[i].axvline(media, color='black', linestyle='--', 
                   label=f'M√©dia = {media:.1f}')
    axes[i].legend()

plt.suptitle('üé≤ Como os Par√¢metros Afetam a Distribui√ß√£o Binomial', fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

print("üîç OBSERVA√á√ïES IMPORTANTES:")
print("   üìä Quando p=0.5, a distribui√ß√£o fica sim√©trica")
print("   üìà Quando n aumenta, a distribui√ß√£o fica mais 'suave'")
print("   ‚öñÔ∏è Quando p √© muito pequeno ou muito grande, fica assim√©trica")
print("   üéØ A m√©dia sempre fica em n√óp")

## ‚ö° Distribui√ß√£o de Poisson: A Especialista em Eventos Raros

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_04.png)

A Poisson √© tipo a **especialista em contar eventos raros** que acontecem no tempo ou espa√ßo:

- N√∫mero de emails por hora
- Acidentes de tr√¢nsito por dia
- Cliques em an√∫ncios por minuto
- Bugs encontrados em c√≥digo
- Chegada de clientes numa loja

### A Matem√°tica (Mais Simples Ainda!):

$$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

Olha s√≥ que clean! Ela s√≥ tem **um par√¢metro**:

- $\lambda$ (lambda): taxa m√©dia de ocorr√™ncia do evento
- $k$: n√∫mero de eventos que queremos calcular
- $e$: n√∫mero de Euler (~2.718)
- $k!$: fatorial de k

### Caracter√≠sticas Especiais:
- **M√©dia:** $\mu = \lambda$
- **Vari√¢ncia:** $\sigma^2 = \lambda$ 
- **Desvio Padr√£o:** $\sigma = \sqrt{\lambda}$

Liiindo! Na Poisson, a m√©dia e vari√¢ncia s√£o **iguais**!

**üéØ Dica do Pedro:** A Poisson √© tipo um "limite" da Binomial quando n √© muito grande e p √© muito pequeno, mas n√óp se mant√©m constante!

In [None]:
# Implementando Poisson do zero e vendo ela em a√ß√£o!

def fatorial(n):
    """Calcula n! de forma recursiva"""
    if n <= 1:
        return 1
    return n * fatorial(n - 1)

def prob_poisson(k, lam):
    """Calcula P(X=k) na distribui√ß√£o de Poisson"""
    return (lam ** k) * np.exp(-lam) / fatorial(k)

# Exemplo pr√°tico: Sistema de monitoramento de site
# Em m√©dia, 3 erros por hora
lambda_erros = 3

# Calculando probabilidades para diferentes n√∫meros de erros
erros_possiveis = np.arange(0, 15)
prob_nossa = [prob_poisson(k, lambda_erros) for k in erros_possiveis]
prob_scipy = stats.poisson.pmf(erros_possiveis, lambda_erros)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Nossa implementa√ß√£o
ax1.bar(erros_possiveis, prob_nossa, alpha=0.7, color='purple')
ax1.set_title('‚ö° Nossa Poisson\nErros por Hora (Œª=3)', fontsize=12)
ax1.set_xlabel('N√∫mero de Erros')
ax1.set_ylabel('Probabilidade')
ax1.axvline(lambda_erros, color='red', linestyle='--', label=f'M√©dia = {lambda_erros}')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Compara√ß√£o com SciPy
ax2.bar(erros_possiveis, prob_scipy, alpha=0.7, color='orange')
ax2.set_title('üìä SciPy (Verifica√ß√£o)\nPerfeito!', fontsize=12)
ax2.set_xlabel('N√∫mero de Erros')
ax2.set_ylabel('Probabilidade')
ax2.axvline(lambda_erros, color='red', linestyle='--', label=f'M√©dia = {lambda_erros}')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando algumas probabilidades interessantes
prob_0_erros = prob_poisson(0, lambda_erros)
prob_mais_5_erros = sum([prob_poisson(k, lambda_erros) for k in range(6, 20)])

print(f"üñ•Ô∏è MONITORAMENTO DO SISTEMA:")
print(f"   üìä Taxa m√©dia: {lambda_erros} erros/hora")
print(f"   ‚úÖ Prob. de 0 erros em 1h: {prob_0_erros:.3f} ({prob_0_erros*100:.1f}%)")
print(f"   üö® Prob. de mais de 5 erros: {prob_mais_5_erros:.3f} ({prob_mais_5_erros*100:.1f}%)")
print(f"   üéØ Desvio padr√£o: {np.sqrt(lambda_erros):.2f}")
print(f"\nüî• Poisson √© perfeita para eventos raros!")

In [None]:
# Vamos ver como Œª (lambda) afeta a forma da Poisson
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
axes = axes.ravel()

lambdas = [0.5, 2, 5, 10]
cores = ['blue', 'red', 'green', 'purple']
cenarios = [
    'Eventos Muito Raros\n(Œª=0.5)',
    'Eventos Raros\n(Œª=2)', 
    'Eventos Moderados\n(Œª=5)',
    'Eventos Frequentes\n(Œª=10)'
]

for i, (lam, cor, cenario) in enumerate(zip(lambdas, cores, cenarios)):
    # Ajustar o range baseado no lambda
    max_k = min(25, int(lam + 4 * np.sqrt(lam) + 5))
    k_values = np.arange(0, max_k)
    probabilities = stats.poisson.pmf(k_values, lam)
    
    axes[i].bar(k_values, probabilities, alpha=0.7, color=cor)
    axes[i].set_title(cenario, fontsize=12)
    axes[i].set_xlabel('N√∫mero de Eventos (k)')
    axes[i].set_ylabel('Probabilidade')
    axes[i].grid(True, alpha=0.3)
    
    # Marcar m√©dia e desvio
    axes[i].axvline(lam, color='black', linestyle='--', 
                   label=f'M√©dia = {lam}')
    axes[i].axvline(lam + np.sqrt(lam), color='gray', linestyle=':', 
                   alpha=0.7, label=f'M√©dia + œÉ')
    axes[i].legend()

plt.suptitle('‚ö° Como Œª (Lambda) Muda a Distribui√ß√£o de Poisson', fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

print("üîç PADR√ïES DA POISSON:")
print("   üìà Quanto maior Œª, mais 'espalhada' fica a distribui√ß√£o")
print("   üìä Para Œª pequeno, a maior probabilidade √© em k=0")
print("   ‚öñÔ∏è Para Œª grande, a distribui√ß√£o fica mais sim√©trica")
print("   üéØ A moda (pico) fica sempre pr√≥xima de Œª")

## üîÑ Conectando as Distribui√ß√µes

T√°, agora vem a parte mais dahora! As distribui√ß√µes n√£o s√£o ilhas isoladas - elas se conectam de formas incr√≠veis!

```mermaid
graph LR
    A[Binomial] -->|n grande, p pequeno| B[Poisson]
    A -->|n grande, p moderado| C[Normal]
    B -->|Œª grande| C
    D[Dados Reais] --> E{Que tipo?}
    E -->|Cont√≠nuo, sim√©trico| C
    E -->|Discreto, sucessos| A
    E -->|Eventos raros| B
```

### As Conex√µes M√°gicas:

1. **Binomial ‚Üí Poisson:** Quando n fica muito grande e p muito pequeno, mas n√óp = Œª
2. **Poisson ‚Üí Normal:** Quando Œª fica grande, a Poisson vira Normal
3. **Binomial ‚Üí Normal:** Quando n √© grande e p n√£o √© extremo

**üéØ Dica do Pedro:** Essas conex√µes s√£o fundamentais para entender quando usar cada distribui√ß√£o e como elas aparecem na IA!

In [None]:
# Vamos ver as conex√µes na pr√°tica - √© liiindo!
fig, axes = plt.subplots(2, 3, figsize=(18, 12))

# Linha 1: Binomial ‚Üí Poisson
# Fixando Œª = np = 5, mas mudando n e p
lambda_fixo = 5
scenarios_binom_poisson = [
    {'n': 25, 'p': 0.2},
    {'n': 100, 'p': 0.05},
    {'n': 500, 'p': 0.01}
]

for i, scenario in enumerate(scenarios_binom_poisson):
    n, p = scenario['n'], scenario['p']
    k_values = np.arange(0, 20)
    
    # Binomial
    prob_binom = stats.binom.pmf(k_values, n, p)
    axes[0, i].bar(k_values - 0.2, prob_binom, width=0.4, alpha=0.7, 
                   color='blue', label=f'Binomial(n={n}, p={p})')
    
    # Poisson
    prob_poisson = stats.poisson.pmf(k_values, lambda_fixo)
    axes[0, i].bar(k_values + 0.2, prob_poisson, width=0.4, alpha=0.7, 
                   color='red', label=f'Poisson(Œª={lambda_fixo})')
    
    axes[0, i].set_title(f'Binomial vs Poisson\nn={n}, p={p}, Œª={lambda_fixo}', fontsize=10)
    axes[0, i].legend()
    axes[0, i].grid(True, alpha=0.3)

# Linha 2: Aproxima√ß√£o Normal
approximations = [
    {'type': 'Binomial', 'n': 100, 'p': 0.3, 'color': 'blue'},
    {'type': 'Poisson', 'lambda': 20, 'color': 'red'},
    {'type': 'Normal', 'mu': 30, 'sigma': 5, 'color': 'green'}
]

x_cont = np.linspace(0, 60, 1000)

for i, approx in enumerate(approximations):
    if approx['type'] == 'Binomial':
        n, p = approx['n'], approx['p']
        k_values = np.arange(0, n+1)
        prob_discrete = stats.binom.pmf(k_values, n, p)
        axes[1, i].bar(k_values, prob_discrete, alpha=0.7, color=approx['color'])
        
        # Aproxima√ß√£o normal
        mu_approx = n * p
        sigma_approx = np.sqrt(n * p * (1 - p))
        normal_approx = stats.norm.pdf(x_cont, mu_approx, sigma_approx)
        axes[1, i].plot(x_cont, normal_approx, 'black', linewidth=2, 
                       label='Aproxima√ß√£o Normal')
        axes[1, i].set_title(f'Binomial({n}, {p})\nŒº={mu_approx}, œÉ={sigma_approx:.1f}')
        
    elif approx['type'] == 'Poisson':
        lam = approx['lambda']
        k_values = np.arange(0, int(lam + 4*np.sqrt(lam)))
        prob_discrete = stats.poisson.pmf(k_values, lam)
        axes[1, i].bar(k_values, prob_discrete, alpha=0.7, color=approx['color'])
        
        # Aproxima√ß√£o normal
        normal_approx = stats.norm.pdf(x_cont, lam, np.sqrt(lam))
        axes[1, i].plot(x_cont, normal_approx, 'black', linewidth=2,
                       label='Aproxima√ß√£o Normal')
        axes[1, i].set_title(f'Poisson({lam})\nŒº={lam}, œÉ={np.sqrt(lam):.1f}')
        
    else:  # Normal
        mu, sigma = approx['mu'], approx['sigma']
        normal_curve = stats.norm.pdf(x_cont, mu, sigma)
        axes[1, i].plot(x_cont, normal_curve, color=approx['color'], linewidth=3)
        axes[1, i].fill_between(x_cont, normal_curve, alpha=0.3, color=approx['color'])
        axes[1, i].set_title(f'Normal({mu}, {sigma})\nA distribui√ß√£o cont√≠nua')
    
    axes[1, i].legend()
    axes[1, i].grid(True, alpha=0.3)

plt.suptitle('üîÑ As Conex√µes M√°gicas Entre Distribui√ß√µes', fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print("üîó CONEX√ïES OBSERVADAS:")
print("   üìä Linha 1: Binomial converge para Poisson quando n‚Üë e p‚Üì")
print("   üìà Linha 2: Ambas convergem para Normal quando os par√¢metros s√£o grandes")
print("   üéØ Essas aproxima√ß√µes s√£o fundamentais na estat√≠stica!")

## üéØ Aplica√ß√µes Pr√°ticas na IA

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_05.png)

Agora vem a parte que mais amo: como essas distribui√ß√µes aparecem **de verdade** na IA!

### üîî Normal na IA:
- **Inicializa√ß√£o de pesos** em redes neurais
- **Ru√≠do** em dados de sensores
- **Erros de predi√ß√£o** em modelos bem calibrados
- **Gradientes** durante o treinamento

### üé≤ Binomial na IA:
- **Classifica√ß√£o bin√°ria** (spam/n√£o spam)
- **A/B testing** (qual vers√£o √© melhor)
- **Dropout** em redes neurais
- **Valida√ß√£o cruzada** (acerto/erro)

### ‚ö° Poisson na IA:
- **Sistemas de recomenda√ß√£o** (cliques por hora)
- **Detec√ß√£o de anomalias** (eventos raros)
- **Processamento de linguagem** (palavras por documento)
- **S√©ries temporais** (eventos por per√≠odo)

**üéØ Dica do Pedro:** No pr√≥ximo m√≥dulo vamos ver como essas distribui√ß√µes se conectam com probabilidade condicional e Bayes!

In [None]:
# Exemplo pr√°tico: Sistema de detec√ß√£o de spam
# Vamos simular um sistema real de machine learning!

np.random.seed(42)  # Para resultados reproduz√≠veis

# Simulando dados de um sistema de email
print("üìß SISTEMA DE DETEC√á√ÉO DE SPAM")
print("="*50)

# 1. Normal: Tempo de processamento (em ms)
tempo_processamento = np.random.normal(loc=150, scale=25, size=1000)
tempo_processamento = np.maximum(tempo_processamento, 0)  # N√£o pode ser negativo

# 2. Binomial: Classifica√ß√£o (spam=1, ham=0)
# Assumindo 15% de spam
n_emails = 1000
prob_spam = 0.15
classificacoes = np.random.binomial(1, prob_spam, n_emails)

# 3. Poisson: N√∫mero de emails suspeitos por hora
lambda_suspeitos = 2.5
horas = 24
emails_suspeitos_por_hora = np.random.poisson(lambda_suspeitos, horas)

# Visualizando o sistema completo
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Tempo de processamento (Normal)
ax1.hist(tempo_processamento, bins=50, alpha=0.7, color='blue', density=True)
x_temp = np.linspace(tempo_processamento.min(), tempo_processamento.max(), 100)
y_temp = stats.norm.pdf(x_temp, 150, 25)
ax1.plot(x_temp, y_temp, 'red', linewidth=2, label='Normal(150, 25)')
ax1.set_title('‚è±Ô∏è Tempo de Processamento\n(Distribui√ß√£o Normal)', fontsize=12)
ax1.set_xlabel('Tempo (ms)')
ax1.set_ylabel('Densidade')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 2. Classifica√ß√µes (Binomial agregada)
spam_counts = np.sum(classificacoes.reshape(-1, 50), axis=1)  # Grupos de 50 emails
ax2.hist(spam_counts, bins=15, alpha=0.7, color='red')
ax2.set_title('üéØ Spam por Lote (50 emails)\n(Distribui√ß√£o Binomial)', fontsize=12)
ax2.set_xlabel('N√∫mero de Spams')
ax2.set_ylabel('Frequ√™ncia')
ax2.axvline(50 * prob_spam, color='black', linestyle='--', 
           label=f'Esperado = {50*prob_spam:.1f}')
ax2.legend()
ax2.grid(True, alpha=0.3)

# 3. Emails suspeitos por hora (Poisson)
ax3.bar(range(24), emails_suspeitos_por_hora, alpha=0.7, color='purple')
ax3.set_title('üö® Emails Suspeitos por Hora\n(Distribui√ß√£o de Poisson)', fontsize=12)
ax3.set_xlabel('Hora do Dia')
ax3.set_ylabel('Emails Suspeitos')
ax3.axhline(lambda_suspeitos, color='red', linestyle='--', 
           label=f'M√©dia = {lambda_suspeitos}')
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Dashboard de m√©tricas
ax4.axis('off')
metrics_text = f"""
üìä M√âTRICAS DO SISTEMA:

‚è±Ô∏è PROCESSAMENTO:
   ‚Ä¢ Tempo m√©dio: {np.mean(tempo_processamento):.1f} ms
   ‚Ä¢ Desvio padr√£o: {np.std(tempo_processamento):.1f} ms
   ‚Ä¢ 95% dos emails < {np.percentile(tempo_processamento, 95):.1f} ms

üéØ CLASSIFICA√á√ÉO:
   ‚Ä¢ Taxa de spam: {np.mean(classificacoes)*100:.1f}%
   ‚Ä¢ Total de spams: {np.sum(classificacoes)}/{len(classificacoes)}
   ‚Ä¢ Esperado: {prob_spam*100:.1f}%

üö® DETEC√á√ÉO:
   ‚Ä¢ Suspeitos/hora: {np.mean(emails_suspeitos_por_hora):.1f}
   ‚Ä¢ M√°ximo em 1h: {np.max(emails_suspeitos_por_hora)}
   ‚Ä¢ Horas sem suspeitos: {np.sum(emails_suspeitos_por_hora == 0)}/24
"""
ax4.text(0.1, 0.9, metrics_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightgray', alpha=0.8))

plt.suptitle('üìß Sistema Real de Detec√ß√£o de Spam\nTr√™s Distribui√ß√µes Trabalhando Juntas!', 
             fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print("\nüî• INSIGHTS DO SISTEMA:")
print(f"   üìä Normal: Tempos seguem padr√£o previs√≠vel - bom para SLA!")
print(f"   üé≤ Binomial: Taxa de spam est√° dentro do esperado")
print(f"   ‚ö° Poisson: Distribui√ß√£o de suspeitos ajuda a detectar picos an√¥malos")

## üí™ Exerc√≠cio Pr√°tico 1: Escolhendo a Distribui√ß√£o Certa

Bora praticar! Vou dar alguns cen√°rios e voc√™ precisa:
1. Identificar qual distribui√ß√£o usar
2. Estimar os par√¢metros
3. Calcular probabilidades interessantes

**üéØ Dica do Pedro:** Pense nas caracter√≠sticas de cada distribui√ß√£o que vimos!

In [None]:
# EXERC√çCIO 1: An√°lise de diferentes cen√°rios
print("üí™ EXERC√çCIO: IDENTIFICANDO DISTRIBUI√á√ïES")
print("=" * 50)

cenarios = [
    {
        'nome': 'üè™ E-commerce',
        'descricao': 'Em um site, 2% dos visitantes fazem compra. Recebemos 500 visitantes por dia.',
        'pergunta': 'Qual a probabilidade de ter exatamente 8 vendas?',
        'distribuicao': 'Binomial',
        'parametros': {'n': 500, 'p': 0.02},
        'calculo': lambda: stats.binom.pmf(8, 500, 0.02)
    },
    {
        'nome': 'üìû Call Center', 
        'descricao': 'Um call center recebe em m√©dia 4 liga√ß√µes por minuto.',
        'pergunta': 'Qual a probabilidade de receber mais de 6 liga√ß√µes em 1 minuto?',
        'distribuicao': 'Poisson',
        'parametros': {'lambda': 4},
        'calculo': lambda: 1 - stats.poisson.cdf(6, 4)
    },
    {
        'nome': '‚öñÔ∏è Medi√ß√µes',
        'descricao': 'Medi√ß√µes de temperatura seguem Normal com m√©dia 25¬∞C e desvio 3¬∞C.',
        'pergunta': 'Qual a probabilidade de medir entre 22¬∞C e 28¬∞C?',
        'distribuicao': 'Normal',
        'parametros': {'mu': 25, 'sigma': 3},
        'calculo': lambda: stats.norm.cdf(28, 25, 3) - stats.norm.cdf(22, 25, 3)
    }
]

# Resolvendo cada cen√°rio
for i, cenario in enumerate(cenarios, 1):
    print(f"\n{i}. {cenario['nome']}")
    print(f"   üìù Situa√ß√£o: {cenario['descricao']}")
    print(f"   ‚ùì Pergunta: {cenario['pergunta']}")
    print(f"   üéØ Distribui√ß√£o: {cenario['distribuicao']}")
    
    # Par√¢metros
    params_str = ', '.join([f"{k}={v}" for k, v in cenario['parametros'].items()])
    print(f"   üîß Par√¢metros: {params_str}")
    
    # Resultado
    resultado = cenario['calculo']()
    print(f"   ‚úÖ Resposta: {resultado:.4f} ({resultado*100:.2f}%)")
    
print("\n" + "="*50)
print("üéØ DICAS PARA IDENTIFICAR:")
print("   üîî Normal: dados cont√≠nuos, sim√©tricos, 'comportados'")
print("   üé≤ Binomial: contagem de sucessos em n tentativas")
print("   ‚ö° Poisson: contagem de eventos raros por per√≠odo")

# DESAFIO EXTRA: Agora √© sua vez!
print("\nüöÄ DESAFIO EXTRA:")
print("Cen√°rio: Uma IA faz 1000 predi√ß√µes por dia, com 92% de acerto.")
print("Pergunta: Qual a probabilidade de acertar menos de 900?")
print("\nüí≠ Pense: Qual distribui√ß√£o usar? Quais os par√¢metros?")
print("üîç Dica: √â contagem de sucessos em tentativas fixas...")

## üß† Exerc√≠cio Pr√°tico 2: Simula√ß√£o Monte Carlo

Agora vamos fazer algo mais avan√ßado! Vamos usar **simula√ß√£o Monte Carlo** para validar nossas distribui√ß√µes te√≥ricas.

A ideia √©: se a teoria estiver certa, simula√ß√µes devem dar resultados similares!

**üéØ Dica do Pedro:** Monte Carlo √© uma t√©cnica poderos√≠ssima em IA - vamos ver um gostinho dela aqui!

In [None]:
# EXERC√çCIO 2: Simula√ß√£o vs Teoria
print("üé≤ MONTE CARLO: SIMULA√á√ÉO VS TEORIA")
print("=" * 50)

np.random.seed(123)  # Para resultados reproduz√≠veis
n_simulacoes = 100000

# Cen√°rio: Sistema de recomenda√ß√£o
# - 1000 usu√°rios por hora
# - 3% clicam nas recomenda√ß√µes
# - Queremos simular um dia (24 horas)

usuarios_por_hora = 1000
prob_clique = 0.03
horas = 24

print(f"üìä CEN√ÅRIO: Sistema de Recomenda√ß√£o")
print(f"   üë• Usu√°rios por hora: {usuarios_por_hora}")
print(f"   üñ±Ô∏è Probabilidade de clique: {prob_clique*100}%")
print(f"   ‚è∞ Per√≠odo: {horas} horas")

# SIMULA√á√ÉO: Gerando dados "reais"
cliques_simulados = []
for _ in range(n_simulacoes):
    # Para cada simula√ß√£o, gerar 24 horas de dados
    cliques_dia = []
    for hora in range(horas):
        # Binomial: quantos cliques nesta hora?
        cliques_hora = np.random.binomial(usuarios_por_hora, prob_clique)
        cliques_dia.append(cliques_hora)
    cliques_simulados.append(cliques_dia)

cliques_simulados = np.array(cliques_simulados)

# TEORIA: O que esperamos?
media_teorica = usuarios_por_hora * prob_clique
variancia_teorica = usuarios_por_hora * prob_clique * (1 - prob_clique)
desvio_teorico = np.sqrt(variancia_teorica)

# COMPARA√á√ÉO
media_simulada = np.mean(cliques_simulados)
desvio_simulado = np.std(cliques_simulados)

fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Distribui√ß√£o de cliques por hora (uma simula√ß√£o)
exemplo_dia = cliques_simulados[0]
ax1.bar(range(24), exemplo_dia, alpha=0.7, color='blue')
ax1.axhline(media_teorica, color='red', linestyle='--', 
           label=f'M√©dia Te√≥rica = {media_teorica:.1f}')
ax1.set_title('üìà Cliques por Hora (Exemplo de 1 Dia)', fontsize=12)
ax1.set_xlabel('Hora do Dia')
ax1.set_ylabel('N√∫mero de Cliques')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 2. Histograma de todas as simula√ß√µes
ax2.hist(cliques_simulados.flatten(), bins=50, alpha=0.7, 
         density=True, color='green', label='Simula√ß√£o')

# Sobrepor a distribui√ß√£o binomial te√≥rica
x_teorico = np.arange(int(media_teorica - 4*desvio_teorico), 
                      int(media_teorica + 4*desvio_teorico))
y_teorico = stats.binom.pmf(x_teorico, usuarios_por_hora, prob_clique)
ax2.bar(x_teorico, y_teorico, alpha=0.5, color='red', 
        width=0.8, label='Teoria (Binomial)')

ax2.set_title('üìä Distribui√ß√£o de Cliques: Simula√ß√£o vs Teoria', fontsize=12)
ax2.set_xlabel('N√∫mero de Cliques')
ax2.set_ylabel('Densidade/Probabilidade')
ax2.legend()
ax2.grid(True, alpha=0.3)

# 3. Converg√™ncia da m√©dia
medias_cumulativas = np.cumsum(cliques_simulados.flatten()) / np.arange(1, len(cliques_simulados.flatten()) + 1)
sample_points = np.logspace(2, np.log10(len(medias_cumulativas)), 1000).astype(int)
ax3.plot(sample_points, medias_cumulativas[sample_points-1], 'blue', linewidth=2)
ax3.axhline(media_teorica, color='red', linestyle='--', 
           label=f'M√©dia Te√≥rica = {media_teorica:.1f}')
ax3.set_title('üéØ Converg√™ncia da M√©dia (Lei dos Grandes N√∫meros)', fontsize=12)
ax3.set_xlabel('N√∫mero de Amostras')
ax3.set_ylabel('M√©dia Cumulativa')
ax3.set_xscale('log')
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Compara√ß√£o num√©rica
ax4.axis('off')
comparison_text = f"""
üî¨ SIMULA√á√ÉO vs TEORIA:

üìä M√âDIA:
   Teoria:    {media_teorica:.2f}
   Simula√ß√£o: {media_simulada:.2f}
   Diferen√ßa: {abs(media_teorica - media_simulada):.4f}

üìè DESVIO PADR√ÉO:
   Teoria:    {desvio_teorico:.2f}
   Simula√ß√£o: {desvio_simulado:.2f}
   Diferen√ßa: {abs(desvio_teorico - desvio_simulado):.4f}

‚úÖ VALIDA√á√ÉO:
   Erro m√©dio: {abs(media_teorica - media_simulada)/media_teorica*100:.3f}%
   Erro desvio: {abs(desvio_teorico - desvio_simulado)/desvio_teorico*100:.3f}%
   
üéØ CONCLUS√ÉO:
   {'‚úÖ Teoria validada!' if abs(media_teorica - media_simulada) < 0.1 else '‚ùå Verificar teoria'}
"""
ax4.text(0.1, 0.9, comparison_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightblue', alpha=0.8))

plt.suptitle('üé≤ Monte Carlo: Validando Nossas Distribui√ß√µes', fontsize=16, y=0.98)
plt.tight_layout()
plt.show()

print(f"\nüî• RESULTADO: {n_simulacoes:,} simula√ß√µes confirmam nossa teoria!")
print(f"üìä A distribui√ß√£o binomial modela perfeitamente este sistema!")

## üéì Resumo: O Mapa dos Dados Completo

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/estat√≠stica-para-ia-modulo-02_img_06.png)

Liiindo! Voc√™s acabaram de dominar o **mapa dos dados**! Vamos recapitular essa jornada incr√≠vel:

### üó∫Ô∏è O Que Aprendemos:

```mermaid
graph TD
    A[Distribui√ß√µes de Probabilidade] --> B[Normal/Gaussiana]
    A --> C[Binomial]
    A --> D[Poisson]
    B --> E[Dados cont√≠nuos<br/>Sim√©trica<br/>Œº e œÉ]
    C --> F[Sucessos/fracassos<br/>n tentativas<br/>p probabilidade]
    D --> G[Eventos raros<br/>Œª taxa m√©dia<br/>Tempo/espa√ßo]
    E --> H[IA: Pesos, erros, gradientes]
    F --> I[IA: Classifica√ß√£o, A/B tests]
    G --> J[IA: Anomalias, cliques, NLP]
```

### üìö Conceitos-Chave:

1. **Distribui√ß√µes s√£o mapas** que mostram onde os dados "moram"
2. **Normal:** A rainha - sim√©trica, ub√≠qua, matem√°tica elegante
3. **Binomial:** Contagem de sucessos em tentativas fixas
4. **Poisson:** Especialista em eventos raros
5. **Conex√µes:** As distribui√ß√µes se transformam umas nas outras!
6. **Aplica√ß√µes:** Cada uma tem seu lugar especial na IA

### üîó Conex√£o com o Curso:
- **M√≥dulo 1:** Usamos Œº e œÉ que calculamos como par√¢metros das distribui√ß√µes
- **M√≥dulo 3:** Vamos usar essas distribui√ß√µes com probabilidade condicional e Bayes
- **M√≥dulos futuros:** Base para regress√£o, testes de hip√≥tese e valida√ß√£o

**üéØ Dica Final do Pedro:** Essas tr√™s distribui√ß√µes cobrem 80% dos casos reais em IA. Domine elas e voc√™ ter√° uma base s√≥lida para entender modelos mais complexos!

In [None]:
# Visualiza√ß√£o final: O mapa completo das distribui√ß√µes
fig = plt.figure(figsize=(18, 12))

# Layout customizado
gs = fig.add_gridspec(3, 4, height_ratios=[1, 1, 0.3], width_ratios=[1, 1, 1, 1])

# Normal
ax1 = fig.add_subplot(gs[0, 0:2])
x_norm = np.linspace(-4, 4, 1000)
y_norm = stats.norm.pdf(x_norm, 0, 1)
ax1.fill_between(x_norm, y_norm, alpha=0.3, color='blue')
ax1.plot(x_norm, y_norm, 'blue', linewidth=3)
ax1.set_title('üîî NORMAL (Gaussiana)\n"A Rainha das Distribui√ß√µes"', fontsize=14, pad=20)
ax1.set_ylabel('Densidade')
ax1.grid(True, alpha=0.3)
ax1.text(0, 0.2, 'Cont√≠nua\nSim√©trica\nŒº, œÉ', ha='center', va='center', 
         bbox=dict(boxstyle='round', facecolor='lightblue'))

# Binomial
ax2 = fig.add_subplot(gs[0, 2:])
n, p = 20, 0.3
x_binom = np.arange(0, n+1)
y_binom = stats.binom.pmf(x_binom, n, p)
ax2.bar(x_binom, y_binom, alpha=0.7, color='red')
ax2.set_title('üé≤ BINOMIAL\n"Cara ou Coroa Turbinado"', fontsize=14, pad=20)
ax2.set_ylabel('Probabilidade')
ax2.grid(True, alpha=0.3)
ax2.text(n*p, max(y_binom)*0.7, 'Discreta\nSucessos\nn, p', ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='lightcoral'))

# Poisson
ax3 = fig.add_subplot(gs[1, 0:2])
lam = 4
x_pois = np.arange(0, 15)
y_pois = stats.poisson.pmf(x_pois, lam)
ax3.bar(x_pois, y_pois, alpha=0.7, color='green')
ax3.set_title('‚ö° POISSON\n"Especialista em Eventos Raros"', fontsize=14, pad=20)
ax3.set_xlabel('Eventos')
ax3.set_ylabel('Probabilidade')
ax3.grid(True, alpha=0.3)
ax3.text(lam, max(y_pois)*0.7, 'Discreta\nEventos raros\nŒª', ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='lightgreen'))

# Aplica√ß√µes em IA
ax4 = fig.add_subplot(gs[1, 2:])
ax4.axis('off')
aplicacoes_text = """
ü§ñ APLICA√á√ïES EM IA:

üîî NORMAL:
   ‚Ä¢ Inicializa√ß√£o de pesos
   ‚Ä¢ Ru√≠do em sensores
   ‚Ä¢ Erros de predi√ß√£o
   ‚Ä¢ Gradientes

üé≤ BINOMIAL:
   ‚Ä¢ Classifica√ß√£o bin√°ria
   ‚Ä¢ A/B testing
   ‚Ä¢ Dropout
   ‚Ä¢ Valida√ß√£o cruzada

‚ö° POISSON:
   ‚Ä¢ Sistemas de recomenda√ß√£o
   ‚Ä¢ Detec√ß√£o de anomalias
   ‚Ä¢ Processamento de linguagem
   ‚Ä¢ S√©ries temporais
"""
ax4.text(0.05, 0.95, aplicacoes_text, fontsize=11, verticalalignment='top',
         bbox=dict(boxstyle='round', facecolor='lightyellow', alpha=0.8))

# Resumo final
ax5 = fig.add_subplot(gs[2, :])
ax5.axis('off')
resumo_text = """
üéØ RESUMO EXECUTIVO: Distribui√ß√µes s√£o o DNA dos dados! Normal para o cont√≠nuo e sim√©trico, Binomial para sucessos/fracassos, Poisson para eventos raros.
Elas se conectam entre si e formam a base matem√°tica de toda IA. Dominar essas tr√™s √© ter 80% do conhecimento necess√°rio para entender como os dados se comportam! üöÄ
"""
ax5.text(0.5, 0.5, resumo_text, fontsize=12, ha='center', va='center',
         bbox=dict(boxstyle='round', facecolor='gold', alpha=0.7))

plt.suptitle('üó∫Ô∏è O MAPA COMPLETO DAS DISTRIBUI√á√ïES DE PROBABILIDADE', 
             fontsize=18, y=0.98, weight='bold')
plt.tight_layout()
plt.show()

print("üéì PARAB√âNS! Voc√™s dominaram o M√≥dulo 2!")
print("üìä Agora voc√™s sabem como os dados se comportam no mundo real!")
print("üöÄ Pr√≥ximo m√≥dulo: Probabilidade Condicional e Teorema de Bayes!")
print("\nüî• Vamos usar essas distribui√ß√µes para construir sistemas inteligentes!")