# Simulação da Distribuição de Poisson

Este notebook apresenta simulações práticas e interativas da **Distribuição de Poisson**, permitindo que você experimente e visualize os conceitos em ação.

## 📚 Revisão Teórica

A **distribuição de Poisson** modela situações onde:
- Contamos o **número de eventos** que ocorrem em um **intervalo fixo** (tempo ou espaço)
- Os eventos ocorrem **independentemente** uns dos outros
- A **taxa média** de ocorrência é **constante** (λ)
- O número de eventos possíveis é **teoricamente infinito**, mas poucos ocorrem na prática

### Fórmula:
$$P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!}$$

Onde:
- **λ (lambda)**: taxa média de eventos por intervalo
- **k**: número específico de eventos
- **e**: número de Euler (≈ 2.718)

### Propriedades:
- **Média**: $E[X] = \lambda$
- **Variância**: $Var(X) = \lambda$
- **Desvio Padrão**: $\sigma = \sqrt{\lambda}$
- **Característica única**: Média = Variância = λ

## 🛠️ Importando as Bibliotecas

In [None]:
# Importação das bibliotecas necessárias
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import poisson
import pandas as pd

# Configuração dos gráficos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

print("✅ Bibliotecas importadas com sucesso!")

## 📞 Exemplo 1: Call Center - Chamadas por Minuto

Vamos começar com um exemplo clássico: **chamadas em um call center**.

**Cenário**: Em média, chegam **4 ligações por minuto** no call center. Qual a probabilidade de receber exatamente 2 ligações em um determinado minuto?

- **λ = 4** (taxa média de ligações por minuto)
- **k = 2** (número específico de ligações que queremos calcular)

In [None]:
# Parâmetros do exemplo
lambda_ligacoes = 4  # taxa média de ligações por minuto
k_especifico = 2     # número de ligações de interesse

# Valores possíveis de k (número de ligações)
k_valores = np.arange(0, 15)  # 0 a 14 ligações (cobrindo ~99% dos casos)

# Calculando as probabilidades para cada valor de k
probabilidades = poisson.pmf(k_valores, lambda_ligacoes)

# Probabilidade específica de k=2
prob_2_ligacoes = poisson.pmf(k_especifico, lambda_ligacoes)

# Propriedades teóricas
media_teorica = lambda_ligacoes
variancia_teorica = lambda_ligacoes
desvio_teorico = np.sqrt(lambda_ligacoes)

print(f"📞 ANÁLISE DO CALL CENTER")
print("=" * 30)
print(f"Taxa média: {lambda_ligacoes} ligações/minuto")
print(f"Queremos: P(X = {k_especifico}) = ?")
print()
print(f"📊 Propriedades Teóricas:")
print(f"   Média: {media_teorica:.2f} ligações")
print(f"   Variância: {variancia_teorica:.2f}")
print(f"   Desvio Padrão: {desvio_teorico:.2f}")
print()
print(f"🎯 RESPOSTA:")
print(f"   P(X = {k_especifico}) = {prob_2_ligacoes:.4f} ({prob_2_ligacoes*100:.2f}%)")
print()
print(f"📈 Outras probabilidades relevantes:")
for i in range(0, 8):
    prob = poisson.pmf(i, lambda_ligacoes)
    print(f"   P(X = {i:2d}) = {prob:.4f} ({prob*100:5.2f}%)")

In [None]:
# Visualização da distribuição de Poisson
plt.figure(figsize=(14, 6))

# Gráfico de barras da distribuição
plt.subplot(1, 2, 1)
cores = ['gold' if k == k_especifico else 'lightblue' for k in k_valores]
bars = plt.bar(k_valores, probabilidades, alpha=0.8, color=cores, edgecolor='navy')

# Destacar a barra de k=2
bars[k_especifico].set_edgecolor('red')
bars[k_especifico].set_linewidth(3)

plt.axvline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'λ = {media_teorica}')
plt.xlabel('Número de Ligações por Minuto (k)')
plt.ylabel('Probabilidade P(X = k)')
plt.title(f'Distribuição de Poisson (λ = {lambda_ligacoes})\nCall Center')
plt.legend()
plt.grid(True, alpha=0.3)

# Adicionar anotação para k=2
plt.annotate(f'P(X=2) = {prob_2_ligacoes:.3f}', 
            xy=(k_especifico, prob_2_ligacoes), 
            xytext=(k_especifico + 2, prob_2_ligacoes + 0.03),
            arrowprops=dict(arrowstyle='->', color='red', lw=2),
            fontsize=12, fontweight='bold',
            bbox=dict(boxstyle="round,pad=0.3", facecolor='yellow', alpha=0.8))

# Gráfico de probabilidades acumuladas
plt.subplot(1, 2, 2)
prob_acumuladas = poisson.cdf(k_valores, lambda_ligacoes)
plt.plot(k_valores, prob_acumuladas, 'o-', color='orange', linewidth=2, markersize=6)
plt.axhline(0.5, color='gray', linestyle=':', alpha=0.7, label='50%')
plt.axhline(0.95, color='gray', linestyle=':', alpha=0.7, label='95%')
plt.xlabel('Número de Ligações por Minuto (k)')
plt.ylabel('Probabilidade Acumulada P(X ≤ k)')
plt.title('Função de Distribuição Acumulada')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 🧪 Exemplo 2: Simulação com Dados Reais

Vamos **simular** 1000 minutos de funcionamento do call center e comparar com a teoria:

In [None]:
# Simulação: 1000 minutos de call center
num_simulacoes = 1000
np.random.seed(42)  # Para reprodutibilidade

# Gerando dados simulados
resultados_simulados = poisson.rvs(lambda_ligacoes, size=num_simulacoes)

# Estatísticas da simulação
media_simulada = np.mean(resultados_simulados)
desvio_simulado = np.std(resultados_simulados)
variancia_simulada = np.var(resultados_simulados)

# Frequência de exatamente 2 ligações
freq_2_ligacoes = np.sum(resultados_simulados == 2) / num_simulacoes

print(f"🔬 RESULTADOS DA SIMULAÇÃO ({num_simulacoes} minutos):")
print("=" * 50)
print(f"   Média Simulada: {media_simulada:.2f} ligações/min")
print(f"   Desvio Simulado: {desvio_simulado:.2f}")
print(f"   Variância Simulada: {variancia_simulada:.2f}")
print(f"   Frequência de 2 ligações: {freq_2_ligacoes:.4f} ({freq_2_ligacoes*100:.2f}%)")
print()
print(f"📊 COMPARAÇÃO TEORIA vs SIMULAÇÃO:")
print(f"   Média - Teoria: {media_teorica:.2f} | Simulação: {media_simulada:.2f} | Diferença: {abs(media_teorica - media_simulada):.2f}")
print(f"   Desvio - Teoria: {desvio_teorico:.2f} | Simulação: {desvio_simulado:.2f} | Diferença: {abs(desvio_teorico - desvio_simulado):.2f}")
print(f"   P(X=2) - Teoria: {prob_2_ligacoes:.4f} | Simulação: {freq_2_ligacoes:.4f} | Diferença: {abs(prob_2_ligacoes - freq_2_ligacoes):.4f}")

# Estatísticas descritivas adicionais
print(f"\n📈 ESTATÍSTICAS ADICIONAIS:")
print(f"   Mínimo observado: {np.min(resultados_simulados)} ligações")
print(f"   Máximo observado: {np.max(resultados_simulados)} ligações")
print(f"   Mediana: {np.median(resultados_simulados):.1f} ligações")

In [None]:
# Comparação visual: Teoria vs Simulação
plt.figure(figsize=(15, 6))

# Histograma dos resultados simulados vs teoria
plt.subplot(1, 3, 1)
range_max = max(np.max(resultados_simulados), 12)
bins = np.arange(-0.5, range_max + 1.5, 1)
freq_sim, _, _ = plt.hist(resultados_simulados, bins=bins, alpha=0.7, 
                         color='lightgreen', density=True, 
                         label='Simulação', edgecolor='black')

# Sobrepor a distribuição teórica
k_teorico = np.arange(0, range_max + 1)
prob_teorica = poisson.pmf(k_teorico, lambda_ligacoes)
plt.bar(k_teorico, prob_teorica, alpha=0.6, color='red', 
        label='Teoria', width=0.6)

plt.xlabel('Número de Ligações por Minuto')
plt.ylabel('Probabilidade')
plt.title('Comparação: Teoria vs Simulação')
plt.legend()
plt.grid(True, alpha=0.3)

# Convergência das médias
plt.subplot(1, 3, 2)
medias_acumuladas = np.cumsum(resultados_simulados) / np.arange(1, num_simulacoes + 1)
plt.plot(range(1, num_simulacoes + 1), medias_acumuladas, color='blue', alpha=0.7)
plt.axhline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'Média Teórica = {media_teorica}')
plt.xlabel('Número de Simulações')
plt.ylabel('Média Acumulada')
plt.title('Convergência para a Média Teórica\n(Lei dos Grandes Números)')
plt.legend()
plt.grid(True, alpha=0.3)

# Boxplot da simulação
plt.subplot(1, 3, 3)
box_data = [resultados_simulados]
bp = plt.boxplot(box_data, patch_artist=True, labels=['Simulação'])
bp['boxes'][0].set_facecolor('lightblue')
plt.axhline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'Média Teórica = {media_teorica}')
plt.ylabel('Número de Ligações')
plt.title('Distribuição da Simulação\n(Boxplot)')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 🎯 Exercício Interativo: Teste seus Conhecimentos

Modifique o parâmetro **λ** abaixo e observe como a distribuição muda:

In [None]:
# MODIFIQUE ESTE PARÂMETRO E EXECUTE A CÉLULA
lambda_exercicio = 2.5    # Taxa média de eventos (λ > 0)
k_interesse = 3           # Número de eventos de interesse (k ≥ 0)

# Validação dos parâmetros
if lambda_exercicio <= 0:
    print("⚠️ ERRO: λ (lambda) deve ser maior que 0")
elif k_interesse < 0:
    print("⚠️ ERRO: k deve ser maior ou igual a 0")
else:
    # Cálculos
    k_max = max(15, int(lambda_exercicio + 4*np.sqrt(lambda_exercicio)))
    k_vals_ex = np.arange(0, k_max)
    probs_ex = poisson.pmf(k_vals_ex, lambda_exercicio)
    
    prob_k_interesse = poisson.pmf(k_interesse, lambda_exercicio)
    prob_ate_k = poisson.cdf(k_interesse, lambda_exercicio)
    
    media_ex = lambda_exercicio
    desvio_ex = np.sqrt(lambda_exercicio)
    
    # Resultados
    print("🎯 RESULTADOS DO SEU EXERCÍCIO:")
    print("=" * 35)
    print(f"Parâmetro: λ = {lambda_exercicio}")
    print(f"Média = Variância = {media_ex:.2f}")
    print(f"Desvio padrão = {desvio_ex:.2f}")
    print()
    print(f"P(X = {k_interesse}) = {prob_k_interesse:.4f} ({prob_k_interesse*100:.2f}%)")
    print(f"P(X ≤ {k_interesse}) = {prob_ate_k:.4f} ({prob_ate_k*100:.2f}%)")
    print(f"P(X > {k_interesse}) = {1-prob_ate_k:.4f} ({(1-prob_ate_k)*100:.2f}%)")
    
    # Análise da forma
    skewness = 1 / np.sqrt(lambda_exercicio)
    if lambda_exercicio < 1:
        forma = "Muito assimétrica à direita"
    elif lambda_exercicio < 5:
        forma = "Moderadamente assimétrica à direita"
    elif lambda_exercicio < 10:
        forma = "Levemente assimétrica à direita"
    else:
        forma = "Aproximadamente simétrica (≈ Normal)"
    
    print(f"\n📊 Forma da distribuição: {forma}")
    print(f"   Coeficiente de assimetria: {skewness:.3f}")
    
    # Gráfico
    plt.figure(figsize=(12, 6))
    
    # Gráfico principal
    plt.subplot(1, 2, 1)
    cores_ex = ['gold' if k == k_interesse else 'lightblue' for k in k_vals_ex]
    plt.bar(k_vals_ex, probs_ex, alpha=0.8, color=cores_ex, edgecolor='navy')
    plt.axvline(media_ex, color='red', linestyle='--', linewidth=2, 
                label=f'λ = {media_ex:.1f}')
    
    # Destacar k de interesse
    if k_interesse < len(k_vals_ex):
        plt.annotate(f'P(X={k_interesse})\n= {prob_k_interesse:.3f}', 
                    xy=(k_interesse, prob_k_interesse), 
                    xytext=(k_interesse + k_max*0.15, prob_k_interesse + max(probs_ex)*0.2),
                    arrowprops=dict(arrowstyle='->', color='red', lw=2),
                    fontsize=11, fontweight='bold',
                    bbox=dict(boxstyle="round,pad=0.3", facecolor='yellow', alpha=0.8))
    
    plt.xlabel('Número de Eventos (k)')
    plt.ylabel('Probabilidade')
    plt.title(f'Distribuição de Poisson - Seu Exercício\nλ = {lambda_exercicio}')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    # Gráfico de probabilidades acumuladas
    plt.subplot(1, 2, 2)
    prob_acum_ex = poisson.cdf(k_vals_ex, lambda_exercicio)
    plt.plot(k_vals_ex, prob_acum_ex, 'o-', color='purple', linewidth=2, markersize=4)
    
    if k_interesse < len(k_vals_ex):
        plt.axhline(prob_ate_k, color='orange', linestyle=':', alpha=0.7, 
                   label=f'P(X≤{k_interesse}) = {prob_ate_k:.3f}')
        plt.axvline(k_interesse, color='orange', linestyle=':', alpha=0.7)
        plt.plot(k_interesse, prob_ate_k, 'ro', markersize=8)
    
    plt.xlabel('k')
    plt.ylabel('P(X ≤ k)')
    plt.title('Probabilidade Acumulada')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Simulação rápida
    simulacao_ex = poisson.rvs(lambda_exercicio, size=1000)
    freq_k = np.sum(simulacao_ex == k_interesse) / 1000
    print(f"\n🔬 Verificação por simulação (1000 experimentos):")
    print(f"   Frequência de k={k_interesse}: {freq_k:.3f} (teoria: {prob_k_interesse:.3f})")
    print(f"   Diferença: {abs(freq_k - prob_k_interesse):.3f}")

## 📝 Resumo e Conclusões

### ✅ O que aprendemos:

1. **Conceito**: A distribuição de Poisson modela **eventos raros** em intervalos fixos
2. **Parâmetro**: λ (lambda) representa a **taxa média** de eventos
3. **Propriedade única**: **Média = Variância = λ**
4. **Aplicações**: Call centers, acidentes, defeitos, chegadas, etc.
5. **Simulação**: A Lei dos Grandes Números confirma a teoria

### 🔍 Observações importantes:

- **λ pequeno** (< 1): Distribuição muito assimétrica à direita
- **λ médio** (1-10): Moderadamente assimétrica
- **λ grande** (> 10): Aproxima-se da distribuição Normal
- **Assimetria** = 1/√λ (diminui conforme λ aumenta)

### 💡 Dicas práticas:

- Use Poisson para **eventos raros** em intervalos **fixos de tempo/espaço**
- Verifique se os eventos são **independentes** entre si
- A **taxa deve ser constante** no período analisado
- Para **λ > 10**, considere usar aproximação Normal: N(λ, λ)

### 🎯 Exemplos de quando usar:

✅ **Use Poisson**:
- Chamadas por hora em um call center
- Defeitos por metro de tecido
- Emails recebidos por dia
- Acidentes por semana
- Clientes chegando a uma loja por minuto

❌ **NÃO use Poisson**:
- Resultados de cara/coroa (use Binomial)
- Notas de provas (use Normal)
- Quando a taxa varia no tempo
- Quando os eventos não são independentes