# Simula√ß√£o da Distribui√ß√£o de Poisson

Este notebook apresenta simula√ß√µes pr√°ticas e interativas da **Distribui√ß√£o de Poisson**, permitindo que voc√™ experimente e visualize os conceitos em a√ß√£o.

## üìö Revis√£o Te√≥rica

A **distribui√ß√£o de Poisson** modela situa√ß√µes onde:
- Contamos o **n√∫mero de eventos** que ocorrem em um **intervalo fixo** (tempo ou espa√ßo)
- Os eventos ocorrem **independentemente** uns dos outros
- A **taxa m√©dia** de ocorr√™ncia √© **constante** (Œª)
- O n√∫mero de eventos poss√≠veis √© **teoricamente infinito**, mas poucos ocorrem na pr√°tica

### F√≥rmula:
$$P(X = k) = \frac{\lambda^k \cdot e^{-\lambda}}{k!}$$

Onde:
- **Œª (lambda)**: taxa m√©dia de eventos por intervalo
- **k**: n√∫mero espec√≠fico de eventos
- **e**: n√∫mero de Euler (‚âà 2.718)

### Propriedades:
- **M√©dia**: $E[X] = \lambda$
- **Vari√¢ncia**: $Var(X) = \lambda$
- **Desvio Padr√£o**: $\sigma = \sqrt{\lambda}$
- **Caracter√≠stica √∫nica**: M√©dia = Vari√¢ncia = Œª

## üõ†Ô∏è Importando as Bibliotecas

In [None]:
# Importa√ß√£o das bibliotecas necess√°rias
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import poisson
import pandas as pd

# Configura√ß√£o dos gr√°ficos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

print("‚úÖ Bibliotecas importadas com sucesso!")

## üìû Exemplo 1: Call Center - Chamadas por Minuto

Vamos come√ßar com um exemplo cl√°ssico: **chamadas em um call center**.

**Cen√°rio**: Em m√©dia, chegam **4 liga√ß√µes por minuto** no call center. Qual a probabilidade de receber exatamente 2 liga√ß√µes em um determinado minuto?

- **Œª = 4** (taxa m√©dia de liga√ß√µes por minuto)
- **k = 2** (n√∫mero espec√≠fico de liga√ß√µes que queremos calcular)

In [None]:
# Par√¢metros do exemplo
lambda_ligacoes = 4  # taxa m√©dia de liga√ß√µes por minuto
k_especifico = 2     # n√∫mero de liga√ß√µes de interesse

# Valores poss√≠veis de k (n√∫mero de liga√ß√µes)
k_valores = np.arange(0, 15)  # 0 a 14 liga√ß√µes (cobrindo ~99% dos casos)

# Calculando as probabilidades para cada valor de k
probabilidades = poisson.pmf(k_valores, lambda_ligacoes)

# Probabilidade espec√≠fica de k=2
prob_2_ligacoes = poisson.pmf(k_especifico, lambda_ligacoes)

# Propriedades te√≥ricas
media_teorica = lambda_ligacoes
variancia_teorica = lambda_ligacoes
desvio_teorico = np.sqrt(lambda_ligacoes)

print(f"üìû AN√ÅLISE DO CALL CENTER")
print("=" * 30)
print(f"Taxa m√©dia: {lambda_ligacoes} liga√ß√µes/minuto")
print(f"Queremos: P(X = {k_especifico}) = ?")
print()
print(f"üìä Propriedades Te√≥ricas:")
print(f"   M√©dia: {media_teorica:.2f} liga√ß√µes")
print(f"   Vari√¢ncia: {variancia_teorica:.2f}")
print(f"   Desvio Padr√£o: {desvio_teorico:.2f}")
print()
print(f"üéØ RESPOSTA:")
print(f"   P(X = {k_especifico}) = {prob_2_ligacoes:.4f} ({prob_2_ligacoes*100:.2f}%)")
print()
print(f"üìà Outras probabilidades relevantes:")
for i in range(0, 8):
    prob = poisson.pmf(i, lambda_ligacoes)
    print(f"   P(X = {i:2d}) = {prob:.4f} ({prob*100:5.2f}%)")

In [None]:
# Visualiza√ß√£o da distribui√ß√£o de Poisson
plt.figure(figsize=(14, 6))

# Gr√°fico de barras da distribui√ß√£o
plt.subplot(1, 2, 1)
cores = ['gold' if k == k_especifico else 'lightblue' for k in k_valores]
bars = plt.bar(k_valores, probabilidades, alpha=0.8, color=cores, edgecolor='navy')

# Destacar a barra de k=2
bars[k_especifico].set_edgecolor('red')
bars[k_especifico].set_linewidth(3)

plt.axvline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'Œª = {media_teorica}')
plt.xlabel('N√∫mero de Liga√ß√µes por Minuto (k)')
plt.ylabel('Probabilidade P(X = k)')
plt.title(f'Distribui√ß√£o de Poisson (Œª = {lambda_ligacoes})\nCall Center')
plt.legend()
plt.grid(True, alpha=0.3)

# Adicionar anota√ß√£o para k=2
plt.annotate(f'P(X=2) = {prob_2_ligacoes:.3f}', 
            xy=(k_especifico, prob_2_ligacoes), 
            xytext=(k_especifico + 2, prob_2_ligacoes + 0.03),
            arrowprops=dict(arrowstyle='->', color='red', lw=2),
            fontsize=12, fontweight='bold',
            bbox=dict(boxstyle="round,pad=0.3", facecolor='yellow', alpha=0.8))

# Gr√°fico de probabilidades acumuladas
plt.subplot(1, 2, 2)
prob_acumuladas = poisson.cdf(k_valores, lambda_ligacoes)
plt.plot(k_valores, prob_acumuladas, 'o-', color='orange', linewidth=2, markersize=6)
plt.axhline(0.5, color='gray', linestyle=':', alpha=0.7, label='50%')
plt.axhline(0.95, color='gray', linestyle=':', alpha=0.7, label='95%')
plt.xlabel('N√∫mero de Liga√ß√µes por Minuto (k)')
plt.ylabel('Probabilidade Acumulada P(X ‚â§ k)')
plt.title('Fun√ß√£o de Distribui√ß√£o Acumulada')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## üß™ Exemplo 2: Simula√ß√£o com Dados Reais

Vamos **simular** 1000 minutos de funcionamento do call center e comparar com a teoria:

In [None]:
# Simula√ß√£o: 1000 minutos de call center
num_simulacoes = 1000
np.random.seed(42)  # Para reprodutibilidade

# Gerando dados simulados
resultados_simulados = poisson.rvs(lambda_ligacoes, size=num_simulacoes)

# Estat√≠sticas da simula√ß√£o
media_simulada = np.mean(resultados_simulados)
desvio_simulado = np.std(resultados_simulados)
variancia_simulada = np.var(resultados_simulados)

# Frequ√™ncia de exatamente 2 liga√ß√µes
freq_2_ligacoes = np.sum(resultados_simulados == 2) / num_simulacoes

print(f"üî¨ RESULTADOS DA SIMULA√á√ÉO ({num_simulacoes} minutos):")
print("=" * 50)
print(f"   M√©dia Simulada: {media_simulada:.2f} liga√ß√µes/min")
print(f"   Desvio Simulado: {desvio_simulado:.2f}")
print(f"   Vari√¢ncia Simulada: {variancia_simulada:.2f}")
print(f"   Frequ√™ncia de 2 liga√ß√µes: {freq_2_ligacoes:.4f} ({freq_2_ligacoes*100:.2f}%)")
print()
print(f"üìä COMPARA√á√ÉO TEORIA vs SIMULA√á√ÉO:")
print(f"   M√©dia - Teoria: {media_teorica:.2f} | Simula√ß√£o: {media_simulada:.2f} | Diferen√ßa: {abs(media_teorica - media_simulada):.2f}")
print(f"   Desvio - Teoria: {desvio_teorico:.2f} | Simula√ß√£o: {desvio_simulado:.2f} | Diferen√ßa: {abs(desvio_teorico - desvio_simulado):.2f}")
print(f"   P(X=2) - Teoria: {prob_2_ligacoes:.4f} | Simula√ß√£o: {freq_2_ligacoes:.4f} | Diferen√ßa: {abs(prob_2_ligacoes - freq_2_ligacoes):.4f}")

# Estat√≠sticas descritivas adicionais
print(f"\nüìà ESTAT√çSTICAS ADICIONAIS:")
print(f"   M√≠nimo observado: {np.min(resultados_simulados)} liga√ß√µes")
print(f"   M√°ximo observado: {np.max(resultados_simulados)} liga√ß√µes")
print(f"   Mediana: {np.median(resultados_simulados):.1f} liga√ß√µes")

In [None]:
# Compara√ß√£o visual: Teoria vs Simula√ß√£o
plt.figure(figsize=(15, 6))

# Histograma dos resultados simulados vs teoria
plt.subplot(1, 3, 1)
range_max = max(np.max(resultados_simulados), 12)
bins = np.arange(-0.5, range_max + 1.5, 1)
freq_sim, _, _ = plt.hist(resultados_simulados, bins=bins, alpha=0.7, 
                         color='lightgreen', density=True, 
                         label='Simula√ß√£o', edgecolor='black')

# Sobrepor a distribui√ß√£o te√≥rica
k_teorico = np.arange(0, range_max + 1)
prob_teorica = poisson.pmf(k_teorico, lambda_ligacoes)
plt.bar(k_teorico, prob_teorica, alpha=0.6, color='red', 
        label='Teoria', width=0.6)

plt.xlabel('N√∫mero de Liga√ß√µes por Minuto')
plt.ylabel('Probabilidade')
plt.title('Compara√ß√£o: Teoria vs Simula√ß√£o')
plt.legend()
plt.grid(True, alpha=0.3)

# Converg√™ncia das m√©dias
plt.subplot(1, 3, 2)
medias_acumuladas = np.cumsum(resultados_simulados) / np.arange(1, num_simulacoes + 1)
plt.plot(range(1, num_simulacoes + 1), medias_acumuladas, color='blue', alpha=0.7)
plt.axhline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'M√©dia Te√≥rica = {media_teorica}')
plt.xlabel('N√∫mero de Simula√ß√µes')
plt.ylabel('M√©dia Acumulada')
plt.title('Converg√™ncia para a M√©dia Te√≥rica\n(Lei dos Grandes N√∫meros)')
plt.legend()
plt.grid(True, alpha=0.3)

# Boxplot da simula√ß√£o
plt.subplot(1, 3, 3)
box_data = [resultados_simulados]
bp = plt.boxplot(box_data, patch_artist=True, labels=['Simula√ß√£o'])
bp['boxes'][0].set_facecolor('lightblue')
plt.axhline(media_teorica, color='red', linestyle='--', linewidth=2, 
            label=f'M√©dia Te√≥rica = {media_teorica}')
plt.ylabel('N√∫mero de Liga√ß√µes')
plt.title('Distribui√ß√£o da Simula√ß√£o\n(Boxplot)')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## üéØ Exerc√≠cio Interativo: Teste seus Conhecimentos

Modifique o par√¢metro **Œª** abaixo e observe como a distribui√ß√£o muda:

In [None]:
# MODIFIQUE ESTE PAR√ÇMETRO E EXECUTE A C√âLULA
lambda_exercicio = 2.5    # Taxa m√©dia de eventos (Œª > 0)
k_interesse = 3           # N√∫mero de eventos de interesse (k ‚â• 0)

# Valida√ß√£o dos par√¢metros
if lambda_exercicio <= 0:
    print("‚ö†Ô∏è ERRO: Œª (lambda) deve ser maior que 0")
elif k_interesse < 0:
    print("‚ö†Ô∏è ERRO: k deve ser maior ou igual a 0")
else:
    # C√°lculos
    k_max = max(15, int(lambda_exercicio + 4*np.sqrt(lambda_exercicio)))
    k_vals_ex = np.arange(0, k_max)
    probs_ex = poisson.pmf(k_vals_ex, lambda_exercicio)
    
    prob_k_interesse = poisson.pmf(k_interesse, lambda_exercicio)
    prob_ate_k = poisson.cdf(k_interesse, lambda_exercicio)
    
    media_ex = lambda_exercicio
    desvio_ex = np.sqrt(lambda_exercicio)
    
    # Resultados
    print("üéØ RESULTADOS DO SEU EXERC√çCIO:")
    print("=" * 35)
    print(f"Par√¢metro: Œª = {lambda_exercicio}")
    print(f"M√©dia = Vari√¢ncia = {media_ex:.2f}")
    print(f"Desvio padr√£o = {desvio_ex:.2f}")
    print()
    print(f"P(X = {k_interesse}) = {prob_k_interesse:.4f} ({prob_k_interesse*100:.2f}%)")
    print(f"P(X ‚â§ {k_interesse}) = {prob_ate_k:.4f} ({prob_ate_k*100:.2f}%)")
    print(f"P(X > {k_interesse}) = {1-prob_ate_k:.4f} ({(1-prob_ate_k)*100:.2f}%)")
    
    # An√°lise da forma
    skewness = 1 / np.sqrt(lambda_exercicio)
    if lambda_exercicio < 1:
        forma = "Muito assim√©trica √† direita"
    elif lambda_exercicio < 5:
        forma = "Moderadamente assim√©trica √† direita"
    elif lambda_exercicio < 10:
        forma = "Levemente assim√©trica √† direita"
    else:
        forma = "Aproximadamente sim√©trica (‚âà Normal)"
    
    print(f"\nüìä Forma da distribui√ß√£o: {forma}")
    print(f"   Coeficiente de assimetria: {skewness:.3f}")
    
    # Gr√°fico
    plt.figure(figsize=(12, 6))
    
    # Gr√°fico principal
    plt.subplot(1, 2, 1)
    cores_ex = ['gold' if k == k_interesse else 'lightblue' for k in k_vals_ex]
    plt.bar(k_vals_ex, probs_ex, alpha=0.8, color=cores_ex, edgecolor='navy')
    plt.axvline(media_ex, color='red', linestyle='--', linewidth=2, 
                label=f'Œª = {media_ex:.1f}')
    
    # Destacar k de interesse
    if k_interesse < len(k_vals_ex):
        plt.annotate(f'P(X={k_interesse})\n= {prob_k_interesse:.3f}', 
                    xy=(k_interesse, prob_k_interesse), 
                    xytext=(k_interesse + k_max*0.15, prob_k_interesse + max(probs_ex)*0.2),
                    arrowprops=dict(arrowstyle='->', color='red', lw=2),
                    fontsize=11, fontweight='bold',
                    bbox=dict(boxstyle="round,pad=0.3", facecolor='yellow', alpha=0.8))
    
    plt.xlabel('N√∫mero de Eventos (k)')
    plt.ylabel('Probabilidade')
    plt.title(f'Distribui√ß√£o de Poisson - Seu Exerc√≠cio\nŒª = {lambda_exercicio}')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    # Gr√°fico de probabilidades acumuladas
    plt.subplot(1, 2, 2)
    prob_acum_ex = poisson.cdf(k_vals_ex, lambda_exercicio)
    plt.plot(k_vals_ex, prob_acum_ex, 'o-', color='purple', linewidth=2, markersize=4)
    
    if k_interesse < len(k_vals_ex):
        plt.axhline(prob_ate_k, color='orange', linestyle=':', alpha=0.7, 
                   label=f'P(X‚â§{k_interesse}) = {prob_ate_k:.3f}')
        plt.axvline(k_interesse, color='orange', linestyle=':', alpha=0.7)
        plt.plot(k_interesse, prob_ate_k, 'ro', markersize=8)
    
    plt.xlabel('k')
    plt.ylabel('P(X ‚â§ k)')
    plt.title('Probabilidade Acumulada')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Simula√ß√£o r√°pida
    simulacao_ex = poisson.rvs(lambda_exercicio, size=1000)
    freq_k = np.sum(simulacao_ex == k_interesse) / 1000
    print(f"\nüî¨ Verifica√ß√£o por simula√ß√£o (1000 experimentos):")
    print(f"   Frequ√™ncia de k={k_interesse}: {freq_k:.3f} (teoria: {prob_k_interesse:.3f})")
    print(f"   Diferen√ßa: {abs(freq_k - prob_k_interesse):.3f}")

## üìù Resumo e Conclus√µes

### ‚úÖ O que aprendemos:

1. **Conceito**: A distribui√ß√£o de Poisson modela **eventos raros** em intervalos fixos
2. **Par√¢metro**: Œª (lambda) representa a **taxa m√©dia** de eventos
3. **Propriedade √∫nica**: **M√©dia = Vari√¢ncia = Œª**
4. **Aplica√ß√µes**: Call centers, acidentes, defeitos, chegadas, etc.
5. **Simula√ß√£o**: A Lei dos Grandes N√∫meros confirma a teoria

### üîç Observa√ß√µes importantes:

- **Œª pequeno** (< 1): Distribui√ß√£o muito assim√©trica √† direita
- **Œª m√©dio** (1-10): Moderadamente assim√©trica
- **Œª grande** (> 10): Aproxima-se da distribui√ß√£o Normal
- **Assimetria** = 1/‚àöŒª (diminui conforme Œª aumenta)

### üí° Dicas pr√°ticas:

- Use Poisson para **eventos raros** em intervalos **fixos de tempo/espa√ßo**
- Verifique se os eventos s√£o **independentes** entre si
- A **taxa deve ser constante** no per√≠odo analisado
- Para **Œª > 10**, considere usar aproxima√ß√£o Normal: N(Œª, Œª)

### üéØ Exemplos de quando usar:

‚úÖ **Use Poisson**:
- Chamadas por hora em um call center
- Defeitos por metro de tecido
- Emails recebidos por dia
- Acidentes por semana
- Clientes chegando a uma loja por minuto

‚ùå **N√ÉO use Poisson**:
- Resultados de cara/coroa (use Binomial)
- Notas de provas (use Normal)
- Quando a taxa varia no tempo
- Quando os eventos n√£o s√£o independentes