# Distribuição de Poisson

Uma variável aleatória discreta $X$ tem _Distribuição de Poisson_ com parâmetro $\lambda \gt 0$ _(taxa)_ se sua função de probabilidade é dada por:

$$P(X=k) = \frac{e^{-\lambda}\lambda^k}{k!} $$

A _Distribuição de Poisson_ é bastante utilizada em contextos baseados em taxas conhecidas (por exemplo peças por minuto, clientes por hora, pacotes por segundo, etc).

## Média e Variância

$$\mu = \lambda$$
$$\sigma^2 = \lambda$$

## Geração de Dados com Distribuição de Poisson

A biblioteca _numpy_ possui um método que auxilia na produção de dados aleatórios modelados com Distribuição de Poisson.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

taxa_lambda = 10
n_pontos = 1000

pontos = np.random.poisson(taxa_lambda, n_pontos)

plt.hist(pontos, bins=np.arange(max(pontos)), density=True, rwidth=0.9)
plt.xlabel('k')
plt.ylabel('P(X=k)')
plt.title('Dados aleatórios gerados pelo numpy com λ =' + str(taxa_lambda))
plt.show(True)

## Lei dos Eventos Raros

A distribuição de Poisson é obtida quando aumentamos o número de experimentos e a probabilidade e sucesso é próxima de zero.

$$
\lim_{n\rightarrow \infty, p\rightarrow 0} \frac{n!}{(n-k)!k!}p^k(1-p)^{n-k} = \frac{e^{-\lambda}\lambda^k}{k!}
$$

Na simulação abaixo, é possível perceber que, se diminuirmos a probabilidade de sucesso, a distribuição binomial se aproxima da de Poisson.

In [None]:
import numpy as np
from matplotlib import pyplot as plt
from math import factorial as fact

n = 100
probabilidades_sucesso = [0.5, 0.2, 0.075]

total_simulacoes = 1000

for p in probabilidades_sucesso:
    sucessos_registrados = np.zeros(n)
    for _ in range(total_simulacoes):
        total_sucessos = 0
        for _ in range(n):
            if np.random.uniform() <= p:
                total_sucessos += 1
        sucessos_registrados[total_sucessos] += 1

    sucessos_registrados /= sum(sucessos_registrados)
    sucessos_teoricos_binomial = [fact(n) / (fact(n-k) * fact(k)) * p ** k  * (1-p) ** (n-k) for k in range(n)]
    sucessos_teoricos_poisson = [(np.exp(-n * p) * (n * p) ** k) / fact(k) for k in range(n)]
    valores_k = np.arange(n)

    plt.xlim(np.min(valores_k[sucessos_registrados>0]), np.max(valores_k[sucessos_registrados > 0]))
    plt.bar(valores_k, sucessos_registrados, label='Sucessos Simulados Poisson')
    plt.plot(valores_k, sucessos_teoricos_binomial, 'r--', label='Probabilidade Teórica Binomial')
    plt.plot(valores_k, sucessos_teoricos_poisson, 'k--', label='Probabilidade Teórica Poisson')
    plt.title('p = ' + str(p) + ', λ = ' + str(n * p))
    plt.xlabel('k')
    plt.ylabel('P(X=k)')
    plt.legend()
    plt.show(True)