**Experimento**<br>
_"Observar a ocorrência de eventos aleatórios em um intervalo contínuo de tempo ou espaço, onde esses eventos ocorrem de maneira independente e a uma taxa média constante $\lambda$"_

Antes de partirmos para as definições formais, vou motivar o estudo da distribuição de *Poisson* com um exemplo que aproveita resultados já apresentados. Vamos adicionar uma nova dimensão ainda não explorada nas distribuições anteriores: o tempo.

**Problema motivador**
> Numa determinada estação, 12 ônibus param a cada 2 horas. Queremos saber qual a probabilidade de passarem 3 ônibus num intervalo de uma hora.

Um olhar ingênuo pode nos levar a normalizar a taxa e considerar que passam 12 ônibus a cada 2 horas, então  a taxa é de 6 ônibus por hora. Assim, para qualquer intervalo menor que uma hora, a probabilidade é de 100%. Essa resposta não está correta! O erro consiste em admitir que a taxa é constante para qualquer intervalo de tempo considerado.

Considere pegar o intervalo de tempo de duas horas e dividí-lo em intervalos menores, digamos, de 10 minutos.

<div style="text-align: center;">
    <img src="../1-images/dividing_time.png" style="max-width: 100%; height: auto;">
</div>

Ao fazer isso, obtemos 12 intervalos igualmente distribuidos com 10 minutos cada. Vamos também considerar (que é bem razoável), que a probabilidade de um ônibus aparecer é proporcional ao intervalo de tempo passado.
$$
p = \lambda \Delta t
$$

Onde $\lambda$ é a constante de proporcionalidade

Por fim, iremos também supor que no máximo um ônibus pode parar a cada intervalo $\Delta t$. Isto é, em cada intervalo de 10 min, no **máximo** um ônibus pode parar. De posse do modelo acima, podemos calcular a probabilidade de $n$ ônibus pararem ao longo dos $m=12$. Perceba que a probabilidade desse evento é equivalente a probabilidade binomial de haver $n$ sucessos em $m$ observações.

$$
P(X=n) = \binom{m}{n} p^n (1-p)^{m-n}
$$

Fazendo as devidas substituições, obtemos:

$$
P(X=3) = \binom{12}{3} (10 \lambda )^3 (1-10 \lambda)^{9}
$$

A expressão acima nos dá a probabilidade de três ônibus pararem no terminal num intervalo de 10 

## 1. Definição do Espaço Amostral $ S $
O espaço amostral $ \Omega $ de um processo de Poisson consiste em todas as possíveis sequências de eventos ocorrendo ao longo de um intervalo contínuo de tempo ou espaço.

Matematicamente, podemos representar $ \Omega $ como o conjunto de todas as possíveis contagens de eventos ao longo de um intervalo $ [0, T] $:

$$
\Omega = \{ (t_1, t_2, \dots, t_n) \mid 0 \leq t_1 \leq t_2 \leq \dots \leq t_n \leq T, \ n \geq 0 \}
$$

onde:
- $ n $ é o número de eventos observados no intervalo $ [0,T] $ (que pode ser zero).
- $ t_i $ representa o instante no qual ocorreu o $ i $-ésimo evento.
- Se o processo for espacial, os $ t_i $ podem representar coordenadas espaciais em vez de tempos.

Em outras palavras, o espaço amostral é composto por todas as possíveis listas de tempos (ou posições) em que eventos ocorrem dentro do intervalo analisado.

### **Exemplos de Espaços Amostrais para Processos de Poisson**
Agora, vejamos exemplos concretos de como esse espaço amostral se configura em diferentes contextos:

1. **Chamadas telefônicas chegando a um call center**  
   - Experimento: **Observar** a chegada de chamadas durante uma hora.  
   - Espaço amostral: Todas as possíveis sequências de tempos em que chamadas foram recebidas no intervalo de 1 hora.  
     $$
     \Omega = \{ (), (t_1), (t_1, t_2), (t_1, t_2, t_3, \dots) \mid 0 \leq t_1 \leq t_2 \leq \dots \leq 60 \}.
     $$
     Aqui, um elemento do espaço amostral pode ser $ (5.2, 18.4, 29.7) $, significando que chamadas ocorreram nos instantes $ 5.2 $, $ 18.4 $ e $ 29.7 $ minutos.

2. **Passageiros chegando a uma estação de metrô**  
   - Experimento: **Observar** a chegada de passageiros em um período de 30 minutos.  
   - Espaço amostral: Todas as possíveis listas de tempos em que passageiros chegam dentro do intervalo de 30 minutos.  
     $$
     \Omega = \{ (), (t_1), (t_1, t_2, \dots, t_n) \mid 0 \leq t_1 \leq t_2 \leq \dots \leq 30 \}.
     $$

3. **Defeitos surgindo em um rolo de tecido de 100 metros**  
   - Experimento: **Observar** as posições dos defeitos ao longo do tecido.  
   - Espaço amostral: Todas as possíveis sequências de posições $ x_i $ ao longo do rolo de tecido.  
     $$
     \Omega = \{ (), (x_1), (x_1, x_2, \dots, x_n) \mid 0 \leq x_1 \leq x_2 \leq \dots \leq 100 \}.
     $$
     Aqui, um elemento do espaço amostral pode ser $ (12.5, 47.3) $, significando que defeitos foram encontrados nas posições $ 12.5 $ e $ 47.3 $ metros do tecido.

---

### **Resumo**
- O espaço amostral de um **processo de Poisson** é formado por todas as possíveis sequências de tempos (ou posições) em que eventos ocorrem dentro do intervalo analisado.
- Cada elemento do espaço amostral é uma **sequência ordenada de tempos ou posições** em que eventos aconteceram.
- O espaço amostral pode ser **contínuo** (caso do processo original) ou **discreto** (caso do número total de eventos no intervalo, que segue uma distribuição de Poisson).

A distribuição de Poisson é caracterizada por um parâmetro **$ \lambda $**, que representa o número esperado de eventos em um determinado intervalo de tempo ou espaço.

Cada valor $ s_i \in S $ ocorre com a seguinte **probabilidade**:

$$
P(s_i) = \frac{e^{-\lambda} \lambda^{s_i}}{s_i!}, \quad \forall s_i \in S
$$

onde:
- $ \lambda $ é o **parâmetro da taxa média de eventos por unidade de tempo ou espaço**.
- $ e^{-\lambda} $ garante que a soma das probabilidades seja **1**.
- $ s_i! $ normaliza a distribuição.

> A função de probabilidade da distribuição de Poisson surge como um **limite da distribuição Binomial**, quando o número de ensaios $ n $ tende ao infinito e a probabilidade de sucesso $ p $ tende a zero, mantendo o produto $ np = \lambda $ fixo.

---

## **3. Definição da Variável Aleatória $ X $**

Definimos a variável aleatória $ X $ como o **número de eventos observados no intervalo**:

$$
X: S \to \mathbb{R}
$$

onde:

$$
X(s_i) = s_i, \quad \forall s_i \in S
$$

Ou seja, $ X $ é simplesmente uma contagem do número de eventos observados.

O **conjunto imagem** de $ X $ é:

$$
\mathcal{X} = \{0, 1, 2, 3, \dots\}
$$

pois a variável pode assumir qualquer valor inteiro não negativo.

---

## **4. Probabilidade Induzida $ P_X(X = k) $**

A **probabilidade induzida** da variável $ X $ pode ser obtida a partir da definição da probabilidade em $ S $, ou seja:

$$
P_X(X = k) = P(\{s_i \in S \mid X(s_i) = k\})
$$

Como cada $ s_i $ representa diretamente um número de eventos, a probabilidade induzida segue a **função de probabilidade da distribuição de Poisson**:

$$
P_X(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}, \quad k \in \mathbb{N}_0
$$

Isso significa que a distribuição de Poisson descreve a **probabilidade de observar exatamente $ k $ eventos em um determinado intervalo**, dado que a taxa média de eventos por intervalo é $ \lambda $.

---

## **5. Probabilidade Acumulada $ F_X(X \leq k) $**

A função de distribuição acumulada (CDF) é definida como:

$$
F_X(k) = P(X \leq k) = \sum_{j=0}^{k} P_X(X = j)
$$

Substituindo a função de probabilidade da Poisson:

$$
F_X(k) = \sum_{j=0}^{k} \frac{e^{-\lambda} \lambda^j}{j!}
$$

Essa soma não tem uma solução fechada, mas pode ser calculada numericamente ou através da função gama incompleta.

> Em Python, essa CDF pode ser calculada com `scipy.stats.poisson.cdf(k, λ)`.

---

## **6. Momentos da Distribuição**
Momentos estatísticos ajudam a descrever o comportamento da distribuição.

### **6.1. Esperança Matemática $ \mathbb{E}[X] $**
O valor esperado da distribuição de Poisson é simplesmente o **parâmetro $ \lambda $**:

$$
\mathbb{E}[X] = \lambda
$$

Isso significa que o número médio de eventos observados em um intervalo é exatamente igual à taxa média de eventos.

### **6.2. Variância $ \text{Var}(X) $**
A variância da distribuição de Poisson também é igual a $ \lambda $:

$$
\text{Var}(X) = \lambda
$$

Ou seja, **a média e a variância são iguais na distribuição de Poisson**.

> Isso é uma propriedade única da Poisson e pode ser útil para identificar processos que seguem essa distribuição.

---

## **7. Função Geradora de Momentos (MGF)**
A função geradora de momentos (MGF) é dada por:

$$
M_X(t) = \mathbb{E}[e^{tX}]
$$

Substituindo a função de probabilidade da Poisson:

$$
M_X(t) = \sum_{k=0}^{\infty} e^{tk} \frac{e^{-\lambda} \lambda^k}{k!}
$$

Rearranjando os termos:

$$
M_X(t) = e^{-\lambda} \sum_{k=0}^{\infty} \frac{(\lambda e^t)^k}{k!}
$$

Reconhecemos essa soma como a **expansão de Taylor da exponencial** $ e^x $, então:

$$
M_X(t) = e^{-\lambda} e^{\lambda e^t}
$$

$$
M_X(t) = e^{\lambda (e^t - 1)}
$$

Isso mostra que a MGF da Poisson tem uma forma exponencial, o que facilita a derivação dos momentos.

---

## **📌 Conclusão**
### **Resumo das Propriedades da Distribuição de Poisson**
| Propriedade            | Expressão |
|------------------------|-----------|
| Espaço amostral       | $ S = \{0, 1, 2, 3, \dots\} $ |
| Parâmetro            | $ \lambda $ (média de eventos por intervalo) |
| PMF (função de massa de probabilidade) | $ P_X(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} $ |
| CDF (função acumulada) | $ F_X(k) = \sum_{j=0}^{k} \frac{e^{-\lambda} \lambda^j}{j!} $ |
| Valor esperado $ \mathbb{E}[X] $ | $ \lambda $ |
| Variância $ \text{Var}(X) $ | $ \lambda $ |
| Função Geradora de Momentos (MGF) | $ M_X(t) = e^{\lambda (e^t - 1)} $ |

A **distribuição de Poisson** é fundamental para modelar **eventos raros** que ocorrem em um intervalo de tempo ou espaço, como:
- O número de chamadas recebidas por um call center em uma hora.
- O número de acidentes em uma rodovia por dia.
- O número de partículas detectadas em um sensor por segundo.

Se precisar de ajustes ou quiser explorar mais aplicações, me avise! 🚀

Ótima observação! Vamos construir a função de probabilidade do **processo de Poisson** **do zero**, partindo **somente do espaço amostral** e das **propriedades fundamentais das funções de probabilidade e dos axiomas de Kolmogorov**.

---

### **Passo 1: Definição do Espaço Amostral**
O espaço amostral do processo de Poisson é o conjunto de todas as possíveis sequências de tempos em que eventos ocorrem dentro de um intervalo \( [0,T] \). Formalmente, um elemento do espaço amostral é:

\[
\omega = (t_1, t_2, \dots, t_n), \quad 0 \leq t_1 \leq t_2 \leq \dots \leq t_n \leq T, \quad n \geq 0.
\]

Isso significa que cada realização do experimento pode ser descrita por um número finito de tempos ordenados \( (t_1, t_2, ..., t_n) \) no intervalo \( [0,T] \).

Nosso objetivo agora é determinar a **função de probabilidade** \( P(\omega) \), ou seja, a probabilidade de observarmos uma sequência específica \( (t_1, t_2, ..., t_n) \).

---

### **Passo 2: Construção de \( P \) com os Axiomas de Kolmogorov**
Uma função de probabilidade \( P \) deve satisfazer os três axiomas de Kolmogorov:

1. **Não negatividade**: \( P(A) \geq 0 \) para qualquer evento \( A \).
2. **Probabilidade total**: \( P(\Omega) = 1 \), ou seja, a soma (ou integral) das probabilidades de todos os eventos possíveis deve ser 1.
3. **Aditividade**: Se \( A_1, A_2, ... \) são eventos mutuamente exclusivos, então \( P(A_1 \cup A_2 \cup ...) = P(A_1) + P(A_2) + ... \).

Essas condições impõem restrições à forma que \( P \) pode assumir.

---

### **Passo 3: Probabilidade de uma Sequência Específica**
Agora, deduzimos \( P(t_1, t_2, ..., t_n) \) **a partir da contagem de sequências no espaço amostral**.

1. **Dividimos o intervalo \( [0,T] \) em pequenos subintervalos \( \Delta t \)** e assumimos que a probabilidade de um evento ocorrer em cada \( \Delta t \) é proporcional ao tamanho de \( \Delta t \), digamos \( \lambda \Delta t \). Isso define uma **taxa constante de ocorrência**.

2. **Probabilidade de exatamente \( n \) eventos ocorrerem em \( [0,T] \)**:  
   - Vamos dividir \( [0,T] \) em \( m \) intervalos pequenos \( \Delta t \), de modo que \( m = \frac{T}{\Delta t} \).
   - Como eventos ocorrem independentemente, a probabilidade de um evento ocorrer em um dado \( \Delta t \) é aproximadamente \( \lambda \Delta t \).
   - Como temos \( m \) intervalos, a probabilidade de **exatamente** \( n \) eventos ocorrerem segue a **distribuição binomial**:

     \[
     P(N(T) = n) = \binom{m}{n} (\lambda \Delta t)^n (1 - \lambda \Delta t)^{m-n}.
     \]

   - Para \( \Delta t \to 0 \), usando o limite fundamental \( (1 - x/m)^m \to e^{-x} \), essa expressão converge para:

     \[
     P(N(T) = n) = \frac{(\lambda T)^n e^{-\lambda T}}{n!}.
     \]

3. **Distribuição dos tempos de ocorrência \( (t_1, t_2, ..., t_n) \)**:  
   - Sabendo que **exatamente \( n \) eventos ocorreram**, os tempos de ocorrência \( t_1, ..., t_n \) devem estar **uniformemente distribuídos no intervalo** \( [0,T] \).
   - Como há \( n! \) maneiras diferentes de ordenar \( n \) pontos distintos em \( [0,T] \), a densidade condicional desses tempos é dada por:

     \[
     P(t_1, t_2, ..., t_n \mid N(T) = n) = \frac{n!}{T^n}.
     \]

4. **Juntando os resultados**:  
   - A probabilidade conjunta de observar \( n \) eventos nos tempos \( (t_1, ..., t_n) \) é dada pela multiplicação das duas expressões anteriores:

     \[
     P(t_1, t_2, ..., t_n) = P(N(T) = n) \times P(t_1, ..., t_n \mid N(T) = n).
     \]

     Substituindo os valores:

     \[
     P(t_1, t_2, ..., t_n) = \frac{(\lambda T)^n e^{-\lambda T}}{n!} \times \frac{n!}{T^n}.
     \]

     Simplificando:

     \[
     P(t_1, t_2, ..., t_n) = \frac{(\lambda T)^n e^{-\lambda T}}{T^n}.
     \]

---

### **Passo 4: Verificação dos Axiomas de Kolmogorov**
Agora, verificamos se \( P \) atende aos axiomas de probabilidade:

1. **Não negatividade**: Como \( \lambda, T > 0 \) e \( e^{-\lambda T} > 0 \), temos \( P \geq 0 \).
2. **Probabilidade total**: A soma de \( P(N(T) = n) \) sobre todos os \( n \) resulta na **soma da série de Poisson**, que é 1:

   \[
   \sum_{n=0}^{\infty} \frac{(\lambda T)^n e^{-\lambda T}}{n!} = e^{-\lambda T} e^{\lambda T} = 1.
   \]

3. **Aditividade**: Como a distribuição é derivada da binomial, que satisfaz o princípio da aditividade, e o processo de Poisson pode ser derivado de um limite binomial, ele também satisfaz essa propriedade.

Portanto, \( P \) é uma **função de probabilidade válida**, deduzida diretamente do espaço amostral!

---

### **Conclusão**
- Construímos a função de probabilidade **do zero**, sem assumir que o número de eventos segue Poisson.
- Mostramos que a contagem de eventos naturalmente leva à distribuição de Poisson.
- Mostramos que os tempos de eventos seguem uma distribuição uniforme condicionalmente ao número total de eventos.
- A probabilidade de uma sequência específica de tempos é:

  \[
  P(t_1, t_2, ..., t_n) = \frac{(\lambda T)^n e^{-\lambda T}}{T^n}, \quad 0 \leq t_1 \leq t_2 \leq \dots \leq T.
  \]

Isso demonstra como a função de probabilidade emerge **diretamente do espaço amostral e dos axiomas de probabilidade**, sem qualquer redundância.