# Todo sobre la Distribucion de Poisson

Es una D. de probabilidad discreta que describe el numero de eventos que ocurren en un intervalo fijo de tiempo o espacio. Fue creada por el matemático y filósofo francés del siglo XVII Simeón-Denis Poisson en su proyecto para modelar la frecuencia de eventos durante un rango de tiempo determinado. Esta distribución la hizo pública en el año 1838 en su trabajo “Investigación sobre la probabilidad de los juicios en materias criminales y civiles”.


Tiene multiples aplicaciones en ciencia de datos, especialemente en situaciones donde se modela el numero de eventos discretos que ocurren en un intervalo continuo. Algunas aplicaciones comunes son:

- **Modelado de conteo de eventos**: numero de llamadas que recibira un call center en una hora especifica, numero de clientes que llegan a un banco en un intervalo de tiempo, entre otros.

- **Analisis de fallo**: Predecir el numero de fallos que ocurren en una maquina o sistema durante un periodo de tiempo.

- **Marketing y negocios**: numero de conversiones en un sitio web en un tiempo dado, numero de respuestas a una campana de correo electronico por dia, entre otros.




## Supuestos de la D. de Poisson

Para determinar si un problema puede resolverse mediante esta distribucion, se deben cumplir los siguientes **Supuestos**:

#### 1.- Variable discreta: 
La variable aleatoria es el numero de veces que ocurre un evento durante un intervalo definido. El intervalo puede ser de tiempo, distancia, area, volumen o alguna unidad similar

#### 2.- Tasa constante: 
La probabilidad de ocurrencia es la misma para cualesquiera dos intervalos de igual longitud. En otras palabras, la tasa teorica con la que ocurren los eventos es constante. Si la tasa de ocurrencia es de 4 eventos por dia, esto no quiere decir que cada dia ocurran 4 eventos, sino que se espera que sean 4. Es decir, un dia pueden suceder 2 eventos, otro dia 6 eventos, y asi sucesivamente, pero al promediar los eventos de todos los dias, arrojara una tasa de 4.
    
#### 3.- Eventos independientes: 
La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo. Es decir, las ocurrencias de los eventos son independientes. El hecho de que ocurra un evento en un intervalo definido no aumenta o disminuye la probabilidad de que ocurra otro evento en el mismo intervalo.
    
#### 4.- Eventos unicos: 
Dos eventos no pueden ocurrir exactamente al mismo tiempo

Si se cumplen estos supuestos, podemos decir que la variable aleatoria discreta $X$ siguen una D. de Poisson. 

## Deduccion de la Distribucion de Poisson

La D. binomial describe el numero de exitos en una serie de eventos independientes, cada uno con probabilidad de exito fija.

La D. de Poisson describe el numero de eventos que ocurren en un intervalo de tiempo o espacio fijo cuando estos eventos ocurren con una tasa promedio constante y son independientes entre si.

La D. Binomial  $B(n,p)$ se puede aproximar a una D. de Poisson $P(n, \lambda)$ bajo las siguiente condiciones:

- $n$ es muy grande $n\rightarrow \infty$.
- $p$ es muy pequeno $p \rightarrow 0$.
- El producto $np = \lambda$ es constante y finito.

Consideremos una variable aleatoria $X$ que sigue una D. Binomial en el que los eventos ocurren con una probabilidad muy pequena ($p \rightarrow 0$) en un gran numero de ensayos ($n\rightarrow \infty$).

$$X \sim B(n,p)$$

Veamos el paso a paso de como llegar a la D. de Poisson a partir de la D. Binomial:

1.- Tenemos la funcion de la D. Binomial y su respectiva esperanza matematica:
$$P(X=x)=\binom{n}{x}p^{x}(1-p)^{(n-x)}$$
$$E(x) = np$$

2.- Supongamos el que producto $np$ es constante para asi considerarlo la tasa de ocurrencia de la D. de Poisson.
    $$\mu = np$$
Redefinimos la probabilidad de exito $p$:
    $$p = \frac{\mu}{n}$$

3.- Desarrollamos el factorial y sustituyamos la nueva definicion de $p$ en la funcion binomial
$$P(X=x) = \frac{n!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

4.- Evaluemos el comportamiento de la funcion cuando $n$ tiende a infinito
$$\lim_{n\rightarrow \infty} \frac{n!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

5.- Desarrollemos el factoria de $n$ y cancelamos terminos comunes

$$\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)(n-x)!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

$$\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)}{x!}\frac{\mu^{x}}{n^{x}}\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

6.- Sacamos del limite los terminos que no contienen $n$

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)}{n^{x}}\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

7.- En el numerador hay $x$ terminos mientras que en el denominador hay $x$ veces $n$, por tanto, podemos cancelar los terminos $n$ de la fraccion quedando de la siguiente forma:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( \frac{n-1}{n} \right )\left ( \frac{n-2}{n} \right )\cdot \cdot \cdot \left ( \frac{n-x+1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n-x}$$

8.- Reorganizando los valores de cada termino nos queda:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( 1-\frac{1}{n} \right )\left ( 1-\frac{2}{n} \right )\cdot \cdot \cdot \left ( 1-\frac{x-1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n-x}$$

9.- Separando el utlimo termino en sus exponentes nos queda:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( 1-\frac{1}{n} \right )\left ( 1-\frac{2}{n} \right )\cdot \cdot \cdot \left ( 1-\frac{x-1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n} \left ( 1 -\frac{\mu}{n} \right )^{-x}$$

10.- Al evaluar el limite cuando n tiende a infinito los terminos toman el valor 1, excepto el termino

$$\left ( 1 -\frac{\mu}{n} \right )^{n}$$

el cual, toma el valor de $e^{-\mu}$

$$\lim_{n\rightarrow \infty} \left ( 1 -\frac{\mu}{n} \right )^{n} \sim e^{-\mu}$$

De esta manera llegamos a la funcion de la D. de Poisson:

$$P(X=x) =  \frac{e^{-\mu}\cdot \mu^x}{x!}$$


## Funcion de Densidad de Probabilidad

La funcion de la D. de Poisson viene dada por:


$$f(x) = P(X=x) = \left\{\begin{matrix}
 & \frac{e^{-\mu}\cdot \mu^x}{x!} & si & x>0\\ 
 & 0 & si & x<0 
\end{matrix}\right.$$

donde: 
- $\mu$ es la tasa de ocurrencia y es mayor que cero.
- $x$ es el numero de eventos y toma valores enteros mayores a cero.
- $P(X=x)$ es la probabilidad de $x$ ocurrencias en un intervalo.

La grafica de la D. de Poisson con $\mu = 1$ viene dada por:

![image.png](attachment:image.png)

Vamos a desarrollar varios ejemplos para comprender esta Distribución desde las condiciones a cumplir hasta su implementacion matematica y con Python.

## Ejemplo 1: *Una veterinaria recibre un promedio de 4 pacientes al dia. Sabiendo que el numero de pacientes que llegan en un dia sigue una distribucion de Poisson, Calcular*

### a.- La probabilidad que lleguen 3 pacientes en un dia

Sabemos que la variable $X$ es el numero de pacientes que llegan a la veterinaria en 1 dia y sigue una D. de Poisson:
$$X \sim Poisson(\mu)$$

El promedio de pacientes al dia es de 4 y representa la tasa de ocurrencia 
$$\mu = 4$$

Nos piden calcular la probabilidad de que lleguen 3 pacientes en un dia ($x = 3$), por tanto, utilizamos la funcion de densidad de probabilidad de Poisson que viene dada por:

$$f(x) = P(X=x) = \frac{e^{-\mu}\cdot \mu^x}{x!}$$

Sustituyendo los valores de $x$ y $\mu$ tenemos:

$$P(X=3) = \frac{e^{-4}\cdot 4^3}{3!}$$

Graficamente se trata de encontrar el valor de altura de la barra 3

![image.png](attachment:image.png)

Ahora, solo nos queda calcular las operaciones matematicas, para ello, vamos a utilizar algunas librerias de Python

In [4]:
# libreria para calcular factoriales y exponenciales
import math

In [9]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# casos buscado
x = 3

# Calculo de la probabilidad con la formula
prob = (math.exp(-miu)*(miu)**x)/(math.factorial(3))
prob = round(prob, 4)
prob

0.1954

> La probabilidad que lleguen 3 pacientes en un dia es de 19.54%

### b.- Probabilidad de que lleguen 5 pacientes en un dia

Con la misma tasa de ocurrencia ($\mu = 4$), calcular la probabilidad de que lleguen a la veterinaria 5 pacientes al dia, es decir:

$$P(X = 5)$$

En este caso, vamos a utilizar la libreria Stats de Python ya que permite realizar el calculo de manera mas simple

In [11]:
# libreria para calcular la D. poisson
from scipy.stats import poisson

In [16]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# casos buscado
x = 5

Calculamos la probabilidad del valor dado, utilizando el metodo PMF de la D. de Poisson.

In [18]:
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.1563

> La probabilidad que lleguen 5 pacientes a la veterinaria de de 15.63%

### c.- Probabilidad de que lleguen a la veterinaria menos 6 pacientes al dia 

En este caso, nos piden calcular la probabilidad acumulada desde 0 pacientes hasta 5, ya que 6 pacientes no cuenta. Graficamente se trata de calcular el area sombreada

![image.png](attachment:image.png)

Para obtener tal probabilidad, debemos calcular la probabilidad para cada numero de pacientes y luego sumar todas:

$$P(X < 6) = P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) + P(X=5)$$

Vamos a calcular cada probabilidad con el metodo PMF de la D. de Poisson

In [25]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# caso limite
x = 5

In [26]:
# calculo de probabilidades con PMF
P_0 = poisson.pmf(0, miu)
P_1 = poisson.pmf(1, miu)
P_2 = poisson.pmf(2, miu)
P_3 = poisson.pmf(3, miu)
P_4 = poisson.pmf(4, miu)
P_5 = poisson.pmf(5, miu)

Ahora sumamos todas las probabilidades y obtenemos el resultado

In [27]:
# suma de todas las probabilidades
prob = P_0 + P_1 + P_2 + P_3 + P_4 + P_5
prob = round(prob, 4)
prob

0.7851

> La probabilidad de que lleguen menos de 6 pacientes es de 78.51%

### 

## Ejemplo 2: *Cada año ocurre un promedio de 24 accidentes aereos.*

### a.- Calcula la probabilidad de que ocurra exactamente un accidente en un mes

La variables $X$ representa el numero de accidentes aereos en un mes. El valor objetivo a buscar es de 1 accidente al mes. 
$$x=1$$
Para obtener la tasa de ocurrencia en un mes, debemos dividir el promedio de accidentes de un año por el numero total de meses:
$$\mu = \frac{24}{12} = 2$$
Ahora, calculamos la probabilidad de que ocurra 1 accidente en un mes:
$$P(X = 1)$$

In [19]:
# parametros de la D.

# tasa de ocurrencia
miu = 2

# casos buscado
x = 1

In [20]:
# Calcular probabilidad para un valor especifico
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.2707

> La probabilidad de que ocurra un accidente al mes es de 27.07%

## Ejemplo 3: *En un hospital se esta estudiando los nacimientos de bebes varones. Se sabe que en una semana nacen una media de 7 varones. Calcular*

### a.- La probabilidad de que nazcan 3 varones en una semana.

La variable $X$ representa en nacimiento de varones en una semana. el valor objetivo es de 3 varones en una semana:
$$x = 3$$

La tasa de ocurrencia viene representado por la media de varones nacidos en una semana que es de 7 $$\mu = 7$$

Nos piden calcular la probabilidad que nazcan 3 varones en una semana.
$$P(X = 3)$$

Graficamente, nos piden calcular la probabilidad que corresponde a la barra 3

![image.png](attachment:image.png)

Vamos a utilizar el metodo PMF de la D. de Poisson para calcular la probabilidad solicitada.

In [21]:
# parametros de la D.

# tasa de ocurrencia
miu = 7

# casos buscado
x = 3

In [22]:
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.0521

> La probabilidad que nazcan 3 varones en una semana es de 5.21%.

### b.- La probabilidad que nazcan menos de 3 varones a la semana

En este caso nos piden calcular la probabilidad acumulada desde 0 hasta 2, ya que el 3 no cuenta. Graficamente se muestra con el area sombreada

![image-2.png](attachment:image-2.png)

Para obtener dicho valor, utilizamos el metodo CDF de la D. de Poisson que nos permite calcular la probabilidad acumulada.

In [23]:
# parametros de la D.

# tasa de ocurrencia
miu = 7

# caso limite
x = 2

In [24]:
# calculo de la probabilidad acumulada
prob = poisson.cdf(x, miu)
prob = round(prob, 4)
prob

0.0818

> La probabilidad que nazcan menos de 3 varones en una semana es de 8.18%