# Todo sobre la Distribución de Poisson

Es una D. de probabilidad discreta que describe el número de eventos que ocurren en un intervalo fijo de tiempo o espacio.Tiene múltiples aplicaciones en ciencia de datos, especialemente en situaciones donde se modela el número de eventos discretos que ocurren en un intervalo contínuo. Algunas aplicaciones comunes son:

- **Modelado de conteo de eventos**: Número de llamadas que recibe un call center en una hora específica, número de clientes que llegan a un banco en un intervalo de tiempo, entre otros.

- **Análisis de fallo**: Predecir el número de fallos que ocurren en una máquina o sistema durante un periodo de tiempo.

- **Marketing y negocios**: Número de conversiones en un sitio web en un tiempo dado, número de respuestas a una campaña de correo electronico por día, entre otros.




## Supuestos de la D. de Poisson

Para determinar si un problema puede resolverse mediante esta distribución, se deben cumplir los siguientes **Supuestos**:

#### 1.- Variable discreta: 
La variable aleatoria es el número de veces que ocurre un evento durante un intervalo definido. El intervalo puede ser de tiempo, distancia, área, volumen o alguna unidad similar.

#### 2.- Tasa constante: 
La probabilidad de ocurrencia es la misma para cualesquiera dos intervalos de igual longitud. En otras palabras, la tasa teórica con la que ocurren los eventos es constante. Si la tasa de ocurrencia es de 4 eventos por día, esto no quiere decir que cada día ocurran 4 eventos, sino que se espera que sean 4. Es decir, un día pueden suceder 2 eventos, otro día 6 eventos, y así sucesivamente, pero al promediar los eventos de todos los días, arrojara una tasa de 4.
    
#### 3.- Eventos independientes: 
La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo. Es decir, las ocurrencias de los eventos son independientes. El hecho de que ocurra un evento en un intervalo definido no aumenta o disminuye la probabilidad de que ocurra otro evento en el mismo intervalo.
    
#### 4.- Eventos únicos: 
Dos eventos no pueden ocurrir exactamente al mismo tiempo.

Si se cumplen estos supuestos, podemos decir que la variable aleatoria discreta $X$ sigue una D. de Poisson. 

## Deducción de la Distribución de Poisson

La D. binomial describe el número de éxitos en una serie de eventos independientes, cada uno con probabilidad de éxito fija.

La D. de Poisson describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo cuando estos eventos ocurren con una tasa promedio constante y son independientes entre sí.

La D. Binomial  $B(n,p)$ se puede aproximar a una D. de Poisson $P(n, \lambda)$ bajo las siguiente condiciones:

- $n$ es muy grande $n\rightarrow \infty$. Se considera valores grandes de $n$ mayores a 70.
- $p$ es muy pequeño $p \rightarrow 0$. Esto corresponde a un evento raro o poco común.
- El producto $np = \lambda$ es constante y finito. Ideal para un valor de $np$ menor a 10.

Considerémos una variable aleatoria $X$ que sigue una D. Binomial en el que los eventos ocurren con una probabilidad muy pequeña ($p \rightarrow 0$) en un gran número de ensayos ($n\rightarrow \infty$).

$$X \sim B(n,p)$$

Veamos el paso a paso de cómo llegar a la D. de Poisson a partir de la D. Binomial:

1.- Tenemos la función de la D. Binomial y su respectiva esperanza matemática:
$$P(X=x)=\binom{n}{x}p^{x}(1-p)^{(n-x)}$$
$$E(x) = np$$

2.- Supongamos el que producto $np$ es constante y lo asumimos como la tasa de ocurrencia de la D. de Poisson.
    $$\mu = np$$
Redefinimos la probabilidad de exito $p$:
    $$p = \frac{\mu}{n}$$

3.- Desarrollamos el factorial y sustituimos la nueva definición de $p$ en la función binomial
$$P(X=x) = \frac{n!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

4.- Evaluamos el comportamiento de la función cuando $n$ tiende a infinito
$$\lim_{n\rightarrow \infty} \frac{n!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

5.- Desarrollamos el factorial de $n$ y cancelamos términos comunes

$$\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)(n-x)!}{x!(n-x)!}\left ( \frac{\mu}{n} \right )^x\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

$$\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)}{x!}\frac{\mu^{x}}{n^{x}}\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

6.- Sacamos del límite los términos que no contienen $n$

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \frac{n(n-1)(n-2)\cdot \cdot \cdot (n-x+1)}{n^{x}}\left ( 1-\frac{\mu}{n} \right )^{n-x}$$

7.- En el numerador hay $x$ términos mientras que en el denominador hay $x$ veces $n$, por tanto, podemos cancelar los términos $n$ de la fracción quedando de la siguiente forma:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( \frac{n-1}{n} \right )\left ( \frac{n-2}{n} \right )\cdot \cdot \cdot \left ( \frac{n-x+1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n-x}$$

8.- Reorganizando los valores de cada término nos queda:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( 1-\frac{1}{n} \right )\left ( 1-\frac{2}{n} \right )\cdot \cdot \cdot \left ( 1-\frac{x-1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n-x}$$

9.- Separando el último término en sus exponentes nos queda:

$$\frac{\mu^{x}}{x!}\lim_{n\rightarrow \infty} \left ( 1-\frac{1}{n} \right )\left ( 1-\frac{2}{n} \right )\cdot \cdot \cdot \left ( 1-\frac{x-1}{n} \right )\left ( 1 -\frac{\mu}{n} \right )^{n} \left ( 1 -\frac{\mu}{n} \right )^{-x}$$

10.- Al evaluar el límite cuando n tiende a infinito, los términos toman el valor 1, excepto el término

$$\left ( 1 -\frac{\mu}{n} \right )^{n}$$

el cual, toma el valor de $e^{-\mu}$

$$\lim_{n\rightarrow \infty} \left ( 1 -\frac{\mu}{n} \right )^{n} \sim e^{-\mu}$$

De esta manera llegamos a la función de la D. de Poisson:

$$P(X=x) =  \frac{e^{-\mu}\cdot \mu^x}{x!}$$


## Funcion de Densidad de Probabilidad

La funcion de la D. de Poisson viene dada por:


$$f(x) = P(X=x) = \left\{\begin{matrix}
 & \frac{e^{-\mu}\cdot \mu^x}{x!} & si & x>0\\ 
 & 0 & si & x<0 
\end{matrix}\right.$$

donde: 
- $\mu$ es la tasa de ocurrencia y es mayor que cero.
- $x$ es el numero de eventos y toma valores enteros mayores a cero.
- $P(X=x)$ es la probabilidad de $x$ ocurrencias en un intervalo.

La grafica de la D. de Poisson con $\mu = 1$ viene dada por:

![image.png](attachment:image.png)

Vamos a desarrollar varios ejemplos para comprender esta Distribución desde las condiciones a cumplir hasta su implementacion matematica y con Python.

## Parametros de la Distribucion de Poisson

- La media ($\mu$) o esperanza matematica $E(x)$ de esta distribucion viene dada por:
$$E(x) = \mu$$

- La varianza ($\sigma^2$) o varianza matematica $V(x)$ viene dada por:
$$V(x) = \mu$$

- La desviacion estandar ($\sigma$) viene dada por
$$\sigma = \sqrt{V(x)} = \sqrt{\mu}$$

## Ejemplo 1: *Una veterinaria recibre un promedio de 4 pacientes al dia. Sabiendo que el numero de pacientes que llegan en un dia sigue una distribucion de Poisson, Calcular*

### a.- La probabilidad que lleguen 3 pacientes en un dia

Sabemos que la variable $X$ es el numero de pacientes que llegan a la veterinaria en 1 dia y sigue una D. de Poisson:
$$X \sim Poisson(\mu)$$

El promedio de pacientes al dia es de 4 y representa la tasa de ocurrencia 
$$\mu = 4$$

Nos piden calcular la probabilidad de que lleguen 3 pacientes en un dia ($x = 3$), por tanto, utilizamos la funcion de densidad de probabilidad de Poisson que viene dada por:

$$f(x) = P(X=x) = \frac{e^{-\mu}\cdot \mu^x}{x!}$$

Sustituyendo los valores de $x$ y $\mu$ tenemos:

$$P(X=3) = \frac{e^{-4}\cdot 4^3}{3!}$$

Graficamente se trata de encontrar el valor de altura de la barra 3

![image.png](attachment:image.png)

Ahora, solo nos queda calcular las operaciones matematicas, para ello, vamos a utilizar algunas librerias de Python

In [6]:
# libreria para calcular factoriales y exponenciales
import math

In [7]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# casos buscado
x = 3

# Calculo de la probabilidad con la formula
prob = (math.exp(-miu)*(miu)**x)/(math.factorial(3))
prob = round(prob, 4)
prob

0.1954

> La probabilidad que lleguen 3 pacientes en un dia es de 19.54%

### b.- Probabilidad de que lleguen 5 pacientes en un dia

Con la misma tasa de ocurrencia ($\mu = 4$), calcular la probabilidad de que lleguen a la veterinaria 5 pacientes al dia, es decir:

$$P(X = 5)$$

Graficamente, se trata de calcular la altura de la barra 5

![image.png](attachment:image.png)

En este caso, vamos a utilizar el metodo de densidad de probabilidad (PMF) que trae la D. de Poisson en la libreria Stats de Python ya que permite realizar el calculo de manera mas simple.

In [8]:
# libreria para calcular la D. poisson
from scipy.stats import poisson

In [9]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# casos buscado
x = 5

Calculamos la probabilidad del valor dado, utilizando el metodo PMF de la D. de Poisson.

In [10]:
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.1563

> La probabilidad que lleguen 5 pacientes a la veterinaria de de 15.63%

### c.- Probabilidad de que lleguen a la veterinaria menos 6 pacientes al dia 

En este caso, nos piden calcular la probabilidad acumulada desde 0 pacientes hasta 5, ya que 6 pacientes no cuenta. Graficamente se trata de calcular el area sombreada

![image.png](attachment:image.png)

Para obtener tal probabilidad, debemos calcular la probabilidad para cada numero de pacientes y luego sumar todas:

$$P(X < 6) = P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) + P(X=5)$$

Vamos a calcular cada probabilidad con el metodo PMF de la D. de Poisson

In [11]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# caso limite
x = 5

In [12]:
# calculo de probabilidades con PMF
P_0 = poisson.pmf(0, miu)
P_1 = poisson.pmf(1, miu)
P_2 = poisson.pmf(2, miu)
P_3 = poisson.pmf(3, miu)
P_4 = poisson.pmf(4, miu)
P_5 = poisson.pmf(5, miu)

Ahora sumamos todas las probabilidades y obtenemos el resultado

In [13]:
# suma de todas las probabilidades
prob = P_0 + P_1 + P_2 + P_3 + P_4 + P_5
prob = round(prob, 4)
prob

0.7851

> La probabilidad de que lleguen menos de 6 pacientes es de 78.51%

### d.- Probabilidad de que lleguen menos de 4 pacientes al dia.

Nos piden calcular la probabilidad de que lleguen de 0 a 3 pacientes a la veterinaria, similar al calculo anterior. 
$$P(X \leq 3)$$
Graficamente es calcular el area sombreada

![image.png](attachment:image.png)

Podemnos resolverlo como lo antes visto o utilizar el metodo de calculo de probabilidad acumulada (CDF) de la D. de Poisson dado por la libreria Stats que suma la probabilidad desde 0 hasta el valor limite de casos.


In [14]:
# parametros de la D.

# tasa de ocurrencia
miu = 4

# caso limite
x = 3

In [15]:
# calculo de la probabilidad acumulada hasta x = 3
prob = poisson.cdf(x, miu)
prob = round(prob, 4)
prob

0.4335

> La probabilidad que lleguen menos de 4 pacientes es de 43.35%

## Ejemplo 2: *Cada año ocurre un promedio de 24 accidentes aereos.*

### a.- Calcula la probabilidad de que ocurra exactamente un accidente en un mes

La variables $X$ representa el numero de accidentes aereos en un mes. El valor objetivo a buscar es de 1 accidente al mes. 
$$x=1$$
Para obtener la tasa de ocurrencia en un mes, debemos dividir el promedio de accidentes de un año por el numero total de meses:
$$\mu = \frac{24}{12} = 2$$

Graficamente se trata de calcular la altura de la barra 1
![image.png](attachment:image.png)

Ahora, calculamos la probabilidad de que ocurra 1 accidente en un mes:
$$P(X = 1)$$

In [16]:
# parametros de la D.

# tasa de ocurrencia
miu = 2

# casos buscado
x = 1

In [17]:
# Calcular probabilidad para un valor especifico
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.2707

> La probabilidad de que ocurra un accidente al mes es de 27.07%

### b.- Probabilidad de que ocurran al menos 16 accidentes aereos al año

Debemos tener en cuenta que la tasa de ocurrencia no es la misma que en el caso anterior. Se habla de año y no de mes, por tanto

$$\mu_{año} = 24$$

Nos piden calcular la probabilidad de que, como minimo, ocurran 10 accidentes por lo que pueden ser mucho mas, es decir 

$$P(X \geq 16)$$

Graficamente se muestra como sigue:

![image.png](attachment:image.png)

Esto es igual a calcular las probabilidades de cada accidente desde 16 hasta infinito. Sin embargo, como no es posible hacer dicho calculo, realizamos la siguiente operacion

$$P(X \geq 10) = 1 - P(X < 16)$$

Esto se puede realizar ya que se asume que el area total de la D. de Poisson es de 1. Ahora, para resolverlo solo queda calcular la probabilidad de cada accidente desde 0 hasta 15, sumarlas y restar el resultado a 1. O podemos utilizar el metodo de probabilidad acumulada de la D. de Poisson visto anteriormente para facilitar el calculo

In [18]:
# parametros de la D.

# tasa de ocurrencia
miu = 24

# casos buscado
x = 15

In [19]:
# calculo de la probabilidad acumulada hasta 15
prob = poisson.cdf(x, miu)
prob = round(prob, 4)
prob

0.0344

Ahora, restamos a 1 el resultado obtenido

In [20]:
probab = 1 - prob
probab

0.9656

> La probabilidad de que hayan al menos 16 accidentes al año es de 97.04%.

> Notemos que a medida que $\mu$ aumenta, la D. de Poisson tiende a una D. Normal.

## Ejemplo 3: *En un hospital se esta estudiando los nacimientos de bebes varones. Se sabe que en una semana nacen una media de 7 varones. Calcular*

### a.- La probabilidad de que nazcan 3 varones en una semana.

La variable $X$ representa en nacimiento de varones en una semana. el valor objetivo es de 3 varones en una semana:
$$x = 3$$

La tasa de ocurrencia viene representado por la media de varones nacidos en una semana que es de 7 $$\mu = 7$$

Nos piden calcular la probabilidad que nazcan 3 varones en una semana.
$$P(X = 3)$$

Graficamente, nos piden calcular la probabilidad que corresponde a la barra 3

![image-2.png](attachment:image-2.png)

Vamos a utilizar el metodo PMF de la D. de Poisson para calcular la probabilidad solicitada.

In [21]:
# parametros de la D.

# tasa de ocurrencia
miu = 7

# casos buscado
x = 3

In [22]:
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.0521

> La probabilidad que nazcan 3 varones en una semana es de 5.21%.

### b.- La probabilidad que nazcan menos de 3 varones a la semana

En este caso nos piden calcular la probabilidad acumulada desde 0 hasta 2, ya que el 3 no cuenta. Graficamente se muestra con el area sombreada

![image-2.png](attachment:image-2.png)

Para obtener dicho valor, utilizamos el metodo CDF de la D. de Poisson que nos permite calcular la probabilidad acumulada.

In [23]:
# parametros de la D.

# tasa de ocurrencia
miu = 7

# caso limite
x = 2

In [24]:
# calculo de la probabilidad acumulada
prob = poisson.cdf(x, miu)
prob = round(prob, 4)
prob

0.0296

> La probabilidad que nazcan menos de 3 varones en una semana es de 8.18%

## Ejemplo 4: *Un vendedor de seguros de vida vende en promedio 3 polizas por semana. Calcular la probabilidad de:*

### a.- Que venda algunas polizas en una semana

Vemos que se trata de una D. de Poisson ya que la variable $X$ representa los seguros vendidos en una semana

$$X \sim Poisson(\mu)$$

En promedio, el vendedor vende 3 polizas por semana lo que representa la tasa de ocurrencia:

$$\mu = 3$$

Nos piden calcular la probabilidad de que se venda al menos una o mas poliza, es decir,

$$P(X>0) = P(X=1) + P(X=2) + \cdot \cdot \cdot P(X = \infty)$$

Graficamente, consiste en calcular el area sombreada

![image.png](attachment:image.png)

Ya que no podemos calcular las probabilidades hasta infinito, utilizamos la siguiente propiedad estadisticas de sucesos

$$P(X>0) = 1 - P(X = 0)$$

Entonces, nos queda calcular $P(X = 0)$ para lo que utilizamos el metodo PMF de Stats

In [25]:
# parametros de la D.

# tasa de ocurrencia
miu = 3

# caso limite
x = 0

In [26]:
# calculo de la probabilidad para X = 0 
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.0498

Ahora solo queda restar a 1 el resultado obtenido

In [27]:
probab = 1 - prob
probab

0.9502

> La probabilidad de que venda al menos 1 poliza a la semana es del 95.02%

### b.- Que venda 2 o mas polizas pero menos de 5, en una semana

Nos piden calcular la siguiente probabilidad

$$P(2 \leq X < 5) = P(X = 2) + P(X = 3) + P(X = 4)$$

Graficamente se muestra como sigue:

![image.png](attachment:image.png)

Para ello, vamos a utilizar la probabilidad acumulada (CDF) para los limites del area sombreada que son 1 y 4 y luego restamos ambas probabilidades para obtener el area sombreada o la probabilidad buscada

$$P(2 \leq X \leq 4) = P(X \leq 4) - P(X \leq 1)$$

In [28]:
# parametros de la D.

# tasa de ocurrencia
miu = 3

# casos limites
x_4 = 4
x_1 = 1

In [29]:
# probabilidad acumulada hasta 1
prob_1 = poisson.cdf(x_1, miu)
prob_1 = round(prob_1, 4)
prob_1

0.1991

In [30]:
# probabilidad acumulada hasta 4
prob_4 = poisson.cdf(x_4, miu)
prob_4 = round(prob_4, 4)
prob_4

0.8153

Ahora solo queda restar ambos resultados

In [31]:
# probabilidad desde 1 hasta 4
prob = prob_4 - prob_1
prob = round(prob, 4)
prob

0.6162

> La probabilidad que venda de 2 a 4 polizas en una semana es de 61.62%

### c.- Suponiendo que hay 5 dias de trabajo por semana, calcular la probabilidad de que en un dia dado se venda una poliza

En este caso, debemos calcular una nueva tasa de ocurrencia $\mu$ ya que la dada por el problema no concuerda con lo que piden ($\mu$ esta referida en semanas y la necesitamos en dias). Como nos indican que la semana es de 5 dias, dividimos la $\mu$ del problema por dicha cantidad para obtener la tasa en dias

$$\mu_{dia} = \frac{\mu}{5} = \frac{3}{5}$$
$$\mu_{dia} = 0.6$$

Nos piden calcular la probabilidad de que se venda 1 poliza en un dia

$$P(X = 1)$$

Graficamente, seria calcular la altura de la barra 1

![image.png](attachment:image.png)

Vamos a utilizar el metodo PMF para obtener dicho calculo


In [32]:
# parametros de la D.

# tasa de ocurrencia
miu = 0.6

# caso limite
x = 1

In [33]:
# probabilidad para x = 1
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.3293

> La probabilidad de que venda 1 poliza en un dia es de 32.93%

### d.- Calcular la media, la varianza y la desviacion estandar de la distribucion de probabilidad que se infiere de este problema

Sabemos que la variable $X$ sigue una D. de Poisson por tanto:

- La media viene dada por
$$E(x) = \mu = 3$$

- La varianza viene dada por
$$V(x) = \mu = 3$$

- La desviacion estandar es de:
$$\sigma = \sqrt{3}$$

## Ejemplo 5: *En una fabrica se manufacturan laminas de aluminio. El departamento de calidad de dicha fabrica esta estudiando la frecuencia del numero de fallos por lamina con el objetivo de poder predecir las probabilidades de laminas defectuosas. Los datos son los siguientes:*

![image.png](attachment:image.png)

### Calcular la probabilidad de encontrar una lamina al azar qe tenga 3 fallos como minimo.

La variable $X$ viene representada por el numero de fallos por cada lamina. Los valores de la tabla se interpretan como sigue:

- Primera fila: hay 4 laminas con cero fallos
- Segunda fila: hay 3 laminas con un fallo
- Tercera fila: hay 5 laminas con dos fallos
- "  "
- "  "

El ejercicio no nos da la tasa de ocurrencia por lo que debemos calcularla a partir de la tabla de frecuencia mediante la siguiente ecuacion:

$$\mu = \frac{\quad\text{Numero de fallos totales}}{\quad\text{Numero de laminas}}$$


- Al sumar los valores de frecuencia obtenemos el total de laminas que son 20.

- Al multiplicar los fallos por la frecuencia obtenemos la cantidad de fallos por evento. Al sumar los fallos de todos los eventos obtenemos el numero de fallos totales.

Sustituimos los valores en la ecuacion:

$$\mu = \frac{0\cdot4 + 1\cdot3 + 2\cdot5 + \cdot \cdot \cdot + 6\cdot1}{20} = \frac{46}{20}$$

$$\mu = 2.3$$

Ahora, debemos saber que la D. de Poisson no esta acotada superiormente, por lo tanto se tiene que entender que esta tabla es un extracto de todos los posibles fallos que pueden llegar hasta infinito. Solo que los tecnicos llegaron hasta la medicion de 6 fallos. 

Aclarado este punto, nos piden calcular la probabilidad de encontrar al menos 3 fallos en una lamina. Esto es:
$$P(X \geq 3) = P(X = 3) + P(X = 4) + P(X = 5) + \cdot \cdot \cdot P(X = \infty)$$

Graficamente se ve como sigue:

![image.png](attachment:image.png)

Como no podemos calcular probabilidades hasta infinito, utilizamos la siguiente propiedad de sucesos:

$$P(X \geq 3) = 1 - P(X < 3) = 1 - [P(X=0) + P(X=1) + P(X=2)]$$

Para no calcular cada una de las probabilidades, utilizamos el metodo CDF para calcular la probabilidad acumulada hasta el limite 2.

In [34]:
# parametros de la D.

# tasa de ocurrencia
miu = 2.3

# caso limite
x = 2

In [35]:
# probabilidad acumulada hasta 2
prob = poisson.cdf(x, miu)
prob = round(prob, 4)
prob

0.596

Finalmente, restamos a 1 el valor obtenido

In [36]:
probab = 1 - prob
probab

0.404

> La probabilidad de que una lamina seleccionada al azar tenga como minimo 3 fallos es de 40.4%

## Ejemplo 6: *Durante la Segunda Guerra Mundial, las tropas alemanas disparaban bombas V1 yV2 desde Calai (Francia) hacia Londres. El sur de Londres se dividio en 576 regiones con la misma extension, 0.25 Km cuadrados. A lo largo de la contienda impactaron en esas regiones un total de 535 bombas V1 y V2*

### a.- Si se selecciona una region al azar, calcula la probabilidad de que fuese blanco de las bombas en dos ocasiones. Tambien para el caso que no recibiese ningun impacto

La variable $X$ representa el numero de impactos por area por lo que se trata de la D. de Poisson. Para calcular la tasa de ocurrencia podemos utilizar la siguiente formula:

$$\mu = \frac{\quad\text{Numero de bombas}}{\quad\text{Cantidad de areas}} = \frac{535}{576}$$

$$\mu = 0.929$$

Nos piden calcular la probabilidad de que en una area determinada al azar impacten bombas en dos ocasiones, es decir,

$$P(X = 2)$$

Graficamente, piden calcular la altura de la barra 2

![image.png](attachment:image.png)

Vamos a calcularlo mediante el metodo PMF de la D. de Poisson

In [37]:
# parametros de la D.

# tasa de ocurrencia
miu = 0.929

# caso limite
x = 2

In [38]:
# probabilidad para X = 2
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.1704

> La probabilidad de que en una area cualquiera impacten dos bombas es de 17.04%

Tambien nos piden calcular la probabilidad de que no impacte ninguna bomba, es decir,

$$P(X = 0)$$

Graficamente pide calcular la altura de la barra cero

![image.png](attachment:image.png)

Procedemos a resolverlo como en el paso anterior, con PMF

In [39]:
# parametros de la D.

# tasa de ocurrencia
miu = 0.929

# caso limite
x = 0

In [40]:
# probabilidad para X = 0
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.3949

> La probabilidad que no impacte ninguna bomba en cualquier area es de 39.49%

### b.- Segun las probabilidades calculadas en el apartado anterior. Cuantas de las 576 regiones se espera que reciban 2 impactos y cuantas ninguno?

Para calcular la cantidad de regiones que reciben dos impactos utilizamos la siguiente formula:

$$\quad\text{Regiones con dos impactos} = np_{2 bombas}$$

Donde $n$ es la cantidad de regiones totales y $p_{2bombas}$ es la probabilidad que caigan dos bombas. Veamos el resultado.

In [41]:
n = 576
p_2 = 0.1704
regiones_2 = n*p_2
regiones_2 = round(regiones_2,2)
regiones_2

98.15

> En 98 regiones es posible qque caigan 2 bombas

Para calcular la cantidad de regiones en las que no caera ninguna bomba, utlizamos la formula anterior pero en vez de la probabilidad para 2 bombas utilizamos la probabilidad para cero bombas.

$$\quad\text{Regiones con cero impactos} = np_{0 bombas}$$

In [42]:
p_0 = 0.3949
regiones_0 = n*p_0
regiones_0 = round(regiones_0,2)
regiones_0

227.46

> Se espera que en 227 regiones no caera bombas.

## Ejemplo 7: *Una empresa que vende internet registra las ventas que hace por email en un periodo de 40 dias. La siguiente tabla muestra los resultados*

![image.png](attachment:image.png)



### a.- Calcular la media y varianza y comprobar si puede ser apropiado usar la D. de Poisson

La tabla se interpreta como sigue:

- Columna 1: Se recibe 0 email en 8 de los 40 dias que se recogen los datos.
- Columna 2: Se recibe 1 email en 13 de los 40 dias que se recogen los datos.
- Columna 3: Se reciben 2 email en 10 de los 40 dias que se recogen los datos.
- "   "
- "   "

Si sumamos las frecuencias obtenemos los dias que representan el periodo donde se recogieron los datos:

$$\sum f = 8+13+10+6+2+1+0 = 40$$

Nos piden calcular la media, cuya formula viene dada por:

$$\overline{X} = \frac{\sum (f \cdot x)}{\sum f}$$

donde $\sum (f \cdot x)$ es la suma de los productos de la frecuencia ($f$) por su repectivo numero de emails ($x$). Entonces,

$$\overline{X} = \frac{0\cdot 8 + 1\cdot13+2\cdot 10+3\cdot 6 + 4\cdot 2 + 5\cdot 1+ 5\cdot 0}{40}$$

$$\overline{X} = 1.6$$

La varianza se calcula mediante la siguiente ecuacion:

$$S^{2} = \frac{\sum (x^{2}\cdot f)}{\sum f} - \overline{X}^{2}$$

Veamos como realizar este calculo en Python

In [43]:
num = (0**2 * 8) + (1**2 * 13) + (2**2 * 10) + (3**2 * 6) + (4**2 * 2) + (5**2 * 1)
den = 40
media = 1.6
Var = (num/den) -  (media**2)
Var = round(Var, 2)
Var

1.54

El valor de Varianza $S^{2}$ es de $1.54$. Notamos que la media $\overline{X} = 1.6$ es muy cercana a la varianza $S^{2} = 1.54$ es decir,

$$\overline{X} \simeq S^{2}$$

Y como en la D. de Poisson la Media es igual a la Varianza

$$E(x) = V(x)$$

Entonces, es un punto en favor de la D. de Poisson. La variable $X$, que representa el numero de email que llegan al dia, es discreta lo cual es otro punto en favor de la D. de Poisson. Los eventos deben ocurrir al azar, es decir no deben estar viciados por lo que suponemos que en el periodo de 40 dias no ha habido ofertas que sesguen las ventas. AL cumplirse todo lo anterior podemos asegurar que es apropiado utilizar la D. de Poisson.



### b.- Usando la de D. de Poisson, calcular la probabilidad que lleguen 1, 2 y 3 emails de ventas.

Nos piden calcular la probabilidad que lleguen 1, 2 y 3 emails de ventas, es decir

$$P(X=1), P(X=2), P(X=3)$$

Recordemos que el periodo es de 40 dias y que ademas la tasa de ocurrencia $\mu$ es igual a la Media $\overline{X}$ antes calculada

$$\mu = \overline{X} = 1.6$$

Vamos a calcular $P(x=1)$ que graficamente es encontrar la altura de la barra 1

![image.png](attachment:image.png)

Utilizamos el metodo PMF de la D. de Poisson para calcularlo

In [44]:
# parametros de la D.

# tasa de ocurrencia
miu = 1.6

# caso limite
x = 1

In [45]:
# probabilidad para x = 1
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.323

> La probabilidad que llegue 1 email por dia es de 32.3%. 

Vamos a calcular $P(x = 2)$ que graficamente seria encontrar la altura de la barra 2

![image.png](attachment:image.png)

Utilizamos el metodo PMF para calcular la probabilidad de dicho valor

In [46]:
# parametros de la D.

# tasa de ocurrencia
miu = 1.6

# caso limite
x = 2

In [47]:
# probabilidad para x = 2
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.2584

> La probabilidad que llegue 2 emails por dia es de 25.84%

Finalmente, calculamos $P(x = 3)$ que graficamente es encontrar la altura de la barra 3

![image.png](attachment:image.png)

Utilizamos el metdo PMF

In [48]:
# parametros de la D.

# tasa de ocurrencia
miu = 1.6

# caso limite
x = 3

In [49]:
# probabilidad para x = 3
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.1378

> La probabilidad que lleguen 3 email por dia es de 13.78%

### c.- Demuestra que los datos obtenidos mediante la D. de Poisson son correctos 

Para demostrarlo, veamos la frecuencia real para los numeros de email 1, 2 y 3

- 1 email: 13 dias
- 2 emails: 10 dias
- 3 emails: 6 dias

Y ahora veamos la probabilidad para los numeros de email 1, 2 y 3

- 1 email: 0.323
- 2 emails: 0.2584
- 3 emails: 0.1378

Sabemos que el periodo en que se recogieron los datos es de 40 dias, por tanto, podemos calcular la frecuencia esperada para cada numero de emails, dada por la D. de Poisson, mediante la siguiente ecuacion:

$$f_{esp}(x) = p_{x}\cdot n$$

Utilizamos dicha formula y calculamos la frecuencia esperada para 1, 2 y 3 emails

In [50]:
n = 40
p_1 = 0.323
p_2 = 0.2584
p_3 = 0.1378

f_1 = n*p_1
f_2 = n*p_2
f_3 = n*p_3
f_3 = round(f_3, 3)

print('Frecuencia esperada para 1 email: ', f_1)
print('Frecuencia esperada para 2 emails: ', f_2)
print('Frecuencia esperada para 3 emails: ', f_3)

Frecuencia esperada para 1 email:  12.92
Frecuencia esperada para 2 emails:  10.336
Frecuencia esperada para 3 emails:  5.512


> Si comparamos la frecuencia esperada con la frecuencia real de cada numero de email vemos que son muy similares y por tanto demostramos que los datos obtenidos por la D. de Poisson son correctos.

## Ejemplo 8: *En cierta parte del pais, 1 de cada 50 niños se ha roto accidentalmente un hueso del cuerpo a las edad de 5 años. Si se eligen 100 niños al azar de 5 años. Cual es la probabilidad de que exactamente 4 de ellos hayan sufrido una fractura?*

Claramente el ejercicio corresponde a una D. Binomial. La variable $X$ es aleatoria y discreta y representa el numero de niños de 5 años que sufren una fractura. La funcion de la D. binomial viene dada por: 

$$P(k)=\binom{n}{k}p^{k}(q)^{n-k}$$

donde
- $p$ es la probabilidad de exito

- $q$ es la probabilidad de fracaso.

- $n$ es el numero de eventos estudiados

- $k$ es el numero deseado de exitos.

La probabilidad de que un nino de 5 anos se rompa un hueso (probabilidad de exito) viene deada por:

$$p = \frac{1}{50}$$

La probabilidad de fracaso $q$ viene dada por lo contrario de $p$

$$q = \frac{49}{50}$$

El estudio se realiza sobre un total de 100 ninos, es decir

$$n = 100$$

Entonces, para calcular la probabilidad de que 4 de los 100 ninos hayan sufrido una fractura $P(k=4)$ procedemos como sigue:

$$P(4)=\binom{100}{4}\left ( \frac{1}{50}\right )^{4}\left ( \frac{49}{50} \right )^{96}$$

Resolver, manualmente, este factorial con $n$ tan grande es tedioso por lo que vamos a utilizar el metodo PMF de la D. Binomial de la libreria Stats para resolverlo: 


In [51]:
# libreria
from scipy.stats import binom

In [52]:
# parametros de la D.

# probabilidad de exito
p = 1/50
# probabilidad de fracaso
q = 49/50
# numero de eventos estudiados
n = 100
# numero de eventos deseados
k = 4

In [53]:
prob = binom.pmf(k, n, p)
prob = round(prob, 4)
prob

0.0902

> La probabilidad de que los 4 ninos seleccionados presenten una fractura es del 9.02%

Podemos resolver el mismo problema mediante la aproximacion a la D. de Poisson con la que reducimos la cantidad de pasos al encontrar la solucion. Pero para ello, se deben cumplir las siguientes condiciones:

- $n$ sea grande. Debe ser mayor a 75. Para este caso, $n = 100$ por lo que cumple la condicion.

- $p$ sea pequeno. Corresponde a un evento raro o poco comun. En este caso, $p = 1/50$ por lo que cumple la condicion.

- El producto $np$ debe ser menor a 10. En este caso, $np = 100/50 = 2$ por tanto, cumple esta condicion.

Al verificar que cumple con las condiciones y conociendo que $X$ es una variable aleatoria discreta podemos aplicar la funcion de la D. de Poisson.

$$P(X=x) = \frac{e^{-\mu}\cdot \mu^x}{x!}$$

La tasa de ocurrencia $\mu$ se calcula como sigue:

$$\mu = np = \frac{100}{50} = 2$$

Nos piden la probabilidad $P(X=4)$ lo que graficamente es hallar la altura de la barra 4

![image.png](attachment:image.png)

Vamos a resolverlo con el metodo PMF de la D. de Poisson


In [54]:
# parametros de la D.

# tasa de ocurrencia
miu = 2
# caso limite
x = 4

In [55]:
# probabilidad para x = 4
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.0902

> Llegamos al mismo resultado (9.02%) con menos parametros utilizando la aproximacion a la D. de Poisson.

## Ejemplo 9: *Suponga que el numero de particulas de asbesto en una muestra de un centimetro cuadrado de polvo sigue una distribucion de Poisson con media de 100. Cual es la probabilidad de que en 10 centimetros cuadrados haya menos de 1000 particulas de asbesto?*

La variable $X$ es una variable aletoria discreta que representa el numero de particulas de asbesto por cada centimetro cuadrado que sigue una D. de Poisson.

Nos dan la tasa de ocurrencia $\mu$ para un centimetro cuadrado: $\mu_{1} = 100$. Como nos piden hayar la probabilidad de encontrar menos de 1000 particulas $P(X < 1000)$ en 10 centimetros cuadrados ($n$), debemos calcular la tasa de ocurrencia para el nuevo espacio:

$$\mu_{10} = \mu_{1}n = 1000 \cdot 10 = 1000$$

Graficamente, se trata de encontrar el area sombreada de azul claro

![image.png](attachment:image.png)

Notemos que la grafica de la D. de Poisson en este caso tiende a una D. Normal. Para resolver este problema, de forma manual, con la D. de Poisson debemos calcular la probabilidad de cada particula hasta 999 y luego sumarlas todas,

$$P(X < 1000) = P(X = 1) + P(X = 2) + P(X = 3) + \cdot \cdot \cdot + P(X = 999)$$

Esta tarea resultaria tediosa y poco eficiente. Para mejorar los calculos podemos aproximar la D. de Poisson a una Normal. 

$$P(x) = \frac{e^{-\mu}\cdot \mu^x}{x!} \sim f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x-\mu}{\sigma} \right )^{2}}$$

De esta forma, tipificamos la variable $X$ y utilizamos la tabla z para agilizar el calculo. Para implementar la aproximacion se debe cumplir con las siguientes condiciones:

- $\mu$ debe ser grande. En terminos practicos, se considera que $\mu \geq 10$ es sufiente para que la D. de Poisson se aproxime a la D. Normal. En este caso, $\mu_{10} = 1000$ por lo que se cumple la condicion.

- Uso de la correccion de continuidad en caso de ser necesario. Suele aplicarse en valores de $\mu$ entre 10 y 50. Consiste en ajustar los valores de $x$ en $\pm 0.5$. En este caso, no es necesario aplicarlo debido a que $\mu_{10}$ es muy grande. 

La media y la varianza de la D. de Poisson es $E(x) = \mu$ y $\sigma^{2} = \mu$. Utilizamos ambos valores para tipificar la variable X con la siguiente ecuacion:

$$z = \frac{x - E(x)}{\sigma}$$

Recordemos que nos piden calcular la probabilidad de encontrar menos de 1000 particulas en 10 centimetros cuadrados, $P(X<1000)$. Entonces debemos hallar el valor de $z$ para $x=1000$. Sustityendo los valores obtenemos:

$$z = \frac{x - \mu_{10}}{\sqrt{\mu_{10}}} = \frac{1000 - 1000}{100} = 0$$



La probabilidad $P(X < 1000)$ es lo mismo que la probabilidad de que $z$ sea menor a cero $P(z < 0)$ donde $z$ es una variable aleatoria continua con distribucion normal estandar de media 0 y desviacion estandar 1. Ahora solo queda calcular el valor de probabilidad $z=0$ en la funcion de la D. Normal con media cero y desviacion estandar de 1 como sigue:

$$f(x=0)=\frac{1}{1 \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{0-0}{1} \right )^{2}} \rightarrow  f(x)=\frac{1}{\sqrt{2\pi}}e^{0}$$

Vamos a hallar tal valor con la libreria Stats mediante el CDF de la D. Normal.


In [56]:
# libreria
from scipy.stats import norm

In [57]:
# parametros de la D

# media
media = 0
# desviacion estandar
std = 1
# variable
z = 0

In [58]:
# probabilidad para z = 0
prob = norm.cdf(z, media, std)
prob

0.5

En este caso, el valor de $P(Z<0)$ es $0.5$, es decir

$$P(X < 1000) = P(Z < 0) = 0.5$$

> La probabilidad que en 10 centimetros cuadrados hallan 1000 particulas de asbesto de 50%

## Relacion entre la D. Poisson y la Exponencial

Supongamos que ciertos eventos ocurren en el tiempo segun un proceso de Poisson. La diferencia principal entre una variable que sigue una D. Poisson y una D. Exponencial es que la primera calcula la cantidad de eventos que ocurren en un determinado periodo de tiempo $t$, es decir

$$X \sim Po(\mu t)$$

Y la segunda estima el tiempo entre la ocurrencia de dos eventos sucesivos

$$X \sim Exp(\mu)$$

En ambos casos las distribuciones utilizan el mismo parametro $\mu$ que es la tasa de ocurrencia por unidad de tiempo. Para entenderlo mejor, veamos el siguiente ejemplo:

## Ejemplo 10: *En un establecimiento de apuestas deportivas llega un cliente cada 3 minutos*. Cual es la probabilidad que al menos pasen 5 minutos antes de que llegue un segundo cliente luego de haber llegado el primero?

Este ejercicios podemos resolverlo con ambas distribuciones. Primero definamos la tasa de ocurrencia,

$$\mu = \frac{\quad\text{Numero de clientes}}{\quad\text{Intervalo de tiempo}}= \frac{1}{3} = 0.33$$

Luego, definamos la variable $X$ para cada distribucion:

- $X_{1}$ es el numero de clientes que llega al establecimiento de apuestas en un minuto y siguen una D. Poisson. $X_{1} \sim Po(\mu) = Po(0.33)$

- $T$ es el tiempo, en minutos, entre la llegada de dos clientes sucesivos y sigue una D. Exponencial. $X \sim Exp(\mu) = Exp(0.33)$

### Solucion con la D. Exponencial

En este contexto, nos piden calcular la probabilidad de que un segundo cliente llegue en 5 o mas minutos despues de haber llegado el primero,

$$P(X \geq 5) = 1 - P(X < 5)$$

Para calcular $P(X < 5)$ utilizamos la probabilidad acumulada (CDF) de la D. Exponencial de la libreria Scipy

In [67]:
# importar libreria 
from scipy.stats import expon

# parametros de la D.

# lambda
lamb = 1/3

# valor limite 
x = 5

In [68]:
# probailidad acumulada hasta el valor 5
prob = expon.cdf(x, scale=1/lamb)
prob = round(prob, 4)
prob

0.8111

Restamos a 1 el resultado obtenido

In [69]:
probab = 1 - prob
probab = round(probab, 4)
probab

0.1889

### Solucion con la D. Poisson

Recordemos que la variable de Poisson $X_{1}$ representa la cantidad de clientes que llegan al establecimiento en un minuto. Como nos piden la probabilidad de que en 5 o mas minutos llegue un segundo cliente podemos reestructurar la preguntar como sigue: **Cual es la probabilidad de que en 5 minutos no lleguen ningun cliente?**. Es decir,

$$P(X_{5} = 0)$$

donde $X_{5}$ es la cantidad de cliente que llegan en 5 minutos. Una vez redefinida la variable de Poisson, debemos rescalar la tasa de ocurrencia $\mu$ a la nueva variable

$$\mu_{5} = 5 \cdot \mu = 5 \cdot (1/3) = 5/3$$

Entonces, decimos que $X_{5}$ sigue una D. Poisson de la forma:

$$X_{5} \sim Po(\mu_{5}) = Po(5/3)$$

Para calcular $P(X_5 = 0)$ utilizamos el PMF de la D. Poisson de la libreria Scipy

In [62]:
# parametros de la D.

# tasa de ocurrencia
miu = 5/3
# caso limite
x = 0

In [64]:
prob = poisson.pmf(x, miu)
prob = round(prob, 4)
prob

0.1889

Vemos que llegamos al mismo resultado (18.19%) con las dos distribuciones, por tanto, dependiendo la probabilidad y su interpretacion podemos utilizar cualquiera de las dos variables.