![Portada_D_Erlang.jpg](attachment:Portada_D_Erlang.jpg)

# Todo sobre la Distribución de Erlang

Es una distribución continua de probabilidad utilizada para modelar el tiempo necesario para que ocurran $k$ eventos en un procesos de Poisson. Fue desarrollada por Agner Erlang en el contexto de la teoría de colas y telecomunicaciones y es esencial en situaciones donde se estudian tiempos entre eventos. Algunas aplicaciones comunes en Ciencia de Datos son:

- Modelado de tiempos de espera entre eventos.

- Análisis de supervivencia (Modelado del tiempo entre la ocurrencia de múltiples eventos).

- Redes de comunicaciones y procesamiento de señales.

- Simulación de procesos industriales.

- Modelado de demanda y flujo de clientes.

## Deducción de la Distribución Erlang

La D. Erlang se obtiene de la generalización de la D. Exponencial la cual modela el tiempo transcurrido entre dos eventos, o bien, el tiempo que transcurre hasta que ocurre el primer evento.

La variable $X$ de la D. exponencial representa el tiempo que transcurre para la primera ocurrencia. Una generalización consiste en hallar el tiempo que transcurre para r-esima ocurrencia, es decir

$$Y = X_1 + X_2 + X_3 + ... + X_r$$

Definimos $Y$ como la variable que representa dicha generalización la cual se interpreta como una suma de variables aleatorias exponenciales independientes entre si e idénticamente distribuidas


$$X_i \sim Exp(\lambda) = \lambda e^{- \lambda x}$$

Supongamos que estamos interesados en obtener el tiempo que transcurre para la segunda ocurrencia, entonces $r = 2$, es decir

$$Y = X_1 + X_2$$

Debemos encontrar la función de distribución de la variable $Y$ para poder calcular el tiempo. La función de probabilidad acumulada viene dada por:

$$F(y) = P(Y \leq y)$$

Sustituimos la variable $Y$ en la probabilidad,

$$F(y) = P(X_1 + X_2 \leq y)$$

Esta expresión corresponde a una función de densidad conjunta, la cual presenta la siguiente propiedad:

$$ f_{X_1X_2}(X_1, X_2) = f_{X_1}(X_1)f_{X_2}(X_2)$$

Aplicando la propiedad anterior y sustituyendo las $X_i$ por su correspondiente distribución exponencial, obtenemos

$$F(y) = \lambda^2 e^{-\lambda(x_1 + x_2)}$$

Para obtener la probabilidad buscada $F(y) = P(X_1 + X_2 \leq y)$ vamos a integrar sobre el área de interés

$$F(y) = P(X_1 + X_2 < y) =\int_{x_2 = 0}^{x_2 =y}\int_{x_1 = 0}^{x_2 = y - x_2} \lambda^2 e^{-\lambda(x_1 + x_2)} dx_1 dx_2$$

El resultado de la integral es el siguiente:

$$F(y) = P(X_1 + X_2 < y) = 1 - e^{-\lambda y} -\lambda y e^{-\lambda y}$$

si derivamos la expresión anterior obtenemos la función de densidad

$$f(y) = \frac{d(F(y))}{dy} = \lambda^2 y e^{-\lambda y}$$

donde $y \geq 0$

Ahora, supongamos que estamos interesados en el tiempo que transcurre para la tercera ocurrencia, es decir $r = 3$

$$Y = X_1 + X_2 + X_3$$

Procediendo como para $k=2$ obtenemos la siguiente función de densidad

$$f(y) = \frac{1}{2} \lambda^2 y^2 e^{- \lambda y}$$

Generalizando la función de densidad para diferentes valores de $k$, obtenemos

$$Er(y) = f(y) =  \frac{\lambda^k y^{r-1}e^{- \lambda y}}{(r-1)!} $$

que corresponde a la función de densidad de la D. de Erlang.

## Función de Densidad de Probabilidad

La función de densidad de probabilidad para la D. Erlang viene dada por:

$$ Er(r, \lambda) = \frac{\lambda^r x^{r-1}e^{-\lambda x}}{(r-1)!}$$

donde:

- $x \geq 0$
- $\lambda$ es la intensidad de proceso conocido también como parámetro de escala.
- $r$ es un entero positivo que representa el número de éxitos que se desea obtener, también llamado parámetro de forma.

La gráfica de la D. Erlang con valores de $\lambda = 2$ y $k = 3$ viene dada por:

![image.png](attachment:image.png)

## Propiedades de la D. Erlang

- **La media $\mu_E$** viene dada por el valor esperado $E[Y]$ de la suma de las $r$ variables exponenciales

$$E[Y] = E[X_1 + X_2 + ... + X_k]$$
$$E[Y] = E[X_1] + E[X_2] + ... + E[X_k]$$

Sabemos que el valor esperado de una variable exponencial viene dado por:

$$E[X_i] = \frac{1}{\lambda}$$

Por tanto, sustituyendo en la ecuación obtenemos que el valor de la media de la D. Erlang viene dada por:

$$\mu_E = E[Y] = \frac{1}{\lambda} + \frac{1}{\lambda} + \frac{1}{\lambda} ... = \frac{r}{\lambda}$$

- **La varianza $\sigma^2$** viene dada por la varianza de la suma de las $k$ variables exponenciales,

$$Var[Y] = Var[X_1 + X_2 + X_3 +...+ X_r]$$

Puesto que las $X_k$ son variables independientes, la varianza puede reescribirse como la suma de la varianza de cada variable

$$Var[Y] = Var[X_1] + Var[X_2] + Var[X_3] + ... + Var[X_r]$$

Sabemos que la varianza de una variable exponencial viene dado por:

$$Var[X_i] = \frac{1}{\lambda^2}$$

Entonces, sustituyendo la varianza para cada variable $X_i$ obtenemos,

$$Var[Y] = \frac{r}{\lambda^2}$$

## Ejemplo 1: *Consideremos una variable aleatoria Erlang X con parámetros $\lambda = 2$ y $r=3$. Calcular la probabilidad de que la variable sea menor o igual a 2*

Sabemos que la variable $X$ sigue una D. Erlang con los siguientes parámetros:

$$X \sim Er(\lambda = 2, r = 3)$$

Se busca la probabilidad de que $X \leq 2$ que graficamente se representa como el área sombreada,

![image.png](attachment:image.png)

Para ello, utilizamos la función de densidad de probabilidad,

$$ Er(\lambda, r)= \lambda e^{-\lambda x} \frac{(\lambda x)^{r-1}}{(r - 1)!}$$

Sustituimos las valores dados en la función e integramos el área de 0 hasta 2, que corresponde a la probabilidad solicitada:

$$P(X \leq 2) = \int_{0}^{2}2 e^{-2x} \frac{(2x)^{3-1}}{(3 - 1)!}dx$$

$$P(X \leq 2) = \int_{0}^{2} e^{-2x} (2x)^{2}dx = \left [ (-1 -2x -2x^2)e^{-2x} \right]_0 ^2$$

$$P(X \leq 2) = 1 - 13e^{-4} = 0.7618$$

> La probabilidad que la variable $X$ sea menor o igual a 2 es de 76.18%.

Otra forma de resolver el problema es a través del método de la Función de Distribución Acumulada (CDF) de la D. Erlang que trae la librería Scipy de Python. Esta nos permite calcular la parobabilidad acumulada hasta el valor límite dado.

In [2]:
# parametros de la distribucion

# de forma
r = 3
# de escala
lamb = 2
# valor limite
x = 2


In [3]:
# libreria para utilizar Erlang
from scipy.stats import erlang 

# calulo de la probabilidad acumulada hasta 2
prob = erlang.cdf(x, r, scale=1/lamb)
prob

0.7618966944464556

> Obtenemos el mismo resultado que el anterior (76.18% de probabilidad) pero esta vez, evitamos el cálculo de la integral.

## Ejemplo 2: *Las fallas de unidades de procesamiento central (CPU) de los sistemas de computadores grandes se modelan con frecuencia como un proceso de Poisson. Por lo general, las fallas no son causadas por degaste sino por otros factores. Suponga que las unidades que fallan se reparan de inmediato y que el número promedio de fallas por hora es de 0.0001.* 

### Sea $X$ el tiempo hasta que ocurren 4 fallas en un sistema. Determine la probabilidad de que $X$ exceda 40000 horas.

Como $X$ representa el tiempo que en el que ocurren 4 fallas, debemos utilizar la D. Erlang. En caso que represente sólo una falla, bien podemos usar la D. Exponencial. Sabemos que $X$ sigue una D. Erlang con los siguientes parámetros

$$X \sim Er(r=4, \lambda = 0.0001)$$

Nos piden calcular la probabilidad de de $X$ sea mayor a 4000,

$$P(X > 40000)$$

Que graficamente es calcular el área sombreada de la siguiente distribución

![image.png](attachment:image.png)

Una forma de resolverlo con el método CDF de Scipy es aplicando la propiedad del complemento a la probabilidad anterior

$$P(X > 40000) = 1 - P(X \leq 40000)$$

Donde $P(X \leq 40000)$ se puede resolver mediante CDF y se representa como la siguiente área.

![image-2.png](attachment:image-2.png)


In [4]:
# parametros de la D.

# de escala
lamb = 0.0001
# de forma
r = 4
# valor limite
x = 40000

Ahora, calculamos la probabilidad acumulada hasta el valor límite

In [5]:
prob = erlang.cdf(x, r, scale=1/lamb)
prob = round(prob, 4)
prob

0.5665

Agregamos el resultado a $P(X > 40000)$ y obtenemos su valor

In [6]:
result = 1 - prob
result

0.4335

> La probabilidad de que el tiempo hasta que ocurran 4 fallas excedan las 40000 horas es de 43.35%.

## Ejemplo 3: *La materia prima de cierto proceso se estudia para determinar la contaminación presente en ella. Suponga que el número de particulas contaminantes por libra de material es una variable aleatoria de Poisson con una media de 0.01 partículas por libra.*

### a.- Cuál es el número esperado de libras de materia prima necesarias para obtener 15 partículas contaminantes?

La variable $X$ representa el número de partículas contaminantes por libra de material. Como sigue un proceso de Poisson con una media dada y nos piden un valor entero de partículas, podemos asumir que dicha variable sigue una D. Erlang.

$$X \sim Er(r=2, \lambda=0.01)$$

Como nos piden hallar el número esperado de libras de materia necesaria para obtener 15 partículas, utilizamos el promedio de la D. Erlang ($\mu_{Er}$) que viene dado por:

$$\mu_{Er} = \frac{r}{\lambda}$$

In [7]:
# parametros de la D

# de escala
lamb = 0.01
# de forma
r = 15

In [8]:
prom = r/lamb
prom

1500.0

> Se requieren 1500 libras de material para conseguir 15 partículas contaminantes.

### b.- Cuál es la desviación estándar de las libras de materia prima necesarias para obtener 15 partículas contaminantes?

En este caso, utilizamos la varianza de la D. Erlang ($\sigma_{Er}^2$) que viene dada por

$$\sigma_{Er}^2 = \frac{r}{\lambda^2}$$

In [9]:
var = r/lamb**2
var

150000.0

Para obtener la desviación estándar ($\sigma_{Er}$) simplemente obtenemos la raíz cuadrada del resultado anterior

In [10]:
std = (var)**0.5
std

387.2983346207417

> La desviación estándar es de 387.29 lo que indica que en un rango entre 1112 y 1888 libras se puede encontrar las 15 partículas contaminantes.

## Ejemplo 4: *En un centro de llamadas de soporte técnico llegan llamadas de acuerdo a un proceso de Poisson con una tasa de 10 por minuto. Cada llamada pasa por tres etapas de procesamiento secuenciales antes de ser resuelta. El tiempo que tarda en completarse cada etapa sigue una distribución exponencial con una tasa media de 5 minutos por etapa*

### a.- Calcular la probabilidad de que el tiempo total de una llamada exceda los 20 minutos

La variable aleatoria $X$ que sigue una D. exponencial y representa el tiempo total para que una llamada pase por las 3 etapas. La cantidad de etapas define el parámetro de forma ($r=3$) y como cada etapa tiene una media de 5 minutos, la tasa media por etapa viene dada por 

$$\lambda = \frac{1}{5} = 0.2$$

Dado estos parámetros podemos asumir que $X$ sigue una D. Erlang,

$$X \sim Er(r=3, \lambda= 0.2)$$

Nos piden calcular la probabilidad de que el tiempo de una llamada exceda los 20 minutos, es decir, $P(X > 20)$, que mediante la propiedad del complemento de la probabilidad podemos redefinirlo como:

$$P(X > 20) = 1 - P(X \leq 20)$$

Graficamente, se trata de encontrar el área sombreada de la siguiente distribución

![image.png](attachment:image.png)

Utilizamos el método CDF para calcular $P(X \leq 20)$

In [11]:
# parametros de la D.
# de escala
lamb = 0.2
# de forma
r = 3
# valor limite
x = 20

In [12]:
prob = erlang.cdf(x, r, scale=1/lamb)
prob

0.7618966944464556

Ahora, restamos a 1 el resultado anterior y obtenemos la probabilidad buscada

In [13]:
result = 1 - prob
result = round(result,4)
result

0.2381

> La probabilidad de que el tiempo total de una llamada exceda los 20 minutos es de 23.81%

### b.- Determinar el número mínimo de agentes necesarios en el sistema para asegurar que menos del 5% de las llamadas excedan los 20 minutos en su tiempo total de procesamiento.

Debemos calcular $P(X > 20)$ la probabilidad de que el tiempo total $X$ exceda los 20 minutos. Esto se puede expresar como:

$$P(X > 20) = 1 - P(X \leq 20)$$

Para asegurar que menos del 5% de las llamadas excedan los 20 minutos, se requiere que

$$P(X > 20) < 0.05$$

Lo que implica que

$$P(X \leq 20) > 0.95$$

Vamos a utilizar el método ppf para encontrar el tiempo correspondiente al 95% de la probabilidad acumulada probando con diferentes valores de $r$ que no exceda los 20 minutos.

In [14]:
# parametros de la D.
lamb = 0.2
# tiempo limite en minutos
umbral_tiempo = 20
# valor de probabilidad deseado
prob_d = 0.95

# iteramos sobre diferentes valores de k
for r in range(1,  10):
    tiempo_c = erlang.ppf(prob_d, r, scale=1/lamb)
    print(f'Numero de agentes: {r}. Tiempo calculado para P(X <= 20) = 0.95: {tiempo_c}')
    
    if tiempo_c >= umbral_tiempo:
        print(f'Se requieren al menos {r} agentes')
        break


Numero de agentes: 1. Tiempo calculado para P(X <= 20) = 0.95: 14.978661367769948
Numero de agentes: 2. Tiempo calculado para P(X <= 20) = 0.95: 23.719322591952885
Se requieren al menos 2 agentes


> Se necesitan al menos 2 agentes para asegurar que el 95% de las llamadas no excedan los 20 minutos.

## Ejemplo 5: *Una empresa farmacéutica realiza un estudio clínico para analizar la efectividad de un nuevo tratamiento para una enfermedad.  El tratamiento consiste en varias fases, y los investigadores quieren modelar el tiempo hasta la recuperación completa de los pacientes. Se sabe que un paciente necesita pasar por tres fases sucesivas para recuperarse totalmente, y cada fase tiene un tiempo de espera que sigue una distribución exponencial con una tasa de 0.5 recuperaciones por mes.*

### a.- Calcular la probabilidad que un paciente se recupere en menos de 6 meses.

La variable $X$ representa el tiempo total hasta la recuperación y dado que cada fase de recuperación sigue una D. Exponencial con tasa $\lambda = 0.5$, la variable $X$ sigue una D. Erlang 

$$X \sim Er(r=3, \lambda=0.5)$$

Nos piden calcular la probabilidad que un paciente se recupere en menos de 6 meses, es decir

$$P(X < 6)$$

Graficamente es hallar el valor del área sombreada.

![image-2.png](attachment:image-2.png)

Vamos a utilizar el método CDF para calcular dicho valor


In [15]:
# Parametros de la D.
# de escala
lamb = 0.5
# de forma
r = 3
# valor limite
x = 6

In [16]:
prob = erlang.cdf(x, r, scale=1/lamb)
prob = round(prob, 4)
prob

0.5768

>  La probabilidad de que un paciente se recupere completamente en menos de 6 meses es aproximadamente 57.68% 

### b.- Estimar el tiempo medio de recuperacion completa

El tiempo mediano de recuperación es el valor de $x$ tal que $P(X \leq x) = 0.5$. Para hallarlo vamos a utilizar el método PPF.

In [17]:
tiempo_prom = erlang.ppf(0.5, r, scale=1/lamb)
tiempo_prom

5.348120627447118

> El tiempo medio de recuperación es de aproximadamente 5 meses.

## Ejemplo 6: Una empresa de marketing digital quiere analizar el comportamiento de los clientes que hacen clic en anuncios en línea. El objetivo es modelar el tiempo entre los clics que realiza un cliente en distintos anuncios de la misma campaña. Se sospecha que los clics siguen un proceso que puede modelarse como un proceso Poisson, donde el tiempo medio entre clics consecutivos es de 4 minutos.

### a.- ¿Cuál es el tiempo medio esperado entre tres clics consecutivos de un cliente en la campaña publicitaria?

Como estamos interesados en modelar el tiempo hasta el tercer clic consecutivo ($X$), podemos usar la D. Erlang con $r = 3$ y tasa de $\lambda$ que corresponde al inverso del tiempo medio entre clics

$$X \sim Er(r=3, \lambda=1/4)$$

Nos piden calcular el tiempo medio esperado para que ocurran 3 clics consecutivos, por lo que usamos la media de Erlang.

$$\mu_{Er} = \frac{r}{\lambda}$$

Sustituyendo los valores en la fórmula, obtenemos:

$$\mu_{Er} = \frac{3}{\frac{1}{4}} = \frac{3 \cdot 4}{1} = 12$$

> el tiempo medio esperado entre tres clics consecutivos es de 12 minutos

### b.- ¿Cuál es la probabilidad de que el tiempo entre tres clics consecutivos sea menor a 10 minutos?

En este caso, utilizamos el método CDF de la distribución con $r=3$ y $\lambda = 1/4$. Graficamente, es hallar el área sombreada de la siguiente distribución:

![image.png](attachment:image.png)

La probabilidad a calcular es  $P(X < 10)$


In [18]:
# parametros de la D.
# de escala
lamb = 0.25
# de forma
r = 3
# valor limite
x = 10

In [20]:
# probabilidad acumulada hasta 10
prob = erlang.cdf(x, r, scale=1/lamb)
prob

0.45618688411667035

> La probabilidad de que el tiempo entre 3 clics consecutivos sea menor a 10 minutos es de 45.61%.

## Relación entre la Distribución Erlang y la Gamma

La D. Erlang es un caso especial de la D. Gamma donde el parámetro de forma $\alpha$ se considera un entero positivo $r$. Para deducirla, analicémos la función de densidad de probabilidad de la D. Gamma:

$$\Gamma (x, \alpha, \beta) = \frac{ x^{\alpha - 1} e^{-\frac{x}{\beta}}}{ \Gamma(\alpha) \beta^{\alpha}}$$

donde:
- $x$ es contínuo y mayor a cero.
- $\alpha$ es un número contínuo positivo conocido como parámetro de forma.
- $\beta$ es un número contínuo positivo conocido como parámetro de escala.
- $\Gamma$ es la integral de la función Gamma, para valores de $\alpha$ contínuos.

Consideremos que el parámetro de forma $\alpha$ toma sólo valores enteros positivos, es decir, $\alpha = r$. Entonces, la función queda

$$\Gamma (x) = \frac{ x^{r - 1} e^{-\frac{x}{\beta}}}{ \Gamma(r) \beta^{r}}$$

Como $r$ ahora se define como un entero, podemos utilizar la siguiente propiedad de la función Gamma $\Gamma(n) = (n-1)!$ y reescribirla en la función $\Gamma(x)$

$$\Gamma (x) = \frac{ x^{r - 1} e^{-\frac{x}{\beta}}}{ (r-1)! \beta^{r}}$$

Parametrizamos la función $\Gamma (x)$ en términos de un parámetro de tasa $\lambda$, es decir,

$$\lambda = \frac{1}{\beta}$$

Y al sustituir la expresión anterior en $\Gamma (x)$ obtenemos la D. Erlang:

$$ \Gamma(x) = Er(x,r, \lambda) = \frac{\lambda^r x^{r-1}e^{-\lambda x}}{(r-1)!}$$

