# Distribucion Weibull

Es una distribucion continua de probabilidad que modela el tiempo hasta el fallo de un producto o sistema, siendo especialmente util en analisis de confiabilidad, vida util de materiales y analisis de riesgos

La D. Exponencial supone una tasa de eventos constante en el tiempo, lo que indica la ausencia de memoria del sistema (el tiempo que pasa desde el ultimo evento no afecta la probabilidad de que ocurra el proximo). Sin embargo, en casos como los componentes mecanicos que tienen una mayor probabilidad de fallar a medida que envejece debido al desgaste, esta distribucion ya no se aplica. En tales caso, la D. de Weibull es adecuada porque permite modelar tasas de fallo que aumentan o disminuyen en el tiempo.

La D. de Poisson modela conteos discretos de eventos en un intervalo de tiempo o espacio bajo la suposicion de independencia de los eventos y una tasa de ocurrencia constante. En casos donde, por ejemplo, el numero de llamadas a un centro de soporte tecnico varia segun la hora del dia, la D. de Poisson deja de ser valida. Es alli donde la D. de Weibull es relevante ya que puede modelar esta variabilidad introduciendo una tasa de eventos dependiente del tiempo.

En resumen, la D. de Weibull es mas relevante que la Exponencial o Poisson cuando hay una tasa de ocurrencia variable, se requiere flexibilidad en la forma de la distribucion o se analiza la duracion de eventos.

# Deduccion de la Distribucion Weibull

La D. Weibull se deriva como una generalizacion de la D. Exponencial para permitir que la tasa de fallo (o la probabilidad de ocurrencia de un evento) sea variable en lugar de constante.

Se inicia con la funcion de supervivencia $S(x)$ que representa la probabilidad de que un evento no haya ocurrido hasta un tiempo $x$:

$$S(x) = P(X > x)$$

En terminos de la funcion de distribucion acumulada $F(x)$ se tiene:

$$S(x) = 1 - F(x)$$

Para Weibull se postula que la funcion de supervivencia tiene la forma exponencial generalizada:

$$S(x) = e^{-(\frac{x}{\lambda })^{k}}$$

Donde:

- $x \geq 0$
- $\lambda > 0$ es el parametro de escala que ajusta el rango de valores de $x$.
- $k > 0$ es el parametro de forma que controla la forma de la distribucion.

La eleccion de esta forma de $S(x)$ se basa en su capacidad para modelar tasas de fallo crecientes o decrecientes segun el valor de $k$. Obtenemos la funcion de distribucion acumulada $F(x)$ de la ecuacion anterior:

$$F(x) = 1 - S(x)$$

$$F(x) = 1 - e^{-(\frac{x}{\lambda })^{k}}$$

Esta funcion representa la probabilidad acumulada CDF de que el evento ocurra antes de un tiempo $x$.

La funcion de distribucion de probabilidad PDF se obtiene derivando la CDF con respecto a x:

$$f(x) = \frac{dF(x)}{dx}$$

Sustityendo $F(x) = 1 - e^{-(\frac{x}{\lambda })^{k}}$ en la ecuacion anterior obtenemos:

$$f(x) = \frac{\mathrm{d} }{\mathrm{d} x}\left [ 1 - e^{-(\frac{x}{\lambda})^k} \right ]$$

Derivando el termino exponencial:
$$f(x) = \frac{\mathrm{d} }{\mathrm{d} x}\left [ - e^{-(\frac{x}{\lambda})^k} \right ]$$

Usando la regla de la cadena:
$$f(x)=e^{-(\frac{x}{\lambda})^{k} } \cdot \frac{\mathrm{d} }{\mathrm{d} x}\left [ - (\frac{x}{\lambda})^{k} \right ]$$

La derivada del exponente es:
$$f(x)=e^{-(\frac{x}{\lambda})^{k} } \cdot \frac{k}{\lambda} \cdot \left ( \frac{x}{\lambda} \right )^{k-1} $$

Simplificando obtenemos:
$$f(x)= \frac{k}{\lambda} \cdot \left ( \frac{x}{\lambda} \right )^{k-1} e^{-(\frac{x}{\lambda})^k}$$

para $x \geq 0$. Esta funcion corresponde a la funcion de densidad de la D. Weibull.

# Funcion de Densidad de Probabilidad

La funcion de densidad de probabilidad para la D. Weibull viene dada por:

$$ f(x,k,\lambda) = \begin{cases}
 \frac{k}{\lambda} \cdot \left ( \frac{x}{\lambda} \right )^{k-1} e^{-(\frac{x}{\lambda})^k},&  x\geq 0 \\
0, &  x<0 
\end{cases}$$

donde,
- $x$ es la variable aleatoria (el tiempo o la magnitud del evento)
- $k>0$ es el parametro de forma que determina la forma de la curva.
- $\lambda>0$ es el parametro de escala que estira o comprie la distribucion.

Los parametros de la D. Weibull se interpretan coo sigue:

- $k < 1$: la tasa de fallo disminuye con el tiempo. (producto con desgate temprano)
- $k = 1$: la tasa de fallo es contante lo que lleva a la D. esponencial.
- $k > 1$: la taa de fallo aumenta con el tiempo. (productos que se degastan con el uso)
- $\lambda$: escala el tiempo o magnitud del evento. Valores altos indican que el evento tarda mas en ocurrir. 

La grafica de la D. Weibull con valores de $k=6$ y $\lambda=3$ viene dada por:

![image.png](attachment:image.png)

# Propiedades de la D. Weibull

- __La Funcion de supervivencia $S(x)$__ mide la probabilidad de que un evento no haya ocurrido hasta $x$ y para la D. Weibull se define como:

$$S(x) = P(X>x) = e^{-(\frac{x}{\lambda})^k}$$

- __Funcion de Distribucion Acumulada (CDF)__ F(x) mide la probabilidad acumulada hasta $x$. Para la D. Weibull se deine como:

$$F(x)=P(X\leq x)=1-e^{-(\frac{x}{\lambda})^k}$$

- __Funcion de tasa de Fallo (Hazard Function)__ describe la probabilidad instantanea de fallo, dado que el evento no ha ocurrido hasta $x$:

$$h(x)=\frac{F(x)}{S(x)}=\frac{k}{\lambda}\left ( \frac{x}{\lambda} \right )^{k-1}$$

    - Si $k=1$, la tasa de fallo es constante, lo que corresponde a la D. Exponencial.
    - Si $k>1$, la tasa de fallo aumenta con x lo que es util para modelar tiempos de vida que empeoran con el tiempo.
    - Si $k<1$, la tasa de fallo disminuye con x lo que es util para modelar iniciales en el tiempo de vida.
    
- __La Media o esperanza $\mu_{E}$__ de la D. Weibull es:

$$\mu_{E} = \lambda \cdot\Gamma \left ( 1 +\frac{1}{k} \right )$$

Donde $\Gamma(z)$ es la funcion Gamma

- __La Varianza $\sigma^{2}$__ mide la dispersion de la distribucion y se calcula como:

$$\sigma^{2} = \lambda^{2} \left [ \Gamma (1 +\frac{2}{k}) - \Gamma^{2} (1+\frac{1}{k}) \right ]$$

- __La Moda $x_{moda}$__ es el valor de x donde la densidad $f(x)$ alcanza su maximo:

$$X_{moda} = \lambda \cdot\left ( \frac{k-1}{k} \right )^{\frac{1}{k}}$$

Para $k>1$. Si $k \leq 1$ la distribucion no tiene un maximo definido.

## Ejemplo 1: _Suponga que la duracion  (en anos) de una bateria es una variable aleatoria que tiene una distribucion Weibull con $k=1.5$ y $\lambda=2$. Una bateria se considera especial si esta entre el 10% de mayor duracion._

### a.- Cuanto tiempo se espera que dure una bateria elegida al azar?

Para este caso la vaiable $X$ representa la duracion de la bateria en años. Como nos indica la variable sigue un proceso de Weibull y como nos piden calcular la esperanza $\mu_{E}$, podemos asumir que dicha variable sigue una D. Weibull

$$X \sim We(\lambda=2, k=1.5)$$

La formula de $E(x)$ viene dada por:

$$\mu_{E} = \lambda \cdot\Gamma \left ( 1 +\frac{1}{k} \right )$$

Como conocemos los valores de los parametros, procedemos a resolverlo

In [2]:
# importamos el metodo gamma de la libreria scipy
from scipy.special import gamma

# asignamos los valores de k y lambda a variables
k = 1.5
lamb = 2

# resolvemos lo que esta entre parentesis
param = 1 + (1/k)

# mostramos el resultado
print(param)

1.6666666666666665


In [4]:
# hallamos el valor de Gamma(1.66)
Gamma = gamma(param)

# multiplicamos Gamma por lambda
result = lamb*Gamma

# mostramos el resultado
print(result)

1.805490585901867


> El tiempo esperado que dure una bateria elegida al azar es de 1.81 años.

### b.- Cual es la probabilidad de que dicha bateria siga funcionando despues de dos años?

No piden hallar la probabilidad de que la bateria funcione despues de 2 anos, es decir

$$P(x>2) = 1 - P(x \leq 2)$$

Entonces, debemos hallar $P(x \leq 2)$ con la Funcion de distribucion acumulativa CDF.  Graficamente lo que nos piden hallar es la probabilidad que esta repesentada por el area sombreada en el siguiente grafico

![image.png](attachment:image.png)



In [14]:
# importamos la D. Weibull
from scipy.stats import weibull_min

# representamos los parametros de la D.
k = 1.5
lamb = 2

# calculamos la probabilidad hasta x=2
cdf = weibull_min.cdf(2, k, scale=lamb)

# mostramos el resultado
print(cdf)

0.6321205588285577


Ahora lo que hacemos es sustituir el valor obtenido en la ecuacion anterior de $P(x > 2)$

In [15]:
P_2 = 1 - cdf
print(P_2)

0.36787944117144233


> La probabilidad que la bateria funcione despues de dos años es de 36.78% 