# Distribuciones importantes a tener en cuenta

En esta sección, vamos a presentar tres distribuciones porque son muy usuales de encontrar en referencias o uso.

## Distribución uniforme

La *distribución uniforme* ilustrada es de la siguiente forma

<img src="Images/uniforme.jpg" alt="Notas" width="600" center/>

Evaluando las ecuaciones, obtenemos lo siguiente

$$
P[\alpha \le x \le \beta] = \frac{\beta-\alpha}{b-a}  \;\;\; \mu = \frac{b+a}{2} \;\;\; \sigma = \frac{b-a}{2\sqrt{3}}
$$

En la práctica no es usual encontrarnos con una distribución uniforme. Con variables discretas, nos la podemos encontrar en lanzamiento de monedas o dados. Cada resultado es igualmente probable. 

En los datos obtenidos a partir de mediciones de fenómenos físicos y químicos, suele haber una tendencia central que es más probable que los valores estén alejados de la media. Sin embargo, si el rango es razonablemente definido, pero no hay evidencia que respalde una distribución particular, a veces se utiliza la distribución uniforme para reflejar nuestra falta de conocimiento.

## Distribución normal

Las más común y frecuentemente encontrada distribución es la *distribución normal* (también llamada *distribución Gausiana*). Su función de densidad es

$$
f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}
$$

Como implican los símbolos, la media de esta distribución es $\mu$ y su desviación estándar es $\sigma$. 

La ilustración de esta distribución para $\mu=100$ y $\sigma=10$ es la siguiente

<img src="Images/normal.jpg" alt="Notas" width="600" center/>

Existe una versión simplificada de la distribución normal llamada *distribución normal estándar* donde $\mu=0$ y $\sigma=1$. Típicamente, el nombre de la variable aleatoria usaca con esta distribución es $z$, y la relación con $x$ en la distribución normal es

$$
z = \frac{x-\mu}{\sigma}
$$

## Distribución Weibull

Cuando empezamos a observar histogramas de conjuntos de datos, encontraremos que muchos de ellos son adecuador para modelar siguiendo la distribución normal. Sin embargo, hay una característica que observamos que es contrario a esta distribución. Y es la falta de simetría, o asimetría. Existen muchas distribuciones que permiten modelar la asimetría. Una que es comúnmente usada en la industria manufacturera para modelar la confiabilidad del producto es la distribución Weibull. Su función densidad es

$$
f(x) = \frac{\alpha}{\beta^\alpha}x^{\alpha-1}e^{-(x/\beta)^\alpha}\;\;\; x \ge 0
$$

donde $\alpha$: parámetro de escala $> 0$, y $\beta$: parámetro de forma $> 0$.

<img src="Images/weibull.jpg" alt="Notas" width="600" center/>

## Python y distribuciones

El submódulo `stats` de SciPy provee funciones para calcular probabilidades para distintas distribuciones. Vamos a calcular la densidad normal (función de densidad de la distribución normal). Para calcular la densidad normal usamos la función `norm.pdf`. Esta función calcula la densidad normal, dado un punto. Para calcular el área entre los valores $a$ y $b$, usaremos la función `norm.cdf`. Esta función calcula el área desde el extremo izquierdo hasta el primer argumento. También se le conoce como *probabilidad acumulada* (*cumulative probability* en inglés).

In [3]:
from scipy import stats

# Valores mu y sigma de la distribución normal

mu = 100
sigma = 10

In [6]:
# Evaluamos la función de densidad en el punto x

x = 60

f = stats.norm.pdf(x, mu, sigma)
f

1.3383022576488537e-05

In [7]:
# El area entre el extremo izquierdo y r

r = 80

cpr = stats.norm.cdf(r, mu, sigma)
cpr

0.022750131948179195

In [10]:
l = 50

cpl = stats.norm.cdf(l, mu, sigma)
cpl

2.8665157187919333e-07

In [11]:
# Probabilidad acumulada entre [l, r]

cp_range = cpr - cpl
cp_range

0.022749845296607316