# Distribuciones de mayor aplicación continuas

In [None]:
import warnings
import matplotlib.pyplot as plt
%matplotlib inline

warnings.filterwarnings('ignore')

Vamos a listas las distribuciones que mas se utilizan en la probabilidad y estadistica. 

Estas variables son muy importantes porque nos permiten modelar una gran cantidad de eventos que vivimos en la vida cotidiana.

Las distribuciones de mayor aplicación continua son:
- **Distribucion exponencial**: Es el caso inverso de la distribucion de Poisson. En Poisson contabamos numero de eventos en unidad de tiempo. En esta distribucion contamos el tiempo que no tardamos en llegar a uno de esos eventos
- **Distribución normal**: Tambien llamada de campana. Se caracteriza por estar centrada en una media de 0 y tener el 99% de los valores en +-3 desviaciones estandar.
- **Distribucion uniforme**: Asume que cada evento esta distribuido con una misma probabilidad.

## Distribución de Exponencial

Distribución exponencial: utilizada generalmente para análisis de fiabilidad, p.e: probabilidad de que un componente falle transcurrido una cierta cantidad de tiempo. Una caracteristica importante es que no tiene memoria ('perdida de memoria'), cada evento futuro es independiente de los pasados.

Esta la distribución de probabilidad describe el tiempo entre eventos en un proceso de puntos de Poisson. Los puntos de Poisson consisten en puntos situados aleatoriamente en un espacio matemático. Es decir, una distribucion exponencial es un proceso en el que los eventos ocurren de manera continua e independiente a una tasa promedio constante.

![exponencial](https://imgur.com/9xgfOk5.png)

para x >= 0

[Distribucion de Exponencial en qwe wiki](https://es.qwe.wiki/wiki/Exponential_distribution)

[Distribucion de Exponencial en scipy.stats - Documentacion](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.expon.html#scipy.stats.expon)


En el este caso la funcion de probabilidad exponencial que scipy maneja se encuentra estandarizada, por ello en la exponencial no se agrega el parametro lambda, sino que lo toma como 1.

In [None]:
from scipy.stats import expon

data = expon.rvs(size = 100000000) # Generamos el experimento de forma aleatoria con .rvs()

# Cantidad de valores de la muestra. Media, varianza, simetria, curtosis
mean, var, skew, kurt = expon.stats(moments='mvsk')
len(data), mean, var, skew, kurt

In [None]:
import seaborn as sns

ax = sns.distplot(data, bins=500, kde=False, color='blue')
ax.set(xlabel='Tiempo', ylabel='Frecuencia')
ax.set_title(label='Distribucion exponencial')
ax.axvline(x=mean, linestyle='--', label='Media')
ax.legend()

## Distribución Normal

Distribución normal: dadas sus características, se utiliza para inferencia estadística, es decir, estimar/evaluar parámetros de toda una población, basados en una muestra. Aquí es donde se utilizan los famosos intervalos de confianza. Investigar sobre las “pruebas de hipótesis”.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes. 

![normal](https://imgur.com/F1HS5qX.png)

para cualquier numero real de x.

[Distribucion de Normal en qwe wiki](https://es.qwe.wiki/wiki/Normal_distribution)

[Distribucion de Normal en scipy.stats - Documentacion](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html#scipy.stats.norm)


En el caso de la distribucion normal que scipy maneja se encuentra estandarizada, por ello en el parametro por defecto es 1.

In [None]:
from scipy.stats import norm
# Valores por defecto son:
# mean = 0
# ver = 1
data = norm.rvs(size = 100000000) # Generamos el experimento de forma aleatoria con .rvs()

# Cantidad de valores de la muestra. Media, varianza, simetria, curtosis
mean, var, skew, kurt = norm.stats(moments='mvsk')
len(data), mean, var, skew, kurt

In [None]:
import seaborn as sns

ax = sns.distplot(data, bins=500, kde=False, color='blue')
ax.set(xlabel='Distribucion normal estandar', ylabel='Frecuencia')
ax.set_title(label='Distribucion normal')
ax.axvline(x=mean, linestyle='--', label='Media')
ax.legend()

## Distribución uniforme

Distribución uniforme: se utiliza generalmente en el ámbito de simulación, por ejemplo “creación” de escenarios aleatorios, números aleatorios, etc.

La distribución uniforme continua o distribución rectangular es una familia de distribuciones de probabilidad simétricas de modo que para cada miembro de la familia, todos los intervalos de la misma longitud en el apoyo de la distribución son igualmente probables.

![uniforme](https://wikimedia.org/api/rest_v1/media/math/render/svg/b701524dbfea89ed90316dbc48c5b62954d7411c)


[Distribucion de Uniforme en qwe wiki](https://es.qwe.wiki/wiki/Uniform_distribution_(continuous))

[Distribucion de Normal en scipy.stats - Documentacion](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.uniform.html#scipy.stats.uniform)


In [None]:
from scipy.stats import uniform

data = uniform.rvs(size = 100000000) # Generamos el experimento de forma aleatoria con .rvs()

# Cantidad de valores de la muestra. Media, varianza, simetria, curtosis
mean, var, skew, kurt = uniform.stats(moments='mvsk')
len(data), mean, var, skew, kurt

In [None]:
import seaborn as sns

ax = sns.distplot(data, bins=500, kde=False, color='blue')
ax.set(xlabel='Distribucion uniforme', ylabel='Frecuencia')
ax.set_title(label='Distribucion uniforme')
ax.axvline(x=mean, linestyle='--', label='Media')
ax.legend()

Las formas funcionales de las distribuciones que acabamos de analizar nos permiten entender que zonas de la distribucion tienen mas disponibilidad.