# Módulo: Distribuciones de Probabilidad
## Distribución de probabilidad continua uniforme
## Distribución de probabilidad continua normal
## Distribución de probabilidad continua chi cuadrada

# Objetivos de la clase

Conocer, comprender y realizar cálculos con algunas distribuciones de probabilidad discreta específicas:
- Distribución binomial
- Distribución hipergeométrica
- Distribución de Poisson


# Distribución de probabilidad continua uniforme


## Descripción
Se trata de una función de densidad "plana", es decir, la probabilidad se reparte uniformemente en todo el rango de la variable aleatoria continua

<center>
    <img src="figures/uniform-2.gif" width="500"/>
</center>

Sea $X$ una variable aleatoria continua en el intervalo $[A,B]$. Si la variable tiene una distribución uniforme, entonces su función de densidad es:

\begin{split}
    f(x) = \Bigg\{
    \begin{array}{ c c }
    \frac{1}{B-A},  & \quad \textrm{if } A \leq x \leq B \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

<center>
    <img src="figures/uniform-1.png" width="500"/>
</center>

## Algunas propiedades
a) La media de la distribución uniforme es:

\begin{align}
    \mu = \frac{A+B}{2}
\end{align}

b) La varianza de la distribución uniforme es:

\begin{align}
    \sigma^{2} = \frac{(B-A)^2}{12}
\end{align}

# Distribución de probabilidad continua normal


## Motivación
Es la distribución de probabilidad más importante en todo el campo de la estadística.

La distribución normal describe de manera aproximada muchos fenómenos de la naturaleza, industria e investigación.

También se conoce como distribución gaussiana en honor a Karl Friedrich Gauss.

<center>
    <img src="figures/normal-1.png" width="500"/>
</center>


Algunas variables que siguen aproximadamente una distribución normal:
- La altura de la población
- Las notas de un grupo de estudiantes
- Errores de instrumentos de medición
- La presión sanguinea

<center>
    <img src="figures/normal-2.png" width="700"/>
</center>
    

## Distribución normal
Una variable aleatoria continua $X$ que sigue una distribución normal se llama variable aleatoria normal.

Su distribución de probabilidad depende únicamente de su media $\mu$ y su desviación estándar $\sigma$.

Su función de densidad se denota $n(x; \mu, \sigma)$ y es igual a:

\begin{align}
    n(x; \mu, \sigma) = \frac{1}{\sqrt{2 \pi \sigma}} \text{exp} \left(- \frac{1}{2 \sigma^2} (x-\mu)^2  \right), \quad -\infty < x < \infty
\end{align}

**Curvas normales para diferentes $\mu$ y $\sigma$:**
<center>
    <img src="figures/normal-4.png" width="1000"/>
</center>

**Propiedades de la curva normal**:
1. La moda, correspondiente al punto máximo de la curva, ocurre en $x = \mu$
2. La curva es simétrica con respecto a un eje vertical a través de la media $\mu$
3. La curva tiene puntos de inflexión en $x = \mu \pm \sigma$
4. Se aproxima de manera asintótica al eje horizontal para ambos lados
5. El área entre la curva y el eje horizontal es igual a uno

## Cálculo de probabilidades

Como para cualquier función de densidad, el área bajo la curva en cierto rango representa la probabilidad que la variable tome un valor dentro de ese rango.

\begin{align}
    P(x_1 < X < x_2) = \int_{x_1}^{x_2} n(x; \mu, \sigma) dx = \frac{1}{\sqrt{2 \pi \sigma}} \int_{x_1}^{x_2}  \text{exp} \left(- \frac{1}{2 \sigma^2} (x-\mu)^2  \right) dx
\end{align}

<center>
    <img src="figures/normal-5.png" width="500"/>
</center>

Ya que la integral no es trivial de resolver, se suelen calcular las probabilidades mediante un cambio de variables y el uso de tablas estandarizadas.

Se define la variable aleatoria normal $Z$ con media $\mu=0$ y desviación estándar $\sigma = 1$ como sigue:

\begin{align}
    Z = \frac{X-\mu}{\sigma}
\end{align}

De esta forma la integral queda así:

\begin{align}
    P(x_1 < X < x_2) = \frac{1}{\sqrt{2 \pi}} \int_{z_1}^{z_2}  \text{exp} \left(- \frac{1}{2} z^2  \right) dz = \int_{z_1}^{z_2}  n(z;0,1) dz
\end{align}

La distribución $n(z;0,1)$ se conoce como **distribución normal estándar** y sus valores de área bajo la curva (probabilidad) se puede obtener desde tablas. Por lo tanto:

\begin{align}
    P(x_1 < X < x_2) = P(z_1 < Z < z_2)
\end{align}


**Ejemplo**: La siguiente tabla muestra áreas bajo la curva de la distribución normal estándar en el rango $(-\infty, z)$, donde la columna corresponde a la unidad y décima de $z$ y la fila corresponde a la centésima.

<center>
    <img src="figures/norm-table-3.png" width="1000"/>
</center>

La probabilidad que $z \in [0.2, 0.41]$ sería igual a:

\begin{align}
    P(0.2 < Z < 0.41) = P(Z < 0.41) - P(Z < 0.2) = 0.6591 - 0.5793 = 0.0798
\end{align}




**Ejemplo**: Dada una variable aleatoria $X$ que tiene distribución normal con $\mu = 50$ y $\sigma = 10$, calcular la probabilidad que $X$ tome un valor entre 45 y 62.

Primero expresamos los valores de $X$ en función una variable normal estándar $Z$ como sigue:

\begin{align}
    z_1 & = \frac{45-50}{10}=-0.5 &
    z_2 & = \frac{62-50}{10}=1.2
\end{align}

Por lo tanto se cumple que:

\begin{align}
    P(45 < X < 62) = P(-0.5 < Z < 1.2)
\end{align}

Vamos a revisar las tablas de valores para los valores de $Z$ que se requieren:

<center>
    <img src="figures/norm-table-5.png" width="900"/>
</center>

Observamos que $P(Z<-0.5) = 0.3085$ y que $P(Z<1.2) = 0.8849$

Por lo tanto:

\begin{align}
    P(-0.5 < Z < 1.2) = P(Z<1.2) - P(Z<-0.5) = 0.8849 - 0.3085 = 0.5764
\end{align}

Es decir, para la variable original $X$ se tiene que:

\begin{align}
    P(45 < X < 62) = P(-0.5 < Z < 1.2) = 0.5764
\end{align}
