# Módulo: Distribuciones de Probabilidad
## Esperanza matemática
## Cálculo de valores esperados y varianzas

# Objetivos de la clase
- Comprender el concepto de esperanza matemática.
- Aplicar este concepto al cálculo de los valores esperados y varianzas.
- Aplicar el mismo concepto al cálculo bivariado de covarianzas y coeficiente de correlación.

# Valor esperado

## Motivación

Consideramos el experimento de lanzar un dado. ¿Cuál sería el promedio de los números obtenidos luego de infinitos lanzamientos?

<center>
    <img src="figures/dice-roll-3.jpg" width="300"/>
</center>

El espacio muestral es: $S = \{1, 2, 3, 4, 5, 6 \}$

Intuitivamente podríamos predecir que el promedio de infinitos lanzamientos es:

\begin{align}
    \frac{1+2+3+4+5+6}{6} = 3.5
\end{align}



¿Cambiaría este valor si el dado estuviera cargado y tuviera el doble de probabilidad de salir 6 en vez de los otros números?

<center>
    <img src="figures/trick-dice-1.jpg" width="200"/>
</center>

El espacio muestral se mantiene, pero las distintas probabilidades harían que el promedio cambie luego de infinitos lanzamientos

## Definición
La **esperanza matemática**, también llamada **valor esperado** o **media poblacional** de una variable aleatoria $X$ es el concepto que generaliza la idea de valor medio (o promedio) de un fenómeno aleatorio.

Matemáticamente, el valor esperado de la variable discreta $X$ es:

\begin{align}
    \mu = E[X] = \sum_{x} x f(x)
\end{align}

Y para el caso de una variable continua $X$ es:

\begin{align}
    \mu = E[X] = \int_{-\infty}^{\infty} x f(x) dx
\end{align}

**Ejemplo**: ¿Cuál sería el valor esperado de lanzar el dado cargado anterior un número infinito de veces?

Las probabilidades deben sumar 1 y hay el doble de probabilidad de lanzar 6 que los otros números. Entonces:

\begin{align}
    w + w + w + w + w + 2w = 1
\end{align}

\begin{align}
    w = \frac{1}{7}
\end{align}

El valor esperado sería:

\begin{align}
    \mu = E[X] = 1 \left( \frac{1}{7} \right) + 2 \left( \frac{1}{7} \right) + 3 \left( \frac{1}{7} \right) + 4 \left( \frac{1}{7} \right) + 5 \left( \frac{1}{7} \right) + 6 \left( \frac{2}{7} \right) \approx 3.86
\end{align}

In [1]:
import numpy as np

def roll(prob):    
    return np.random.choice(a=[1, 2, 3, 4, 5, 6], p=prob)

def simulate(n, prob):
    trials = [roll(prob) for i in range(n)]
    return print( np.sum(trials)/n )

simulate(100, [1/6, 1/6, 1/6, 1/6, 1/6, 1/6])

#simulate(100, [1/7, 1/7, 1/7, 1/7, 1/7, 2/7])

3.55


**Ejemplo**: Sea $X$ la variable aleatoria que denota la vida en horas de un dispositivo electrónico. Suponga que tiene la siguiente función de densidad:

\begin{split}
    f(x) = \Bigg\{
    \begin{array}{ c c }
    \frac{20000}{x^3},  & \quad \textrm{if } x > 100 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

¿Cuál sería la vida esperada (o media poblacional) para este dispositivo electrónico?

\begin{align}
    \mu = E[X] = \int_{100}^{\infty} x \frac{20000}{x^3} dx = \frac{-20000}{x} = \Big|_{100}^{\infty} = 200
\end{align}

# Varianza y Covarianza

## Cálculo varianza
Así como el valor esperado representa una generalización de la media para una variable aleatoria, también es posible introducir el concepto de probabilidad para los cálculos de medidas de variabilidad.

De esta forma, se define la varianza de la variable discreta $X$ como:

\begin{align}
    \sigma^{2} = E[(X-\mu)^2] = \sum_{x} (x-\mu)^2 f(x)
\end{align}

Y la varianza para la variable continua $X$ como:

\begin{align}
    \sigma^{2} = E[(X-\mu)^2] = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx
\end{align}

La desviación estándar ($\sigma$) corresponde a la raiz cuadrada positiva de la varianza.

\begin{align}
    \sigma = +\sqrt{ \sigma^2 }
\end{align}

Además, se puede demostrar el siguiente teorema para la variable aleatoria $X$:

\begin{align}
    \sigma^2 = E[X^2] - \mu^2 
\end{align}

## Cálculo covarianza

Para el caso del análisis bivariado, supongamos que estudiamos la variación conjunta de 2 variables aleatorias $X$ e $Y$ con distribución conjunta $f(x,y)$.

Se puede generalizar el cálculo de la covarianza de la siguiente forma para el caso discreto:

\begin{align}
    \sigma_{XY} = E[(X-\mu_{X})(Y-\mu_{Y})] = \sum_{x} \sum_{y} (x-\mu_{X}) (y-\mu_{Y}) f(x,y)
\end{align}

Y de la siguiente forma para el caso continuo:

\begin{align}
    \sigma_{XY} = E[(X-\mu_{X})(Y-\mu_{Y})] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} (x-\mu_{X}) (y-\mu_{Y}) f(x,y) dx dy
\end{align}

Análogo al caso unidimensional, se puede demostrar el siguiente teorema para las variables aleatorias $X$ e $Y$:

\begin{align}
    \sigma_{XY} = E[XY] - \mu_{X}\mu_{Y}
\end{align}

Además, se define el **coeficiente de correlación** (Pearson) entre las variables aleatorias $X$ e $Y$ como sigue:

\begin{align}
    \rho_{XY} = \frac{\sigma_{XY}}{\sigma_{X} \sigma_{Y}}
\end{align}

Este coeficiente mide el grado de correlación lineal entre ambas variables y toma valores entre -1 y 1 (cómo vimos anteriormente en clases)

Para el cálculo del valor esperado $E[XY]$ podemos usar la siguiente propiedad:

Siendo $X$ e $Y$ variables aleatorias discretas con distribución de probabilidad conjunta $f(x,y)$, el valor esperado de la variable aleatoria $Z = r(x,y)$ es:

\begin{align}
    E[Z] = E[r(x,y)] = \sum_{x} \sum_{y} r(x,y) f(x,y)
\end{align}

Y para el caso de variables aleatorias continuas:

\begin{align}
    E[Z] = E[r(x,y)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} r(x,y) f(x,y) dx dy
\end{align}


# Ejercicio
La fracción $X$ de corredores y la fracción $Y$ de corredoras que compiten en un maratón vienen dadas por la función de densidad conjunta $f(x,y)$. Se pide calcular la covarianza de $X$ e $Y$.

\begin{split}
    f(x) = \Bigg\{
    \begin{array}{ c c }
    8xy,  & \quad \textrm{if } 0 \leq y \leq x \leq 1 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

Primero calculamos las funciones de densidad marginal:

\begin{split}
    g(x) = \int_{-\infty}^{\infty} f(x,y) dy =  \Bigg\{
    \begin{array}{ c c }
    4x^3,  & \quad \textrm{if } 0 \leq x \leq 1 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}



\begin{split}
    h(y) = \int_{-\infty}^{\infty} f(x,y) dx =  \Bigg\{
    \begin{array}{ c c }
    4y(1-y^2),  & \quad \textrm{if } 0 \leq y \leq 1 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

Ahora podemos calcular los valores esperados para cada variable:

\begin{align}
    \mu_{X} = E[X] = \int_{-\infty}^{\infty} x g(x) dx = \int_{0}^{1} 4x^4 dx = \frac{4}{5}
\end{align}

\begin{align}
    \mu_{Y} = E[Y] = \int_{-\infty}^{\infty} y h(y) dy = \int_{0}^{1} 4y(1-y^2) dy = \frac{8}{15}
\end{align}




Para el cálculo de la covarianza podemos emplear el valor esperado de la variable conjunta $r(x,y) = XY$:

\begin{align}
    E[XY] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} r(x,y) f(x,y) dx dy = \int_{0}^{1} \int_{y}^{1} xy \cdot 8xy \cdot dx dy = \frac{4}{9}
\end{align}

Finalmente la covarianza entre las variables $X$ e $Y$ se calcula de la siguiente forma:

\begin{align}
    \sigma_{XY} = E[XY] - \mu_{X}\mu_{Y} = \frac{4}{9} - \left( \frac{4}{5} \right) \left( \frac{8}{15} \right)= \frac{4}{225}
\end{align}

# Sumario
- La esperanza matemática es el concepto que ayuda a generalizar los cálculos de media y varianza considerando las distribuciones de probabilidad.
- Usando esto, podemos aproximar de mejor manera las medidas de tendencia central y variabilidad para una población si conocemos las distribuciones de probabilidad.