# Módulo: Distribuciones de Probabilidad
## T5a: Valor esperado

# Objetivos de la clase
- Comprender el concepto de valor esperado o esperanza matemática.
- Aplicar este concepto al cálculo de medias y varianzas.


# Valor esperado

## Motivación

Consideramos el experimento de lanzar un dado. ¿Cuál sería el promedio de los números obtenidos luego de infinitos lanzamientos?

<center>
    <img src="figures/dice-roll-3.jpg" width="300"/>
</center>

El espacio muestral es: $S = \{1, 2, 3, 4, 5, 6 \}$

Intuitivamente podríamos predecir que el promedio de infinitos lanzamientos es:

\begin{align}
    \frac{1+2+3+4+5+6}{6} = 3.5
\end{align}



¿Cambiaría este valor si el dado estuviera cargado y tuviera el doble de probabilidad de salir 6 en vez de los otros números?

<center>
    <img src="figures/trick-dice-1.jpg" width="200"/>
</center>

El espacio muestral se mantiene, pero las distintas probabilidades harían que el promedio cambie luego de infinitos lanzamientos

## Definición
La **esperanza matemática**, también llamada **valor esperado** o **media poblacional** de una variable aleatoria $X$ es el concepto que generaliza la idea de valor medio (o promedio) de un fenómeno aleatorio.

Matemáticamente, el valor esperado de la variable discreta $X$ es:

\begin{align}
    \mu = E[X] = \sum_{x} x f(x)
\end{align}

Y para el caso de una variable continua $X$ es:

\begin{align}
    \mu = E[X] = \int_{-\infty}^{\infty} x f(x) dx
\end{align}

**Ejemplo**: ¿Cuál sería el valor esperado de lanzar el dado cargado anterior un número infinito de veces?

Las probabilidades deben sumar 1 y hay el doble de probabilidad de lanzar 6 que los otros números. Entonces:

\begin{align}
    w + w + w + w + w + 2w = 1
\end{align}

\begin{align}
    w = \frac{1}{7}
\end{align}

El valor esperado sería:

\begin{align}
    \mu = E[X] = 1 \left( \frac{1}{7} \right) + 2 \left( \frac{1}{7} \right) + 3 \left( \frac{1}{7} \right) + 4 \left( \frac{1}{7} \right) + 5 \left( \frac{1}{7} \right) + 6 \left( \frac{2}{7} \right) \approx 3.86
\end{align}

In [7]:
import numpy as np

def roll(prob):    
    return np.random.choice(a=[1, 2, 3, 4, 5, 6], p=prob)

def simulate(n, prob):
    trials = [roll(prob) for i in range(n)]
    return print( np.mean(trials) )

simulate(100, [1/6, 1/6, 1/6, 1/6, 1/6, 1/6])

#simulate(100, [1/7, 1/7, 1/7, 1/7, 1/7, 2/7])

3.5


**Ejemplo**: Sea $X$ la variable aleatoria que denota la vida en horas de un dispositivo electrónico. Suponga que tiene la siguiente función de densidad:

\begin{split}
    f(x) = \Bigg\{
    \begin{array}{ c c }
    \frac{20000}{x^3},  & \quad \textrm{if } x > 100 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

¿Cuál sería la vida esperada (o media poblacional) para este dispositivo electrónico?

\begin{align}
    \mu = E[X] = \int_{100}^{\infty} x \frac{20000}{x^3} dx = \frac{-20000}{x} = \Big|_{100}^{\infty} = 200
\end{align}

# Varianza generalizada

## Cálculo varianza
Así como el valor esperado representa una generalización de la media para una variable aleatoria, también es posible introducir el concepto de probabilidad para los cálculos de medidas de variabilidad.

De esta forma, se define la varianza de la variable discreta $X$ como:

\begin{align}
    \sigma^{2} = E[(X-\mu)^2] = \sum_{x} (x-\mu)^2 f(x)
\end{align}

Y la varianza para la variable continua $X$ como:

\begin{align}
    \sigma^{2} = E[(X-\mu)^2] = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx
\end{align}

La desviación estándar ($\sigma$) corresponde a la raiz cuadrada positiva de la varianza.

\begin{align}
    \sigma = +\sqrt{ \sigma^2 }
\end{align}

Además, se puede demostrar el siguiente teorema para la variable aleatoria $X$:

\begin{align}
    \sigma^2 = E[X^2] - \mu^2 
\end{align}

# Ejercicio
La tasa de aprobación $X$ de un examen viene dada por la función de densidad $f(x)$. Se pide calcular la desviación estándar de $X$.

\begin{split}
    f(x) = \Bigg\{
    \begin{array}{ c c }
    2x,  & \quad \textrm{if } 0 \leq x \leq 1 \\
    0,                & \quad \textrm{elsewhere}
  \end{array}
\end{split}

Primero calculamos el valor esperado:

\begin{align}
    \mu = E[X] = \int_{-\infty}^{\infty} x f(x) dx = \int_{0}^{1} 2x^2 dx = \frac{2}{3} \approx 0.667
\end{align}



Ahora calculamos la varianza:

\begin{align}
    \sigma^{2} = E[(X-\mu)^2] = \int_{0}^{1} (x- \frac{2}{3} )^2 2x dx = \frac{1}{18}
\end{align}

Finalmente la desviación estándar es:

\begin{align}
    \sigma = \sqrt{\frac{1}{18}} \approx 0.236
\end{align}


# Sumario
- La esperanza matemática es el concepto que ayuda a generalizar los cálculos de media y varianza considerando las distribuciones de probabilidad.
- Usando esto, podemos aproximar de mejor manera las medidas de tendencia central y variabilidad para una población si conocemos las distribuciones de probabilidad.