# Sesi√≥n 3 A

## 1. Repaso de probabilidad (parte 2A)

### 1.1. Variables aleatorias

Las variables aleatorias son funciones que asignan un valor num√©rico a cada resultado de un experimento aleatorio. Se clasifican en dos tipos:

* **Variables aleatorias discretas**
* **Variables aleatorias continuas**

#### Variables aleatorias discretas

```{admonition} Definici√≥n
:class: note

Sea $\Omega$ un espacio muestral discreto, es decir, un conjunto finito o numerable de posibles resultados de un experimento aleatorio.

Una variable aleatoria discreta es una funci√≥n que asigna un n√∫mero real a cada elemento de $\Omega$:

$$
X: \Omega \to \mathbb{R}
$$

Es decir, toma un resultado del experimento aleatorio y lo traduce a un n√∫mero real que nos interesa analizar o interpretar.
```

##### ¬øpor qu√© usamos variables aleatorias?

Cuando trabajamos con variables aleatorias, no nos enfocamos directamente en los resultados del experimento (como obtener un 3 y un 5 al lanzar dos datos), sino en _alguna cantidad derivada_ de esos resultados: una suma, una ganacia, un conteo, etc.

Esto nos permite:

- Modelar situaciones de forma num√©rica.
- Usar herramientas matem√°ticas para analizar fen√≥menos aleatorios.
- Calcular cantidades como la probabilidad de √©xito, el valor esperado o la variabilidad de un resultado.

**Ejemplo**

Supongamos que lanzamos dos dados. El espacio mestral es:

$$
\Omega = \{(i,j): i,j=1, 2, \dots, 6\}.
$$

Este conjunto tiene 36 posibles pares ordenados, y si los dados son justos, cada uno tiene la misma probabilidad:

$$p(i, j) = \frac{1}{36}$$

Ahora, supongamos el siguiente juego:

- Ganas $500 si la suma de los datos es 7.
- Pierdes $100 en cualquier otro caso.

Podemos **definir una variable aleatoria discreta $X(i, j)$** que represente la ganacia del juego:

$$
X(i,j) = \left\lbrace
\begin{array}{lc}
500  &  \text{si } i+j=7 \\
-100 &  \text{si } i+j\neq7
\end{array}
\right .
$$

```{admonition} Interpretaci√≥n
:class: tip

Esta **variable aleatoria** convierte los resultados del experimento (el lanzamiento de los dados) en una cantidad que nos interesa: la ganancia o p√©rdida en el juego.

As√≠, en lugar de analizar directamente los pares $(i, j)$, analizamos el _comportamiento_ de $X$, que ya resume lo que queremos estudiar.
```

#### 1.1.1. Funci√≥n de _masa_ de probabilidad (PMF)

Una vez que tenemos una variable aleatoria discreta $X$, queremos saber con qu√© probabilidad toma cada uno de sus posibles valores.

Para eso usamos la funci√≥n de masa de probabilidad o PMF _(Probability Mass Function)_.

##### ¬øqu√© hace la PMF?

La PMF asigna una probabilidad a cada valor posible que puede tomar la variable aleatoria.

En otras palabras:

> La PMF mapea cada valor real que puede tomar $X$ al n√∫mero entre 0 y 1 que representa su **probabilidad**.

![](../images/PMF.png)

Consideramos el tiro de un solo dado. El dado est√° cargado, de modo que solo salen los valores $1$, $5$ y $6$, y de modo que la funci√≥n de probabilidad sea:


$$
f(X) = \left\{\begin{array}{cc }0.3 & X=1 \\ 0.3 & X=5 \\ 0.4 & X=6\end{array}\right.
$$

```{thebe-button}
```

In [None]:
#from scipy import stats
#from matplotlib import pyplot as plt
#import numpy as np

In [None]:
# definir listas de valores de X y probabilidades

In [None]:
# se define una variable aleatoria discreta

In [None]:
# Grafico: PMF

#### 1.1.2. Funci√≥n de distribuci√≥n acumulada (CDF)

La funci√≥n de distribuci√≥n acumulada ‚Äîconocida como CDF _(Cumulative Distribution Function)_‚Äî es una forma alternativa de describir una variable aleatoria discreta $X$.

##### ¬øqu√© hace la CDF?

La CDF asigna a cada valor $x$ la probabilidad de que la variable aleatoria $X$ tome un valor **menor o igual** a $x$.


![](../images/CMF.png)

```{admonition} Propiedades de la CDF
:class: note

- $F(x)$ es **mon√≥tona no decreciente**: nunca baja.

- $0 \leq F(x) \leq 1$.

- $\lim_{x \to \infty} F(x) = 1$.

- $\lim_{x \to -\infty} F(x) = 0$.
```

Como tabla, siguiendo el ejemplo de los dados:

$$
F(X) = p(X \leq x).
$$

| x      | 1   | 2   | 3   | 4   | 5   | 6   |
| ------ | --- | --- | --- | --- | --- | --- |
| p(X=x) | 0.3 | 0   | 0   | 0   | 0.3 | 0.4 |
| F(x)   | 0.3 | 0.3 | 0.3 | 0.3 | 0.6 | 1   |

In [None]:
# Grafico: CDF

```{admonition} OJO
:class: warning

Es f√°cil notar que:

- $(0 \leq p(a) \leq 1)$
- $(x)$ puede ser cualquier n√∫mero. Si $(x)$ es un valor que $(X)$ nunca toma, entonces $(p(x) = 0)$.

üî∏ La **primera afirmaci√≥n aplica tanto para la PMF como para la CDF**:
Ambas funciones siempre devuelven valores entre 0 y 1.

üî∏ La **segunda afirmaci√≥n aplica solo para la PMF**:
La CDF $(F(x) = \mathbb{P}(X \leq x))$ puede ser mayor que 0 incluso si $(X)$ nunca toma el valor exacto $(x)$, porque **acumula** las probabilidades de los valores menores o iguales a $(x)$.
```

Recapitulando, tenemos:

| **Concepto**            | **Palabra clave**           | **¬øQu√© representa?**                              |
| ----------------------- | --------------------------- | ------------------------------------------------- |
| Espacio muestral        | ‚ÄúTodo lo posible y medible‚Äù | Todas las salidas del experimento                 |
| Funci√≥n de probabilidad | ‚ÄúPeso‚Äù                      | Cu√°n probable es cada resultado                   |
| Variable aleatoria      | ‚ÄúTraducci√≥n‚Äù                | Asocia un n√∫mero a cada resultado del experimento |
| Distribuci√≥n            | ‚ÄúComportamiento‚Äù            | C√≥mo se reparten los valores que genera $(X)$     |

### 1.2. Distribuciones de probabilidad discretas

#### 1.2.1. Distribuci√≥n de Bernoulli

**Qu√© modela:**

Un solo experimento con dos posibles resultados: √©xito (1) o fracaso (0).

**Ejemplo:**

Tirar una moneda una vez:

- Cara = 1 (√©xito)
- Cruz = 0 (fracaso)

**Par√°metros:**
$\theta \in [0, 1]$ es la probabilidad de √©xito.

Se denota como:

$$
X \sim \text{Bernoulli}(\theta)
$$

In [None]:
# Variable aleatoria de Bernoulli

In [None]:
# Grafico: PMF

In [None]:
# Grafico: CDF

#### 1.2.2. Distribuci√≥n Binomial

**Qu√© modela:**
El n√∫mero total de √©xitos en $n$ experimentos independientes de Bernoulli.

**Ejemplo:**
Tirar una moneda $n$ veces y contar cu√°ntas veces sale cara.

**Par√°metros:**

- $n$: n√∫mero de ensayos
- $\theta$: probabilidad de √©xito en cada ensayo

Se denota como:

$$
X \sim \text{Binomial}(n, \theta)
$$

La pmf de una distribuci√≥n binomial es:

$$
p(a) = \left(\begin{array}{c}n \\ a \end{array}\right) \theta^a (1 - \theta)^{n-a}
$$

Si hacemos $n=1$, $\text{Binomial}(1, \theta) = \text{Bernoulli}(\theta)$.

In [None]:
# Variable aleatoria binomial

In [None]:
# Grafico: PMF


In [None]:
# Grafico: CDF


#### 1.2.3 Distribuci√≥n Geom√©trica

**Qu√© modela:**
El n√∫mero de ensayos hasta obtener el primer √©xito (incluyendo ese √©xito).

**Ejemplo:**
Tirar una moneda hasta que salga cara por primera vez.
Si sale cara en el tercer intento, $X=3$.

**Par√°metros:**
$\theta$: probabilidad de √©xito en cada intento.

Se denota como:

$$
X \sim \text{Geometric}(\theta)
$$

La VA $X$ sigue una distribuci√≥n geom√©trica con par√°metro $\theta$ si,

- $X$ toma los valores $1, 2, 3, \dots$
- Su pmf est√° dada por $p(a) = \theta (1 - \theta)^{a - 1}$.

La denotamos como $Geom(\theta)$.

In [None]:
# Variables aleatorias Geom√©tricas

In [None]:
# Grafico: PMF

In [None]:
# Grafico: CDF

### 1.3. Valor esperado y varianza (discretas)

#### 1.3.1. Esperanza

Antes de definirla formalmente, es importante notar que el valor esperado no solo se aplica a la variable aleatoria en s√≠, sino tambi√©n a **cualquier funci√≥n de la variable**. Es decir, podemos calcular el valor esperado de $f(X)$, donde $(f)$ es una funci√≥n que transforma los valores de la variable aleatoria.

Esto permite, por ejemplo, obtener cantidades como:

- la varianza: $\mathbb{E}[X^2]$
- la utilidad esperada: $\mathbb{E}[\log X]$
- el valor esperado de p√©rdidas u otras m√©tricas de inter√©s

Este enfoque m√°s general se expresa como:

$$
\mathbb{E}[f(X)] = \sum_x p(x) \cdot f(x)
$$

Y si tomamos $f(x) = x$, recuperamos la forma m√°s com√∫n del valor esperado:

$$
\mathbb{E}[X] = \sum_x p(x) \cdot x
$$

#### 1.3.2. Varianza

El valor esperado es una _medida de tendencia central_, en el sentido de que nos da un valor promedio, o ‚Äúcentro de gravedad‚Äù probabil√≠stico, hacia el cual tienden los datos al repetirse el experimento muchas veces.

Sin embargo, **no nos dice qu√© tan dispersos est√°n los valores alrededor de ese promedio**. Para eso, necesitamos una medida de variabilidad: la **varianza**.

La varianza de una funci√≥n $f(X)$, denotada como $\mathrm{var}_p[f]$, se define como:

$$
\mathrm{var}_p[f] = \mathbb{E}_p\left[(f(x) - \mathbb{E}_p[f])^2\right]
$$

Esta expresi√≥n se interpreta como el **promedio ponderado de los cuadrados de las desviaciones** entre los valores de $f(x)$ y su esperanza. En otras palabras: mide **cu√°nto var√≠an los valores alrededor de su media**.

Una forma algebraicamente m√°s sencilla y muy √∫til para calcular la varianza es:

$$
\mathrm{var}_p[f] = \mathbb{E}_p[f(x)^2] - \left(\mathbb{E}_p[f]\right)^2
$$

Esta f√≥rmula permite calcular la varianza a partir de **dos esperanzas**:

- La esperanza del cuadrado de $f(x)$
- El cuadrado de la esperanza de $f(x)$

#### 1.3.3. C√°lculo de esperanza y varianza de variable aleatoria Bernoulli

Sea $X$ una variable aleatoria que toma valores en el conjunto $\{0, 1\}$. Se denota como:

![Distribuci√≥n Bernoulli](../images/bernulli-1.png)

- En **verde**, se resalta la probabilidad $P(X = 1) = \theta$.
- En **azul**, se muestra que $P(X = 0) = 1 - \theta$.

## Esperanza de una variable Bernoulli

La esperanza matem√°tica o valor esperado de $X$ se define como:

![Esperanza de X](../images/bernulli-2.png)

- Los t√©rminos en **azul** y **verde** ayudan a identificar qu√© probabilidad corresponde a cada valor posible de $X$.
- El resultado final, $\mathbb{E}[X] = \theta$, est√° **enmarcado en morado** para destacarlo.

##### A) Esperanza de $X^2$

Dado que los √∫nicos valores posibles de $X$ son 0 y 1, se cumple que $X^2 = X$. Por lo tanto:

![Esperanza de X al cuadrado](../images/bernulli-3.png)

- Esta igualdad se debe a que $0^2 = 0$ y $1^2 = 1$, as√≠ que no hay cambio al elevar al cuadrado.


##### B) Varianza de una variable Bernoulli

La varianza se calcula con la f√≥rmula:

![Varianza de X](../images/bernulli-4.png)

- Se utiliza el resultado anterior $\mathbb{E}[X] = \theta$.
- El desarrollo muestra c√≥mo se simplifica la f√≥rmula hasta obtener $\theta(1 - \theta)$, que aparece resaltado al final.


##### Ejemplo num√©rico

**Ejemplo 1.** Suponemos que tenemos un dado justo con cinco 3's y un 6. ¬øCu√°l esperar√≠a que fuera el promedio de 6000 tiros?

In [None]:
#x_vals = [3, 6]
#probs = [5/6, 1/6]

# X1 (crear la variable aleatoria discreta)

# Calcular la esperanza (valor esperado)


In [None]:
#X1.rvs(size=100)

In [None]:
# Muestreamos la variable aleatoria

# Obtenemos el promedio a medida que vamos obteniendo m√°s muestras

# Graficamos


In [None]:
# Varianza X1


**Ejemplo 2.** Se tiran dos dados de seis caras. Si ganas $1000 si la suma es 2, y pierdes $100 de otro modo, ¬øCu√°nto esperas ganar en promedio por tiro?

In [None]:
# X2


# Valor esperado te√≥rico


In [None]:
# Muestreamos la variable aleatoria

# Obtenemos el promedio a medida que vamos obteniendo m√°s muestras

# Graficamos


In [None]:
# Varianza X2


Si queremos una medida que nos de un sentido de dispersi√≥n en las "mismas unidades" de la variable aleatoria, podemos acudir a la desviaci√≥n est√°ndar, que se define como:

$$
\text{std}_p[f] = \sqrt{\text{var}_p[f]}
$$

In [None]:
# STD de X1 y X2

```{admonition} Actividad de integraci√≥n
:class: tip

Genera una funci√≥n que nos permita calcular la esperanza y la varianza de una variable aleatoria discreta, dada su PMF. Utiliza esta funci√≥n para calcular la esperanza y varianza de las siguientes distribuciones:

- Distribuci√≥n Bernoulli con $\theta = 0.3$.
- Distribuci√≥n Binomial con $n = 10$ y $\theta = 0.3
- Distribuci√≥n Geom√©trica con $\theta = 0.3$.
```

In [None]:
# Bernoulli

In [None]:
# Binomial

In [None]:
# Geom√©trica

##### üí° Pregunta: en lo anterior, _¬øestamos usando datos para generar el c√°lculo?_