# Interpretaciones de la probabilidad

## 1.1. ¬øqu√© representa una probabilidad?

Ya sabemos qu√© es una _funci√≥n de probabilidad_ y c√≥mo puede _distribuirse_ sobre un espacio muestral. Es importante notar que, en este punto, la _probabilidad_ es un objeto estrictamente matem√°tico, cuya definici√≥n est√° separada del proceso mediante el cual se asignan probabilidades a los eventos.

Pero surge una pregunta fundamental:

> **¬øC√≥mo se asignan o calculan esos valores de probabilidad en la pr√°ctica?**

La respuesta depende de la **interpretaci√≥n** que adoptemos sobre qu√© representa una probabilidad en un contexto real.

A continuaci√≥n, exploramos dos de las interpretaciones m√°s influyentes y ampliamente utilizadas: la **frecuentista** y la **bayesiana**.

## 1.2. Enfoque frecuentista: medir por repetici√≥n

> Si repetimos un experimento muchas veces, el cociente entre el n√∫mero de veces que ocurre un evento y el total de repeticiones se usa como una estimaci√≥n de su probabilidad. Este valor es lo que se conoce como la _frecuencia relativa_.

Este valor se llama _frecuencia relativa_ del evento:

$$\mathbb{P}(A) \approx \frac{\#A}{n}$$

A medida que el n√∫mero de experimentos crece, esta frecuencia relativa tiende (bajo ciertas condiciones) a estabilizarse en un valor fijo. Este valor es interpretado como la **probabilidad** del evento desde el punto de vista _frecuentista_.

```{admonition} Frecuencia relativa
:class: attention

La **frecuencia relativa** es el cociente entre el n√∫mero de veces que ocurre un evento y el n√∫mero total de repeticiones del experimento. En el enfoque **frecuentista**, esta proporci√≥n se interpreta como la probabilidad del evento, especialmente cuando el n√∫mero de repeticiones es grande.
```

```{admonition} Ejemplo
:class: tip

![](../images/sesion2-freq.png)

Si lanzamos una moneda 1000 veces y cae cara en 502 de ellas, entonces:

$$
\mathbb{P}(\text{cara}) \approx \frac{502}{1000} = 0.502
$$

Al aumentar el n√∫mero de repeticiones, esta estimaci√≥n se estabiliza. Podemos observar este fen√≥meno en la **Figura 3.**
```

![Convergencia de la frecuencia relativa](../images/frecuencia_relativa_frecuentista.png)

**Figura 3**. En el enfoque frecuentista, la probabilidad se interpreta como el valor al que tiende la _frecuencia relativa_ de un evento (por ejemplo, "cara" en una moneda) conforme se incrementa el n√∫mero de repeticiones del experimento.

```{admonition} ¬øEs s√≥lo una f√≥rmula?
:class: caution

Aunque el enfoque frecuentista utiliza la _frecuencia relativa_ para estimar la probabilidad, **no se reduce solamente a una f√≥rmula**.

Este enfoque implica una forma espec√≠fica de entender qu√© es una probabilidad:

1. La probabilidad de un evento se **define** como el **l√≠mite** de su _frecuencia relativa_ al repetir el experimento muchas veces.

$$\lim_{n \to \infty} \frac{\#A}{n} = \mathbb{P}(A)$$

2. Se asume que las probabilidades son **propiedades objetivas del mundo**, no creencias subjetivas.
3. No se habla de probabilidades en eventos √∫nicos o no repetibles, como ‚Äúla probabilidad de que llueva ma√±ana‚Äù.

Por tanto, el frecuentismo es una postura **matem√°tica y filos√≥fica**, no solo un m√©todo de c√°lculo.
```

> **¬øQu√© significa "variable aleatoria" en estad√≠stica frecuentista?**

Hasta ahora, posiblemente has visto que una _variable aleatoria_ es algo que usamos para modelar resultados inciertos, como lanzar un dado, medir una altura, o contar cu√°ntas veces sale cara una moneda.

Y eso es, precisamente, lo que significa en el enfoque **frecuentista**.

> Una _variable aleatoria_ representa el **resultado num√©rico** de un experimento aleatorio que se puede repetir muchas veces.

Por ejemplo, si lanzas una moneda y defines $(X = 1)$ si sale cara y $(X = 0)$ si sale cruz, entonces $(X)$ es una _variable aleatoria_.

Aqu√≠, lo aleatorio es el **resultado** del experimento, **no** el par√°metro que describe su comportamiento (como la probabilidad de que salga cara).

Desde esta perspectiva, _los par√°metros son constantes fijas, pero desconocidas_ y no se modelan con variables aleatorias.

```{admonition} Fundamento te√≥rico
:class: note

El hecho de que la frecuencia relativa se estabilice a medida que aumenta el n√∫mero de repeticiones est√° respaldado por un resultado matem√°tico conocido como la [**ley de los grandes n√∫meros**](https://es.wikipedia.org/wiki/Ley_de_los_grandes_n%C3%BAmeros).
```

## 1.3. Enfoque bayesiano: probabilidades como creencias

_¬øQu√© significa decir que algo tiene cierta probabilidad de ocurrir desde la perspectiva bayesiana?_

El enfoque bayesiano propone una forma muy intuitiva de verlo:

> La probabilidad es una medida de qu√© tanto creemos que algo es cierto, bas√°ndonos en lo que sabemos hasta ahora.

As√≠, para los bayesianos, la probabilidad no es una propiedad fija del mundo como ‚Äúla gravedad‚Äù, sino m√°s bien una forma de representar nuestra incertidumbre. Y lo m√°s importante:

> üí° Esa creencia puede cambiar si recibimos nueva informaci√≥n.

```{admonition} Ejemplo
Sup√≥n que alguien te dice:

> _"Hay probabilidad de lluvia ma√±ana"._

Esa probabilidad puede ser diferente dependiento de si:

* viste un pron√≥stico confiable,

* el cielo est√° completamente despejado,

* o escuchaste truenos a lo lejos.

Cada nueva pista _cambia tu creencia_. Y esto es justamente lo que el enfoque bayesiano busca formalizar: **c√≥mo actualizamos** nuestras creencias cuando obtenemos nueva evidencia.
```

> ¬øC√≥mo se hace esto?

La herramienta central para actualizar nuestras creencias es la **probabilidad condicional**:

$$
\mathbb{P}(A \mid B) = \frac{\mathbb{P}(A \cap B)}{\mathbb{P}(B)}
$$

Esta f√≥rmula expresa la probabilidad de que ocurra un evento $(A)$, dado que se ha observado otro evento $(B)$. La **probabilidad condicional** es el primer paso hacia un modelo bayesiano completo, ya que introduce la noci√≥n de **informaci√≥n que modifica creencias**.

```{admonition} Probabilidad condicional
:class: tip

La probabilidad condicional nos dice cu√°l es la probabilidad de que ocurra un evento $(A)$, dado que ya sabemos que ha ocurrido otro evento $(B)$.

![](../images/sesion2-probcondi.png)

Por ejemplo, la probabilidad de lluvia puede cambiar si sabemos que el cielo est√° despejado. Esta forma de actualizar creencias es esencial en el enfoque **bayesiano**.
```

Aqu√≠ es donde entra en escena el famoso **Teorema de Bayes**.

```{admonition} Teorema de Bayes: actualizaci√≥n de creencias
:class: important

El Teorema de Bayes permite **actualizar una creencia previa** cuando se incorpora nueva informaci√≥n. Se compone de tres elementos:

- **Prior**: lo que cre√≠amos antes de observar datos $(P(A))$
- **Likelihood** (verosimilitud): qu√© tan probable es observar los datos si la hip√≥tesis fuera cierta $(P(B \mid A))$
- **Posterior**: lo que creemos **despu√©s** de observar los datos $(P(A \mid B))$

![](../images/sesion2-probcondi2.png)

Este resultado es matem√°ticamente demostrable, y es la base de toda la estad√≠stica bayesiana.
```

> **¬øQu√© significa "variable aleatoria" en estad√≠stica bayesiana??**

Hasta ahora, posiblemente has visto que una variable aleatoria es algo que usamos para modelar resultados inciertos, como lanzar un dado, medir una altura, o contar cu√°ntas veces sale cara una moneda.

Pero en el mundo bayesiano, las cosas se vuelven m√°s interesantes:

> Tambi√©n usamos variables aleatorias para representar lo que no sabemos sobre un par√°metro.

Por ejemplo, imagina que est√°s tratando de averiguar cu√°l es la probabilidad $\theta$ de que una m√°quina falle en un d√≠a cualquiera.
No tienes un n√∫mero exacto, pero...

> _Creo que la m√°quina es bastante confiable, as√≠ que probablemente $\theta$ sea algo as√≠ como 0.1... pero no estoy segura"_

Aqu√≠ no est√°s hablando de un resultado aleatorio, como el lanzamiento de un dado. Est√°s hablando de tu **incertidumbre sobre un valor desconocido.**

Y eso, en bayes, se modela con una _variable aleatoria._

> **¬øY c√≥mo describimos esa incertidumbre?**

Usamos lo que se llama una **distribuci√≥n de probabilidad**, que nos dice qu√© tan probable o cre√≠ble creemos que es cada posible valor de $\theta$.

Por ejemplo:

- Si pensamos que valores peque√±os de $\theta$ (como 0.05 o 0.1) son m√°s probables, la distribuci√≥n ser√° m√°s alta en esa zona.

- Si valores como 0.8 o 0.9 nos parecen muy poco probables, la distribuci√≥n ser√° muy baja all√≠.

Esto se representa con una funci√≥n como:

$$
p_X(x)
$$

significa que:

- $(X)$: es la variable aleatoria que representa la probabilidad de un evento (como que salga cara).
- $(x)$: es un valor posible de esa probabilidad (por ejemplo, 0.7).
- $(p_X(x))$: es cu√°n cre√≠ble o probable consideramos ese valor, dada la informaci√≥n disponible.

![](../images/sesion2-bayes_prob_de_probabilidad.png)

**Figura 4.** Notaci√≥n de la funci√≥n de densidad de probabilidad: $p_X(x)$ represeta cu√°n probable o cre√≠ble creemos que es cada posible valor del par√°metro X.

En lugar de afirmar ‚Äúla probabilidad es 0.7‚Äù, el bayesiano dice: ‚Äú0.7 es plausible, pero tambi√©n lo son otros valores cercanos y esta es la distribuci√≥n que los describe‚Äù.

![](../images/bayes_prior_posterior.png)

**Figura 5.** En el enfoque bayesiano, una creencia inicial (distribuci√≥n prior, l√≠nea azul) se combina con la evidencia aportada por los datos (verosimilitud, l√≠nea roja) para producir una creencia actualizada (posterior, l√≠nea verde). Esto se realiza aplicando el Teorema de Bayes.

```{admonition} Resumen
:class: tip

En estad√≠stica bayesiana:
- Los par√°metros desconocidos se tratan como variables aleatorias.

- Modelamos nuestras creencias sobre esos valores con distribuciones de probabilidad.

- Cuando obtenemos nuevos datos, actualizamos esas creencias usando el Teorema de Bayes.
```

<iframe width="650" height="315"
    src="https://www.youtube.com/embed/XIbL0foEckA"
    title="YouTube video player"
    frameborder="0"
    allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture"
    allowfullscreen>
</iframe>

![](../images/memes/interpretations-joke.png)