# Sesión 2

## 1. Repaso de probabilidad

### 1.1. Introducción

Antes de sumergirnos en el mundo de los _modelos gráficos probabilísticos_, comprendamos primero algunos de los fundamentos de la teoría de probabilidad, ya que constituye la base formal para este enfoque.

Una forma de visualizar su importancia es observando cómo diferentes perspectivas epistemológicas y metodológicas dan lugar a distintos tipos de modelado. En la **Figura 1**, se muestra una distinción entre dos enfoques principales:

- El **enfoque determinista**, que se basa en el modelado no probabilísta y utiliza métodos donde no interviene el azar.

- El **enfoque estocástico**, que recurre al modelado probabilísta y se sustenta formalmente en la teoría de probabilidad.

Ambos caminos convergen en aplicaciones prácticas como los **modelos de aprendizaje automático (ML) y aprendizaje profundo (DL)**. Estos modelos pueden surgir tanto desde una perspectiva determinista como estocástica, aunque es en el enfoque probabilístico donde encontramos herramientas más directas para representar la _incertidumbre_ y tomas decisiones informadas.

![](../images/sesion2-esquema.png)

**Figura 1.** Elaboración propia.

### 1.2. Fundamentos de la teoría de probabilidad

La teoría de probabilidad nos permite modelar incertidumbre mediante una estructura matemática compuesta por tres elementos: _un espacio muestral $\Omega$, un sistema de eventos medibles $S$ y una función de probabilidad $\mathbb{P}$_. Formalmente, esta estructura se expresa como la **triple**:

$$(\Omega, S, \mathbb{P})$$

A continuación, desglosamos cada uno de estos componentes:

#### 1.2.1. Espacio muestral $(\Omega)$

El **espacio muestral** es el conjunto que contiene **todos los posibles resultados** de un experimento aleatorio. Se denota por:

$$
\Omega
$$

- Representa **todo lo que puede pasar**.

- Es el punto de partida para definir eventos.

```{admonition} Ejemplo
:class: tip

Si lanzamos un dado de 6 caras, el espacio muestral es:

$\Omega = \{1, 2, 3, 4, 5, 6\}$
```

Puedes consultar más [aquí](https://en.wikipedia.org/wiki/Probability_space)



#### 1.2.2. Conjunto potencia $\mathcal{P}(\Omega)$

Es el conjunto de **todos los subconjuntos _posibles_** de $\Omega$.

- Incluye desde el conjunto vacío $\varnothing$ hasta el conjunto total $\Omega$.

- Representa **todas las _combinaciones_ posibles de eventos.**

```{admonition} Ejemplo
:class: tip

Si $\Omega={1,2,3}$, entonces:

$P(\Omega) = \{\varnothing, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\}, \{2,3\}, \{1,2,3\}\}$
```

A continuación, podemos ver el **conjunto potencia** en la **Figura 2**, representado mediante un diagrama de Hasse.

![](../images/hasse.png)

**Figura 2.** Diagrama de Hasse del conjunto potencia de ${1,2,3}$. Elaboración propia con base en: [_Power set_](https://en.wikipedia.org/wiki/Power_set).

Puedes consultar más [aquí](https://en.wikipedia.org/wiki/Power_set).

#### 1.2.3. σ-álgebra $(S)$ o espacio de eventos

Es una colección especial de subconjuntos de $\Omega$ (es decir, una subcolección de $\mathcal{P}(\Omega)$) que cumple con tres propiedades clave:

```{admonition} Propiedades del sistema de eventos $S$
:class: tip

1. **Contiene el evento vacío y el evento total**
   - $\varnothing \in S$: representa el evento que nunca ocurre.
   - $\Omega \in S$: representa el evento que siempre ocurre.

2. **Cerrado bajo unión**
   Si $\alpha, \beta \in S$, entonces $\alpha \cup \beta \in S$.
   Esto permite formar eventos como “ocurre $\alpha$ o $\beta$”.

3. **Cerrado bajo complemento**
   Si $\alpha \in S$, entonces $\Omega - \alpha \in S$ (también denotado $\alpha^c$).
   Esto garantiza que también podamos trabajar con el evento “no ocurre $\alpha$”.
```

```{admonition} Ejemplo
Si $\Omega={1,2,3}$, una posible σ-álgebra es:

$$S = \{\varnothing, \{1,2,3\}, \{1\}, \{2,3\}\}$$

Aquí, $\{2,3\}$ es el complemento de $\{1\}$, y viceversa.
```

Puedes consultar más [aquí](https://en.wikipedia.org/wiki/%CE%A3-algebra#Definition_and_properties).

#### 1.2.4. Función de probabilidad

Hasta ahora hemos definido el espacio muestral $(\Omega)$, que contiene todos los posibles resultados de un experimento, y una σ-álgebra $(S)$, que representa los subconjuntos medibles de $(\Omega)$, es decir, los **eventos** a los que podemos asignar una probabilidad coherente.

Una **función de probabilidad** es una regla matemática que asigna a cada evento medible un número entre $0$ y $1$, representando **cuán probable** es que ese evento ocurra. Formalmente:

$$\mathbb{P} : S \rightarrow [0, 1]$$

o

$$0 \leq \mathbb{P}(\text{evento}) \leq 1$$

Para que esta asignación tenga sentido y sea consistente con la intuición, la función $\mathbb{P}$ debe cumplir tres condiciones fundamentales, conocidas como los **axiomas de Kolmogórov**:

```{admonition} Definición formal
:class: tip

Una función $\mathbb{P}$ es una **probabilidad** sobre el espacio $(\Omega, S)$ si cumple:

1. **No negatividad:** $\mathbb{P}(A) \geq 0$ para todo $A \in S$

2. **Normalización:** $\mathbb{P}(\Omega) = 1$

3. **Aditividad numerable:** si tienes una **colección infinita de eventos** $(A_1, A_2, A_3, \ldots)$ que son **mutuamente excluyentes** (es decir, no se superponen, o sea, $(A_i \cap A_j = \emptyset)$ si $( i \ne j )$), entonces la probabilidad de que ocurra alguno de esos eventos (la unión de todos ellos) es igual a la **suma de las probabilidades individuales**.

$$
\mathbb{P}\left( \bigcup_{i=1}^{\infty} A_i \right) = \sum_{i=1}^{\infty} \mathbb{P}(A_i)
$$

Esto garantiza que la probabilidad se comporta de manera coherente incluso cuando se trata de **infinitas situaciones posibles**, no solo finitas. Es una característica esencial para que una función se considere una **medida de probabilidad** en _teoría de la medida_.
```

> 📌 _Nota:_ Estos tres principios consolidan la probabilidad como una rama formal de la matemática, basada en la _teoría de conjuntos_ y la _teoría de la medida_.

```{admonition} Evento en teoría de probabilidad
:class: tip

En teoría de probabilidad, un **evento** es cualquier subconjunto del espacio muestral $\Omega$ que **pertenece a la σ-álgebra** $(S)$.
Solo a estos eventos se les puede asignar una probabilidad formalmente válida.
Por eso también se les llama **eventos medibles**.
```

##### ¿Cómo se relacionan los conceptos que hemos visto?

Para construir un modelo probabilístico sólido, necesitamos entender cómo se relacionan tres objetos fundamentales: el **espacio muestral**, el **conjunto potencia** y la **σ-álgebra**.

- El **espacio muestral** $\Omega$ es el punto de partida: contiene todos los posibles resultados de un experimento.

- A partir de él, podemos formar el **conjunto potencia** $\mathcal{P}(\Omega)$, que incluye **todos los subconjuntos posibles** de $\Omega$. En principio, cada uno de estos subconjuntos podría considerarse un evento.

- Sin embargo, no todos los subconjuntos de $\Omega$ pueden ser tratados como **eventos válidos** desde el punto de vista de la probabilidad. Para que un subconjunto sea un **evento medible**, debe pertenecer a una **σ-álgebra** $S \subseteq \mathcal{P}(\Omega)$, la cual cumple ciertas propiedades de consistencia lógica (como estar cerrada bajo unión, complemento, etc.).

Podemos resumir estas diferencias clave en la siguiente tabla:

| Concepto                                | Qué representa                                | Contenido                                    |
| --------------------------------------- | --------------------------------------------- | -------------------------------------------- |
| Espacio muestral $(\Omega)$             | Resultados posibles de un experimento         | Un conjunto base (como $\{1,2,3\})$          |
| Conjunto potencia $\mathcal{P}(\Omega)$ | Todos los subconjuntos posibles de $(\Omega)$ | Todos los eventos posibles, medibles o no    |
| $\sigma$-álgebra $(S)$                  | Subconjuntos **medibles** de $(\Omega)$       | Subconjuntos que cumplen ciertas propiedades |

---

La siguiente **Figura 2** ilustra visualmente cómo se relacionan estos tres niveles de generalidad:

![](../images/all.jpg)

**Figura 2.** Relación entre espacio muestral, conjunto potencia y $\sigma$-álgebra. Elaboración propia.