# Operaciones con probabilidades

Una vez que entendemos qué representa una probabilidad y cómo se puede interpretar, el siguiente paso natural es analizar **cómo se combinan o se relacionan distintos eventos entre sí**.

Esto nos lleva a estudiar conceptos fundamentales como la **probabilidad condicional, conjunta y marginal**.

## 1.1. Probabilidad conjunta, condicional y marginal

Hasta ahora hemos aprendido a:

- Definir un **espacio muestral** $(\Omega)$, que contiene todos los posibles resultados de un experimento.
- Considerar subconjuntos de $(\Omega)$ como **eventos**, organizados en una estructura llamada $(\sigma)$-álgebra.
- Asignar valores de **probabilidad** a esos eventos mediante funciones que cumplen ciertos principios (como los axiomas de Kolmogórov).
- Interpretar esos valores bajo los enfoques **frecuentista** y **bayesiano**.

Este marco nos permite describir eventos **individuales**, pero también **eventos compuestos**: por ejemplo, cuando dos condiciones ocurren a la vez, o una depende de otra.

##### ¿Qué nos permite considerar eventos compuestos?

La clave está en la $(\sigma)$-álgebra:

> Al definir el espacio de eventos como una $(\sigma)$-álgebra, garantizamos que podemos operar con ellos de forma lógica y estructurada:
>
> - unir eventos $(A \cup B)$
> - tomar complementos $(A^c)$
> - y también **intersecciones** como $(A \cap B)$, que representan **eventos conjuntos**.

Esto no solo nos permite construir descripciones más ricas de situaciones, sino que nos habilita a hacer **operaciones de probabilidad** sobre múltiples eventos.

A continuación, exploraremos tres operaciones fundamentales:

### 1.1.1. Probabilidad conjunta

La **probabilidad conjunta** mide la probabilidad de que **dos eventos ocurran al mismo tiempo**.

Se denota como:

$$
\mathbb{P}(A \cap B)
$$

o, si el contexto lo permite, simplemente $\mathbb{P}(A, B)$.

```{admonition} Ejemplo
:class: tip

Si $(A = \{\text{llover}\})$ y $(B = \{\text{llevar paraguas}\})$,
entonces $(\mathbb{P}(A \cap B))$ representa la probabilidad de que **llueva y lleves paraguas** el mismo día.
```

### 1.1.2. Probabilidad condicional

La **probabilidad condicional** responde a la pregunta:

> ¿Cuál es la probabilidad de que ocurra \(A\) si ya sabemos que ocurrió \(B\)?

Se define como:

$$
\mathbb{P}(A \mid B) = \frac{\mathbb{P}(A \cap B)}{\mathbb{P}(B)} \quad \text{si } \mathbb{P}(B) > 0
$$

```{admonition} Ejemplo
:class: tip

Si $(\mathbb{P}(\text{llover y llevar paraguas}) = 0.3 )$
y $(\mathbb{P}(\text{llevar paraguas}) = 0.5)$,
entonces:

$$
\mathbb{P}(\text{llover} \mid \text{llevar paraguas}) = \frac{0.3}{0.5} = 0.6
$$
```

### 1.1.3. Probabilidad marginal

La **probabilidad marginal** es la probabilidad de un evento **sin condicionar** en ningún otro.

Cuando trabajamos con variables múltiples, podemos obtener la marginal de una variable “resumiendo” la información sobre las otras.

$$
\mathbb{P}(A) = \sum_{b} \mathbb{P}(A, B=b)
$$

En el caso continuo:

$$
\mathbb{P}(A) = \int \mathbb{P}(A, B)\, dB
$$

```{admonition} Nota
:class: note

La marginal es útil cuando queremos concentrarnos en un solo evento o variable, ignorando otras que también están en juego.
```

## 1.2. Reglas derivadas de la probabilidad

Una vez que hemos definido formalmente la **probabilidad condicional**, podemos deducir tres reglas fundamentales que se utilizan constantemente en modelado probabilístico.

Estas reglas no son nuevos axiomas, sino **consecuencias directas** de combinar:

- Los **axiomas de Kolmogórov**, especialmente:

  - La aditividad: $P(A \cup B) = P(A) + P(B)$ si $A \cap B = \varnothing$

- La **definición de probabilidad condicional**

Veamos cada una:

##### 📌 Regla de marginalización

Se basa en la **aditividad**: si $B$ puede tomar varios valores disjuntos, entonces:

$$
P(A) = \sum_B P(A, B)
$$

Esta regla permite **reducir** una probabilidad conjunta a una **marginal**.

---

##### 📌 Regla de la cadena

Viene directamente de _reordenar_ la definición de probabilidad condicional:

$$
P(A \mid B) = \frac{P(A, B)}{P(B)} \quad \Rightarrow \quad P(A, B) = P(A \mid B) \cdot P(B)
$$

Esta relación es fundamental en estructuras secuenciales como los modelos gráficos.

También puede escribirse simétricamente:

$$
P(B, A) = P(B \mid A) \cdot P(A)
$$

---

##### 📌 Regla de la probabilidad total

Surge al aplicar **marginalización** sobre la **regla de la cadena**:

$$
P(A) = \sum_B P(A, B) = \sum_B P(A \mid B) \cdot P(B)
$$

Es decir, descomponemos la probabilidad de $A$ en función de sus componentes condicionales respecto a $B$.

```{admonition} Nota técnica
:class: tip

En el contexto de probabilidad, usamos la notación $P(A, B)$ como abreviatura de $P(A \cap B)$ (la probabilidad de que ocurran ambos eventos).
```

> Además de ser útil para calcular probabilidades marginales,  
> la **regla de la probabilidad total** también puede interpretarse como una **constante de normalización**:
>
> garantiza que la distribución condicional resultante \( P(A \mid B) \) sea **válida**,  
> es decir, que **sume 1** al considerar todos los posibles valores de \(A\).

```{math}
\sum_A P(A \mid B) = 1
```

![](../images/reglas_probabilidad_diagrama.png)

**Figura 5.** La definición de probabilidad condicional permite derivar tres reglas fundamentales: la **regla de la cadena**, la **regla de marginalización** y la **regla de la probabilidad total**. Estas relaciones son la base del razonamiento probabilístico en contextos donde intervienen múltiples eventos.