# **Algunos conceptos básicos de la Teoría de la Probabilidad**

Para medir la incertidumbre o probabilidad se parte de un marco dado, llamémosle $S$, en el que se incluyen todos los posibles resultados de un cierto experimento como conjunto exhaustivo y mútuamente exclusivo de elementos. El resultado de cada uno de estos experimentos recibe el nombre de **suceso**. Por ejemplo, si $S$ es lanzar una moneda al aire, el conjuto de los posibles sucesos son $\{cara, cruz\}$. Si $S$ es lanzar dos veces una maneda al aire, el conjuto de los posibles sucesos son $\{ (cara, cara), (cara, cruz), (cruz, cara), (cruz, cruz)\}$.

El conjunto $S$ se conoce como **espacio muestral**. A veces también se le nombra como $U$. Una vez definido este conjunto, el objetivo consiste en asignar a todo subconjunto (**sucesos**) de $S$ un número real que mida el grado de incertidumbre sobre su realización.

**NOTA**: Trabajaremos con subconjuntos de $S$, esto es, subconjuntos de sucesos. Por ejemplo, si $S$ es tirar un dado, todos los posibles resultados son $\{1, 2, 3, 4, 5, 6\}$, y dos posibles subconjutos serían $A=\{1,2\}$ y $B=\{1, 2, 3\}$. En este caso, $A$ es a su vez un subconjunto de $B$, y se denota así $A ⊆ B$. Observa que si $A=\{1, 2\}$, la probabilidad de $A$ es la probabilidad de lanzar un dado y que salga un 1 <u>o</u> un 2.

**Medida de Probabilidad**. Una función $p$ que proyecta los subconjuntos posibles de $S$ en el intervalo $[0, 1]$ se llama medida de probabilidad si satisface los siguientes axiomas:

1. **Normalización**. $p(S)=1$, la probabilidad de que suceda todo lo posible es 1.
2. **Aditividad**: para cualquier sucesión de subconjuntos <u>disjuntos</u> de $S$: $A_1, A_2, ... A_n $ se cumple que $p(\bigcup_{i=1}^{n}A_i)=\sum_{i=1}^{n} p(A_i)$
  
  La probabilidad de que ocurran los $A_i$ es igual a la suma de sus probabilidades individuales. O también, la probabiliad de un cierto subconjunto es la suma de las probabilidades de sus partes (si son *disjuntas*).

A partir de los anterioes, podemos deducir:

1. **Normalización**: $p(∅)=0$, la probabilidad de ningún suceso es cero.
2. **Monotocidad**: Si $A ⊆ B$, entonces $p(A) ≤ p(B)$. Si $A$ es un subconjunto de $B$ (o son iguales), entonces la probabilidad de $A$ es menor o igual que $B$.

  Obvio, sea $A=\{(cara, cara),(cruz,cruz)\}$ y $B=\{(cara, cara),(cara,cruz),(cruz,cruz)\}$; $A$ es un subconjunto de $B$, entonces la $p(A)$ es $\frac{1}{4}+\frac{1}{4}=\frac{1}{2}=0.5$ y la $p(B)$ es $\frac{1}{4}+\frac{1}{4}+\frac{1}{4}=\frac{3}{4}=0.75$.

3. **Inclusión-exclusión**: Dado cualquier par de subconjuntos $A$ y $B$ de $S$ (ya no tienen porque ser disjuntos), se cumple siempre la siguiente igualdad: $p(A \cup B)=p(A)+p(B)-p(A \cap B)$.

  Sean $A$ y $B$ los definidos antes, si simplemente sumáramos sus probabilidades el resultado sería $0.5+0.75=1.25$ lo que *viola* el axioma 1. Esto es debido a que la intersección de ambos subconjuntos no es $∅$, es $\{(cara, cara),(cruz,cruz)\}$, por tanto la probabilidad de la unión de ambos es $0.5+0.75-\frac{1}{2}=0.75$.


# **Distribuciones de Probabilidad**

Sea $\{X_1, ..., X_n\}$ un conjunto de variables aleatorias y $\{x_1, ..., x_n\}$ el conjunto de sus posibles realizaciones. Observa que vamos a escribir las variables aleatorias con mayúsculas y que sus realizaciones con minúsculas. Por ejemplo, si $X_i$ es una variable aleatoria binaria, entonces sus $x_i$ puede ser $1$ o $0$.

Ejemplos de variables aleatorias:
- Lanzar una moneda al aire: $cara$ o $cruz$
- Lanzar un dado: $1$ o $2$ o $3$ o $4$ o $5$ o $6$.
- Edad de una persona: conjunto de los números naturales.
- Tiempo que se tarda en llegar al trabajo, desde casa, en una ciudad concreta: números reales $>0$.

Como ves, hay variables aleatorias que tienen un número infinito de posibles realizaciones. Sólo veremos los casos de VA con resultados finitos y discretos. Pero en los casos mostrados se podría acotar, por ejemplo, la edad en un rango (0-150) y ya tenemos una VA discreta con resultados finitos.

## **Probabilidad conjunta**

Es la probabilidad de que dos o más eventos se den simultáneamente.

Antes hablamos de la probabilidad de un subconjunto del espacio muestral, ahora nos referiremos a la probabilidad de un conjunto de variables aleatorias. Por ejemplo, la probabiliad de lanzar una moneda y que salga $cruz$ **y** tirar un dado y que salga un 5.

## **Probabilidad marginal**

La probabilidad marginal se refiere a la probabilidad de un evento o resultado particular en un subconjunto de un conjunto más grande de eventos o resultados. En otras palabras, es la probabilidad de un evento específico sin tener en cuenta o considerar los otros eventos relacionados.

$$ p(x_1)= \sum_{\forall x_2 \in X_2, ..., \forall x_n \in X_n} p(x_1, x_2, ..., x_n) $$

Por ejemplo, suponiendo *equiprobabilidad*:

   | Género | Color de ojos |
   |--------|---------------|
   | Hombre | Azul          |
   | Hombre | Marrón        |
   | Mujer  | Azul          |
   | Mujer  | Verde         |
   | Mujer  | Marrón        |
   | Hombre | Verde         |

Si queremos calcular la probabilidad marginal de que una persona tenga ojos azules (sin importar el género), simplemente sumamos las probabilidades conjuntas en las filas donde el color de ojos es azul:

Probabilidad marginal de ojos azules = P(Ojos azules) = P(Género = Hombre, Ojos = Azul) + P(Género = Mujer, Ojos = Azul)

Probabilidad marginal de ojos azules = (1/6) + (1/6) = 1/3

Entonces, la probabilidad marginal de tener ojos azules <u>en este grupo de personas</u> es 1/3, lo que significa que aproximadamente 1 de cada 3 personas tiene ojos azules, independientemente de su género.

## **Probabilidad condicionada**

Es la probabilidad de que ocurra un evento dado que otro evento ya ha ocurrido.

Sean $X$ e $Y$ dos conjuntos <u>disjuntos</u> de variables aleatorias tales que $p(y) > 0$. Entonces, la probabilidad condicional (función de probabilidad condicionada) de $X$ dado $Y = y$ viene dada por:

$$p(X=x|Y=y)=p(x|y)=\frac{p(x,y)}{p(y)}, \hspace{1cm} con \hspace{1mm} p(y)>0$$

Supongamos que estamos interesados en calcular la probabilidad de que una persona sea mujer sabiendo que tiene ojos azules. En términos de probabilidad condicional, esto se denota como $P(Mujer|Ojos=Azul)$.

$$p(Mujer | Ojos = Azul) = \frac{\text{Número de mujeres con ojos azules}}{\text{Número de personas con ojos azules}}=1/2$$

Pero también:

$$p(Mujer|Ojos=Azul)=\frac{p(Mujer,Azul)}{p(Azul)}=\frac{1/6}{1/3}=1/2$$

En este ejemplo, la probabilidad condicional de ser mujer dado que una persona tiene ojos azules es igual a $\frac{1}{2}$.

Hay una relación más profunda entre la probabilidad conjunta y la condicionad:

$$p(x, y) = p(y)p(x|y)$$

En general, tenemos:

$$p(x_1|y_1, ..., y_n) = \frac{p(x_1, y_1, ..., y_n)}{p(y_1, ..., y_n)}$$

O, usando la probabilidad marginal:

$$p(x_1|y_1, ..., y_n) = \frac{p(x_1, y_1, ..., y_n)}{\sum_{x_i} p(x_i, y_1, ..., y_n)}$$


## Género, fumador, estado civil y embarazada

Considéremos las siguientes características (variables y sus posibles valores) de las personas de una población dada:

- Sexo = { $hombre$, $mujer$ }
- Fumador = { sí ($f$), no ($\overline{f}$) }
- Estado Civil = { casado ($c$), no casado ($\overline{c}$) }
- Embarazo = { sí ($e$), no ($\overline{e}$) }

La tabla de probabilidad conjunta es:

| Sexo     | Fumador        | Estado civil   | Embarazo       | probabilidad conjunta |
|:--------:|:--------------:|:--------------:|:--------------:|:---------------------:|
| $hombre$ | $f$            | $c$            | $e$            | 0.00                  |
| $hombre$ | $f$            | $c$            | $\overline{e}$ | 0.02                  |
| $hombre$ | $f$            | $\overline{c}$ | $e$            | 0.00                  |
| $hombre$ | $f$            | $\overline{c}$ | $\overline{e}$ | 0.07                  |
| $hombre$ | $\overline{f}$ | $c$            | $e$            | 0.00                  |
| $hombre$ | $\overline{f}$ | $c$            | $\overline{e}$ | 0.18                  |
| $hombre$ | $\overline{f}$ | $\overline{c}$ | $e$            | 0.00                  |
| $hombre$ | $\overline{f}$ | $\overline{c}$ | $\overline{e}$ | 0.23                  |
| $mujer$  | $f$            | $c$            | $e$            | 0.01                  |
| $mujer$  | $f$            | $c$            | $\overline{e}$ | 0.04                  |
| $mujer$  | $f$            | $\overline{c}$ | $e$            | 0.01                  |
| $mujer$  | $f$            | $\overline{c}$ | $\overline{e}$ | 0.10                  |
| $mujer$  | $\overline{f}$ | $c$            | $e$            | 0.05                  |
| $mujer$  | $\overline{f}$ | $c$            | $\overline{e}$ | 0.10                  |
| $mujer$  | $\overline{f}$ | $\overline{c}$ | $e$            | 0.01                  |
| $mujer$  | $\overline{f}$ | $\overline{c}$ | $\overline{e}$ | 0.18                  |

¿Cúal es probabilidad (marginal) de ser $mujer$?

$ p(mujer)= \sum p(mujer, Fumador, \text{Estado Civil}, Embarazo) $

$ p(mujer)= \sum p(mujer, \{f, \overline{f}\}, \{c, \overline{c}\}, \{e, \overline{e}\}) = 0.01+0.04+0.01+0.10+0.05+0.10+0.01+0.18=0.5$

Y la probabilidad de ser mujer siendo fumadora:

$ p(mujer|f)= \frac{p(mujer,f)}{p(f)}=\frac{0.01 + 0.04 + 0.01 + 0.10}{(0.01 + 0.04 + 0.01 + 0.10) + (0.00 + 0.02 + 0.00 + 0.07)}=0.64$

Sea A una persona elegida al azar de la población.

Sin conocer si la persona es fumadora, la probabilidad de que se trate de una mujer es $$p(mujer) = 0.50$$

Pero si se sabe que la persona es fumadora, esta probabilidad cambia de 0.50 a $$p(mujer|f) = 0.64$$

Por tanto, se tiene $p(mujer|f) \neq p(mujer)$; por lo que las variables Sexo y Fumador son dependientes.

Igualmente pasa para $Sexo$ y $Embarazo$.

Por otra parte, la variable $\text{Estado Civil}$ no contiene información relevante sobre la variable $Sexo$ y viceversa. Esto puede verse en la tabla, en la que las probabilidades conjuntas coinciden con el producto de las marginales para todos los valores posibles de las dos variables. Por ello, las variables $Sexo$ y $\text{Estado Civil}$ son independientes.



# Teorema de Bayes

Es una fórmula que permite calcular la probabilidad de un evento condicionado a la ocurrencia de otro evento, utilizando información previa (probabilidades marginales) y la probabilidad de los eventos involucrados.

El teorema se enuncia de la siguiente manera:

$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$
Donde:

- **P(A|B)** es la probabilidad de que ocurra el evento **A**, dado que ha ocurrido el evento **B** (probabilidad condicionada).
- **P(B|A)** es la probabilidad de que ocurra el evento **B**, dado que ha ocurrido el evento **A**.
- **P(A)** es la probabilidad a priori de que ocurra el evento **A**.
- **P(B)** es la probabilidad total de que ocurra el evento **B**.

