# Conceptos de Probabilidad

- **Espacio muestral (S):** es el conjunto de todos los resultado posibles de un experimento aleatorio.
- **Evento:** es todo subconjunto del espacio muestral. Se denotan por letras mayúsculas A, B, etc.

**Ejemplo:**


Sea el **experimento E**: lanzar un dado.

**Evento:** que salga un número par.

Definimos el evento de la siguiente manera: 
- A = sale número par = (2, 4, 6)

- **Probabilidad:** es el conjunto de posibilidades de que un evento ocurra o no en un momento determinado. Estas posibilidades se miden en una escala del 0 al 1. Donde 0 indica que es imposible que el evento ocurra y 1 indica que el evento ocurrirá con certeza.

Si todos los resultados en un espacio muestral S finito son igualmente probables, y E es un evento en ese espacio muestral, entonces la probabilidad del evento E está dada por la siguiente fórmula (definición clásica de la probabilidad).

![estadistica_09.png](attachment:estadistica_09.png)

$$P(E) = \frac{\text{# resultados favorables}}{\text{# total de posibles resultados}} = \frac{n(E)}{n(S)}$$

### Reglas de adición

![estadistica_10.png](attachment:estadistica_10.png)

![estadistica_11.png](attachment:estadistica_11.png)

**Ejemplo:** Lanzamiento de un dado. 

$$Probabilidad E: P(E = 1/6)$$

**Evento excluyente**: Probabilidad de que salga un número par: A = {2, 4, 6} 

$$P(A) = P(2) + P(4) + P(6) = 1/6 + 1/6 + 1/6 = 1/2$$

**Evento excluyente**: Probabilidad de que salga un número mayor a 3: A = {4, 5, 6}

$$P(A) = P(4) + P(5) + P(6) = 1/6 + 1/6 + 1/6 = 1/2$$

**Evento no excluyente**: Probabilidad de que salga un número par o mayor a 3: 

- A = {2, 4, 6}
- B = {4, 5, 6}
- AnB = {4, 6}

$$P(A n B) = 2/6 = 1/3$$

$$P(A U B) = 1/2 + 1/2 - 1/3 = 2/3 $$

**Ejercicio:** Usando el dataset del titanic:
- Probabilidad de elegir un pasajero de la clase 1.
- Probabilidad de elegir un pasajero de sexo masculino.
- PRobabilidad de elegir un pasajero con una edad que sea número primo.

In [None]:
import pandas as pd

df = pd.read_csv("titanic.csv")

df = df[["Sex", "Age", "Pclass"]]

df

## Probabilidad Condicional

La probabilidad condicional, (o probabilidad condicionada) es la probabilidad de que ocurra un evento, dado que otro evento ha ocurrido.

**Ejemplo:**

Se clasifica un grupo de 100 ejecutivos, de acuerdo a su peso y a si sufren o no de hipertensión. La tabla muestra el número de ejecutivos en cada categoría.

|                | Insuficiente | Normal | Sobrepeso | Total     |
|----------------|--------------|--------|-----------|-----------|
| **Hipertenso** | 2            | 8      | 10        | 20        |
| **Normal**     | 20           | 45     | 15        | 80        |
| **Total**      | 22           | 53     | 25        | **100**   |

- Si se elige un ejecutivo al azar, ¿cuál es la probabilidad de que tenga hipertensión?

$$P(H) = 20/100 = 2$$

- Si se elige a una persona al azar, y se descubre que tiene sobrepeso, ¿cuál es la probabilidad de que tenga hipertensión? ¿Es la misma que antes?

Probabilidad de que sea hipertenso, sabiendo que tiene sobrepeso:
$$P(H|S)$$

Para calcularla, nos fijamos sólo en los ejecutivos con sobrepeso:
$$P(H|S) = 10/25 = 0.4$$

¿Por qué? es como si eligiese la persona al azar sólo entre los que tienen sobrepeso.

![estadistica_12.png](attachment:estadistica_12.png)

![estadistica_13.png](attachment:estadistica_13.png)

**Eventos independientes**

**Ejemplo:**

Tiro de 2 dados. Cual es la probabilidad de que:
1. En el primer dado salga un 1: 

$$P(C) = 1/6$$

2. El segundo dado salga un 1, sabiendo que en el primero salió 1:

$$P(D|C) = P(D) = 1/6$$

3. Que en los 2 dados salga un 1:
$$P(C n D) = P(C) * P(D) = 1/6 * 1/6 = 1/36 = 0.027$$

**Eventos dependientes**

**Ejemplo:**

De una baraja de poker, saco 2 cartas. Cual es la probabilidad de que:
1. La primera carta sea de corazones: 

$$P(A) = 13/52$$

2. La segunda sea espada, sabiendo que la primera fue espada: 

$$P(B|A) = 12/51$$

3. Las dos cartas sean espada:
$$P(A n B) = P(A) * P(B|A) = 13/52 * 12/51 = 156/2652 = 0.058$$

**Ejercicio**: Usando el dataset del titanic:

1. ¿Cuál es la probabilidad de elegir un pasajero al azar y que sea menor a 25 años dado que es mujer?


2. ¿Cuál es la probabilidad de elegir un pasajero al azar de la clase 3, dado que no ha sobrevivido?


3. ¿Cuál es la probabilidad de elegir un pasajero al azar del sexo masculino, dado que es clase 1 y dado que no sobrevivio?


4. ¿Cuál es la probabilidad de elegir un pasajero al azar del sexo femenino, dado que es clase 1 y dado que no sobrevivio?

In [None]:
df = pd.read_csv("titanic.csv")

df = df[["Sex", "Age", "Pclass", "Survived"]]

df