# Semana 3 - Clase 2

# Reglas y Aplicaciones de la Probabilidad con el Dataset Titanic



**Objetivo de la Clase**


Aplicar las reglas de probabilidad utilizando el dataset público Titanic, explorando probabilidad condicional, la regla de la adición y la multiplicación a través de problemas reales.

## **1. Introducción al Dataset Titanic**

El `dataset Titanic` contiene información sobre pasajeros del famoso barco, incluyendo variables como:

+ Survived: 1 = Sí, 0 = No

+ Pclass: Clase del pasajero (1, 2, 3)

+ Sex: Género (male, female)

+ Age: Edad del pasajero

+ Fare: Tarifa pagada

In [1]:
## Cargar base de datos de Titanic
## https://www.kaggle.com/c/titanic/data
## https://seaborn.pydata.org/generated/seaborn.load_dataset.html

import seaborn as sns

df = sns.load_dataset("titanic")
print(df.head())

   survived  pclass     sex   age  sibsp  parch     fare embarked  class  \
0         0       3    male  22.0      1      0   7.2500        S  Third   
1         1       1  female  38.0      1      0  71.2833        C  First   
2         1       3  female  26.0      0      0   7.9250        S  Third   
3         1       1  female  35.0      1      0  53.1000        S  First   
4         0       3    male  35.0      0      0   8.0500        S  Third   

     who  adult_male deck  embark_town alive  alone  
0    man        True  NaN  Southampton    no  False  
1  woman       False    C    Cherbourg   yes  False  
2  woman       False  NaN  Southampton   yes   True  
3  woman       False    C  Southampton   yes  False  
4    man        True  NaN  Southampton    no   True  


## **2. Análisis de Probabilidad con el Titanic**

### 2.1. Regla de la Adición

Ejemplo: ¿Cuál es la probabilidad de que un pasajero haya sido de primera clase o haya sobrevivido?

**Fórmula:**
$$
P(A \cup B) = P(A) + P(B) - P(A \cap B)
$$



In [2]:
p_class1 = len(df[df['pclass'] == 1]) / len(df)
p_survived = len(df[df['survived'] == 1]) / len(df)
p_both = len(df[(df['pclass'] == 1) & (df['survived'] == 1)]) / len(df)

p_union = p_class1 + p_survived - p_both
print(f"Probabilidad de ser de primera clase o haber sobrevivido: {p_union:.2f}")

Probabilidad de ser de primera clase o haber sobrevivido: 0.47


### 2.2. Regla de la Multiplicación

Ejemplo: ¿Cuál es la probabilidad de que un pasajero seleccionado al azar sea mujer y haya sobrevivido?

**Formula:**
$$
P(A \cap B) = P(A) * P(B|A) 
$$



In [3]:
p_female = len(df[df['sex'] == 'female']) / len(df)
p_surv_given_female = len(df[(df['sex'] == 'female') & (df['survived'] == 1)]) / len(df[df['sex'] == 'female'])

p_intersection = p_female * p_surv_given_female
print(f"Probabilidad de ser mujer y haber sobrevivido: {p_intersection:.2f}")

Probabilidad de ser mujer y haber sobrevivido: 0.26


### 2.3. Probabilidad Condicional

Ejemplo: Si un pasajero era de primera clase, ¿cuál era la probabilidad de que sobreviviera?

**Fórmula:**
$$
P(B|A) = \frac{P(A \cap B)}{P(A)}
$$


In [4]:
p_surv_given_class1 = len(df[(df['pclass'] == 1) & (df['survived'] == 1)]) / len(df[df['pclass'] == 1])
print(f"Probabilidad de sobrevivir dado que era de primera clase: {p_surv_given_class1:.2f}")

Probabilidad de sobrevivir dado que era de primera clase: 0.63


## **3. Ejercicio**

Si seleccionamos un pasajero al azar, ¿cuál es la probabilidad de que sea hombre o haya pagado una tarifa superior a 50?

$$
P(A \cup B) = P(A) + P(B) - P(A \cap B)
$$

In [5]:
p_male = len(df[df['sex'] == 'male']) / len(df)
p_fare50 = len(df[df['fare'] > 50]) / len(df)
p_both = len(df[(df['sex'] == 'male') & (df['fare'] > 50)]) / len(df)

p_union = p_male + p_fare50 - p_both
print(f"Probabilidad de ser hombre o haber pagado más de $50: {p_union:.2f}")

Probabilidad de ser hombre o haber pagado más de $50: 0.75


## **4. Conclusión Final**

+ El dataset Titanic permite aplicar la probabilidad en situaciones reales.

+ Las reglas de adición, multiplicación y probabilidad condicional ayudan a comprender relaciones entre variables.

+ Python facilita el cálculo de probabilidades en datasets grandes.