# Exploración inicial del Titanic

Este notebook carga el dataset del Titanic y realiza una primera exploración con Pandas, Matplotlib y Seaborn.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# --- 1. Cargar dataset ---
df = pd.read_csv("data/titanic.csv")

# --- 2. Primer vistazo ---
print("Dimensiones del dataset:", df.shape)
print("\nColumnas disponibles:\n", df.columns.tolist())
print("\nPrimeras filas:\n", df.head())

In [None]:
# --- 3. Información general ---
print("\nInformación del dataset:")
print(df.info())

print("\nEstadísticas numéricas:")
print(df.describe())

In [None]:
# --- 4. Valores faltantes ---
print("\nValores nulos por columna:")
print(df.isnull().sum())

In [None]:
# --- 5. Preguntas exploratorias ---
survived_counts = df["Survived"].value_counts()
print("\nSupervivientes (0 = no, 1 = sí):\n", survived_counts)

print("\nEdad media de los supervivientes:", df[df["Survived"]==1]["Age"].mean())

print("\nDistribución de pasajeros por clase:")
print(df["Pclass"].value_counts())

In [None]:
# --- 6. Visualizaciones ---
sns.set_style("whitegrid")

sns.countplot(data=df, x="Sex", hue="Survived")
plt.title("Supervivencia por sexo")
plt.show()

df["Age"].hist(bins=30, edgecolor="black")
plt.title("Distribución de edades")
plt.xlabel("Edad")
plt.ylabel("Número de pasajeros")
plt.show()

sns.countplot(data=df, x="Pclass", hue="Survived")
plt.title("Supervivencia por clase")
plt.show()