# 🌳 Árbol de decisión con el dataset Titanic
Ejercicio sencillo en Python usando `scikit-learn`, `pandas` y `seaborn`. En este cuaderno entrenaremos un modelo para predecir si un pasajero del Titanic sobrevivió.

In [None]:

import pandas as pd
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt


## 📥 Cargar el dataset Titanic

In [None]:

# Cargar dataset Titanic desde seaborn
titanic = sns.load_dataset("titanic")

# Ver las primeras filas
titanic.head()


## 🧹 Preparar los datos

In [None]:

# Seleccionamos algunas columnas relevantes
datos = titanic[["survived", "pclass", "sex", "age", "fare"]].dropna()

# Convertimos la variable 'sex' a numérica
datos["sex"] = datos["sex"].map({"male": 0, "female": 1})

# Variables (X) y etiqueta (y)
X = datos[["pclass", "sex", "age", "fare"]]
y = datos["survived"]

# Verificamos que todo esté correcto
datos.head()


## ✂️ Dividir los datos en entrenamiento y prueba

In [None]:

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)


## 🌳 Crear y entrenar el modelo

In [None]:

# Creamos el árbol de decisión
modelo = DecisionTreeClassifier(random_state=42, max_depth=4)
modelo.fit(X_train, y_train)


## 📊 Evaluar el modelo

In [None]:

y_pred = modelo.predict(X_test)
print("Precisión del modelo:", accuracy_score(y_test, y_pred))


## 🌿 Visualizar el árbol de decisión

In [None]:

plt.figure(figsize=(12, 6))
plot_tree(
    modelo,
    filled=True,
    feature_names=X.columns,
    class_names=["No sobrevivió", "Sobrevivió"]
)
plt.show()


✅ **Resultado esperado:**
- Precisión entre 0.75 y 0.85 (puede variar ligeramente)
- Visualización del árbol mostrando las decisiones según clase, sexo, edad y tarifa.