# 🌳 Clasificación con Árboles de Decisión (Salud Preventiva)
Este notebook muestra cómo usar árboles de decisión para clasificar pacientes como **saludables o no saludables** según variables de estilo de vida.

**Incluye:** entrenamiento del árbol, visualización, matriz de confusión y métricas de evaluación.

In [None]:
# Librerías necesarias
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay, classification_report

In [None]:
# Cargar datos y binarizar Health_Score
df = pd.read_csv("synthetic_health_data.csv")
# Se define saludable si Health_Score > 70
df['Saludable'] = (df['Health_Score'] > 70).astype(int)
X = df.drop(columns=['Health_Score', 'Saludable'])
y = df['Saludable']
X.head()

## 🌱 Entrenamiento del árbol de decisión

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
tree = DecisionTreeClassifier(max_depth=4, random_state=42)
tree.fit(X_train, y_train)

plt.figure(figsize=(12,6))
plot_tree(tree, feature_names=X.columns, class_names=['No saludable', 'Saludable'], filled=True)
plt.title("Árbol de decisión para clasificar estado de salud")
plt.show()

## 📊 Matriz de confusión y reporte de métricas

In [None]:
y_pred = tree.predict(X_test)
cm = confusion_matrix(y_test, y_pred, labels=[0, 1])
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=['No saludable', 'Saludable'])
disp.plot(cmap='YlGnBu')
plt.title("Matriz de Confusión")
plt.show()

print(classification_report(y_test, y_pred, target_names=['No saludable', 'Saludable']))

## 📝 Actividad práctica con Kahoot (opcional)
Simula preguntas tipo test como:
- ¿Qué representa un Falso Positivo en salud?
- ¿Qué significa precisión en un modelo?
- ¿Qué variable fue la más importante en el árbol?
- ¿Cuál fue el nivel de exactitud alcanzado?