### ¿Cómo funciona un Árbol de Decisión (Decision Tree) para Regresión?

Un Árbol de Decisión es un modelo no paramétrico supervisado que se utiliza tanto para clasificación como para regresión. Cuando se usa para regresión, el objetivo es predecir un valor de salida continuo (un número).

Su funcionamiento se basa en dividir repetidamente el espacio de características en regiones más pequeñas y manejables, haciendo preguntas simples sobre las características de los datos. Imagina que es como un juego de '20 preguntas':

1.  **Nodos Raíz y Nodos Internos**: Cada nodo en el árbol representa una 'pregunta' sobre una característica (ej. '¿La edad de la casa es mayor a 30 años?').
2.  **Ramas**: Las respuestas a estas preguntas dirigen a la observación por diferentes ramas del árbol.
3.  **Nodos Hoja (Leaf Nodes)**: Una vez que se llega a un nodo hoja, no hay más preguntas. La predicción para cualquier observación que caiga en este nodo hoja es típicamente el valor promedio de las variables objetivo de todas las muestras de entrenamiento que llegaron a ese mismo nodo.
4.  **Criterio de División**: El algoritmo elige las preguntas (divisiones) que mejor reducen la varianza (o el error cuadrático medio) en la variable objetivo dentro de cada una de las subregiones resultantes. El objetivo es crear nodos hojas donde los valores de `y` sean lo más homogéneos posible.

Los árboles de decisión son muy intuitivos y fáciles de interpretar, pero pueden ser propensos al sobreajuste si son muy profundos y no se regulan correctamente (por ejemplo, mediante la poda o limitando su profundidad).

### Python

```python
from sklearn.tree import DecisionTreeRegressor

# Instanciar el modelo con parámetros (ej. profundidad máxima)
model = DecisionTreeRegressor(max_depth=5, random_state=42)
```

### Ejemplo de DecisionTreeRegressor con `fetch_california_housing`

In [6]:
import numpy as np
import pandas as pd
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor # Importamos DecisionTreeRegressor
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error

# 1. Cargar el dataset
california = fetch_california_housing(as_frame=True)
X = california.data
y = california.target

# 2. Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Tamaño del conjunto de entrenamiento: {X_train.shape[0]} muestras")
print(f"Tamaño del conjunto de prueba: {X_test.shape[0]} muestras")

# 3. Instanciar y entrenar el modelo DecisionTreeRegressor
# Limitamos la profundidad para evitar el sobreajuste excesivo y mejorar la interpretabilidad
dt_model = DecisionTreeRegressor(max_depth=10, random_state=42) # Usamos max_depth para control
dt_model.fit(X_train, y_train)

print("Modelo DecisionTreeRegressor entrenado exitosamente.")

# 4. Realizar predicciones en el conjunto de prueba
y_pred_dt = dt_model.predict(X_test)

# 5. Calcular y mostrar métricas de evaluación para DecisionTreeRegressor
r2_dt = r2_score(y_test, y_pred_dt)
mae_dt = mean_absolute_error(y_test, y_pred_dt)
rmse_dt = np.sqrt(mean_squared_error(y_test, y_pred_dt))

print(f"Métricas para DecisionTreeRegressor (max_depth=10):")
print(f"  R2 Score: {r2_dt:.4f}")
print(f"  Mean Absolute Error (MAE): {mae_dt:.4f}")
print(f"  Root Mean Squared Error (RMSE): {rmse_dt:.4f}")

Tamaño del conjunto de entrenamiento: 16512 muestras
Tamaño del conjunto de prueba: 4128 muestras
Modelo DecisionTreeRegressor entrenado exitosamente.
Métricas para DecisionTreeRegressor (max_depth=10):
  R2 Score: 0.6829
  Mean Absolute Error (MAE): 0.4332
  Root Mean Squared Error (RMSE): 0.6446
