# Gradient Boosting Regressor

El **Gradient Boosting Regressor** es un estimador (implementaci칩n del algoritmo) que construye un modelo de manera secuencial, optimizando una funci칩n de p칠rdida.  
Su funcionamiento se basa en los siguientes pasos:

1. Se entrena un modelo inicial (normalmente un 치rbol de decisi칩n) para predecir el valor objetivo.
2. Se calcula el **error residual** entre las predicciones y los valores reales.
3. Se entrena un nuevo 치rbol para predecir los errores residuales.
4. Se suma la contribuci칩n del nuevo 치rbol al modelo existente, ponderado por una **tasa de aprendizaje**.
5. Se repiten los pasos 2 a 4 hasta completar el n칰mero de iteraciones (el n칰mero de 치rboles se ajusta en `n_estimators`).

Para conjuntos de datos grandes (`n_samples >= 10,000`), se recomienda usar `HistGradientBoostingRegressor`, una variante m치s eficiente de este algoritmo.

## Par치metros principales

El `GradientBoostingRegressor` ofrece diversos par치metros que ajustan el rendimiento del estimador, entre ellos se encuentran:

- **`loss`**: Funci칩n de p칠rdida a optimizar.
- **`learning_rate`**: Tasa de aprendizaje que controla cu치nto contribuye cada 치rbol al modelo final (por defecto, `0.1`).
- **`n_estimators`**: N칰mero de 치rboles en el conjunto (por defecto, `100`).
- **`subsample`**: Fracci칩n de datos usados para entrenar cada 치rbol. (por defecto, `1.0`).
- **`criterion`**: Criterio de divisi칩n en los 치rboles (por defecto, `'friedman_mse'`).
- **`min_samples_split`**: M칤nimo de muestras requerido para dividir un nodo (por defecto, `2`).
- **`min_samples_leaf`**: M칤nimo de muestras que debe tener un nodo hoja (por defecto, `1`).
- **`max_depth`**: Profundidad m치xima de los 치rboles (por defecto, `3`).
- **`random_state`**: Controla la aleatoriedad del modelo, si no se fija, cada vez que entrenes el modelo obtendr치s resultados ligeramente diferentes.

Estos par치metros permiten controlar el sobreajuste (Evitar que un modelo se adapte demasiado a los datos de entrenamiento).

---

## Interpretaci칩n del modelo en uso

La siguiente configuraci칩n ha sido utilizada en el sistema:

```python
model = GradientBoostingRegressor(
    n_estimators=1000, 
    learning_rate=0.01, 
    max_depth=6, 
    subsample=0.8, 
    random_state=42
)
```

### Explicaci칩n de los par치metros utilizados:

1. **`n_estimators=1000`**: Se entrenan **1,000 치rboles**, lo que permite corregir errores gradualmente y mejorar la precisi칩n del modelo.
2. **`learning_rate=0.01`**: Cada nuevo 치rbol contribuye solo un **1%** al modelo final, evitando sobreajuste y mejorando la estabilidad.
3. **`max_depth=6`**: Se permite que los 치rboles tengan **hasta 6 niveles de profundidad**, capturando patrones m치s complejos. Puede clasificar datos en 64 categor칤as diferentes antes de llegar a una decisi칩n final.
4. **`subsample=0.8`**: Cada 치rbol se entrena con el **80% de los datos**, introduciendo aleatoriedad para mejorar la generalizaci칩n.
5. **`random_state=42`**: Fija un n칰mero para que el entrenamiento siempre d칠 los mismos resultados.

### Conclusi칩n sobre la configuraci칩n

Esta configuraci칩n busca lograr un buen equilibrio entre precisi칩n y capacidad de generalizaci칩n (capacidad del modelo para realizar predicciones precisas sobre nuevos datos que no ha visto antes). Usar muchos 치rboles (1,000) con una tasa de aprendizaje baja (0.01) hace que el modelo mejore poco a poco, evitando errores grandes y haci칠ndolo m치s estable. El submuestreo (usar solo el 80% de los datos en cada 치rbol) introduce algo de aleatoriedad, lo que ayuda a que el modelo no se ajuste demasiado a los datos de entrenamiento y funcione mejor con nuevos datos. Sin embargo, entrenar tantos 치rboles con una profundidad de 6 puede hacer que el proceso sea m치s lento y requiera m치s recursos 丘멆잺.

---

## Fuente
Parte del contenido de esta documentaci칩n se basa en la documentaci칩n oficial de Scikit-Learn.
Puedes encontrar m치s informaci칩n en:  
游댕 [Scikit-Learn - GradientBoostingRegressor](https://scikit-learn.org/dev/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html#sklearn.ensemble.GradientBoostingRegressor)
Todo el contenido original pertenece a Scikit-Learn.