![image.png](attachment:image.png)

# **Ajuste de hiperparámetros para CatBoost**

Optimizar un modelo CatBoost requiere una cuidadosa selección de hiperparámetros. CatBoost es conocido por su robustez y buen desempeño con configuraciones por defecto, pero ajustar los hiperparámetros puede mejorar aún más su rendimiento. Como guía general, no debes pensar que con esto es suficiente, sólo es un punto de partida para poder trabajar mejor tus modelos en función del problema técnico y de negocio que tengas que resolver con su ayuda.

### Hiperparámetros Clave en CatBoost

1. **`iterations`** (Número de árboles): Número de árboles de boosting.
2. **`learning_rate`** (Tasa de aprendizaje): Velocidad de entrenamiento del modelo.
3. **`depth`** (Profundidad de los árboles): Profundidad máxima de los árboles.
4. **`l2_leaf_reg`** (Regulación L2 en las hojas): Coeficiente de penalización L2.
5. **`border_count`** (Número de divisiones para características numéricas): Afecta la velocidad de entrenamiento y la precisión.
6. **`bagging_temperature`**: Parámetro para el muestreo de filas.

### Ejemplos de Grid para Clasificación

1. **Grid Básico**:
   ```python
   grid_1 = {
       'iterations': [100, 300, 500],
       'learning_rate': [0.01, 0.05, 0.1],
       'depth': [4, 6, 8],
       'l2_leaf_reg': [1, 3, 5],
       'bagging_temperature': [0, 1, 10]
   }
   ```

2. **Grid enfocado en Profundidad y Regularización**:
   ```python
   grid_2 = {
       'iterations': [100, 200],
       'learning_rate': [0.03, 0.1],
       'depth': [4, 7, 10],
       'l2_leaf_reg': [1, 5, 10],
       'bagging_temperature': [0, 5]
   }
   ```

3. **Grid con Mayor Variedad en Iterations y Learning Rate**:
   ```python
   grid_3 = {
       'iterations': [100, 500, 1000],
       'learning_rate': [0.01, 0.05],
       'depth': [3, 5, 7],
       'l2_leaf_reg': [1, 4, 7],
       'bagging_temperature': [0, 10, 20]
   }
   ```

### Ejemplos de Grid para Regresión

1. **Grid Básico**:
   ```python
   grid_4 = {
       'iterations': [100, 300, 500],
       'learning_rate': [0.01, 0.05, 0.1],
       'depth': [4, 6, 8],
       'l2_leaf_reg': [1, 3, 5],
       'bagging_temperature': [0, 1, 10]
   }
   ```

2. **Grid enfocado en Regularización y Profundidad**:
   ```python
   grid_5 = {
       'iterations': [200, 400],
       'learning_rate': [0.03, 0.1],
       'depth': [4, 7, 10],
       'l2_leaf_reg': [2, 6, 10],
       'bagging_temperature': [0, 5]
   }
   ```

3. **Grid con Variación en Iterations y Learning Rate**:
   ```python
   grid_6 = {
       'iterations': [100, 300, 600],
       'learning_rate': [0.01, 0.05],
       'depth': [3, 5, 7],
       'l2_leaf_reg': [1, 4, 7],
       'bagging_temperature': [0, 10, 20]
   }
   ```

### Consejos para la Selección del Grid

- **Balance entre Iterations y Learning Rate**: Un mayor número de `iterations` con una `learning_rate` baja puede llevar a una mejor precisión pero aumentar el tiempo de entrenamiento.
- **Control de Overfitting**: Ajusta `depth`, `l2_leaf_reg`, y `bagging_temperature` para controlar el sobreajuste.
- **Prueba y Error**: Dado que CatBoost maneja bien las configuraciones por defecto, es útil probar primero con un rango amplio y luego ajustar los parámetros en función de los resultados obtenidos.
- **Validación Cruzada**: Utiliza la validación cruzada para evaluar el rendimiento de diferentes configuraciones de hiperparámetros.

