# Learning_curve, Validation_curve, Tuning de Hiperparámetros

## **1. learning_curve**
Se utiliza para analizar cómo el rendimiento del modelo cambia en función del tamaño del conjunto de entrenamiento. 

Es útil para diagnosticar problemas como underfitting (subajuste) o overfitting (sobreajuste).

### Características principales:
- **Qué varía**: El tamaño del conjunto de entrenamiento.
- **Propósito**: Evaluar si el modelo necesita más datos para mejorar su rendimiento.

### Gráfica típica:
- **Eje X**: Tamaño del conjunto de entrenamiento.
- **Eje Y**: Métricas de rendimiento (e.g., precisión, error).
- **Dos curvas**: Una para el conjunto de entrenamiento y otra para el conjunto de validación.

### Interpretación:
- Si ambas curvas convergen hacia un valor bajo de rendimiento, el modelo está underfitting .
- Si la curva de entrenamiento es mucho mejor que la de validación, el modelo está overfitting .
- Si ambas curvas convergen hacia un valor alto de rendimiento, el modelo está bien ajustado.

## **2. validation_curve**
Se utiliza para evaluar cómo el rendimiento del modelo cambia al variar un hiperparámetro específico. 

Es útil para identificar el rango óptimo de un hiperparámetro sin realizar una búsqueda exhaustiva (como con GridSearchCV).

### Características principales:
- **Qué varía**: Un hiperparámetro específico (e.g., max_depth, C, n_estimators).
- **Propósito**: Analizar cómo un hiperparámetro afecta el rendimiento del modelo.

### Gráfica típica:
- **Eje X**: Valores del hiperparámetro.
- **Eje Y**: Métricas de rendimiento (e.g., precisión, error).
- **Dos curvas**: Una para el conjunto de entrenamiento y otra para el conjunto de validación.

### Interpretación:
- Si la curva de entrenamiento mejora constantemente mientras la de validación empeora, el modelo está overfitting con valores altos del hiperparámetro.
- Si ambas curvas convergen hacia un valor bajo de rendimiento, el modelo está underfitting .
- Si ambas curvas convergen hacia un valor alto de rendimiento, el hiperparámetro está bien ajustado.

## 3. Tuning de Hiperparámetros 
El *hyperparameter tuning* es un proceso más amplio que busca encontrar la **combinación óptima de múltiples hiperparámetros** para un modelo. 

Se utiliza cuando quieres ajustar varios hiperparámetros simultáneamente para maximizar el rendimiento del modelo.

#### **Técnicas comunes de Hyperparameter Tuning:**
1. **Grid Search (`GridSearchCV`):**
   - Explora exhaustivamente una cuadrícula predefinida de valores para cada hiperparámetro.
   - Costoso computacionalmente, pero garantiza encontrar el mejor valor dentro de la cuadrícula.

2. **Random Search (`RandomizedSearchCV`):**
   - Explora aleatoriamente una distribución de valores para cada hiperparámetro.
   - Menos costoso que Grid Search y puede ser más eficiente si el espacio de búsqueda es grande.

3. **Optimización Bayesiana:**
   - Usa modelos probabilísticos para seleccionar los hiperparámetros más prometedores.
   - Herramientas como `BayesianOptimization` o `Optuna` implementan esta técnica.

4. **Otros métodos avanzados:**
   - Algoritmos genéticos.
   - Búsqueda basada en árboles de Parzen (TPE).

#### **Características principales:**
- **Qué hace:** Busca la combinación óptima de múltiples hiperparámetros.
- **Propósito:** Maximizar el rendimiento del modelo en datos de validación.
- **Ventajas:**
  - Encuentra automáticamente la mejor combinación de hiperparámetros.
  - Puede manejar múltiples hiperparámetros simultáneamente.
- **Desventajas:**
  - Puede ser computacionalmente costoso, especialmente con Grid Search.
  - Requiere definir un espacio de búsqueda adecuado.
