# Conclusiones: Comparación de los tres modelos multietiqueta

## 1. Rendimiento numérico (F1-micro)

| Modelo                 | F1-micro (media ± std) |
|------------------------|-----------------------:|
| **SVM (RBF, OvR)**     | 0.5387 ± 0.0095        |
| **Random Forest**      | 0.6084 ± 0.0110        |
| **Red neuronal densa** | 0.5966 ± 0.0118        |

> **Nota:** Se reporta solo **F1-micro** porque el dataset está algo desbalanceado y F1-macro/Hamming loss pueden no reflejar bien la calidad global.

---

## 2. Definición de las métricas  

$$
\begin{aligned}
  F1_{\text{micro}} &= 
    \frac{2 \sum_{l} \text{TP}_l}
         {2 \sum_{l} \text{TP}_l + \sum_{l} \text{FP}_l + \sum_{l} \text{FN}_l}
  \\[6pt]
  F1_{\text{macro}} &= 
    \frac{1}{L}\sum_{l=1}^{L} F1_l
  \\[6pt]
  \text{HL} &= 
    \frac{1}{N\,L}\sum_{i=1}^{N}\sum_{l=1}^{L}
      \mathbf{1}\!\left[y_{il}\neq\hat y_{il}\right]
\end{aligned}
$$

- \(L\): número de etiquetas  
- \(N\): número de muestras  
- \(\text{TP},\text{FP},\text{FN}\): verdaderos positivos, falsos positivos y falsos negativos

---

## 3. Lectura de los resultados

- **SVM con kernel RBF**  
  - Obtiene un **F1-micro** promedio de **0.539**, el más bajo.  
  - Su desempeño depende fuertemente de la elección de \(\gamma\) y \(C\), y de la escala de las features.

- **Random Forest**  
  - Mejora notable hasta **0.608** (+0.069 respecto a SVM).  
  - Captura bien interacciones no lineales y es menos sensible al escalado.

- **Red neuronal densa**  
  - F1-micro de **0.597**, muy próxima a Random Forest (−0.0118).  
  - Su fortaleza está en modelar patrones complejos, aunque requiere mayor tuning y entrenamiento.

---

## 4. Conclusión general

1. **Random Forest** es el ganador bajo este esquema, combinando robustez y buen rendimiento sin un tuning excesivo.  
2. **Red neuronal** se sitúa en segundo lugar, con potencial para igualar o superar a RF si se dispone de más datos y se optimizan hiperparámetros.  
3. **SVM** ofrece la menor efectividad aquí y exige cuidado en el ajuste de parámetros y preprocesamiento.



# Referencias y Prompts — *Seismic-Multilabel-Event-Classifier*

## 1. Prompts de Diseño e Implementación

- **1.1 Configurar y cargar correctamente el modelo desde checkpoint:**  
  > *Prompt:* "Enséñame cómo cargar manualmente un checkpoint `.ckpt` en PyTorch Lightning, renombrando los `state_dict` si es necesario y utilizando los hiperparámetros almacenados."

- **1.2 Corregir errores de importación en rutas relativas:**  
  > *Prompt:* "El módulo `src.seismic_model` no se importa correctamente, crea el archivo `seismic_model.py` en la carpeta correcta dentro del proyecto."

- **1.3 Corrección de errores con Trainer en Lightning:**  
  > *Prompt:* "Corrige el error `model must be a LightningModule` que ocurre cuando trato de entrenar mi red neuronal en Lightning."

## 2. Prompts de Corrección y Optimización

- **2.1 Optimización de hiperparámetros para Random Forest y SVM:**  
  > *Prompt:* "Amplía el espacio de búsqueda para la optimización de hiperparámetros usando `RepeatedKFold` y `GridSearchCV` en Random Forest y SVM."

- **2.2 Estandarización de entrada en cada fold:**  
  > *Prompt:* "Corrige la fuga de datos (`data leakage`) aplicando escalado (`StandardScaler`) *dentro* de cada partición de validación cruzada."

- **2.3 Exportación de resultados de evaluación:**  
  > *Prompt:* "Guarda en CSV los resultados de cada fold de evaluación de los modelos para posterior análisis."

---

## 3. Referencias Bibliográficas

- [1] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau, M. Brucher, M. Perrot, and E. Duchesnay, “Scikit-learn: Machine Learning in Python,” *Journal of Machine Learning Research*, vol. 12, pp. 2825–2830, 2011.

- [2] Ó. E. Vásquez Pino, "*Engineered Features* para la estimación de magnitud de eventos sísmicos," Memoria de Título, Departamento de Ingeniería Eléctrica, Facultad de Ciencias Físicas y Matemáticas, Universidad de Chile, 2023.

- [3] Lightning AI, “Lightning AI: Idea to AI product, fast,” [https://lightning.ai](https://lightning.ai) (accedido el 28 de abril de 2025).

- [4] Lightning AI. "Lightning Documentation." [https://lightning.ai/docs/pytorch/stable/](https://lightning.ai/docs/pytorch/stable/)

- [5] TorchMetrics. "Multilabel Classification Metrics." [https://torchmetrics.readthedocs.io/en/stable/classification/multilabel.html](https://torchmetrics.readthedocs.io/en/stable/classification/multilabel.html)

- [6] J. Demšar, "Statistical Comparisons of Classifiers over Multiple Data Sets," *Journal of Machine Learning Research*, vol. 7, pp. 1–30, Jan. 2006.

- [7] S. Raschka, "Model Evaluation, Model Selection, and Algorithm Selection in Machine Learning," *arXiv preprint* arXiv:1811.12808, 2018.

- [8] A. Géron, *Hands‑On Machine Learning with Scikit‑Learn, Keras & TensorFlow*, 3rd ed., O’Reilly Media, 2022.

---

