# Detección de barras en galaxias - Modelos Alternativos
## Proyecto integrador MNA

### Integrantes
- Jonathan Jesús Marmolejo Hernández - A01795195
- Isaid Posadas Oropeza - A01795015
- Luis Daniel Ortega Muñoz - A01795197

# Tabla comparativa de modelos de clasificación de Galaxias Barradas

| Modelo                  | Precisión (Barrada) | Precisión (No Barrada) | Recall (Barrada) | Recall (No Barrada) | F1-Score (Barrada) | F1-Score (No Barrada) | Accuracy | Notebook |
|-------------------------|---------------------|-------------------------|-------------------|----------------------|---------------------|------------------------|----------|----------|
| XGBoost                 | 0.56                | 0.70                    | 0.42              | 0.80                 | 0.48                | 0.74                   | 0.66     | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/XGBoost_vs_RandomForest.ipynb) |
| Random Forest           | 0.57                | 0.72                    | 0.50              | 0.77                 | 0.53                | 0.74                   | 0.67     | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/XGBoost_vs_RandomForest.ipynb) |
| CNN - MobileNetV3       | 0.56                | 0.80                    | 0.73              | 0.65                 | 0.63                | 0.72                   | 0.68     | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/ModelosCNNAlternativos_MobileNet_EfficientNet.ipynb) |
| CNN - EfficientNet      | 0.56                | 0.79                    | 0.71              | 0.66                 | 0.63                | 0.72                   | 0.68     | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/ModelosCNNAlternativos_MobileNet_EfficientNet.ipynb) |
| YOLOv5m                 | 0.64                | -                       | 0.77              | -                    | 0.70                | -                      | -        | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/Yolov5m_Sample.ipynb) 
[Ver rendimiento](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/Yolov5m_vs_Yolov8m.ipynb) |
| YOLOv8m                 | 0.54                | -                       | 0.93              | -                    | 0.68                | -                      | -        | [Ver notebook](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/Yolov8m_Sample.ipynb) 
[Ver rendimiento](https://github.com/ludanortmun/itesm-mna-barred-galaxies/blob/main/notebooks/Yolov5m_vs_Yolov8m.ipynb)  |


## Conclusiones

### 1. Mejor desempeño balanceado
Los modelos basados en redes neuronales convolucionales, específicamente **MobileNetV3** y **EfficientNet**, ofrecen el mejor equilibrio entre precisión y recall para ambas clases. Ambos alcanzan un **accuracy de 0.68**, lo que indica un rendimiento sólido en la detección tanto de galaxias barradas como no barradas.

---

### 2. Rendimiento de modelos clásicos
Los modelos tradicionales como **XGBoost** y **Random Forest** también muestran un rendimiento aceptable. Sin embargo, su **bajo recall en la clase barrada** representa una limitación importante cuando el objetivo es no pasar por alto ninguna galaxia con barra.

---

### 3. YOLOv5m destaca por su recall
**YOLOv5m** presenta una **alta sensibilidad (recall 0.77)** para la clase barrada, lo que lo convierte en una buena opción cuando se busca minimizar falsos negativos. Sin embargo, no se reportan métricas para la clase sin barra ni el accuracy global, lo que dificulta una comparación completa frente a los demás modelos.

---

### 4. YOLOv8m sobresale en sensibilidad
**YOLOv8m** logra el **mayor recall (0.93)** para galaxias barradas, lo que lo posiciona como el modelo más sensible en la tarea de detección. No obstante, al igual que YOLOv5m, **no se han reportado métricas para la clase no barrada ni el accuracy**, por lo que su desempeño general requiere una evaluación complementaria.

---

### 5. ¿Por qué faltan métricas en YOLOv5m y YOLOv8m?
A diferencia de los clasificadores tradicionales, **YOLO es un modelo de detección de objetos**, no un clasificador binario. Detecta únicamente la presencia de las clases entrenadas (en este caso, *barras*), y **no genera una predicción explícita para “sin barra”**.  
Por lo tanto, si el modelo no detecta ninguna instancia de la clase barrada en una imagen, se asume que esta no tiene barra. Sin embargo, esta interpretación **no está representada directamente en las salidas del modelo**, lo que complica el cálculo de métricas como precisión o recall para la clase no barrada, a menos que se haga un procesamiento adicional fuera del framework.

---

### 6. Recomendaciones según el objetivo

Dado que el objetivo principal es **detectar todas las galaxias con barra (maximizar el recall)** y al mismo tiempo **mantener una precisión razonable para reducir falsos positivos**, las recomendaciones son las siguientes:

- **YOLOv8m** es la mejor opción actual si se prioriza no omitir ninguna galaxia con barra, ya que alcanza el mayor recall (0.93) entre todos los modelos evaluados. Esto lo convierte en la opción más adecuada cuando los falsos negativos deben minimizarse al máximo.

- Aunque YOLOv8m puede generar una mayor cantidad de falsos positivos, es posible mitigar esto ajustando el umbral de confianza (`--conf`) para mejorar la precisión sin reducir significativamente el recall.

- **YOLOv5m** también representa una alternativa válida. Tiene un recall de 0.77 y una mejor precisión que YOLOv8m (0.64 vs 0.54), por lo que podría ser útil si se busca reducir ligeramente los falsos positivos a cambio de un leve descenso en sensibilidad.

- Los modelos tradicionales como **Random Forest** y **XGBoost** no son adecuados para este objetivo, ya que su bajo recall en la clase barrada indica que podrían pasar por alto una proporción considerable de galaxias con barra.

- Los modelos **CNN (MobileNetV3 y EfficientNet)** ofrecen un rendimiento balanceado y aceptable en ambas clases, pero no alcanzan el nivel de sensibilidad que proporcionan los modelos YOLO.

En conclusión, **YOLOv8m** es la opción más efectiva si el objetivo es capturar la mayor cantidad posible de galaxias barradas, incluso si eso implica aceptar algunas falsas detecciones.


---

### 7. Consideración de variantes más grandes de YOLO
Existen versiones más potentes como **YOLOv5l**, **YOLOv5x**, **YOLOv8l** o **YOLOv8x**, que cuentan con arquitecturas más profundas y mayor capacidad de representación. Estos modelos podrían ofrecer **mejores métricas de precisión y recall**, pero requieren **mayor tiempo de entrenamiento y más recursos computacionales**. Su evaluación es recomendable si se busca un rendimiento superior y se dispone del hardware adecuado.
