# Notebook 04 – Comparación de Modelos y Conclusiones

En este notebook se presentan las métricas obtenidas por todos los modelos entrenados en los notebooks anteriores:
- **Notebook 03**: Logistic Regression y Linear SVM (modelos tradicionales)
- **Notebook 05**: LSTM con Word2Vec (modelo de Deep Learning)

Se realiza un análisis comparativo completo y se elige el modelo final para el proyecto de análisis de sentimiento.


## Resumen de Métricas por Modelo

### Modelos Tradicionales (Notebook 03)

**Logistic Regression:**
- Accuracy: 0.839
- Precision (clase 0): 0.83, Recall: 0.86, F1-score: 0.84
- Precision (clase 1): 0.85, Recall: 0.82, F1-score: 0.84
- F1-score promedio: 0.84

**Linear SVM:**
- Accuracy: 0.82
- Precision (clase 0): 0.81, Recall: 0.83, F1-score: 0.82
- Precision (clase 1): 0.83, Recall: 0.81, F1-score: 0.82
- F1-score promedio: 0.82

### Modelo Deep Learning (Notebook 05)

**LSTM con Word2Vec:**
- Accuracy: 0.716
- Precision (clase 0): 0.68, Recall: 0.82, F1-score: 0.74
- Precision (clase 1): 0.77, Recall: 0.61, F1-score: 0.68
- F1-score promedio: 0.71


## Análisis Comparativo

### Comparación de Accuracy

1. **Logistic Regression**: 0.839 (mejor)
2. **Linear SVM**: 0.82
3. **LSTM con Word2Vec**: 0.716

### Comparación de F1-score Promedio

1. **Logistic Regression**: 0.84 (mejor)
2. **Linear SVM**: 0.82
3. **LSTM con Word2Vec**: 0.71

### Observaciones

- **Modelos tradicionales**: Los modelos basados en CountVectorizer y regresión logística/SVM obtienen mejores resultados que el modelo de Deep Learning en este caso. Esto puede deberse a:
  - El tamaño del dataset (5000 muestras) puede ser insuficiente para aprovechar completamente las capacidades de una red neuronal
  - Los modelos tradicionales con n-gramas capturan bien los patrones de sentimiento en reviews cortas
  - El preprocesado con stopwords y stemming funciona bien con modelos tradicionales

- **LSTM con Word2Vec**: Aunque obtiene menor accuracy, tiene mejor recall en la clase negativa (0.82 vs 0.86 y 0.83), lo que significa que detecta mejor las reviews negativas. Sin embargo, tiene problemas con la clase positiva (recall 0.61), lo que sugiere que el modelo podría necesitar más ajuste de hiperparámetros o más datos de entrenamiento.

- **Equilibrio de clases**: Logistic Regression muestra el mejor equilibrio entre precisión y recall en ambas clases, lo que indica una mejor capacidad de generalización.

## Modelo Final Elegido

El modelo final elegido es **Logistic Regression**.

Este modelo muestra:
- El mejor accuracy global (0.839)
- El mejor F1-score promedio (0.84)
- Mejor equilibrio entre precisión y cobertura en ambas clases
- Menor número de errores totales en la matriz de confusión
- Mayor estabilidad y consistencia en el rendimiento

Aunque el modelo LSTM tiene potencial para mejorar con más datos y ajuste de hiperparámetros, para este proyecto y este tamaño de dataset, Logistic Regression ofrece el mejor rendimiento con menor complejidad computacional.


## Visualización Comparativa

Creo una visualización para comparar las métricas de los tres modelos de manera gráfica y facilitar la interpretación de los resultados.


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Datos de los modelos
modelos = ['Logistic\nRegression', 'Linear SVM', 'LSTM\nWord2Vec']
accuracy = [0.839, 0.82, 0.716]
f1_score = [0.84, 0.82, 0.71]

# Crear gráfico comparativo
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 5))

# Gráfico de Accuracy
ax1.bar(modelos, accuracy, color=['#2ecc71', '#3498db', '#e74c3c'])
ax1.set_ylabel('Accuracy')
ax1.set_title('Comparación de Accuracy')
ax1.set_ylim([0.6, 0.9])
ax1.grid(axis='y', alpha=0.3)
for i, v in enumerate(accuracy):
    ax1.text(i, v + 0.01, f'{v:.3f}', ha='center', va='bottom')

# Gráfico de F1-score
ax2.bar(modelos, f1_score, color=['#2ecc71', '#3498db', '#e74c3c'])
ax2.set_ylabel('F1-Score Promedio')
ax2.set_title('Comparación de F1-Score')
ax2.set_ylim([0.6, 0.9])
ax2.grid(axis='y', alpha=0.3)
for i, v in enumerate(f1_score):
    ax2.text(i, v + 0.01, f'{v:.3f}', ha='center', va='bottom')

plt.tight_layout()
plt.show()
