# Análisis de Sentimientos usando Transformers (BERT)

En este notebook implementaremos y evaluaremos un modelo BERT para la clasificación de sentimientos de las reseñas.

In [2]:
import sys
sys.path.append('..')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from src.models.deep_learning.bert_model import BERTSentimentClassifier

RuntimeError: Failed to import transformers.models.bert.modeling_tf_bert because of the following error (look up to see its traceback):
Your currently installed version of Keras is Keras 3, but this is not yet supported in Transformers. Please install the backwards-compatible tf-keras package with `pip install tf-keras`.

## 1. Carga y Preparación de Datos

In [None]:
# Inicializar el clasificador BERT
classifier = BERTSentimentClassifier()

# Preparar los datos
data_file = "../data/processed/reviews_preprocessed.csv"
X_train, X_test, y_train, y_test, class_weights = classifier.prepare_data(data_file)

## 2. Construcción y Entrenamiento del Modelo

In [None]:
# Construir el modelo
classifier.build_model()

In [None]:
# Entrenar el modelo
history = classifier.train(
    X_train, y_train,
    X_test, y_test,
    class_weights,
    epochs=5,
    batch_size=32
)

## 3. Evaluación del Modelo

In [None]:
# Evaluar el modelo
output_dir = "../models/deep_learning"
report, cm = classifier.evaluate(X_test, y_test, output_dir)

print("\nReporte de Clasificación:")
print(report)

## 4. Visualización de Resultados

In [None]:
# Visualizar el historial de entrenamiento
plt.figure(figsize=(12, 4))

# Gráfico de pérdida
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Training Loss', linewidth=2)
plt.plot(history.history['val_loss'], label='Validation Loss', linewidth=2)
plt.title('Model Loss', fontsize=12)
plt.xlabel('Epoch', fontsize=10)
plt.ylabel('Loss', fontsize=10)
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend(fontsize=10)

# Gráfico de precisión
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Training Accuracy', linewidth=2)
plt.plot(history.history['val_accuracy'], label='Validation Accuracy', linewidth=2)
plt.title('Model Accuracy', fontsize=12)
plt.xlabel('Epoch', fontsize=10)
plt.ylabel('Accuracy', fontsize=10)
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend(fontsize=10)

plt.tight_layout()
plt.show()