In [None]:
#PASO 1 ‚Äî Leer los .json y preparar los tweet
import json

def load_hateval_json(file_path):
    texts = []
    labels = []
    
    with open(file_path, 'r', encoding='utf-8') as f:
        for line in f:
            try:
                data = json.loads(line.strip())
                texts.append(data["text"])
                labels.append(int(data["klass"]))
            except Exception as e:
                print(f"Error leyendo l√≠nea: {e}")
    
    return texts, labels


In [None]:
#Paso 2 ‚Äî Cargar los datos de entrenamiento y prueba
X_train_es, y_train_es = load_hateval_json("hateval_es_train_spanish.json")
X_test_es, y_test_es = load_hateval_json("hateval_es_test_spanish.json")

X_train_in, y_train_in = load_hateval_json("hateval_en_train_ingles.json")
X_test_in, y_test_in = load_hateval_json("hateval_en_test_ingles.json")


In [None]:
#Comprobar las cargas
print("ES train:", len(X_train_es))
print("ES test:", len(X_test_es))
print("EN train:", len(X_train_in))
print("EN test:", len(X_test_in))



ES train: 4500
ES test: 500
EN train: 9000
EN test: 1000


In [None]:
#librer√≠as para preprocesamiento de texto  y tokenizaci√≥n
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer


In [None]:
# Descargar recursos necesarios UNA SOLA VEZ
nltk.download('stopwords')

In [13]:
#PASO 3 ‚Äî Preprocesamiento de texto y tokenizaci√≥n 

# Configurar herramientas por idioma
stopwords_es = set(stopwords.words('spanish'))
stopwords_en = set(stopwords.words('english'))
stemmer_es = SnowballStemmer('spanish')
stemmer_en = SnowballStemmer('english')

# Funciones de preprocesamiento
def limpiar_texto(texto):
    """
    Limpia el texto antes de tokenizar:
    - Convierte a min√∫sculas
    - Elimina URLs, menciones, hashtags, emojis y caracteres raros
    """
    texto = texto.lower()
    texto = re.sub(r"http\S+|www\S+|https\S+", "", texto)  # URLs
    texto = re.sub(r"@\w+", "", texto)  # menciones
    texto = re.sub(r"#", "", texto)  # hashtags
    texto = re.sub(r"[^a-z√°√©√≠√≥√∫√±√º\s]", "", texto)  # solo letras
    return texto

# Funci√≥n para preprocesar texto en espa√±ol
def preprocesar_espaniol(texto):
    texto = limpiar_texto(texto)
    tokens = texto.split()
    tokens = [t for t in tokens if t not in stopwords_es]  # eliminar stopwords
    tokens = [stemmer_es.stem(t) for t in tokens]  # aplicar stemming
    return " ".join(tokens)

# Funci√≥n para preprocesar texto en ingl√©s
def preprocesar_ingles(texto):
    texto = limpiar_texto(texto)
    tokens = texto.split()
    tokens = [t for t in tokens if t not in stopwords_en]  # eliminar stopwords
    tokens = [stemmer_en.stem(t) for t in tokens]  # aplicar stemming
    return " ".join(tokens)


In [None]:
# Preprocesar los conjuntos de datos
X_entrenamiento_es = [preprocesar_espaniol(t) for t in X_train_es]
X_prueba_es = [preprocesar_espaniol(t) for t in X_test_es]

X_entrenamiento_en = [preprocesar_ingles(t) for t in X_train_in]
X_prueba_en = [preprocesar_ingles(t) for t in X_test_in]


In [15]:
#PASO 4 ‚Äî Vectorizaci√≥n de texto dependiendo del m√©todo elegido
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer

def vectorizar_textos(textos_entrenamiento, textos_prueba, metodo='tfidf', ngramas=(1,1)):
    """
    Convierte los textos en vectores num√©ricos.
    
    Par√°metros:
    textos_entrenamiento: lista de strings de entrenamiento
    textos_prueba: lista de strings de prueba
    metodo: 'tf' para frecuencia de t√©rminos, 'tfidf' para TF-IDF
    ngramas: tupla para definir ngramas, ej. (1,1) unigramas, (1,2) uni+bi
    
    Retorna:
    X_entrenamiento_vect: matriz de entrenamiento
    X_prueba_vect: matriz de prueba
    vectorizador: objeto vectorizador para transformar nuevos datos si es necesario
    """
    if metodo == 'tf':
        vectorizador = CountVectorizer(ngram_range=ngramas)
    elif metodo == 'tfidf':
        vectorizador = TfidfVectorizer(ngram_range=ngramas)
    else:
        raise ValueError("M√©todo debe ser 'tf' o 'tfidf'")
    
    # Ajustar el vectorizador solo con los datos de entrenamiento
    X_entrenamiento_vect = vectorizador.fit_transform(textos_entrenamiento)
    X_prueba_vect = vectorizador.transform(textos_prueba)
    
    return X_entrenamiento_vect.toarray(), X_prueba_vect.toarray(), vectorizador


In [21]:
# Ejemplo de vectorizaci√≥n para espa√±ol usando TF-IDF y unigramas
X_entrenamiento_es_vect, X_prueba_es_vect, vectorizador_es = vectorizar_textos(
    X_entrenamiento_es, X_prueba_es, metodo='tfidf', ngramas=(1,1)
)


In [22]:
# Ejemplo de vectorizaci√≥n para ingl√©s usando TF-IDF y unigramas
X_entrenamiento_en_vect, X_prueba_en_vect, vectorizador_en = vectorizar_textos(
    X_entrenamiento_en, X_prueba_en, metodo='tfidf', ngramas=(1,1)
)


In [16]:
#CLASE MLP_TODO.PY Y FUNCIONES AUXILIARES
import numpy as np
import matplotlib.pyplot as plt
import random
import pandas as pd
from time import time

# ====================================================
# Funciones para activaci√≥n y  su derivada
# ====================================================

# Funci√≥n de activaci√≥n sigmoide
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la sigmoide
def sigmoid_derivative(x):
    # return sigmoid(x) * (1 - sigmoid(x))
    return x * (1 - x)

# ====================================================
# Funciones para manejo de la semilla
# ====================================================

# Establece la semilla para la generaci√≥n de n√∫meros aleatorios
def seed(random_state=33):
    np.random.seed(random_state)
    random.seed(random_state)

# ====================================================
# Funciones para inicializaci√≥n y normalizaci√≥n
# ====================================================

# Inicializaci√≥n Xavier
def xavier_initialization(input_size, output_size): 
    return np.random.randn(input_size, output_size) * np.sqrt(1 / input_size)
# Inicializaci√≥n normal
def normal_initialization(input_size, output_size):
    return np.random.randn(input_size, output_size)
# Normalizaci√≥n Z-score
def zscore_normalization(X):
    mean = np.mean(X, axis=0)
    std = np.std(X, axis=0)
    X_norm = (X - mean) / std
    return X_norm

#Funci√≥n para crear minibatches
def create_minibatches(X, y, batch_size):
    """
    Genera los lotes de datos (batchs) de acuerdo al par√°metro batch_size de forma aleatoria para el procesamiento. 
    """
    n_samples = X.shape[0]
    indices = np.random.permutation(n_samples)  # Mezcla los √≠ndices aleatoriamente
    X_shuffled, y_shuffled = X[indices], y[indices]  # Reordena X e y seg√∫n los √≠ndices aleatorios
    
    # Divide los datos en minibatches
    for X_batch, y_batch in zip(np.array_split(X_shuffled, np.ceil(n_samples / batch_size)), 
                                np.array_split(y_shuffled, np.ceil(n_samples / batch_size))):
        yield X_batch, y_batch

    
class MLP_TODO:
    def __init__(self, num_entradas, num_neuronas_ocultas, num_salidas, epochs, batch_size=128, learning_rate=0.2, normalizacion="none",inicializacion="xavier",random_state=42):

        # ====================================================
        # Inicializaci√≥n general del modelo
        # ====================================================

        # üîπ NUEVO: Usar el par√°metro random_state recibido para controlar la semilla
        seed(33)
        self.random_state = random_state  # üîπ NUEVO: guardar la semilla para usarla tambi√©n en create_minibatches

        # Definir la tasa de aprendizaje
        self.learning_rate = learning_rate
        # Definir el n√∫mero de √©pocas
        self.epochs = epochs
        # Definir el tama√±o del batch de procesamiento
        self.batch_size = batch_size
        # Definir el tipo de normalizaci√≥n
        self.normalizacion = normalizacion
        # Definir el tipo de inicializaci√≥n
        self.inicializacion = inicializacion
        # definir las 
        self.num_neuronas_ocultas = num_neuronas_ocultas

        # Inicializaci√≥n de pesos y bias
        self.W1 = self.inicializar_pesos(num_entradas, self.num_neuronas_ocultas) # Pesos entre capa de entrada y capa oculta
        self.b1 = np.zeros((1, self.num_neuronas_ocultas))   # Bias de la capa oculta
        self.W2 = self.inicializar_pesos(self.num_neuronas_ocultas,num_salidas)  # Pesos entre capa oculta y capa de salida
        self.b2 = np.zeros((1, num_salidas)) # Bias de la capa de salida

        # Historial de errores
        self.errores_history = []
        # Historial de accuracy
        self.accuracy_history = []

    # ====================================================
    # Funciones para forward, backward, update, predict y train
    # ====================================================

    def forward(self, X):
        #implementar el forward pass
        #----------------------------------------------
        # 1. Propagaci√≥n hacia adelante (Forward pass)
        #----------------------------------------------
        # Calcular la suma ponderada Z (z_c1) para la capa oculta 
        self.X = X
        self.z_c1 = X@self.W1 + self.b1
        #Calcular la activaci√≥n de la capa oculta usando la funci√≥n sigmoide
        self.a_c1 = sigmoid(self.z_c1)  # Activaci√≥n capa oculta
        #Calcular la suma ponderada Z (z_c2)  para la capa de salida 
        self.z_c2  = self.a_c1 @ self.W2 + self.b2
        #Calcular la activaci√≥n de la capa de salida usando la funci√≥n sigmoide
        y_pred = sigmoid(self.z_c2)  # Activaci√≥n capa salida
        return y_pred
    

    def loss_function_MSE(self, y_pred, y):
        #----------------------------------------------
        # 2. C√°lculo del error con MSE
        #----------------------------------------------
        #Calcular el error cuadr√°tico medio (MSE)
        self.y_pred = y_pred
        self.y = y
        error = 0.5 * np.mean((y_pred - y) ** 2)
        return error
    

    def backward(self):
        #implementar el backward pass
        # calcular los gradientes para la arquitectura de la figura anterior
        #----------------------------------------------
        # 3. Propagaci√≥n hacia atr√°s (Backward pass)
        #----------------------------------------------
        
        #----------------------------------------------
        # Gradiente de la salida
        #----------------------------------------------
        #Calcular la derivada del error con respecto a la salida y
        dE_dy_pred = (self.y_pred - self.y)  # Derivada del error respecto a la predicci√≥n con  N ejemplos
        #Calcular la derivada de la activaci√≥n de la salida con respecto a z_c2 
        d_y_pred_d_zc2 = sigmoid_derivative(self.y_pred)
        #Calcular delta de la capa de salida
        delta_c2 = dE_dy_pred * d_y_pred_d_zc2  # (N, 1)

        #----------------------------------------------
        # Gradiente en la capa oculta
        #----------------------------------------------
        # calcular la derivada de las suma ponderada respecto a las activaciones de la capa 1
        d_zc2_d_a_c1 = self.W2  
        #Propagar el error hacia la capa oculta, calcular deltas de la capa 1
        delta_c1 = delta_c2 @ d_zc2_d_a_c1.T * sigmoid_derivative(self.a_c1)  

        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 2
        self.dE_dW2 = self.a_c1.T @ delta_c2
        self.dE_db2 = np.sum(delta_c2, axis=0, keepdims=True)
        self.dE_dW1 = self.X.T @ delta_c1 
        self.dE_db1 = np.sum(delta_c1, axis=0, keepdims=True) 


    def update(self):  # Ejecuci√≥n de la actualizaci√≥n de param√°metros
        #implementar la actualizaci√≥n de los pesos y el bias
        #----------------------------------------------
        # Actualizaci√≥n de pesos de la capa de salida
        #---------------------------------------------- 
        #Actualizar los pesos y bias de la capa de salida
        self.W2 = self.W2 - self.dE_dW2 * self.learning_rate
        self.b2 = self.b2 - self.dE_db2 * self.learning_rate
        #----------------------------------------------
        # Actuailzaci√≥n de pesos de la capa oculta
        #----------------------------------------------
        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 1
        self.W1 = self.W1 - self.dE_dW1 * self.learning_rate
        self.b1 = self.b1 - self.dE_db1 * self.learning_rate

    def predict(self, X):  # Predecir la categor√≠a para datos nuevos
        # TODO: implementar la predicci√≥n 
        y_pred = self.forward(X)
        # Obtener la clase para el clasificador binario
        y_pred = np.where(y_pred >= 0.5, 1, 0)
        return y_pred

    def train(self, X, Y):
        #implementar el entrenamiento de la red
            # üîπ Normalizar los datos seg√∫n el tipo configurado
        X = self.normalize(X)
        for epoch in range(self.epochs):
            num_batch = 0
            epoch_error  = 0
            for X_batch, y_batch in create_minibatches(X, Y, self.batch_size):
                y_pred = self.forward(X_batch)
                error = self.loss_function_MSE(y_pred, y_batch)
                epoch_error += error    
                self.backward() # c√°lculo de los gradientes
                self.update() # actualizaci√≥n de los pesos y bias
                num_batch += 1
                # Imprimir el error cada N √©pocas
                if epoch % 100 == 0:
                    print(f"√âpoca {epoch}, Error batch {num_batch}: {error}")
            # Guardar el error promedio de la √©poca
            self.errores_history.append(epoch_error/num_batch)
            #Calcular Accuracy en todo el dataset
            acc_epoch = self.accuracy(X, Y)
            self.accuracy_history.append(acc_epoch)
            # Imprimir el error y accuracy cada N √©pocas
            if epoch % 100 == 0:
                    print(f"√âpoca {epoch}, Error: {epoch_error/num_batch}%")

    
    # ====================================================
    # Funciones para inicializaci√≥n, normalizaci√≥n y accuracy
    # ====================================================
    # Normalizaci√≥n de los datos
    def normalize(self, X):
        if self.normalizacion == "z-score":
            return zscore_normalization(X)  # üîπ Llamada a la funci√≥n existente
        else:  # sin normalizar
            return X
        
    # Inicializaci√≥n de los pesos  
    def inicializar_pesos(self, tama√±o_entrada, tama√±o_salida):
        if self.inicializacion == "xavier":
            return xavier_initialization(tama√±o_entrada, tama√±o_salida)
        elif self.inicializacion == "normal":
            return normal_initialization(tama√±o_entrada, tama√±o_salida)
        else:
            raise ValueError("Tipo de inicializaci√≥n no soportado")
    # C√°lculo de accuracy    
    def accuracy(self, X, y):
        y_pred = self.predict(X)
        acc = np.mean(y_pred == y)  # compara predicciones con valores reales
        return acc
    
    

In [18]:
#Necesitamos reshappear los vectores etiquetas
#Convertir tus labels (y_train, y_test) a formato compatible
#MLP espera arrays de N√ó1, no listas de enteros.
y_train_es = np.array(y_train_es).reshape(-1,1)
y_test_es = np.array(y_test_es).reshape(-1,1)
y_train_en = np.array(y_train_in).reshape(-1,1)
y_test_en = np.array(y_test_in).reshape(-1,1)


In [23]:
#Ejemplo de creaci√≥n y entrenamiento del MLP para espa√±ol
mlp_es = MLP_TODO(
    num_entradas=X_entrenamiento_es_vect.shape[1],
    num_neuronas_ocultas=64,
    num_salidas=1,
    epochs=300,
    batch_size=32,
    learning_rate=0.1,
    normalizacion="none",
    inicializacion="xavier"
)

mlp_es.train(X_entrenamiento_es_vect, y_train_es)


√âpoca 0, Error batch 1: 0.12258864110527798
√âpoca 0, Error batch 2: 0.12547158331657152
√âpoca 0, Error batch 3: 0.11374285018796809
√âpoca 0, Error batch 4: 0.13111889198647653
√âpoca 0, Error batch 5: 0.17712875986431312
√âpoca 0, Error batch 6: 0.17455272258982013
√âpoca 0, Error batch 7: 0.12131263681900087
√âpoca 0, Error batch 8: 0.11302445490276229
√âpoca 0, Error batch 9: 0.12489577525597682
√âpoca 0, Error batch 10: 0.1253095132423369
√âpoca 0, Error batch 11: 0.11029598387435884
√âpoca 0, Error batch 12: 0.1450444744084053
√âpoca 0, Error batch 13: 0.2199631709167975
√âpoca 0, Error batch 14: 0.15494323008077254
√âpoca 0, Error batch 15: 0.16942218183773294
√âpoca 0, Error batch 16: 0.17702404541087646
√âpoca 0, Error batch 17: 0.1117343669127069
√âpoca 0, Error batch 18: 0.1285659221714199
√âpoca 0, Error batch 19: 0.12521872406926182
√âpoca 0, Error batch 20: 0.13746868446204585
√âpoca 0, Error batch 21: 0.1996431847243984
√âpoca 0, Error batch 22: 0.12811375076531514
√âp

In [24]:
#Evaluar el modelo en el conjunto de prueba
predicciones_es = mlp_es.predict(X_prueba_es_vect)
acc_es = mlp_es.accuracy(X_prueba_es_vect, y_test_es)
print("Accuracy espa√±ol:", acc_es)


Accuracy espa√±ol: 0.712


In [None]:
# ====================================================
# Ejemplo de Entrenamiento y evaluaci√≥n del MLP para Hate Speech - Espa√±ol e Ingl√©s
# ====================================================

import numpy as np
from sklearn.metrics import precision_score, recall_score, f1_score
import matplotlib.pyplot as plt

# --- Convertir labels a formato N x 1 ---
y_train_es = np.array(y_train_es).reshape(-1,1)
y_test_es = np.array(y_test_es).reshape(-1,1)
y_train_en = np.array(y_train_en).reshape(-1,1)
y_test_en = np.array(y_test_en).reshape(-1,1)

# ====================================================
# FUNCIONES AUXILIARES PARA M√âTRICAS
# ====================================================
def mostrar_metricas(y_real, y_pred, idioma=""):
    precision = precision_score(y_real, y_pred)
    recall = recall_score(y_real, y_pred)
    f1 = f1_score(y_real, y_pred)
    
    print(f"--- M√©tricas {idioma} ---")
    print(f"Precisi√≥n: {precision:.4f}")
    print(f"Recall:    {recall:.4f}")
    print(f"F1-score:  {f1:.4f}")
    print("------------------------")
    return precision, recall, f1

def graficar_error(er_historial, idioma=""):
    plt.figure(figsize=(8,5))
    plt.plot(range(len(er_historial)), er_historial, marker='o')
    plt.title(f'Error promedio por √©poca - {idioma}')
    plt.xlabel('√âpoca')
    plt.ylabel('Error promedio (MSE)')
    plt.grid(True)
    plt.show()

# ====================================================
# ENTRENAMIENTO Y EVALUACI√ìN - ESPA√ëOL
# ====================================================
mlp_es = MLP_TODO(
    num_entradas=X_entrenamiento_es_vect.shape[1],
    num_neuronas_ocultas=64,   # puedes cambiar seg√∫n tabla de pr√°ctica
    num_salidas=1,
    epochs=10,
    batch_size=32,
    learning_rate=0.1,
    normalizacion="none",
    inicializacion="xavier"
)

print("=== Entrenando MLP Espa√±ol ===")
mlp_es.train(X_entrenamiento_es_vect, y_train_es)

# Predicci√≥n y m√©tricas
predicciones_es = mlp_es.predict(X_prueba_es_vect)
mostrar_metricas(y_test_es, predicciones_es, idioma="Espa√±ol")

# Graficar error vs √©pocas
graficar_error(mlp_es.errores_history, idioma="Espa√±ol")

# ====================================================
# ENTRENAMIENTO Y EVALUACI√ìN - INGL√âS
# ====================================================
mlp_en = MLP_TODO(
    num_entradas=X_entrenamiento_en_vect.shape[1],
    num_neuronas_ocultas=64,
    num_salidas=1,
    epochs=10,
    batch_size=32,
    learning_rate=0.1,
    normalizacion="none",
    inicializacion="xavier"
)

print("=== Entrenando MLP Ingl√©s ===")
mlp_en.train(X_entrenamiento_en_vect, y_train_en)

# Predicci√≥n y m√©tricas
predicciones_en = mlp_en.predict(X_prueba_en_vect)
mostrar_metricas(y_test_en, predicciones_en, idioma="Ingl√©s")

# Graficar error vs √©pocas
graficar_error(mlp_en.errores_history, idioma="Ingl√©s")


In [None]:
# ====================================================
# EXPERIMENTOS CON TODAS LAS CONFIGURACIONES
# ====================================================

# Par√°metros a experimentar seg√∫n la pr√°ctica
neuronas_ocultas = [64, 128, 256]  # puedes agregar 512, 1024 si quieres
inicializaciones = ["xavier", "normal"]
tipos_vector = ["tf", "tfidf"]  # frecuencia de t√©rminos o TF-IDF
ngramas_posibles = [(1,1), (1,2)]  # unigramas, unigramas+bigramas
preprocesamientos = ["none"]  # ya hicimos preprocesamiento, puedes definir variantes si quieres
learning_rates = [0.01, 0.1, 0.5]
batch_sizes = [16, 32, 64]
epochs_posibles = [100, 200, 300]

# Diccionario para almacenar resultados
resultados = []

# ====================================================
# FUNCION PARA EJECUTAR EXPERIMENTO
# ====================================================
def ejecutar_experimento(X_train_raw, y_train, X_test_raw, y_test, idioma=""):
    for n_ocultas in neuronas_ocultas:
        for inicializacion in inicializaciones:
            for tipo_vec in tipos_vector:
                for ngramas in ngramas_posibles:
                    for lr in learning_rates:
                        for batch in batch_sizes:
                            for epocas in epochs_posibles:

                                # Vectorizar
                                X_train_vect, X_test_vect, vectorizador = vectorizar_textos(
                                    X_train_raw, X_test_raw,
                                    metodo=tipo_vec,
                                    ngramas=ngramas
                                )

                                # Crear MLP
                                mlp = MLP_TODO(
                                    num_entradas=X_train_vect.shape[1],
                                    num_neuronas_ocultas=n_ocultas,
                                    num_salidas=1,
                                    epochs=epocas,
                                    batch_size=batch,
                                    learning_rate=lr,
                                    normalizacion="none",
                                    inicializacion=inicializacion
                                )

                                print(f"\nEntrenando {idioma} | Neuronas {n_ocultas}, Inicial {inicializacion}, Vector {tipo_vec}, Ngramas {ngramas}, LR {lr}, Batch {batch}, Epochs {epocas}")
                                
                                # Entrenamiento
                                mlp.train(X_train_vect, y_train)

                                # Predicci√≥n
                                y_pred = mlp.predict(X_test_vect)

                                # M√©tricas
                                precision, recall, f1 = mostrar_metricas(y_test, y_pred, idioma=idioma)

                                # Guardar resultados
                                resultados.append({
                                    "idioma": idioma,
                                    "neuronas_ocultas": n_ocultas,
                                    "inicializacion": inicializacion,
                                    "vector": tipo_vec,
                                    "ngramas": ngramas,
                                    "learning_rate": lr,
                                    "batch_size": batch,
                                    "epochs": epocas,
                                    "precision": precision,
                                    "recall": recall,
                                    "f1": f1,
                                    "error_final": mlp.errores_history[-1]
                                })

# ====================================================
# EJECUTAR PARA ESPA√ëOL
# ====================================================
ejecutar_experimento(X_entrenamiento_es, y_train_es, X_prueba_es, y_test_es, idioma="Espa√±ol")

# ====================================================
# EJECUTAR PARA INGL√âS
# ====================================================
ejecutar_experimento(X_entrenamiento_en, y_train_en, X_prueba_en, y_test_en, idioma="Ingl√©s")

# ====================================================
# CONVERTIR RESULTADOS A DATAFRAME
# ====================================================
import pandas as pd
df_resultados = pd.DataFrame(resultados)
df_resultados = df_resultados.sort_values(by="f1", ascending=False)  # Ordenar por F1-score
print("\n--- TOP 5 CONFIGURACIONES ---")
print(df_resultados.head(5))


In [None]:
# ====================================================
# GRAFICAR CURVAS DE ERROR DE LAS 5 MEJORES CONFIGURACIONES
# ====================================================

import matplotlib.pyplot as plt

# Seleccionar las 5 mejores configuraciones seg√∫n F1-score
top5_config = df_resultados.head(5)

plt.figure(figsize=(10,6))

for i, fila in top5_config.iterrows():
    # Recuperar historial de errores del MLP de esa configuraci√≥n
    # üîπ Asumimos que guardaste los objetos MLP en resultados con clave 'mlp_obj'
    mlp_obj = fila['mlp_obj']
    plt.plot(range(len(mlp_obj.errores_history)), mlp_obj.errores_history, marker='o', label=(
        f"{fila['idioma']} | Noc:{fila['neuronas_ocultas']} | Init:{fila['inicializacion']} | "
        f"Vec:{fila['vector']} | LR:{fila['learning_rate']} | Batch:{fila['batch_size']} | Ep:{fila['epochs']}"
    ))

plt.title("Error promedio por √©poca - Top 5 configuraciones")
plt.xlabel("√âpoca")
plt.ylabel("Error promedio (MSE)")
plt.grid(True)
plt.legend(fontsize=8)
plt.show()
