## Clasificaci√≥n de Textos

<img src="figs/fig-diagrama-clasificador.png" width="900">

# Entrenar al clasificador

### Clasificador: Red Neuronal Multicapa

<center>
<img src="figs/fig-MLP_XOR.png" width="600" style="background-color:white;">
</center>


### 1. Cargar los datos

In [1]:
import pandas as pd
dataset = pd.read_json("./data_aggressiveness_es.json", lines=True)
#conteo de clases
print("Total de ejemplos de entrenamiento")
print(dataset.klass.value_counts()) # muestra el conteo de cada clase
# Extracci√≥n de los textos en arreglos de numpy
X = dataset['text'].to_numpy()
# Extracci√≥n de las etiquetas o clases de entrenamiento
Y = dataset['klass'].to_numpy()

Total de ejemplos de entrenamiento
klass
nonaggressive    3655
aggressive       1477
Name: count, dtype: int64


### 2. Codificar las categor√≠as (clases)

In [2]:
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
# Normalizar las etiquetas a una codificaci√≥n ordinal para entrada del clasificador
Y_encoded= le.fit_transform(Y)
print("Clases:")
print(le.classes_)
print("Clases codificadas:")
print(le.transform(le.classes_))

Clases:
['aggressive' 'nonaggressive']
Clases codificadas:
[0 1]


### 3. Preparar los conjuntos de datos  (datasets) para entrenamiento y para probar el rendimiento del clasificador

In [3]:
# Dividir el conjunto de datos en conjunto de entrenamiento (80%) y conjunto de pruebas (20%)
from sklearn.model_selection import train_test_split

X_train, X_test, Y_train, Y_test =  train_test_split(X, Y_encoded, test_size=0.2, stratify=Y_encoded, random_state=42)


### 4. Crear Matriz Documento-T√©rmino

In [5]:
from nltk.corpus import stopwords
from sklearn.feature_extraction.text import TfidfVectorizer
from nltk import word_tokenize

_STOPWORDS = stopwords.words("spanish")  # agregar m√°s palabras a esta lista si es necesario

# Normalizaci√≥n del texto

import unicodedata
import re
PUNCTUACTION = ";:,.\\-\"'/"
SYMBOLS = "()[]¬ø?¬°!{}~<>|"
NUMBERS= "0123456789"
SKIP_SYMBOLS = set(PUNCTUACTION + SYMBOLS)
SKIP_SYMBOLS_AND_SPACES = set(PUNCTUACTION + SYMBOLS + '\t\n\r ')

def normaliza_texto(input_str,
                    punct=False,
                    accents=False,
                    num=False,
                    max_dup=2):
    """
        punct=False (elimina la puntuaci√≥n, True deja intacta la puntuaci√≥n)
        accents=False (elimina los acentos, True deja intactos los acentos)
        num= False (elimina los n√∫meros, True deja intactos los acentos)
        max_dup=2 (n√∫mero m√°ximo de s√≠mbolos duplicados de forma consecutiva, rrrrr => rr)
    """
    
    nfkd_f = unicodedata.normalize('NFKD', input_str)
    n_str = []
    c_prev = ''
    cc_prev = 0
    for c in nfkd_f:
        if not num:
            if c in NUMBERS:
                continue
        if not punct:
            if c in SKIP_SYMBOLS:
                continue
        if not accents and unicodedata.combining(c):
            continue
        if c_prev == c:
            cc_prev += 1
            if cc_prev >= max_dup:
                continue
        else:
            cc_prev = 0
        n_str.append(c)
        c_prev = c
    texto = unicodedata.normalize('NFKD', "".join(n_str))
    texto = re.sub(r'(\s)+', r' ', texto.strip(), flags=re.IGNORECASE)
    return texto


# Preprocesamiento personalizado 
def mi_preprocesamiento(texto):
    #convierte a min√∫sculas el texto antes de normalizar
    tokens = word_tokenize(texto.lower())
    texto = " ".join(tokens)
    texto = normaliza_texto(texto)
    return texto
    
# Tokenizador personalizado 
def mi_tokenizador(texto):
    # Elimina stopwords: palabras que no se consideran de contenido y que no agregan valor sem√°ntico al texto
    #print("antes: ", texto)
    texto = [t for t in texto.split() if t not in _STOPWORDS]
    #print("despu√©s:",texto)
    return texto


vec_tfidf = TfidfVectorizer(analyzer="word", preprocessor=mi_preprocesamiento, tokenizer=mi_tokenizador,  ngram_range=(1,1))
X_tfidf = vec_tfidf.fit_transform(X_train)
print("vocabulario: ", len(vec_tfidf.get_feature_names_out()))

vocabulario:  10609


### 5. Crear el clasificador: Crear la clase MLP_TODO 

In [None]:

"""
import numpy as np

# Funci√≥n de activaci√≥n sigmoide
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la sigmoide
def sigmoid_derivative(x):
    # return sigmoid(x) * (1 - sigmoid(x))
    return x * (1 - x)

# Establece la semilla para la generaci√≥n de n√∫meros aleatorios
def seed(random_state=33):
    np.random.seed(random_state)

def xavier_initialization(input_size, output_size):
    # Calcular el l√≠mite de la distribuci√≥n uniforme
    limit = np.sqrt(6 / (input_size + output_size))
    # Generar la matriz de pesos con distribuci√≥n uniforme en el rango [-limit, limit]
    W = np.random.uniform(-limit, limit, (input_size, output_size))
    return W


def create_minibatches(X, y, batch_size):
    n_samples = X.shape[0]
    indices = np.random.permutation(n_samples)  # Mezcla los √≠ndices aleatoriamente
    X_shuffled, y_shuffled = X[indices], y[indices]  # Reordena X e y seg√∫n los √≠ndices aleatorios
    
    # Divide los datos en minibatches
    for X_batch, y_batch in zip(np.array_split(X_shuffled, np.ceil(n_samples / batch_size)), 
                                np.array_split(y_shuffled, np.ceil(n_samples / batch_size))):
        yield X_batch, y_batch

    
class MLP_TODO:
    def __init__(self, num_entradas, num_neuronas_ocultas, num_salidas, epochs, batch_size=32, learning_rate=0.5, random_state=42):

        seed(random_state)
        # Definir la tasa de aprendizaje
        self.learning_rate = learning_rate
        # Definir el n√∫mero de √©pocas
        self.epochs = epochs
        # Definir el tama√±o del batch de procesamiento
        self.batch_size = batch_size
        
        # definir las capas
        self.W1 = xavier_initialization(num_neuronas_ocultas, num_entradas)  # Pesos entre capa de entrada y capa oculta
        self.b1 = np.zeros((1, num_neuronas_ocultas))   # Bias de la capa oculta
        self.W2 = xavier_initialization(num_salidas, num_neuronas_ocultas)  # Pesos entre capa oculta y capa de salida
        self.b2 = np.zeros((1, num_salidas)) # Bias de la capa de salida

    def forward(self, X):
        # TODO: implementar el forward pass
        #----------------------------------------------
        # 1. Propagaci√≥n hacia adelante (Forward pass)
        #----------------------------------------------
        # TODO: Calcular la suma ponderada Z (z_c1) para la capa oculta 
        self.X = X
        self.z_c1 = 0
        # TODO: Calcular la activaci√≥n de la capa oculta usando la funci√≥n sigmoide
        self.a_c1 = 0
        # TODO: Calcular la suma ponderada Z (z_c2)  para la capa de salida 
        self.z_c2 = 0
        # TODO: Calcular la activaci√≥n de la capa de salida usando la funci√≥n sigmoide
        y_pred = 0  # Activaci√≥n capa de salida
        return y_pred
    

    def loss_function_MSE(self, y_pred, y):
        #----------------------------------------------
        # 2. C√°lculo del error con MSE
        #----------------------------------------------
        # TODO: Calcular el error cuadr√°tico medio (MSE)
        self.y_pred = y_pred
        self.y = y
        error = 0.5 * np.mean((y_pred - y) ** 2)
        return error
    

    def backward(self):
        # TODO: implementar el backward pass
        # calcular los gradientes para la arquitectura de la figura anterior
        #----------------------------------------------
        # 3. Propagaci√≥n hacia atr√°s (Backward pass)
        #----------------------------------------------
        
        #----------------------------------------------
        # Gradiente de la salida
        #----------------------------------------------
        # TODO: Calcular la derivada del error con respecto a la salida y
        dE_dy_pred = 0 # Derivada del error respecto a la predicci√≥n con  N ejemplos
        # TODO: Calcular la derivada de la activaci√≥n de la salida con respecto a z_c2 
        d_y_pred_d_zc2 = 0
        # TODO: Calcular delta de la capa de salida
        delta_c2 = 0

        #----------------------------------------------
        # Gradiente en la capa oculta
        #----------------------------------------------
        # calcular la derivada de las suma ponderada respecto a las activaciones de la capa 1
        d_zc2_d_a_c1 = 0
        # TODO: Propagar el error hacia la capa oculta, calcular deltas de la capa 1
        delta_c1 = 0

        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 2
        self.dE_dW2 = 0
        self.dE_db2 =0
        self.dE_dW1 =  0
        self.dE_db1 =  0


    def update(self):  # Ejecuci√≥n de la actualizaci√≥n de param√°metros
        # TODO: implementar la actualizaci√≥n de los pesos y el bias
        #----------------------------------------------
        # Actualizaci√≥n de pesos de la capa de salida
        #---------------------------------------------- 
        
        # TODO: Actualizar los pesos y bias de la capa de salida
        self.W2 = 0
        self.b2 = 0

        #----------------------------------------------
        # Actuailzaci√≥n de pesos de la capa oculta
        #----------------------------------------------
        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 1
        self.W1 = 0
        self.b1 = 0

    def predict(self, X):  # Predecir la categor√≠a para datos nuevos
        # TODO: implementar la predicci√≥n 
        y_pred = self.forward(X)
        # Obtener la clase para el clasificador binario
        y_pred = np.where(y_pred >= 0.5, 1, 0)
        return y_pred

    def train(self, X, Y):
        #implementar el entrenamiento de la red
        for epoch in range(self.epochs):
            for X_batch, y_batch in create_minibatches(X, Y, self.batch_size):
                y_pred = self.forward(X_batch)
                error = self.loss_function_MSE(y_pred, y_batch)
                self.backward() # c√°lculo de los gradientes
                self.update() # actualizaci√≥n de los pesos y bias

                # Imprimir el error cada N √©pocas
                if epoch % 100 == 0:
                    print(f"√âpoca {epoch}, Error: {error}")
                    

"""

In [6]:
#CLASE MLP_TODO.PY Y FUNCIONES AUXILIARES
import numpy as np
import matplotlib.pyplot as plt
import random
import pandas as pd
from time import time

# ====================================================
# Funciones para activaci√≥n y  su derivada
# ====================================================
def cargar_dataset(ruta):
    # Cargar el archivo CSV con pandas
    datos = pd.read_csv(ruta)
    # Separar las caracter√≠sticas (todas menos la √∫ltima columna)
    X = datos.iloc[:, :-1].values  
    # Separar la columna objetivo (√∫ltima columna)
    y = datos.iloc[:, -1].values  
    # Asegurar que y sea un vector columna (n x 1)
    y = y.reshape(-1, 1)
    # Mostrar informaci√≥n del dataset cargado
    print(f"Conjunto de datos cargado desde: {ruta}")
    print(f"   ‚Üí Ejemplos: {X.shape[0]}, Caracter√≠sticas: {X.shape[1]}")
    print(f"   ‚Üí Clases √∫nicas en y: {np.unique(y).ravel()}")

    return X, y


# Funci√≥n de activaci√≥n sigmoide
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la sigmoide
def sigmoid_derivative(x):
    # return sigmoid(x) * (1 - sigmoid(x))
    return x * (1 - x)

# ====================================================
# Funciones para manejo de la semilla
# ====================================================

# Establece la semilla para la generaci√≥n de n√∫meros aleatorios
def seed(random_state=33):
    np.random.seed(random_state)
    random.seed(random_state)

# ====================================================
# Funciones para inicializaci√≥n y normalizaci√≥n
# ====================================================

# Inicializaci√≥n Xavier
def xavier_initialization(input_size, output_size): 
    return np.random.randn(input_size, output_size) * np.sqrt(1 / input_size)
# Inicializaci√≥n normal
def normal_initialization(input_size, output_size):
    return np.random.randn(input_size, output_size)
# Normalizaci√≥n Z-score
def zscore_normalization(X):
    mean = np.mean(X, axis=0)
    std = np.std(X, axis=0)
    X_norm = (X - mean) / std
    return X_norm

#Funci√≥n para crear minibatches
def create_minibatches(X, y, batch_size):
    """
    Genera los lotes de datos (batchs) de acuerdo al par√°metro batch_size de forma aleatoria para el procesamiento. 
    """
    n_samples = X.shape[0]
    indices = np.random.permutation(n_samples)  # Mezcla los √≠ndices aleatoriamente
    X_shuffled, y_shuffled = X[indices], y[indices]  # Reordena X e y seg√∫n los √≠ndices aleatorios
    
    # Divide los datos en minibatches
    for X_batch, y_batch in zip(np.array_split(X_shuffled, np.ceil(n_samples / batch_size)), 
                                np.array_split(y_shuffled, np.ceil(n_samples / batch_size))):
        yield X_batch, y_batch

    
class MLP_TODO:
    def __init__(self, num_entradas, num_neuronas_ocultas, num_salidas, epochs, batch_size=128, learning_rate=0.2, normalizacion="none",inicializacion="xavier",random_state=42):

        # ====================================================
        # Inicializaci√≥n general del modelo
        # ====================================================

        # üîπ NUEVO: Usar el par√°metro random_state recibido para controlar la semilla
        seed(33)
        self.random_state = random_state  # üîπ NUEVO: guardar la semilla para usarla tambi√©n en create_minibatches

        # Definir la tasa de aprendizaje
        self.learning_rate = learning_rate
        # Definir el n√∫mero de √©pocas
        self.epochs = epochs
        # Definir el tama√±o del batch de procesamiento
        self.batch_size = batch_size
        # Definir el tipo de normalizaci√≥n
        self.normalizacion = normalizacion
        # Definir el tipo de inicializaci√≥n
        self.inicializacion = inicializacion
        # definir las 
        self.num_neuronas_ocultas = num_neuronas_ocultas

        # Inicializaci√≥n de pesos y bias
        self.W1 = self.inicializar_pesos(num_entradas, self.num_neuronas_ocultas) # Pesos entre capa de entrada y capa oculta
        self.b1 = np.zeros((1, self.num_neuronas_ocultas))   # Bias de la capa oculta
        self.W2 = self.inicializar_pesos(self.num_neuronas_ocultas,num_salidas)  # Pesos entre capa oculta y capa de salida
        self.b2 = np.zeros((1, num_salidas)) # Bias de la capa de salida

        # Historial de errores
        self.errores_history = []
        # Historial de accuracy
        self.accuracy_history = []

    # ====================================================
    # Funciones para forward, backward, update, predict y train
    # ====================================================

    def forward(self, X):
        #implementar el forward pass
        #----------------------------------------------
        # 1. Propagaci√≥n hacia adelante (Forward pass)
        #----------------------------------------------
        # Calcular la suma ponderada Z (z_c1) para la capa oculta 
        self.X = X
        self.z_c1 = X@self.W1 + self.b1
        #Calcular la activaci√≥n de la capa oculta usando la funci√≥n sigmoide
        self.a_c1 = sigmoid(self.z_c1)  # Activaci√≥n capa oculta
        #Calcular la suma ponderada Z (z_c2)  para la capa de salida 
        self.z_c2  = self.a_c1 @ self.W2 + self.b2
        #Calcular la activaci√≥n de la capa de salida usando la funci√≥n sigmoide
        y_pred = sigmoid(self.z_c2)  # Activaci√≥n capa salida
        return y_pred
    

    def loss_function_MSE(self, y_pred, y):
        #----------------------------------------------
        # 2. C√°lculo del error con MSE
        #----------------------------------------------
        #Calcular el error cuadr√°tico medio (MSE)
        self.y_pred = y_pred
        self.y = y
        error = 0.5 * np.mean((y_pred - y) ** 2)
        return error
    

    def backward(self):
        #implementar el backward pass
        # calcular los gradientes para la arquitectura de la figura anterior
        #----------------------------------------------
        # 3. Propagaci√≥n hacia atr√°s (Backward pass)
        #----------------------------------------------
        
        #----------------------------------------------
        # Gradiente de la salida
        #----------------------------------------------
        #Calcular la derivada del error con respecto a la salida y
        dE_dy_pred = (self.y_pred - self.y)  # Derivada del error respecto a la predicci√≥n con  N ejemplos
        #Calcular la derivada de la activaci√≥n de la salida con respecto a z_c2 
        d_y_pred_d_zc2 = sigmoid_derivative(self.y_pred)
        #Calcular delta de la capa de salida
        delta_c2 = dE_dy_pred * d_y_pred_d_zc2  # (N, 1)

        #----------------------------------------------
        # Gradiente en la capa oculta
        #----------------------------------------------
        # calcular la derivada de las suma ponderada respecto a las activaciones de la capa 1
        d_zc2_d_a_c1 = self.W2  
        #Propagar el error hacia la capa oculta, calcular deltas de la capa 1
        delta_c1 = delta_c2 @ d_zc2_d_a_c1.T * sigmoid_derivative(self.a_c1)  

        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 2
        self.dE_dW2 = self.a_c1.T @ delta_c2
        self.dE_db2 = np.sum(delta_c2, axis=0, keepdims=True)
        self.dE_dW1 = self.X.T @ delta_c1 
        self.dE_db1 = np.sum(delta_c1, axis=0, keepdims=True) 


    def update(self):  # Ejecuci√≥n de la actualizaci√≥n de param√°metros
        #implementar la actualizaci√≥n de los pesos y el bias
        #----------------------------------------------
        # Actualizaci√≥n de pesos de la capa de salida
        #---------------------------------------------- 
        #Actualizar los pesos y bias de la capa de salida
        self.W2 = self.W2 - self.dE_dW2 * self.learning_rate
        self.b2 = self.b2 - self.dE_db2 * self.learning_rate
        #----------------------------------------------
        # Actuailzaci√≥n de pesos de la capa oculta
        #----------------------------------------------
        #calcula el gradiente de la funci√≥n de error respecto a los pesos de la capa 1
        self.W1 = self.W1 - self.dE_dW1 * self.learning_rate
        self.b1 = self.b1 - self.dE_db1 * self.learning_rate

    def predict(self, X):  # Predecir la categor√≠a para datos nuevos
        # TODO: implementar la predicci√≥n 
        y_pred = self.forward(X)
        # Obtener la clase para el clasificador binario
        y_pred = np.where(y_pred >= 0.5, 1, 0)
        return y_pred

    def train(self, X, Y):
        #implementar el entrenamiento de la red
            # üîπ Normalizar los datos seg√∫n el tipo configurado
        X = self.normalize(X)
        for epoch in range(self.epochs):
            num_batch = 0
            epoch_error  = 0
            for X_batch, y_batch in create_minibatches(X, Y, self.batch_size):
                y_pred = self.forward(X_batch)
                error = self.loss_function_MSE(y_pred, y_batch)
                epoch_error += error    
                self.backward() # c√°lculo de los gradientes
                self.update() # actualizaci√≥n de los pesos y bias
                num_batch += 1
                # Imprimir el error cada N √©pocas
                if epoch % 100 == 0:
                    print(f"√âpoca {epoch}, Error batch {num_batch}: {error}")
            # Guardar el error promedio de la √©poca
            self.errores_history.append(epoch_error/num_batch)
            #Calcular Accuracy en todo el dataset
            acc_epoch = self.accuracy(X, Y)
            self.accuracy_history.append(acc_epoch)
            # Imprimir el error y accuracy cada N √©pocas
            if epoch % 100 == 0:
                    print(f"√âpoca {epoch}, Error: {epoch_error/num_batch}%")

    def evaluar(self, X, y):
        """
        Eval√∫a el desempe√±o del modelo en un conjunto de prueba.
        Muestra todas las predicciones junto con las salidas esperadas en columnas paralelas.
        Calcula la precisi√≥n total.
        """
        # Normalizar los datos de entrada con la misma t√©cnica usada en entrenamiento
        X = self.normalize(X)

        # Obtener las predicciones
        y_pred = self.predict(X)

        # Combinar esperadas y predicciones en columnas paralelas
        resultados = np.column_stack((y, y_pred))
        
        # Mostrar resultados
        print("\nüîç Evaluaci√≥n del modelo (esperada | predicha):")
        for idx, (esperada, predicha) in enumerate(resultados):
            print(f"{idx+1:02d}: {esperada} | {predicha}")

        # Calcular precisi√≥n global
        accuracy = np.mean(y_pred == y)
        print(f"\n‚úÖ Precisi√≥n del modelo: {accuracy * 100:.2f}%")

        return accuracy


    
    # ====================================================
    # Funciones para inicializaci√≥n, normalizaci√≥n y accuracy
    # ====================================================
    # Normalizaci√≥n de los datos
    def normalize(self, X):
        if self.normalizacion == "z-score":
            return zscore_normalization(X)  # üîπ Llamada a la funci√≥n existente
        else:  # sin normalizar
            return X
        
    # Inicializaci√≥n de los pesos  
    def inicializar_pesos(self, tama√±o_entrada, tama√±o_salida):
        if self.inicializacion == "xavier":
            return xavier_initialization(tama√±o_entrada, tama√±o_salida)
        elif self.inicializacion == "normal":
            return normal_initialization(tama√±o_entrada, tama√±o_salida)
        else:
            raise ValueError("Tipo de inicializaci√≥n no soportado")
    # C√°lculo de accuracy    
    def accuracy(self, X, y):
        y_pred = self.predict(X)
        acc = np.mean(y_pred == y)  # compara predicciones con valores reales
        return acc
    
    # ====================================================
    # Funciones para graficar Error, Acurery y ambas
    # ====================================================
    
    # Gr√°fica del error despues del entrenamiento
    def plot_error(self):
        plt.figure(figsize=(8, 5))
        plt.plot(self.errores_history, label="Error MSE", linewidth=2)
        plt.xlabel("√âpocas")
        plt.ylabel("Error cuadr√°tico medio (MSE)")
        #T√≠tulo din√°mico con configuraci√≥n
        plt.title(f"Entrenamiento MLP - Capacas ocultas: {self.num_neuronas_ocultas}, Inicializacion: {self.inicializacion}, Normalizaci√≥n: {self.normalizacion}, "
                f"LR: {self.learning_rate}, Batch_size: {self.batch_size},Funcion de activacion: Sigmoid, √âpocas: {self.epochs}")
        plt.legend()
        plt.grid(True)
        plt.show()
  
    

### 6. Entrenar la red neuronal

In [8]:
import numpy as np

X_tr = X_tfidf.toarray()
Y_tr = Y_train[:, np.newaxis] # Agregar una dimensi√≥n adicional para representar 1 ejemplo de entrenamiento por fila

num_entradas= X_tr.shape[1] # tama√±o de la matriz Documento-T√©rmino
num_neuronas_ocultas = 128
num_salidas = 1
epochs = 10 
batch_size = 16
learning_rate = 0.1
random_state = 33
norm= "none"
init= "normal"

clasificador_mlp = MLP_TODO(
                        num_entradas,
                        num_neuronas_ocultas,
                        num_salidas,
                        epochs,
                        batch_size,
                        learning_rate,
                        norm,
                        init
                    )
# Entrenamos al clasificador
clasificador_mlp.train(X_tr, Y_tr)



√âpoca 0, Error batch 1: 0.23776988783038916
√âpoca 0, Error batch 2: 0.21341728095102683
√âpoca 0, Error batch 3: 0.1977315946282544
√âpoca 0, Error batch 4: 0.1291934741311775
√âpoca 0, Error batch 5: 0.05944379154596904
√âpoca 0, Error batch 6: 0.07933819233199192
√âpoca 0, Error batch 7: 0.05451363614486498
√âpoca 0, Error batch 8: 0.08169615137739744
√âpoca 0, Error batch 9: 0.045407231313687374
√âpoca 0, Error batch 10: 0.13656207816313629
√âpoca 0, Error batch 11: 0.0939662963205969
√âpoca 0, Error batch 12: 0.17928227935526111
√âpoca 0, Error batch 13: 0.15106093321546069
√âpoca 0, Error batch 14: 0.18241541741728723
√âpoca 0, Error batch 15: 0.09815009310415439
√âpoca 0, Error batch 16: 0.12684743883813118
√âpoca 0, Error batch 17: 0.08733031624956522
√âpoca 0, Error batch 18: 0.2049092694104731
√âpoca 0, Error batch 19: 0.14322449611068777
√âpoca 0, Error batch 20: 0.0938735900890027
√âpoca 0, Error batch 21: 0.13748096176211527
√âpoca 0, Error batch 22: 0.10979092860250222
√

### Predicci√≥n de datos nuevos

In [9]:
ejemplos_nuevos = ["maldito perro",]
# Suponer que se cuenta con el objeto vec_tfidf entrenado con el vocabulario del conjunto de entrenamiento
X_ejemplos_tfidf = vec_tfidf.transform(ejemplos_nuevos)
X_ejemplos_tfidf = X_ejemplos_tfidf.toarray()
print(X_ejemplos_tfidf)

y_pred_nuevo = clasificador_mlp.predict(X_ejemplos_tfidf)
y_pred_nuevo = y_pred_nuevo.flatten()
print(le.inverse_transform(y_pred_nuevo))


[[0. 0. 0. ... 0. 0. 0.]]
['nonaggressive']


### 7. Predecir los datos del conjuntos de prueba con el modelo entrenado

In [10]:
import numpy as np


X_test_tfidf = vec_tfidf.transform(X_test)
X_t = X_test_tfidf.toarray()
Y_t = Y_test[:, np.newaxis] # Agregar una dimensi√≥n adicional para representar 1 ejemplo de entrenamiento por fila

y_pred_test = clasificador_mlp.predict(X_t)
print(y_pred_test)

[[0]
 [1]
 [1]
 ...
 [1]
 [0]
 [1]]


### Inspecci√≥n de los resultados de los primeros N ejemplos de prueba

In [11]:
print("textos: ", X_test[:5])
print("clase esperada: ",Y_test[:5])
print("clase predicha: ", y_pred_test[:5])

textos:  ['@USUARIO @USUARIO Callate el hocico puta, ya quisieras ser mexicana Puta paname√±a de mierda tu pais es un asco igual que las personas que viven ahi puro puto negro de mierda que asco y luego son bien putos llorones ojala el bolillo se muera junto con toda la puta seleccion paname√±a aquerosa alv!!!'
 'Twitter siempre saca mi lado filos√≥fico aunque est√° de la verga pero lo saca üòÅ #MartesDeGanarSeguidores'
 'Comportandonos de la peor manera Dandole la espalda ala madre naturaleza Todos quieren dominar al mundo'
 'Yo bien tonta gaste en suscribirme al canal + de BTS en V live pensando que ten√≠a que hacerlo para ver el comeback'
 'C√ìMPRENME DULCES HIJOS DE SUS PUTAS MADRES como mantra del d√≠a.']
clase esperada:  [0 1 1 1 1]
clase predicha:  [[0]
 [1]
 [1]
 [1]
 [1]]


### Mostrar la predicci√≥n de la clase original 

In [12]:
print(Y_test[:10])
print(y_pred_test[:10])

[0 1 1 1 1 1 1 1 0 1]
[[0]
 [1]
 [1]
 [1]
 [1]
 [0]
 [1]
 [0]
 [1]
 [1]]


In [13]:

# llevar a la misma forma la salida de las predicciones
y_pred_test = y_pred_test.flatten()

print(Y_test[:10])
print(y_pred_test[:10])

[0 1 1 1 1 1 1 1 0 1]
[0 1 1 1 1 0 1 0 1 1]


In [14]:
# Obten las primeras N predicciones
pred =  y_pred_test[:5] 
pred_ori = le.inverse_transform(pred)
pred, pred_ori

(array([0, 1, 1, 1, 1]),
 array(['aggressive', 'nonaggressive', 'nonaggressive', 'nonaggressive',
        'nonaggressive'], dtype=object))

# 8. Evaluando el desempe√±o

## M√©tricas de Evaluaci√≥n
 - #### Las m√©tricas precisi√≥n, recall y F1 son fundamentales para evaluar el rendimiento de un clasificador


<img src="figs/fig_precision-recall.png" width="300">

##### Fuente: https://en.wikipedia.org/wiki/Precision_and_recall


<img src="figs/fig_matriz-confusion.png" width="500">


TP=True Positive

TN=True Negative

FP=False Positive (Error tipo I: ejemplo, se considera que el paciente est√° enfermo, pero en realidad est√° sano)

FN=False Negative ( Error tipo II: ejemplo, se considera que el paciente est√° sano, pero en realidad est√° enfermo)


$$ Accuracy = \frac{total~ TP + total~TN}{total~muestras} $$

$$ Precision_c = \frac{ TP_c}{TP_c + FP_c} $$

$$ Recall_c = \frac{ TP_c}{TP_c + FN_c} $$

$$ F1-score_c= 2 \times \frac{ Precision_c \times Recall_c}{Precision_c + Recall_c} $$

$$ macro-F1-score= \frac{ 1 }{|Clases|} \sum{F1-score_c} $$

## Matriz de confusi√≥n

In [None]:
from sklearn.metrics import confusion_matrix
from sklearn.metrics import ConfusionMatrixDisplay
ConfusionMatrixDisplay.from_predictions(Y_test, y_pred_test)

In [None]:
# para la clase 0, la precisi√≥n es la siguiente
tp= 82
fp = 31+11+33
tp/(tp + fp)

## M√©tricas

In [15]:
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score
print("P=", precision_score(Y_test, y_pred_test, average='macro'))
print("R=", recall_score(Y_test, y_pred_test, average='macro'))
print("F1=", f1_score(Y_test, y_pred_test, average='macro'))
print("Acc=", accuracy_score(Y_test, y_pred_test))


P= 0.6739858700229261
R= 0.6718582467556475
F1= 0.6728873534143642
Acc= 0.7332035053554041


## Inspecci√≥n del desempe√±o por clase

In [16]:
from sklearn.metrics import confusion_matrix
print(confusion_matrix(Y_test, y_pred_test))

[[156 140]
 [134 597]]


In [17]:
from sklearn.metrics import classification_report
print(classification_report(Y_test, y_pred_test, digits=4, zero_division='warn'))

              precision    recall  f1-score   support

           0     0.5379    0.5270    0.5324       296
           1     0.8100    0.8167    0.8134       731

    accuracy                         0.7332      1027
   macro avg     0.6740    0.6719    0.6729      1027
weighted avg     0.7316    0.7332    0.7324      1027

