# Laboratorio 1
**Redes Neuronales para Lenguaje Natural, 2025**

En este laboratorio construiremos analizadores de sentimiento de tres clases (positivo, negativo, neutro) en textos que muestran opiniones, con el objetivo de comparar distintas técnicas de representación de los textos y utilizarlas para alimentar un modelo de redes neuronales.

**Entrega: 9 de octubre de 2025**

**Formato: notebook de Python (.ipynb)**

**No olvidar mantener todas las salidas de cada región de código en el notebook!**

---



## 0. Preparación del entorno

Comenzamos con algunos imports y definiciones.

In [1]:
! pip install --upgrade gensim


import torch
import gensim
import numpy as np
import pandas as pd
from sklearn.metrics import precision_recall_fscore_support, accuracy_score, confusion_matrix

POLARITY_LABELS = ['Neg','Pos','Neu']
POLARITY_ID = {p:i for (i,p) in enumerate(POLARITY_LABELS) }



In [2]:
POLARITY_ID

{'Neg': 0, 'Pos': 1, 'Neu': 2}

Descargamos los datos de textos de prensa, anotados con una de las siguientes clases: Pos, Neg,Neu. Por más información sobre el dataset, consulte [aquí](https://github.com/pln-fing-udelar/pln-inco-resources/tree/master/sentiment/corpusAnalisisSentimientosEsp)

In [3]:
! wget https://raw.githubusercontent.com/pln-fing-udelar/pln-inco-resources/master/sentiment/corpusAnalisisSentimientosEsp/prensaUyUnaClase.csv

--2025-09-14 19:53:24--  https://raw.githubusercontent.com/pln-fing-udelar/pln-inco-resources/master/sentiment/corpusAnalisisSentimientosEsp/prensaUyUnaClase.csv
Resolviendo raw.githubusercontent.com (raw.githubusercontent.com)... 2606:50c0:8002::154, 2606:50c0:8003::154, 2606:50c0:8000::154, ...
Conectando con raw.githubusercontent.com (raw.githubusercontent.com)[2606:50c0:8002::154]:443... conectado.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: 216401 (211K) [text/plain]
Guardando como: ‘prensaUyUnaClase.csv’


2025-09-14 19:53:25 (6,89 MB/s) - ‘prensaUyUnaClase.csv’ guardado [216401/216401]



Cargamos el dataset en un dataframe de pandas y generamos conjuntos de entrenamiento, desarrollo y testeo.
Este dataset está compuesto por textos con opiniones. Para cada opinión tenemos el texto, un campo que no utilizaremos, y una categoría, que puede ser: Pos, Neg, o Neutro (indicando su polaridad).

In [None]:
from sklearn.model_selection import train_test_split

dataset_df = pd.read_csv('./prensaUyUnaClase.csv', header=None)
dataset_df.columns = ['text', 'extra', 'polarity']

# Dividimos train y test
temp_df, test_df = train_test_split(dataset_df, test_size=0.2, random_state=42)

# Separamos conjunto de validación
train_df, dev_df = train_test_split(temp_df, test_size=0.2, random_state=42)

print("Training set size:", len(train_df))
print("Development set size:", len(dev_df))
print("Test set size:", len(test_df))

display(dataset_df.iloc[0].text)
display(dataset_df.iloc[0].polarity)





En este laboratorio utilizaremos el texto como entrada (columna "text"), y el valor a predecir será la polaridad (columna "polarity").

Imprimimos algunos textos de ejemplo y sus categorías, y luego imprimimos la cantidad de ejemplos de las tres clases en las tres particiones.

In [None]:
train_text = train_df.loc[:,'text'].to_numpy()
dev_text = dev_df.loc[:,'text'].to_numpy()
test_text = test_df.loc[:,'text'].to_numpy()

train_labels = np.array([POLARITY_ID[l] for l in train_df.loc[:,'polarity']])
dev_labels = np.array([POLARITY_ID[l] for l in dev_df.loc[:,'polarity']])
test_labels = np.array([POLARITY_ID[l] for l in test_df.loc[:,'polarity']])

print(train_text[121])
print(POLARITY_LABELS[train_labels[121]])

print(train_text[27])
print(POLARITY_LABELS[train_labels[27]])

print(train_text[755])
print(POLARITY_LABELS[train_labels[755]])

print(*POLARITY_LABELS, sep='\t')
print(*np.bincount(train_labels), sep='\t')
print(*np.bincount(dev_labels), sep='\t')
print(*np.bincount(test_labels), sep='\t')


In [None]:
print(train_text[1])
print(train_labels[1])

## Parte 1

Utilizando pytorch, construir un clasificador tipo Multi-Layered Perceptron (MLP) que clasifique los textos según su sentimiento.
En esta parte, se debe utilizar una representación tipo **bag-of-words (BOW)** para los tweets, la cual se utilizará como entrada de la red.

Puede probar realizar diferentes alternativas dentro de la representación BOW, por ejemplo considerar o no mayúsculas y minúsculas, descartar palabras con listas de stop words, usar N-gramas de orden mayor en vez de palabras simples, o utilizar tf-idf

**Sugerencias:**
* Utilizar la clase CountVectorizer de sklearn
* Limitar el número máximo de features para no quedarse sin memoria
* Reducir la dimensionalidad del vector utilizando, por ejemplo, SVD

In [None]:
# su código aquí


Describa las características de su mejor modelo, incluyendo arquitectura e hiperparámetros. Evalúelo sobre el corpus de **dev**, imprimiendo la métrica accuracy, y las métricas macro-precision, macro-recall y macro-F1. Incluya también una matriz de confusión.

---



In [None]:
# su código aquí


**Descripción del modelo**:

...

## Parte 2

Utilizando pytorch, construir un clasificador tipo Multi-Layered Perceptron (MLP) que clasifique los textos según su polaridad.
En esta parte, se debe utilizar una representación tipo **centroide de word embeddings** para los tweets, la cual se utilizará como entrada de la red.

Puede probar realizar diferentes alternativas dentro de la representación con word embeddings, por ejemplo considerar o no mayúsculas y minúsculas, o descartar palabras con listas de stop words.

**Sugerencias:**
* Puede utilizar uno de los embeddings que vimos en el taller en clase
* O puede bajar alguna otra colección de embeddings, pero no entrene sus propios embeddings!

In [None]:
# su código aquí


Describa las características de su mejor modelo, incluyendo arquitectura e hiperparámetros. Evalúelo sobre el corpus de **dev**, imprimiendo la métrica accuracy, y las métricas macro-precision, macro-recall y macro-F1. Incluya también una matriz de confusión.


In [None]:
# su código aquí


**Descripción del modelo**:

...

Repita el paso anterior, utilizando la misma arquitectura, pero cambiando los embeddings utilizados. Compare los resultados y comente.

In [None]:
# su código aquí

**Comentarios**:

...

## Parte 3 (opcional):
Elija uno de los clasificadores anteriores y realice una búsqueda automatizada de hiperparámetros del modelo. Por ejemplo, puede utilizar una búsqueda en grilla completa o una búsqueda aleatoria, eligiendo diferente cantidad de capas, número unidades por capa, funciones de activación, y valores de learning rate. Intente encontrar el mejor clasificador posible, comparándolos sobre el corpus de **dev**.

In [None]:
# su código aquí


Describa las características de su mejor modelo, incluyendo arquitectura e hiperparámetros. Evalúelo sobre el corpus de **dev**, imprimiendo la métrica accuracy, y las métricas macro-precision, macro-recall y macro-F1. Incluya también una matriz de confusión.

In [None]:
# su código aquí


## Parte 4:

Elija el mejor clasificador de todos los construidos en las partes anteriores, comparándolos utilizando la medida macro-F1, y evalúelo sobre el corpus de **test**, imprimiendo la métrica accuracy, y las métricas macro-precision, macro-recall y macro-F1.

In [None]:
# su código aquí


Despliege la matriz de confusión sobre el corpus de **test** para las tres clases (P, N, NEU) para el mejor clasificador construido en las partes anteriores.

In [None]:
# su código aquí


Analice los resultados, y responda, al menos, las siguientes preguntas:

1.   ¿Cuál fue la representación que funcionó mejor? Describa brevemente sus características.
2.   ¿Cuál es la forma del modelo? Indique cantidad de capas, unidades, y funciones de activación. Puede usar el método print() sobre el modelo para imprimir la forma del modelo.
3.   Indique qué categoría o categorías fueron las más difíciles de aprender para su clasificador. ¿La categoría más difícil es la misma para el mejor clasificador de las partes 1 y 2 (y la parte 3 si la hizo)?

( sus respuestas aquí)
