#Clasificación de Sentimientos con una Red Neuronal Multicapa (PyTorch)
##🎯 Objetivo
En esta actividad vas a construir una red neuronal feedforward multicapa (MLP) usando PyTorch. El objetivo es entrenarla para que pueda clasificar frases en español como positivas o negativas.

###Con esto vas a:

* Comprender cómo se arma una red con varias neuronas.

* Usar funciones de activación y entrenamiento automático.

* Observar cómo mejora respecto al perceptrón simple de la Actividad 1.

##🧰 1. Preparación del entorno
Importamos PyTorch y NumPy para comenzar.

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np

##🗂️ 2. Datos de entrenamiento
Usamos un conjunto de frases típicas de opiniones escritas en Argentina, etiquetadas como positivas (1) o negativas (0).

In [2]:
frases = [
    "La verdad, este lugar está bárbaro. Muy recomendable",
    "Una porquería de servicio, nunca más vuelvo",
    "Me encantó la comida, aunque la música estaba muy fuerte",
    "El envío fue lento y el producto llegó dañado. Qué desastre",
    "Todo excelente. Atención de diez",
    "Qué estafa, me arrepiento de haber comprado",
    "Muy conforme con el resultado final",
    "No me gustó para nada la experiencia",
    "Superó mis expectativas, ¡gracias!",
    "No lo recomiendo, mala calidad"
]

etiquetas = np.array([1, 0, 1, 0, 1, 0, 1, 0, 1, 0])  # 1 = Positivo, 0 = Negativo


##🧾 3. Construcción del vocabulario
Definimos manualmente un vocabulario con palabras que suelen aparecer en frases de opinión con carga positiva o negativa.

In [3]:
vocabulario = [
    "bárbaro", "recomendable", "porquería", "nunca", "encantó",
    "fuerte", "desastre", "excelente", "estafa", "arrepiento",
    "conforme", "gustó", "superó", "gracias", "recomiendo", "mala"
]


##🧠 4. Preprocesamiento: vectorización de las frases
Cada frase se convierte en un vector binario (bag-of-words) que indica si contiene alguna de las palabras del vocabulario.

In [4]:
def vectorizar(frase, vocabulario):
    tokens = frase.lower().split()
    return np.array([1 if palabra in tokens else 0 for palabra in vocabulario], dtype=np.float32)

X_np = np.array([vectorizar(frase, vocabulario) for frase in frases], dtype=np.float32)
y_np = etiquetas.astype(np.float32).reshape(-1, 1)

# Convertimos a tensores de PyTorch
X = torch.tensor(X_np)
y = torch.tensor(y_np)

##🧱 5. Definición del modelo (MLP)
Vamos a crear un modelo simple con una capa oculta, activación ReLU, y una salida sigmoide para predicción binaria.

In [5]:
input_size = len(vocabulario)
hidden_size = 8

class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.net = nn.Sequential(
            nn.Linear(input_size, hidden_size),
            nn.ReLU(),
            nn.Linear(hidden_size, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.net(x)

modelo = MLP()

##⚙️ 6. Entrenamiento del modelo
Definimos la función de pérdida y el optimizador. Entrenamos por varias épocas.

In [6]:
criterio = nn.BCELoss()  # Binary Cross Entropy
optimizador = optim.Adam(modelo.parameters(), lr=0.01)

epocas = 200

for epoca in range(epocas):
    modelo.train()
    salida = modelo(X)
    loss = criterio(salida, y)

    optimizador.zero_grad()
    loss.backward()
    optimizador.step()

    if (epoca + 1) % 10 == 0:
        print(f"Época {epoca+1}, Pérdida: {loss.item():.4f}")


Época 10, Pérdida: 0.6281
Época 20, Pérdida: 0.5261
Época 30, Pérdida: 0.3963
Época 40, Pérdida: 0.2683
Época 50, Pérdida: 0.1679
Época 60, Pérdida: 0.1056
Época 70, Pérdida: 0.0690
Época 80, Pérdida: 0.0478
Época 90, Pérdida: 0.0350
Época 100, Pérdida: 0.0268
Época 110, Pérdida: 0.0213
Época 120, Pérdida: 0.0173
Época 130, Pérdida: 0.0145
Época 140, Pérdida: 0.0122
Época 150, Pérdida: 0.0105
Época 160, Pérdida: 0.0091
Época 170, Pérdida: 0.0080
Época 180, Pérdida: 0.0071
Época 190, Pérdida: 0.0063
Época 200, Pérdida: 0.0057


##🧪 7. Evaluación con frases nuevas
Probamos la red con frases que no estaban en el entrenamiento, para ver cómo generaliza.

In [7]:
frases_prueba = [
    "No me gustó la atención, bastante mala",
    "Muy buena experiencia, todo excelente",
    "Una estafa total, no lo recomiendo",
    "Súper conforme con el servicio",
    "Nada que ver con lo prometido, una decepción"
]

# Vectorizamos las frases de prueba
X_prueba_np = np.array([vectorizar(frase, vocabulario) for frase in frases_prueba], dtype=np.float32)
X_prueba = torch.tensor(X_prueba_np)

# Predicción
modelo.eval()
with torch.no_grad():
    predicciones = modelo(X_prueba)

# Mostrar resultados
for frase, pred in zip(frases_prueba, predicciones):
    clase = "Positivo" if pred.item() >= 0.5 else "Negativo"
    print(f"Frase: '{frase}' => Sentimiento predicho: {clase} ({pred.item():.2f})")

Frase: 'No me gustó la atención, bastante mala' => Sentimiento predicho: Negativo (0.00)
Frase: 'Muy buena experiencia, todo excelente' => Sentimiento predicho: Positivo (0.98)
Frase: 'Una estafa total, no lo recomiendo' => Sentimiento predicho: Positivo (0.97)
Frase: 'Súper conforme con el servicio' => Sentimiento predicho: Positivo (1.00)
Frase: 'Nada que ver con lo prometido, una decepción' => Sentimiento predicho: Positivo (0.97)


##💬 Reflexión final
###👉 ¿Qué aprendimos?

* Cómo implementar y entrenar una red neuronal multicapa para análisis de sentimiento.

* Cómo preprocesar texto en español usando bag-of-words.

* Las ventajas del MLP frente al perceptrón simple.

* Limitaciones: aún no capta el orden de las palabras ni el contexto secuencial.

➡️ En la próxima actividad aprenderemos a usar redes recurrentes (LSTM) para incorporar secuencia y memoria en el procesamiento de texto. ¡Nos acercamos a modelos más cercanos al lenguaje humano!