#Análisis de Sentimiento con una Red LSTM usando Keras
##🎯 Objetivo
En esta actividad vas a construir un modelo de red neuronal recurrente (RNN), específicamente una LSTM, usando la API Keras de TensorFlow. El modelo leerá frases en español y clasificará su sentimiento como positivo o negativo.



##🧰 1. Preparación del entorno
Importamos las librerías necesarias. Si estás en Google Colab, podés ejecutar la celda tal como está.

In [None]:
import numpy as np
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

##🗂️ 2. Datos de entrenamiento
Vamos a usar las mismas frases que en la actividad anterior, pero ahora procesadas como secuencias de palabras, no como bolsa de palabras.

In [None]:
frases = [
    "La verdad, este lugar está bárbaro. Muy recomendable",
    "Una porquería de servicio, nunca más vuelvo",
    "Me encantó la comida, aunque la música estaba muy fuerte",
    "El envío fue lento y el producto llegó dañado. Qué desastre",
    "Todo excelente. Atención de diez",
    "Qué estafa, me arrepiento de haber comprado",
    "Muy conforme con el resultado final",
    "No me gustó para nada la experiencia",
    "Superó mis expectativas, ¡gracias!",
    "No lo recomiendo, mala calidad"
]

etiquetas = np.array([1, 0, 1, 0, 1, 0, 1, 0, 1, 0])

##✏️ 3. Tokenización y vectorización
Con Keras, vamos a convertir las frases en secuencias de números, donde cada número representa una palabra del vocabulario.

In [None]:
# Tokenización
tokenizer = Tokenizer(oov_token="<OOV>")
tokenizer.fit_on_texts(frases)

# Secuencias numéricas
secuencias = tokenizer.texts_to_sequences(frases)

# Padding para que todas las frases tengan la misma longitud
maxlen = max(len(seq) for seq in secuencias)
X = pad_sequences(secuencias, maxlen=maxlen, padding='post')

# Convertimos las etiquetas
y = np.array(etiquetas)

##🧱 4. Definición del modelo LSTM
Vamos a usar una red con:

* Capa de embedding (representación vectorial aprendida de cada palabra).

* Una capa LSTM para captar la secuencia.

* Una capa densa para clasificar.

In [None]:
# Parámetros
vocab_size = len(tokenizer.word_index) + 1  # +1 por el token OOV
embedding_dim = 16
lstm_units = 32

# Modelo
modelo = Sequential([
    Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=maxlen),
    LSTM(units=lstm_units),
    Dense(1, activation='sigmoid')
])

modelo.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
modelo.summary()

##🚀 5. Entrenamiento
Entrenamos el modelo por unas pocas épocas para ver resultados rápidos en clase. Si tenés más tiempo o más datos, podés aumentarlas.

In [None]:
modelo.fit(X, y, epochs=20, batch_size=2, verbose=1)


##🧪 6. Evaluación con frases nuevas
Ahora vamos a probar el modelo con frases no vistas y observar sus predicciones.

In [None]:
frases_nuevas = [
    "Muy buena atención, quedé encantado",
    "Horrible experiencia, no vuelvo más",
    "Todo excelente, gracias por la atención",
    "Me arrepiento completamente, fue un desastre",
    "Un servicio impecable y rápido"
]

# Tokenizamos y convertimos
secuencias_nuevas = tokenizer.texts_to_sequences(frases_nuevas)
X_nuevo = pad_sequences(secuencias_nuevas, maxlen=maxlen, padding='post')

# Predicción
predicciones = modelo.predict(X_nuevo)

# Mostrar resultados
for frase, pred in zip(frases_nuevas, predicciones):
    clase = "Positivo" if pred[0] >= 0.5 else "Negativo"
    print(f"Frase: '{frase}' => Sentimiento predicho: {clase} ({pred[0]:.2f})")


#🧠 Reflexión final
##👉 ¿Qué aprendimos?

* Cómo representar texto como secuencia de palabras usando Keras.

* Qué es una red LSTM y cómo recuerda el contexto.

* Cómo el orden de las palabras sí influye en el resultado.

* Que las redes recurrentes pueden manejar frases más complejas que los MLP o perceptrones.