#An√°lisis de Sentimiento con una Red LSTM usando Keras
##üéØ Objetivo
En esta actividad vas a construir un modelo de red neuronal recurrente (RNN), espec√≠ficamente una LSTM, usando la API Keras de TensorFlow. El modelo leer√° frases en espa√±ol y clasificar√° su sentimiento como positivo o negativo.



##üß∞ 1. Preparaci√≥n del entorno
Importamos las librer√≠as necesarias. Si est√°s en Google Colab, pod√©s ejecutar la celda tal como est√°.

In [None]:
import numpy as np
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

##üóÇÔ∏è 2. Datos de entrenamiento
Vamos a usar las mismas frases que en la actividad anterior, pero ahora procesadas como secuencias de palabras, no como bolsa de palabras.

In [None]:
frases = [
    "La verdad, este lugar est√° b√°rbaro. Muy recomendable",
    "Una porquer√≠a de servicio, nunca m√°s vuelvo",
    "Me encant√≥ la comida, aunque la m√∫sica estaba muy fuerte",
    "El env√≠o fue lento y el producto lleg√≥ da√±ado. Qu√© desastre",
    "Todo excelente. Atenci√≥n de diez",
    "Qu√© estafa, me arrepiento de haber comprado",
    "Muy conforme con el resultado final",
    "No me gust√≥ para nada la experiencia",
    "Super√≥ mis expectativas, ¬°gracias!",
    "No lo recomiendo, mala calidad"
]

etiquetas = np.array([1, 0, 1, 0, 1, 0, 1, 0, 1, 0])

##‚úèÔ∏è 3. Tokenizaci√≥n y vectorizaci√≥n
Con Keras, vamos a convertir las frases en secuencias de n√∫meros, donde cada n√∫mero representa una palabra del vocabulario.

In [None]:
# Tokenizaci√≥n
tokenizer = Tokenizer(oov_token="<OOV>")
tokenizer.fit_on_texts(frases)

# Secuencias num√©ricas
secuencias = tokenizer.texts_to_sequences(frases)

# Padding para que todas las frases tengan la misma longitud
maxlen = max(len(seq) for seq in secuencias)
X = pad_sequences(secuencias, maxlen=maxlen, padding='post')

# Convertimos las etiquetas
y = np.array(etiquetas)

##üß± 4. Definici√≥n del modelo LSTM
Vamos a usar una red con:

* Capa de embedding (representaci√≥n vectorial aprendida de cada palabra).

* Una capa LSTM para captar la secuencia.

* Una capa densa para clasificar.

In [None]:
# Par√°metros
vocab_size = len(tokenizer.word_index) + 1  # +1 por el token OOV
embedding_dim = 16
lstm_units = 32

# Modelo
modelo = Sequential([
    Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=maxlen),
    LSTM(units=lstm_units),
    Dense(1, activation='sigmoid')
])

modelo.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
modelo.summary()

##üöÄ 5. Entrenamiento
Entrenamos el modelo por unas pocas √©pocas para ver resultados r√°pidos en clase. Si ten√©s m√°s tiempo o m√°s datos, pod√©s aumentarlas.

In [None]:
modelo.fit(X, y, epochs=20, batch_size=2, verbose=1)


##üß™ 6. Evaluaci√≥n con frases nuevas
Ahora vamos a probar el modelo con frases no vistas y observar sus predicciones.

In [None]:
frases_nuevas = [
    "Muy buena atenci√≥n, qued√© encantado",
    "Horrible experiencia, no vuelvo m√°s",
    "Todo excelente, gracias por la atenci√≥n",
    "Me arrepiento completamente, fue un desastre",
    "Un servicio impecable y r√°pido"
]

# Tokenizamos y convertimos
secuencias_nuevas = tokenizer.texts_to_sequences(frases_nuevas)
X_nuevo = pad_sequences(secuencias_nuevas, maxlen=maxlen, padding='post')

# Predicci√≥n
predicciones = modelo.predict(X_nuevo)

# Mostrar resultados
for frase, pred in zip(frases_nuevas, predicciones):
    clase = "Positivo" if pred[0] >= 0.5 else "Negativo"
    print(f"Frase: '{frase}' => Sentimiento predicho: {clase} ({pred[0]:.2f})")


#üß† Reflexi√≥n final
##üëâ ¬øQu√© aprendimos?

* C√≥mo representar texto como secuencia de palabras usando Keras.

* Qu√© es una red LSTM y c√≥mo recuerda el contexto.

* C√≥mo el orden de las palabras s√≠ influye en el resultado.

* Que las redes recurrentes pueden manejar frases m√°s complejas que los MLP o perceptrones.