<a href="https://colab.research.google.com/github/apchavezr/16.-Aprendizaje-Profundo-para-Ciencia-de-Datos/blob/main/LSTM_Prediccion_Palabra.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Ejemplo: Predicción de palabras con redes LSTM: Ejemplo ilustrativo

Este notebook tiene como propósito demostrar, de manera paso a paso, el funcionamiento de una red neuronal de tipo LSTM (*Long Short-Term Memory*) para tareas de modelado de lenguaje. A través de una frase de entrada, el modelo intenta predecir la palabra siguiente, permitiendo observar el comportamiento de una arquitectura secuencial típica en procesamiento de lenguaje natural (NLP).

**Escenario de ejemplo:**  
Dada la secuencia de palabras `"El clima está muy"`, se busca predecir la palabra que más probablemente continúa la frase, como `"frío"`, `"agradable"` o `"caliente"`.

Este ejercicio no se basa en un modelo previamente entrenado con corpus lingüísticos reales, por lo tanto, los resultados presentados no tienen valor predictivo en contexto real. El enfoque es exclusivamente didáctico para facilitar la comprensión de las entradas, estados ocultos y salidas en una red LSTM aplicada a texto.


In [None]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Embedding, LSTM, Dense

# Definir vocabulario simplificado
vocabulario = ["<PAD>", "El", "clima", "está", "muy", "frío", "caliente", "agradable"]
word2idx = {word: idx for idx, word in enumerate(vocabulario)}
idx2word = {idx: word for word, idx in word2idx.items()}
vocab_size = len(vocabulario)


In [None]:
# Frase de entrada codificada: "El clima está muy"
entrada = ["El", "clima", "está", "muy"]
input_seq = np.array([[word2idx[w] for w in entrada]])
print("Secuencia codificada:", input_seq)


Secuencia codificada: [[1 2 3 4]]


In [None]:
# Parámetros
embedding_dim = 8
lstm_units = 16
maxlen = 4  # longitud de la frase de entrada

# Crear arquitectura LSTM
input_layer = Input(shape=(maxlen,))
embedding = Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=maxlen)(input_layer)
lstm_out, state_h, state_c = LSTM(lstm_units, return_sequences=False, return_state=True)(embedding)
output = Dense(vocab_size, activation='softmax')(lstm_out)

modelo = Model(inputs=input_layer, outputs=output)
modelo.compile(optimizer='adam', loss='categorical_crossentropy')
modelo.summary()


In [None]:
# Ejecutar predicción (sin entrenamiento)
pred = modelo.predict(input_seq)
predicted_idx = np.argmax(pred)
predicted_word = idx2word[predicted_idx]

print("Palabra predicha:", predicted_word)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 216ms/step
Palabra predicha: caliente


# Conclusión

Este ejercicio permitió observar cómo una red LSTM procesa una secuencia de palabras mediante el uso de memoria a corto y largo plazo. A diferencia de redes neuronales tradicionales, las LSTM conservan información contextual relevante a través del tiempo, lo cual es crucial en tareas de procesamiento de lenguaje natural.