In [1]:
from keras.models import Sequential
from keras.layers import LSTM, Dense, Embedding
from keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from keras.utils import to_categorical
import numpy as np

# Datos de entrenamiento
text = "El gato está sobre la mesa. El perro juega en el jardín."
tokenizer = Tokenizer()
tokenizer.fit_on_texts([text])
sequences = tokenizer.texts_to_sequences([text])[0]
vocab_size = len(tokenizer.word_index) + 1

# Preparación de los datos
sequences = np.array(sequences)
X = sequences[:-1]
y = sequences[1:]
X = pad_sequences([X], maxlen=5)
y = pad_sequences([y], maxlen=5)

# Convertir las etiquetas a codificación one-hot
y = to_categorical(y, num_classes=vocab_size)

# Crear el modelo
model = Sequential()
model.add(Embedding(vocab_size, 10, input_length=5))
model.add(LSTM(50,  return_sequences=True))
model.add(Dense(vocab_size, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Entrenamiento del modelo
model.fit(X, y, epochs=100, verbose=1)

# Generación de texto
seed_text = "El gato"
for _ in range(20):
    encoded = tokenizer.texts_to_sequences([seed_text])[0]
    encoded = pad_sequences([encoded], maxlen=5)
    y_pred = model.predict(encoded)
    next_word_index = np.argmax(y_pred[0], axis=-1)[0].item()
    next_word = tokenizer.index_word[next_word_index]
    seed_text += " " + next_word

print(seed_text)




Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

In [22]:
from keras.models import Sequential
from keras.layers import LSTM, Dense, Embedding
from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences
from keras.utils import to_categorical
import numpy as np

# Datos de entrenamiento (texto más largo)
text = """
          Había una vez, en un bosque encantado, una comunidad de animales que
          vivía en armonía. Los bosques estaban llenos de árboles altos y
          frondosos, y los rayos del sol se filtraban a través de las hojas,
          creando un mágico juego de luces y sombras.
          Entre los habitantes del bosque, se encontraban el zorro astuto
          llamado Zorro, el búho sabio llamado Sabio, y el conejo curioso
          llamado Curioso. Cada día, se reunían alrededor del gran roble
          en el centro del bosque para compartir historias y sabiduría.
          Un día, una extraña criatura llegó al bosque. Era un armadillo
          llamado Armadix. Se movía torpemente con su caparazón y parecía
          perdido. Los otros animales se acercaron a él con curiosidad.
          Zorro, siempre astuto, decidió ayudar a Armadix a encontrar su
          camino de regreso a casa. Sabio, el búho, usó su conocimiento
          para trazar un mapa y Curioso, el conejo, se ofreció a guiarlo.
          A medida que avanzaban a través del bosque, Armadix comenzó a
          hablar sobre su tierra natal, un lejano lugar lleno de desafíos
          y peligros. Los otros animales escucharon atentamente y aprendieron
          mucho sobre la vida más allá del bosque encantado.
          Después de un largo viaje, finalmente llegaron a la casa de Armadix.
          El pequeño armadillo estaba agradecido y les prometió que siempre recordaría
          la amabilidad de los animales del bosque. Armadix les contó sobre un hermoso
          jardín secreto que se escondía en el bosque y los invitó a visitarlo cuando quisieran.
          El bosque encantado seguía siendo un lugar mágico, pero ahora había un
          vínculo aún más fuerte entre los animales. Aprendieron que la amistad y
          la colaboración podían superar cualquier desafío, y que la curiosidad
          por el mundo exterior solo los había unido más.
          Y así, la comunidad de animales continuó viviendo en armonía, compartiendo
          historias y sabiduría bajo la sombra del gran roble en el Bosque Encantado.
    """

tokenizer = Tokenizer()
tokenizer.fit_on_texts([text])
sequences = tokenizer.texts_to_sequences([text])[0]
vocab_size = len(tokenizer.word_index) + 1

# Preparación de los datos
sequences = np.array(sequences)
sequence_length = 5  # Longitud de las secuencias
X, y = [], []
for i in range(0, len(sequences) - sequence_length):
    X.append(sequences[i:i + sequence_length])
    y.append(sequences[i + sequence_length])
X = pad_sequences(X, maxlen=sequence_length)
y = to_categorical(y, num_classes=vocab_size)

# Crear el modelo
model = Sequential()
model.add(Embedding(vocab_size, 10, input_length=sequence_length))
model.add(LSTM(50, return_sequences=True, input_shape=(sequence_length, vocab_size)))
model.add(LSTM(50, return_sequences=True))
model.add(LSTM(50, return_sequences=True))
model.add(LSTM(50, return_sequences=True))
model.add(LSTM(50, return_sequences=True))
model.add(LSTM(50))
model.add(Dense(vocab_size, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Entrenamiento del modelo
model.fit(X, y, epochs=100, verbose=1)

# Generación de texto
seed_text = "El gato está sobre la mesa. El perro esta en la casa de mis"
for _ in range(20):
    encoded = tokenizer.texts_to_sequences([seed_text])[0]
    if len(encoded) < sequence_length:
        break
    encoded = pad_sequences([encoded[-sequence_length:]], maxlen=sequence_length)
    y_pred = model.predict(encoded)
    next_word_index = np.argmax(y_pred, axis=-1)[0]
    next_word = tokenizer.index_word[next_word_index]
    seed_text += " " + next_word

print(seed_text)


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78