<a class="anchor" id="0"></a>
#RNN con Keras

Ejemplo b&aacute;sico de una RNN con Keras para generar texto.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
import numpy as np
import pandas as pd
from __future__ import print_function
from keras.layers import SimpleRNN #-> Capa RNN Simple
from keras.models import Sequential  #-> Modelo Secuencial
from keras.layers import Dense, Activation

#Vamos a subir el archivo "wonderland.txt"
#Alicia en el pais de las maravillas
#Nos va a servir para entrenar nuestra red

from google.colab import files

archivos = files.upload()

Saving wonderland.txt to wonderland (1).txt


In [7]:
def setUpTrainDataFromTxt(INPUT_FILE, SEQLEN, STEP):
    text=""

    for archivo in INPUT_FILE:
      print("Leyendo archivo ", archivo)
      fin = open(archivo, 'rb') #-> r = abrir para lectura (read) | b = abrir en modo binario
      lines = []
      for line in fin:
          line = line.strip().lower()
          line = line.decode("ascii", "ignore")
          if len(line) == 0:
              continue
          lines.append(line)  #-> Se lee linea a linea y se "Anexa" a string
      fin.close()
      text = text + " ".join(lines)
      print("cantidad lineas", len(lines))
      print("largo texto", len(text))


    #Se arma una RNN a nivel de caracteres (letras)
    #Usaremos los caracteres del texto, ese es nuestra muestra

    #Se trabajara con los indices ASCII

    # Creamos las tablas de datos y su caracter
    chars = set([c for c in text])
    nb_chars = len(chars) #-> Numero de caracteres distintos en el texto
    char2index = dict((c, i) for i, c in enumerate(chars))
    index2char = dict((i, c) for i, c in enumerate(chars))

    # creamos los inputs y sus labels desde el texto.
    #Letra a letra (una a la vez)
    #Por cada caracter (paso ${step}), extraemos una secuencia de largo ${seqlen}

    #Ejemplo, asumiento que el input es "The sky was falling", obtendremos la siguiente secuencia
    #   The sky wa -> s
    #   he sky was ->
    #   e sky was  -> f
    #    sky was f -> a
    #   sky was fa -> l
    input_chars = []
    label_chars = []
    for i in range(0, len(text) - SEQLEN, STEP):
        input_chars.append(text[i:i + SEQLEN])
        label_chars.append(text[i + SEQLEN])

    # Vectorizamos los datos y las etiquetas con 1-hot encoding

    X = np.zeros((len(input_chars), SEQLEN, nb_chars), dtype=np.bool_)
    y = np.zeros((len(input_chars), nb_chars), dtype=np.bool_)
    for i, input_char in enumerate(input_chars):
        for j, ch in enumerate(input_char):
            X[i, j, char2index[ch]] = 1
        y[i, char2index[label_chars[i]]] = 1

    return X, y, nb_chars, input_chars, label_chars, char2index, index2char

In [8]:
INPUT_FILE = []
INPUT_FILE.append("/content/quijote.txt")
INPUT_FILE.append("/content/donjuantenorio.txt")
INPUT_FILE.append("/content/ladivinacomedia.txt")

SEQLEN = 10
STEP = 1

X, y, nb_chars, input_chars, label_chars, char2index, index2char = setUpTrainDataFromTxt(INPUT_FILE, SEQLEN, STEP)

Leyendo archivo  /content/quijote.txt
cantidad lineas 32251
largo texto 2073831
Leyendo archivo  /content/donjuantenorio.txt
cantidad lineas 5681
largo texto 2416002
Leyendo archivo  /content/ladivinacomedia.txt
cantidad lineas 11373
largo texto 3105472


In [9]:
# Modelo. SingleRNN con una capa fully connected para calcular la predicción

HIDDEN_SIZE = 128
BATCH_SIZE = 128
NUM_ITERATIONS = 25
NUM_EPOCHS_PER_ITERATION = 1
NUM_PREDS_PER_EPOCH = 100

model = Sequential()
model.add(
    SimpleRNN(
        HIDDEN_SIZE,
        return_sequences=False,
                                        #-> Numero de caracteres distintos en el texto
        input_shape=(SEQLEN, nb_chars), #-> Las cadenas de entrenamiento son de 10
        unroll=True)
    )
model.add(Dense(nb_chars))
model.add(Activation("softmax"))

model.compile(
    loss="categorical_crossentropy",
    optimizer="rmsprop"
    )

In [None]:
# Entrenamos el modelo en n iteraciones y probamos la salida en cada iteración

for iteration in range(NUM_ITERATIONS):
    print("=" * 50)
    print("Iteración #: %d" % (iteration))

    #Entrenamiento de la iteración
    model.fit(X, y,
              batch_size=BATCH_SIZE,
              epochs=NUM_EPOCHS_PER_ITERATION)

    # test de la iteración
    #en base a una semilla (texto inicial), generamos una salida
    test_idx = np.random.randint(len(input_chars))
    test_chars = input_chars[test_idx]

    print("Generando texto de la salida: %s" % (test_chars))
    print(test_chars, end="")

    for i in range(NUM_PREDS_PER_EPOCH):
        Xtest = np.zeros((1, SEQLEN, nb_chars))
        for i, ch in enumerate(test_chars):   #-> Codificamos los caracteres
            Xtest[0, i, char2index[ch]] = 1
        pred = model.predict(Xtest, verbose=0)[0]
        ypred = index2char[np.argmax(pred)] #-> Decodificamos la predicción
        print(ypred, end="")

        test_chars = test_chars[1:] + ypred
    print()


Iteración #: 0
Generando texto de la salida: donde la h
donde la haba de la como el cura de la como el cura de la como el cura de la como el cura de la como el cura d
Iteración #: 1
Generando texto de la salida:           
                                                                                                              
Iteración #: 2
Generando texto de la salida: l cautivo 
l cautivo a la sancho de la caballero de la caballero de la caballero de la caballero de la caballero de la ca
Iteración #: 3
Generando texto de la salida: on tanta f
on tanta fuerza de la mano de la mano de la mano de la mano de la mano de la mano de la mano de la mano de la 
Iteración #: 4
Generando texto de la salida: ados del c
ados del caballero de la caballero de la caballero de la caballero de la caballero de la caballero de la cabal
Iteración #: 5
Generando texto de la salida: cho, mas y
cho, mas y en el mundo en el mundo en el mundo en el mundo en el mundo en el mundo en el mundo en el mundo en