# Red recurrente en Keras
Generar una red que tome unas secuencias de texto y sea capaz de generar unas nuevas secuencias de texto.
Arquitectura que permite analizar secuencias, generando tambien hidden states

El objetivo es que a tráves de cualquier caracter de entrada el RNN sea capaz de generar un caracter de salida que forme un nombre de dinosaurio

In [1]:
# Librerias
import numpy as np
np.random.seed(5)

# Permiten crear celda recurrente
from keras.layers import Input, Dense, SimpleRNN 
# Crear y entrenar el modelo
from keras.models import Model
from keras.optimizers import SGD 
# Formatos de entrada y salida
from keras.utils import to_categorical 
from keras import backend as K

Using TensorFlow backend.


In [2]:
# Cargar nombres de dinosaurios
nombres = open('dinosaurios.txt').read()
nombres = nombres.lower()
# nombres = nombres.replace('\r','\\r').replace('\n',' ')
nombres = nombres.replace('}','')

In [3]:
# Set para contener caracteres únicos
alfabeto = list(set(nombres))
tam_datos, tam_alfabeto = len(nombres), len(alfabeto)

## Formato OneHot
Diccionario en el que se asigna a cada caracter del alfabeto un número (codificación), con el fin de que el modelo pueda leer los caracteres

In [4]:
car_a_ind = { car:ind for ind,car in enumerate(sorted(alfabeto))}

In [5]:
ind_a_car = { ind:car for ind,car in enumerate(sorted(alfabeto))}

## Modelo RNN
A continuación se implementara un RNN con hiden states, X y y

In [6]:
n_a = 25
# Contenedores
entrada = Input(shape=(None,tam_alfabeto))
# Estado oculto
a0 = Input(shape=(n_a,))

### Capa recurrente

In [7]:
# n_a: Numeros de neuronas
celdas_recurrentes = SimpleRNN(n_a, activation='tanh', return_state = True )

### Capa de salida

In [8]:
# 27 neuronas
capa_salida = Dense(tam_alfabeto, activation='softmax')

In [9]:
# Celda recurrente
hs, _ = celdas_recurrentes(entrada, initial_state=a0)
salida = []
salida.append(capa_salida(hs))
modelo = Model([entrada,a0], salida)

# Optimizador
opt = SGD(lr=0.05)
modelo.compile(optimizer=opt, loss = 'categorical_crossentropy')

In [10]:
# Generar una lista adicional con los nombres aleatorios de diccionarios
with open('dinosaurios.txt') as f:
    ejemplos = f.readlines()
ejemplos = list(map( lambda x: x.replace("}",""), ejemplos))
ejemplos = [x.lower().strip() for x in ejemplos]
np.random.shuffle(ejemplos)

In [11]:
# Una funcion que tome uno a uno cada ejemplo de entrenamiento y que genere 3 vectores de entrada
def train_generator():
    while True:
        # Tomar un ejemplo aleatorio
        ejemplo = ejemplos[np.random.randint(0,len(ejemplos))]

        # Convertir el ejemplo a representación numérica
        X = [None] + [car_a_ind[c] for c in ejemplo]

        # Crear "Y", resultado de desplazar "X" un caracter a la derecha
        Y = X[1:] + [car_a_ind['\n']]

        # Representar "X" y "Y" en formato one-hot
        x = np.zeros((len(X),1,tam_alfabeto))
        onehot = to_categorical(X[1:],tam_alfabeto).reshape(len(X)-1,1,tam_alfabeto)
        x[1:,:,:] = onehot
        y = to_categorical(Y,tam_alfabeto).reshape(len(X),tam_alfabeto)

        # Activación inicial (matriz de ceros)
        a = np.zeros((len(X), n_a))

        yield [x, a], y


In [None]:
# 10.000 iteraciones cada una con 80 ejemplos
BATCH_SIZE = 80			# Número de ejemplos de entrenamiento a usar en cada iteración
NITS = 10000			# Número de iteraciones

for j in range(NITS):
    historia = modelo.fit_generator(train_generator(), steps_per_epoch=BATCH_SIZE, epochs=1, verbose=0)

    # Imprimir evolución del entrenamiento cada 1000 iteraciones
    if j%1000 == 0:
        print('\nIteración: %d, Error: %f' % (j, historia.history['loss'][0]) + '\n')



Iteración: 0, Error: 3.133577



In [None]:
# Generacion de nombres
def generar_nombre(modelo, car_a_ind, tam_alfabeto,n_a):
    # Para iniciar la predicción se iniciaran con celdas vacias
    x = np.zeros((1,1,tam_alfabeto,))
    a = np.zeros((1,n_a))
    
    nombre_generado = ''
    fin_linea = '\n'
    car = -1
    contador = 0
    
    while (car !=  fin_linea and contador != 50):
        a,_ = celda_recurrente(K.constant(x), initial_state=K.constant(a))
        # Crear las capas de salida con la prediccion de 27 elementos
        y = capa_salida(a)
        prediccion = K.eval(y)
        
        # Eleccion aleatoriamente una de las 27 predicciones
        ix = np.random.choice(list(range(tam_alfabeto)), p=prediccion.ravel())
        car = ind_a_car[ix]
        nombre_generado += car
        
        x = to_categorical(ix, tam_alfabeto).reshape(1,1,tam_alfabeto)
        a = K.eval(a)
        
        contador += 1
        if (contador == 50):
            nombre_generado += '\n'
    print(nombre_generado)

In [None]:
for i in range(100):
    generar_nombre(modelo,car_a_ind, tam_alfabeto, n_a)

In [None]:
1