# Laboratorio: Modelos del lenguaje con RNNs

En este laboratorio, vamos a entrenar un modelo del lenguaje basado en caracteres con Recurrent Neural Networks. Asimismo, utilizaremos el modelo para generar texto. En particular, alimentaremos nuestro modelo con obras de la literatura clásica en castellano para obtener una red neuronal que sea capaz de "escribir" fragmentos literarios.

Los entrenamientos en esta laboratorio para obtener un modelo de calidad podrían tomar cierto tiempo (5-10 minutos por epoch), por lo que se aconseja empezar a trabajar pronto. El uso de GPUs no ayuda tanto con LSTMs como con CNNs, por lo que si tenéis máquinas potentes en casa es posible que podáis entrenar más rápido o a la misma velocidad que en Colab. En todo caso, la potencia de Colab es más que suficiente para completar este laboratorio con éxito.

<center><img src="https://upload.wikimedia.org/wikipedia/commons/d/d8/El_ingenioso_hidalgo_don_Quijote_de_la_Mancha.jpg" style="text-align: center" height="300px"></center>

El dataset a utilizar consistirá en un archivo de texto con el contenido íntegro en castellano antiguo de El Ingenioso Hidalgo Don Quijote de la Mancha, disponible de manera libre en la página de [Project Gutenberg](https://www.gutenberg.org). Asimismo, como apartado optativo en este laboratorio se pueden utilizar otras fuentes de texto. Aquí podéis descargar los datos a utilizar de El Quijote y un par de obras adicionales:

[El ingenioso hidalgo Don Quijote de la Mancha (Miguel de Cervantes)](https://onedrive.live.com/download?cid=C506CF0A4F373B0F&resid=C506CF0A4F373B0F%219424&authkey=AH0gb-qSo5Xd7Io)

[Compilación de obras teatrales (Calderón de la Barca)](https://onedrive.live.com/download?cid=C506CF0A4F373B0F&resid=C506CF0A4F373B0F%219433&authkey=AKvGD6DC3IRBqmc)

[Trafalgar (Benito Pérez Galdós)](https://onedrive.live.com/download?cid=C506CF0A4F373B0F&resid=C506CF0A4F373B0F%219434&authkey=AErPCAtMKOI5tYQ)

Como ya deberíamos de estar acostumbrados en problemas de Machine Learning, es importante echar un vistazo a los datos antes de empezar.

## 1. Carga y procesado del texto

Primero, vamos a descargar el libro e inspeccionar los datos. El fichero a descargar es una versión en .txt del libro de Don Quijote, a la cual se le han borrado introducciones, licencias y otras secciones para dejarlo con el contenido real de la novela.

In [1]:
import numpy as np
import keras
import matplotlib.pyplot as plt
from keras.callbacks import LambdaCallback
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import random
import io

path = keras.utils.get_file(
    fname="don_quijote.txt",
    origin="https://onedrive.live.com/download?cid=C506CF0A4F373B0F&resid=C506CF0A4F373B0F%219424&authkey=AH0gb-qSo5Xd7Io"
)

Downloading data from https://onedrive.live.com/download?cid=C506CF0A4F373B0F&resid=C506CF0A4F373B0F%219424&authkey=AH0gb-qSo5Xd7Io


Una vez descargado, vamos a leer el contenido del fichero en una variable. Adicionalmente, convertiremos el contenido del texto a minúsculas para ponérselo un poco más fácil a nuestro modelo (de modo que todas las letras sean minúsculas y el modelo no necesite diferenciar entre minúsculas y mayúsculas).

**1.1.** Leer todo el contenido del fichero en una única variable ***text*** y convertir el string a minúsculas

**CARGANDO LOS DATOS**

In [2]:
## TU CÓDIGO AQUÍ
text=open(path).read().lower()

Podemos comprobar ahora que efectivamente nuestra variable contiene el resultado deseado, con el comienzo tan característico del Quijote.

In [3]:
print("Longitud del texto: {}".format(len(text)))
print(text[0:300])

Longitud del texto: 2071198
capítulo primero. que trata de la condición y ejercicio del famoso hidalgo
don quijote de la mancha


en un lugar de la mancha, de cuyo nombre no quiero acordarme, no ha mucho
tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua,
rocín flaco y galgo corredor. una olla de algo más


## 2. Procesado de los datos

Una de las grandes ventajas de trabajar con modelos que utilizan caracteres en vez de palabras es que no necesitamos tokenizar el texto (partirlo palabra a palabra). Nuestro modelo funcionará directamente con los caracteres en el texto, incluyendo espacios, saltos de línea, etc.

Antes de hacer nada, necesitamos procesar el texto en entradas y salidas compatibles con nuestro modelo. Como sabemos, un modelo del lenguaje con RNNs acepta una serie de caracteres y predice el siguiente carácter en la secuencia.

* "*El ingenioso don Qui*" -> predicción: **j**
* "*El ingenioso don Quij*" -> predicción: **o**

De modo que la entrada y la salida de nuestro modelo necesita ser algo parecido a este esquema. En este punto, podríamos usar dos formas de preparar los datos para nuestro modelo.

1. **Secuencia a secuencia**. La entrada de nuestro modelo sería una secuencia y la salida sería esa secuencia trasladada un caracter a la derecha, de modo que en cada instante de tiempo la RNN tiene que predecir el carácter siguiente. Por ejemplo:

>* *Input*:   El ingenioso don Quijot
>* *Output*: l ingenioso don Quijote

2. **Secuencia a carácter**. En este variante, pasaríamos una secuencia de caracteres por nuestra RNN y, al llegar al final de la secuencia, predeciríamos el siguiente carácter.

>* *Input*:   El ingenioso don Quijot
>* *Output*: e

En este laboratorio, por simplicidad, vamos a utilizar la segunda variante.

De este modo, a partir del texto, hemos de generar nuestro propio training data que consista en secuencias de caracteres con el siguiente carácter a predecir. Para estandarizar las cosas, utilizaremos secuencias de tamaño *SEQ_LENGTH* caracteres (un hiperparámetro que podemos elegir nosotros).



#### 2.1. Obtención de los caracteres y mapas de caracteres

Antes que nada, necesitamos saber qué caracteres aparecen en el texto, ya que tendremos que diferenciarlos mediante un índice de 0 a *num_chars* - 1 en el modelo. Obtener:


1.   Número de caracteres únicos que aparecen en el texto.
2.   Diccionario que asocia char a índice único entre 0 y *num_chars* - 1. Por ejemplo, {'a': 0, 'b': 1, ...}
3.   Diccionario reverso de índices a caracteres: {0: 'a', 1: 'b', ...}


In [4]:
## TU CÓDIGO AQUÍ
chars=sorted(list(set(text)))
char_indices=dict((c,i) for i,c in enumerate(chars))
indices_char=dict((i,c) for i,c in enumerate(chars))
print('Caracteres únicos: {}'.format(len(chars)))
print(char_indices)
print(indices_char)

Caracteres únicos: 61
{'\n': 0, ' ': 1, '!': 2, '"': 3, "'": 4, '(': 5, ')': 6, ',': 7, '-': 8, '.': 9, '0': 10, '1': 11, '2': 12, '3': 13, '4': 14, '5': 15, '6': 16, '7': 17, ':': 18, ';': 19, '?': 20, ']': 21, 'a': 22, 'b': 23, 'c': 24, 'd': 25, 'e': 26, 'f': 27, 'g': 28, 'h': 29, 'i': 30, 'j': 31, 'l': 32, 'm': 33, 'n': 34, 'o': 35, 'p': 36, 'q': 37, 'r': 38, 's': 39, 't': 40, 'u': 41, 'v': 42, 'w': 43, 'x': 44, 'y': 45, 'z': 46, '¡': 47, '«': 48, '»': 49, '¿': 50, 'à': 51, 'á': 52, 'é': 53, 'í': 54, 'ï': 55, 'ñ': 56, 'ó': 57, 'ù': 58, 'ú': 59, 'ü': 60}
{0: '\n', 1: ' ', 2: '!', 3: '"', 4: "'", 5: '(', 6: ')', 7: ',', 8: '-', 9: '.', 10: '0', 11: '1', 12: '2', 13: '3', 14: '4', 15: '5', 16: '6', 17: '7', 18: ':', 19: ';', 20: '?', 21: ']', 22: 'a', 23: 'b', 24: 'c', 25: 'd', 26: 'e', 27: 'f', 28: 'g', 29: 'h', 30: 'i', 31: 'j', 32: 'l', 33: 'm', 34: 'n', 35: 'o', 36: 'p', 37: 'q', 38: 'r', 39: 's', 40: 't', 41: 'u', 42: 'v', 43: 'w', 44: 'x', 45: 'y', 46: 'z', 47: '¡', 48: '«', 49: 

<enumerate object at 0x7aaeb9944e00>


#### 2.2. Obtención de secuencias de entrada y carácter a predecir

Ahora, vamos a obtener las secuencias de entrada en formato texto y los correspondientes caracteres a predecir. Para ello, recorrer el texto completo leído anteriormente, obteniendo una secuencia de SEQ_LENGTH caracteres y el siguiente caracter a predecir. Una vez hecho, desplazarse un carácter a la izquierda y hacer lo mismo para obtener una nueva secuencia y predicción. Guardar las secuencias en una variable ***sequences*** y los caracteres a predecir en una variable ***next_chars***.

Por ejemplo, si el texto fuera "Don Quijote" y SEQ_LENGTH fuese 5, tendríamos

* *sequences* = ["Don Q", "on Qu", "n Qui", " Quij", "Quijo", "uijot"]
* *next_chars* = ['u', 'i', 'j', 'o', 't', 'e']

In [7]:
# Definimos el tamaño de las secuencias. Puedes dejar este valor por defecto.
SEQ_LENGTH = 30
# Espacio entre sentencias
step=1 # Para que la siguiente sentencia esté desplazada un caracter a la izquierda.
sequences = []
next_chars = [] # siguiente caracter a predecir para la sentencia asociada.

## TU CÓDIGO AQUÍ
for i in range(0,len(text)-SEQ_LENGTH, step):
  sequences.append(text[i:i+SEQ_LENGTH])
  next_chars.append(text[i+SEQ_LENGTH])


In [8]:
print('Ejemplo: secuencia número 7:')
print(sequences[6])
print('Siguiente caracter:')
print(next_chars[6])

Ejemplo: secuencia número 7:
lo primero. que trata de la co
Siguiente caracter:
n


Indicar el tamaño del training set que acabamos de generar.

In [9]:
## TU CÓDIGO AQUÍ
print('número de datos de training:{}'.format(len(sequences)))

número de datos de training:2071168


Como el Quijote es muy largo y tenemos muchas secuencias, podríamos encontrar problemas de memoria. Por ello, vamos a elegir un número máximo de ellas. Si estás corriendo esto localmente y tienes problemas de memoria, puedes reducir el tamaño aún más, pero ten cuidado porque, a menos datos, peor calidad del modelo.

In [10]:
MAX_SEQUENCES = 500000

perm = np.random.permutation(len(sequences))
sequences, next_chars = np.array(sequences), np.array(next_chars)
sequences, next_chars = sequences[perm], next_chars[perm]
sequences, next_chars = list(sequences[:MAX_SEQUENCES]), list(next_chars[:MAX_SEQUENCES])

print(len(sequences))

500000


#### 2.3. Obtención de input X y output y para el modelo

Finalmente, a partir de los datos de entrenamiento que hemos generado vamos a crear los arrays de datos X e y que pasaremos a nuestro modelo.

Para ello, vamos a utilizar *one-hot encoding* para nuestros caracteres. Por ejemplo, si sólo tuviéramos 4 caracteres (a, b, c, d), las representaciones serían: (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0) y (0, 0, 0, 1).

De este modo, **X** tendrá shape *(num_sequences, seq_length, num_chars)* e **y** tendrá shape *(num_sequences, num_chars)*.



In [11]:
NUM_CHARS = len(chars)  # Tu número de caracteres distintos aquí
NUM_SEQUENCES = len(sequences)
X = np.zeros((NUM_SEQUENCES, SEQ_LENGTH, NUM_CHARS))
y = np.zeros((NUM_SEQUENCES, NUM_CHARS))

## Tu código para rellenar X e y aquí. Pista: utilizar el diccionario de
## chars a índices obtenido anteriormente junto con numpy. Por ejemplo,
## si hacemos
##     X[0, 1, char_to_indices['a']] = 1
## estamos diciendo que para la segunda posición de la primera secuencia se
## tiene una 'a'

## TU CÓDIGO AQUÍ
for i,sequence in enumerate(sequences): # i es el número de secuencia y sequence contiene los caracteres
  for t,char in enumerate(sequence): # t recorre la longitud de la secuencia y char cada caracter de la secuencia
    X[i,t,char_indices[char]]=1
  y[i,char_indices[next_chars[i]]]=1

In [12]:
# EJEMPLO: Comprobación de que cada caracter de la secuencia 0 tiene la codificación one-hot
print(sequences[0])
for j in range(SEQ_LENGTH):
  for k in range(NUM_CHARS):
    if (X[0,j,k]==1):
      print(indices_char[k],end='')

l pidiera ni
tal rogara...»

y
l pidiera ni
tal rogara...»

y

## 3. Definición del modelo y entrenamiento

Una vez tenemos ya todo preparado, es hora de definir el modelo. Define un modelo que utilice una **LSTM** con **128 unidades internas**. Si bien el modelo puede definirse de una manera más compleja, para empezar debería bastar con una LSTM más una capa Dense con el *softmax* que predice el siguiente caracter a producir. Adam puede ser una buena elección de optimizador.

Una vez el modelo esté definido, entrénalo un poco para asegurarte de que la loss es decreciente. No es necesario guardar la salida de este entrenamiento en el entregable final, ya que vamos a hacer el entrenamiento más informativo en el siguiente punto.

In [13]:
## TU CÓDIGO AQUÍ
vocab_size=len(chars)

In [14]:
model=Sequential()
model.add(LSTM(128, input_shape=(SEQ_LENGTH,vocab_size)))
model.add(Dense(vocab_size,activation='softmax'))
print(model.summary())

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 lstm (LSTM)                 (None, 128)               97280     
                                                                 
 dense (Dense)               (None, 61)                7869      
                                                                 
Total params: 105149 (410.74 KB)
Trainable params: 105149 (410.74 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________
None


**Training**

In [15]:
optimizer='adam'
model.compile(loss='categorical_crossentropy',optimizer=optimizer,metrics=['accuracy'])


In [None]:
history=model.fit(X,y, validation_split=0.05, batch_size=128, epochs=20,shuffle=True).history

Train on 475000 samples, validate on 25000 samples
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [None]:
from sklearn.externals import joblib # Para salvar el modelo
joblib.dump(model,'modelo_entrenado.pkl')
model2=joblib.load('modelo_entrenado.pkl')


In [None]:
from google.colab import files
files.download('modelo_entrenado.pkl')

In [None]:
#results=model2.evaluate(X,y)
#print(results)

Para ver cómo evoluciona nuestro modelo del lenguaje, vamos a generar texto según va entrenando. Para ello, vamos a programar una función que, utilizando el modelo en su estado actual, genere texto, con la idea de ver cómo se va generando texto al entrenar cada epoch.

En el código de abajo podemos ver una función auxiliar para obtener valores de una distribución multinomial. Esta función se usará para muestrear el siguiente carácter a utilizar según las probabilidades de la salida de softmax (en vez de tomar directamente el valor con la máxima probabilidad, obtenemos un valor aleatorio según la distribución de probabilidad dada por softmax, de modo que nuestros resultados serán más diversos, pero seguirán teniendo "sentido" ya que el modelo tenderá a seleccionar valores con más probabilidad).



In [None]:
def sample(probs, temperature=1.0):
    """Nos da el índice del elemento a elegir según la distribución
    de probabilidad dada por probs.

    Args:
      probs es la salida dada por una capa softmax:
        probs = model.predict(x_to_predict)[0]

      temperature es un parámetro que nos permite obtener mayor
        "diversidad" a la hora de obtener resultados.

        temperature = 1 nos da la distribución normal de softmax
        0 < temperature < 1 hace que el sampling sea más conservador,
          de modo que sampleamos cosas de las que estamos más seguros
        temperature > 1 hace que los samplings sean más atrevidos,
          eligiendo en más ocasiones clases con baja probabilidad.
          Con esto, tenemos mayor diversidad pero se cometen más
          errores.
    """
    # Cast a float64 por motivos numéricos
    probs = np.asarray(probs).astype('float64')

    # Hacemos logaritmo de probabilidades y aplicamos reducción
    # por temperatura.
    probs = np.log(probs) / temperature

    # Volvemos a aplicar exponencial y normalizamos de nuevo
    exp_probs = np.exp(probs)
    probs = exp_probs / np.sum(exp_probs)

    # Hacemos el sampling dadas las nuevas probabilidades
    # de salida (ver doc. de np.random.multinomial)
    samples = np.random.multinomial(1, probs, 1)
    return np.argmax(samples)


Utilizando la función anterior y el modelo entrenado, vamos a añadir un callback a nuestro modelo para que, según vaya entrenando, veamos los valores que resultan de generar textos con distintas temperaturas al acabar cada epoch.

Para ello, abajo tenéis disponible el callback *on_epoch_end*. Esta función elige una secuencia de texto al azar en el texto disponible en la variable
text y genera textos de longitud *GENERATED_TEXT_LENGTH* según las temperaturas en *TEMPERATURES_TO_TRY*, utilizando para ello la función *generate_text*.

Completa la función *generate_text* de modo que utilicemos el modelo y la función sample para generar texto.

NOTA: Cuando hagas model.predict, es aconsejable usar verbose=0 como argumento para evitar que la función imprima valores de salida.

***El siguiente código predice el siguiente caracter a partir de una secuencia aleatoria.
Primero, seleccionamos una secuencia de la longitud fijada SEQ_LENGTH al azar del texto del Quijote, codificamos la secuencia según la representación one-hot y mostramos el caracter que predice el modelo con mayor probabilidad.***


In [None]:
#CÓDIGO Ejemplo: Predice el siguiente caracter de una secuencia aleatoria
# Primero, seleccionamos una secuencia al azar para empezar a predecir
# a partir de ella
start_pos = random.randint(0, len(text) - SEQ_LENGTH - 1)
seed_text = text[start_pos:start_pos + SEQ_LENGTH]
print("Seed: {}".format(seed_text))
print()
#----------------------------------
# Aquí representomos la secuencia seed_text como codificación one-hot
X_pred = np.zeros((1, SEQ_LENGTH, NUM_CHARS))
# Construimos X_pred a partir de seed_text
for t,char in enumerate(seed_text): # t recorre la longitud de la secuencia y char cada caracter de la secuencia
  X_pred[0,t,char_indices[char]]=1
#-------------------------------------
#PREDICCIÓN
prediccion=model.predict(X_pred, batch_size=32, verbose=0)
print(indices_char[np.argmax(prediccion)],end='') # Muestra el caracter más probable para la sequencia 100
##################################################333


Seed:  algún hombre sin alma y sin c

o

***Visto el código anterior podemos modificar seed_text eliminando el primer caracter y añadiendo el caracter predicho al final, de tal forma que podemos  repetir el código anterior  generando un nuevo caracter y así sucesivamente se generará la cadena más probable (al haber usado argmax). El código puede verse a continuación***

In [None]:
print(seed_text)
seed_text=seed_text[1:SEQ_LENGTH-1]
print(seed_text)
seed_text+=indices_char[np.argmax(prediccion)]
print(seed_text)

despertara; y, mirando a una y
espertara; y, mirando a una 
espertara; y, mirando a una l


***Ahora implementamos una función que genere la secuencia de texto más probable a partir de una secuencia inicial.***

In [None]:
def genera_texto(texto, model, length):
  X_pred = np.zeros((1, SEQ_LENGTH, NUM_CHARS)) # Declaramos X_pred
  for k in range(length): # Genera el número de caracteres fijados en el parámetro length
    #Inicializamos X_pred a cero
    for a in range(SEQ_LENGTH):
      for b in range(NUM_CHARS):
         X_pred[0,a,b]=0
    # Aquí representomos la secuencia seed_text como codificación one-hot
    # Construimos X_pred a partir de seed_text
    for t,char in enumerate(texto): # t recorre la longitud de la secuencia y char cada caracter de la secuencia
      X_pred[0,t,char_indices[char]]=1
    #-------------------------------------
    #PREDICCIÓN
    prediccion=model.predict(X_pred, batch_size=32, verbose=0)
    print(indices_char[np.argmax(prediccion)],end='') # Muestra el caracter más probable para la sequencia dada
    #Actualizamos la cadena de entrada
    texto=texto[1:SEQ_LENGTH]
    texto+=indices_char[np.argmax(prediccion)]
    #texto+=indices_char[sample(prediccion[0],1)]
    #print(texto)



***Probamos el modelo para que prediga los siguientes 120 caracteres dada una secuencia inicial aleatoria:***

In [None]:
# Primero, seleccionamos una secuencia al azar para empezar a predecir
# a partir de ella
start_pos = random.randint(0, len(text) - SEQ_LENGTH - 1)
seed_text = text[start_pos:start_pos + SEQ_LENGTH]
print('Seed:',seed_text)
print('Texto generado:')
genera_texto(seed_text, model2, 120)

Seed: jo:

-¿qué es esto, señora ama
Texto generado:
ne y en la cabeza, y a la señora del caballero de la mano a la menos, que se le diesen en la cabeza, y así lo que al cab

In [None]:
TEMPERATURES_TO_TRY = [0.2, 0.5, 1.0, 1.2]
GENERATED_TEXT_LENGTH = 300

def generate_text(seed_text, model, length, temperature=1):
    """Genera una secuencia de texto a partir de seed_text utilizando model.

    La secuencia tiene longitud length y el sampling se hace con la temperature
    definida.
    """

    # Aquí guardaremos nuestro texto generado, que incluirá el
    # texto origen
    generated = seed_text

    # Utilizar el modelo en un bucle de manera que generemos
    # carácter a carácter. Habrá que construir los valores de
    # X_pred de manera similar a como hemos hecho arriba, salvo que
    # aquí sólo se necesita una oración
    # Nótese que el x que utilicemos tiene que irse actualizando con
    # los caracteres que se van generando. La secuencia de entrada al
    # modelo tiene que ser una secuencia de tamaño SEQ_LENGTH que
    # incluya el último caracter predicho.

    ### TU CÓDIGO AQUÍ
    ######################################################################
    texto=seed_text
    X_pred = np.zeros((1, SEQ_LENGTH, NUM_CHARS)) # Declaramos X_pred
    for k in range(length): # Genera el número de caracteres fijados en el parámetro length
      #Inicializamos X_pred a cero
      for a in range(SEQ_LENGTH):
        for b in range(NUM_CHARS):
          X_pred[0,a,b]=0
      # Aquí representomos la secuencia seed_text como codificación one-hot
      # Construimos X_pred a partir de seed_text
      for t,char in enumerate(texto): # t recorre la longitud de la secuencia y char cada caracter de la secuencia
        X_pred[0,t,char_indices[char]]=1
      #-------------------------------------
      #PREDICCIÓN
      prediccion=model.predict(X_pred, batch_size=32, verbose=0)
      # print(indices_char[np.argmax(prediccion)],end='') # Muestra el caracter más probable para la sequencia dada
      #Actualizamos la cadena de entrada
      texto=texto[1:SEQ_LENGTH]
      #texto+=indices_char[np.argmax(prediccion)]
      texto+=indices_char[sample(prediccion[0],temperature)]
      # generated+=indices_char[np.argmax(prediccion)]
      generated+=indices_char[sample(prediccion[0],temperature)]
    ######################################################################
    ### FIN DE TU CÓDIGO
    return generated

In [None]:
# Primero, seleccionamos una secuencia al azar para empezar a predecir
# a partir de ella
start_pos = random.randint(0, len(text) - SEQ_LENGTH - 1)
seed_text = text[start_pos:start_pos + SEQ_LENGTH]
print('Seed:',seed_text)
print('Texto generado:')
generate_text(seed_text, model2, GENERATED_TEXT_LENGTH,temperature=0.1)

Seed: nte
aderezada, y don quijote, 
Texto generado:


'nte\naderezada, y don quijote, qe la manera que le señora del caballero de la mano a la menos, que se la de ser elto de la mano a la menos, que ee he dabía de ser es caballero de la mano a la manos, que ss llto sue le diesen en la cano a la menos, qino que se ha de ser el caballero de la cano a la menos, sue ne la de ser el cabal'

In [None]:



def on_epoch_end(epoch, logs):
  print("\n\n\n")

  # Primero, seleccionamos una secuencia al azar para empezar a predecir
  # a partir de ella
  start_pos = random.randint(0, len(text) - SEQ_LENGTH - 1)
  seed_text = text[start_pos:start_pos + SEQ_LENGTH]
  for temperature in TEMPERATURES_TO_TRY:
    print("------> Epoch: {} - Generando texto con temperature {}".format(
        epoch + 1, temperature))

    generated_text = generate_text(seed_text, model2,
                                   GENERATED_TEXT_LENGTH, temperature)
    print("Seed: {}".format(seed_text))
    print("Texto generado: {}".format(generated_text))
    print()


generation_callback = LambdaCallback(on_epoch_end=on_epoch_end)

In [None]:
history=model2.fit(X,y, validation_split=0.05, batch_size=128, epochs=2,shuffle=True,verbose=0,callbacks=[generation_callback]).history





------> Epoch: 1 - Generando texto con temperature 0.2
Seed: ivos y a los muertos. por eso 
Texto generado: ivos y a los muertos. por eso qe aos mosinos d eesla meno de la mano,de lasmano,de la mabellería de las mesperables d dn el mundo de la mano de la  canos de lo meno de la mano de lo mano de li madtcer due es cura d ee la mano de los densamientos de las daales que sl cuaa ye los cespuraudores que estaba en cundo de la mano  yues 

------> Epoch: 1 - Generando texto con temperature 0.5
Seed: ivos y a los muertos. por eso 
Texto generado: ivos y a los muertos. por eso do se eeevabe aa vaeha pe la melo,de cu carsona y donea,d ee ma cano,der el pundo ee la mnpripa, eun ttrosme uam s to que le so mano de da 
drandgstasan dor el muallo,de aos
aes ee lo meerra  y esí  se or  meraddo de lo maedta de la deluienza de la dmga q la malora,qe los qes dal es las cecuaas de c

------> Epoch: 1 - Generando texto con temperature 1.0
Seed: ivos y a los muertos. por eso 
Texto generado: ivos y a

***El modelo va mejorando época a época. Se había entrenado con anterioridad 20 épocas y se observa en cada una el descenso del loss y el aumento del accuracy.***
 Comentar las diferencias apreciadas al utilizar diferentes valores de temperatura.
***Observamos como al aumentar el parámetro temperatura el texto predicho es menos probable haciéndose ilegible.***

Entrena ahora tu modelo. No te olvides de añadir *generation_callback* a la lista de callbacks utilizados en fit(). Ya que las métricas de clasificación no son tan críticas aquí (no nos importa tanto acertar el carácter exacto, sino obtener una distribución de probabilidad adecuada), no es necesario monitorizar la accuracy ni usar validation data, si bien puedes añadirlos para asegurarte de que todo está en orden.


## Entregable

Completa los apartados anteriores para entrenar modelos del lenguaje que sean capaces de generar texto con cierto sentido. Comentar los resultados obtenidos y cómo el modelo va mejorando época a época. Comentar las diferencias apreciadas al utilizar diferentes valores de temperatura. Entregar al menos la salida de un entrenamiento completo con los textos generados época a época.

El objetivo no es conseguir generar pasajes literarios con coherencia, sino obtener lenguaje que se asemeje en cierta manera a lo visto en el texto original y donde las palabras sean reconocibles como construcciones en castellano. Como ejemplo de lo que se puede conseguir, este es el resultado de generar texto después de 10 epochs y con temperature 0.2:


```
-----> Epoch: 10 - Generando texto con temperature 0.2
Seed: o le cautivaron y rindieron el
Texto generado: o le cautivaron y rindieron el caballero de la caballería de la mano de la caballería del cual se le dijo:

-¿quién es el verdad de la caballería de la caballería de la caballería de la caballería de la caballería, y me ha de habían de la mano que el caballero de la mano de la caballería. y que no se le habían de la mano de la c

```

Asimismo, se proponen los siguientes aspectos opcionales para conseguir nota extra:

*   Experimentar con los textos de teatro en verso de Calderón de la Barca (¿es capaz el modelo de aprender las estructuras del teatro en verso?) o con alguno de los otros textos disponibles. También se puede probar con textos de vuestra elección.
*   Experimentar con distintos valores de SEQ_LENGTH.
*   Experimentar con los hiperparámetros del modelo o probar otro tipo de modelos como GRUs o *stacked* RNNs (RNNs apiladas).
*   Experimentar utilizando embeddings en vez de representaciones one-hot.
*   (Difícil) Entrenar un modelo secuencia a secuencia en vez de secuencia a carácter.


