# Generación de textos con Deep Learning



In [None]:
import sys
import numpy
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import LSTM
from keras.callbacks import ModelCheckpoint
from keras.utils import np_utils

In [None]:
#Cargamos el texto y lo pasamos a minuscula
filename = "C:/Users/Josemi/Downloads/caperucita.txt";
raw_text = open(filename).read()
raw_text = raw_text.lower()

In [None]:
#Crear mapeo de caracteres únicos a enteros, y un mapeo inverso
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))

In [None]:
n_chars = len(raw_text)
n_vocab = len(chars)
print("Total de caracteres:", n_chars)
print("Total vocales:", n_vocab)

In [None]:
#Preparar el conjunto de datos de entrada para los pares de salida codificados como enteros
seq_length = 100
dataX = []
dataY = []
for i in range(0, n_chars - seq_length, 1):
  seq_in = raw_text[i:i + seq_length]
  seq_out = raw_text[i + seq_length]
  dataX.append([char_to_int[char] for char in seq_in])
  dataY.append(char_to_int[seq_out])
n_patterns = len(dataX)
print("Total patrones: ", n_patterns)

In [None]:
#Remodelar X para que sea [muestras, pasos de tiempo, características]
X = np.reshape(dataX, (n_patterns, seq_length, 1))
#Normalizacion
X = X / float(n_vocab)
#Codificacion en caliente con la variable de salida
y = np_utils.to_categorical(dataY)

In [None]:
#Define el LSTM model
model = Sequential()
model.add(LSTM(256, input_shape=(X.shape[1], X.shape[2])))
model.add(Dropout(0.2))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam')

In [None]:
#Se define el checkpoint
filepath="pesos-los3-30-{epoch:02d}-{loss:.4f}.hdf5";
checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
callbacks_list = [checkpoint]

In [None]:
#Ajuste del modelo
model.fit(X, y, epochs=50, batch_size=128, callbacks=callbacks_list)

In [None]:
#Carga de los pesos de la red
filename="pesos-los3-30-50-1.9956.hdf5"
model.load_weights(filename)
model.compile(loss='categorical_crossentropy', optimizer='adam')

In [None]:
int_to_char = dict((i, c) for i, c in enumerate(chars))

In [None]:
#Toma una semilla aleatoria
start = numpy.random.randint(0, len(dataX)-1)
pattern = dataX[start]
print("Semilla:")
print("\"", ''.join([int_to_char[value] for value in pattern]), "\"")
#Genera los carácteres
for i in range(1000):
  x = numpy.reshape(pattern, (1, len(pattern), 1))
  x = x / float(n_vocab)
  prediction = model.predict(x, verbose=0)
  index = numpy.argmax(prediction)
  result = int_to_char[index]
  seq_in = [int_to_char[value] for value in pattern]
  sys.stdout.write(result)
  pattern.append(index)
  pattern = pattern[1:len(pattern)]
print("\nHecho.")

# Red Neuronal Recurrente LSTM más grande
Ahora vamos ha hacer los mismo creando una red mucho más grande. Mantendremos el mismo número de unidades de memoria en 256, pero añadiremos una segunda capa.

In [None]:
#Define la LSTM model
model = Sequential()
model.add(LSTM(256, input_shape=(X.shape[1], X.shape[2]), return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(256))
model.add(Dropout(0.2))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam')
filename="pesos-los3grande-303-30-2.3081.hdf5"

In [None]:
#Grande LSTM Network para generar texto 3 cerditos
import sys
import numpy
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import LSTM
from keras.callbacks import ModelCheckpoint
from keras.utils import np_utils
#Cargamos el texto y lo pasamos a minuscula
filename = "los3.txt"
raw_text = open(filename).read()
raw_text = raw_text.lower()
#Crear mapeo de caracteres únicos a enteros, y un mapeo inverso
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
#Sumarizamos los datos cargados
n_chars = len(raw_text)
n_vocab = len(chars)
print("Total caracters: ", n_chars)
print("Total vocabulario: ", n_vocab)
#Preparar el conjunto de datos de entrada para los pares de salida codificados como enteros
seq_length = 100
dataX = []
dataY = []
for i in range(0, n_chars - seq_length, 1):
  seq_in = raw_text[i:i + seq_length]
  seq_out = raw_text[i + seq_length]
  dataX.append([char_to_int[char] for char in seq_in])
  dataY.append(char_to_int[seq_out])
n_patterns = len(dataX)
print("Total patrones: ", n_patterns)
#Remodelar X para que sea [muestras, pasos de tiempo, características]
X = numpy.reshape(dataX, (n_patterns, seq_length, 1))
#Normalizacion
X = X / float(n_vocab)
#Codificacion en caliente con la variable de salida
y = np_utils.to_categorical(dataY)
#Se define el LSTM modelo
model = Sequential()
model.add(LSTM(256, input_shape=(X.shape[1], X.shape[2]), return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(256))
model.add(Dropout(0.2))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam')
#Se define el checkpoint
filepath="pesos-los3grandes-303-{epoch:02d}-{loss:.4f}.hdf5";
checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
callbacks_list = [checkpoint]
#Ajuste del modelo
model.fit(X, y, epochs=150, batch_size=64, callbacks=callbacks_list)

In [None]:
filename="pesos-los3grandes-303-135-0.0111.hdf5"

In [None]:
#Carga de la red LSTM grande para generar texto
import sys
import numpy
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import LSTM
from keras.utils import np_utils
#Cargamos el texto y lo pasamos a minuscula
filename = "los3.txt"
raw_text = open(filename).read()
raw_text = raw_text.lower()
#Crear mapeo de caracteres únicos a enteros, y un mapeo inverso
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
int_to_char = dict((i, c) for i, c in enumerate(chars))
#Sumarizamos los datos cargados
n_chars = len(raw_text)
n_vocab = len(chars)
print("Total Characters: ", n_chars)
print("Total Vocab: ", n_vocab)
#Preparar el conjunto de datos de entrada para los pares de salida codificados como enteros
seq_length = 100
dataX = []
dataY = []
for i in range(0, n_chars - seq_length, 1):
    seq_in = raw_text[i:i + seq_length]
    seq_out = raw_text[i + seq_length]
    dataX.append([char_to_int[char] for char in seq_in])
    dataY.append(char_to_int[seq_out])
    n_patterns = len(dataX)

print("Total Patterns: ", n_patterns)
#Remodelar X para que sea [muestras, pasos de tiempo, características]
X = numpy.reshape(dataX, (n_patterns, seq_length, 1))
#Normalizacion
X = X / float(n_vocab)
#Codificacion en caliente de la variable de salida
y = np_utils.to_categorical(dataY)
#Define la LSTM model
model = Sequential()
model.add(LSTM(256, input_shape=(X.shape[1], X.shape[2]), return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(256))
model.add(Dropout(0.2))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam')
#Carga de los pesos de la red
filename="pesos-los3grandes-303-135-0.0111.hdf5"
model.load_weights(filename)
model.compile(loss='categorical_crossentropy', optimizer='adam')
#Toma una semilla aleatoria
start = numpy.random.randint(0, len(dataX)-1)
pattern = dataX[start]
print("Semilla:")
print("\"", ''.join([int_to_char[value] for value in pattern]), "\"")
#Genera los carácteres
for i in range(1000):
  x = numpy.reshape(pattern, (1, len(pattern), 1))
  x = x / float(n_vocab)
  prediction = model.predict(x, verbose=0)
  index = numpy.argmax(prediction)
  result = int_to_char[index]
  seq_in = [int_to_char[value] for value in pattern]
  sys.stdout.write(result)
  pattern.append(index)
  pattern = pattern[1:len(pattern)]
print("\nHecho.")

# Ideas de extensión para mejorar el modelo
A continuación se muestran ideas que se pueden investigar para mejorar aún más el modelo:

- Predecir menos de 1.000 caracteres como salida para una semilla dada.
- Eliminar toda la puntuación del texto fuente y, por lo tanto, del vocabulario de los modelos.
- Probar con una codificación en caliente para las secuencias de entrada.
- Aumentar el número de epoch de entrenamiento a 100 o cientos.
- Añadir más unidades de memoria a las capas y/o más capas.
- Experimentar con los factores de escala (temperatura) al interpretar las probabilidades de predicción.
- Cambiar las capas de LSTM para que estén en estado para mantener el estado en todos los lotes.


In [1]:
import numpy as np
import keras
import sys
from keras.models import Sequential
from keras.layers import Dense, Dropout, LSTM
from keras.utils import np_utils
from keras.callbacks import ModelCheckpoint

filename = "caperucita.txt"
raw_text = open(filename, encoding="utf-8",errors="ignore").read()


raw_text = open(filename).read()
raw_text = raw_text.lower()
#Crear mapeo de caracteres únicos a enteros, y un mapeo inverso
chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
#Sumarizamos los datos cargados
n_chars = len(raw_text)
n_vocab = len(chars)
print("Total caracters: ", n_chars)
print("Total vocabulario: ", n_vocab)

seq_length = 100
x_data = []
y_data = []

# loop through inputs, start at the beginning and go until we hit
# the final character we can create a sequence out of
for i in range(0, n_chars - seq_length, 1):
    # Define input and output sequences
    # Input is the current character plus desired sequence length
    in_seq = raw_text[i:i + seq_length]
    
    
    # Out sequence is the initial character plus total sequence length
    out_seq = raw_text[i + seq_length]

    # We now convert list of characters to integers based on
    # previously and add the values to our lists
    x_data.append([char_to_int[char] for char in in_seq])
    
    y_data.append(char_to_int[out_seq])

n_patterns = len(x_data)    
print ("Total Patterns:", n_patterns)
y = np_utils.to_categorical(y_data)
X = np.reshape(x_data, (n_patterns, seq_length, 1))

#shape de la matriz encoded= (3129, 100, 39)

X = X/float(n_vocab)
#Define la LSTM model
model = Sequential()

model.add(LSTM(256, input_shape=(X.shape[1], 1), return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(256))
model.add(Dropout(0.2))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam')
#Carga de los pesos de la red
filepath = "model_weights_saved.hdf5"

Checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
callbacks_list = [Checkpoint]
#Ajuste del modelo
model.fit(X, y, epochs=101, batch_size=64, callbacks=callbacks_list)


Total caracters:  4705
Total vocabulario:  45
Total Patterns: 4605
Epoch 1/101
Epoch 1: loss improved from inf to 3.14563, saving model to model_weights_saved.hdf5
Epoch 2/101
Epoch 2: loss improved from 3.14563 to 3.07001, saving model to model_weights_saved.hdf5
Epoch 3/101
Epoch 3: loss improved from 3.07001 to 3.05835, saving model to model_weights_saved.hdf5
Epoch 4/101
Epoch 4: loss did not improve from 3.05835
Epoch 5/101
Epoch 5: loss improved from 3.05835 to 3.04886, saving model to model_weights_saved.hdf5
Epoch 6/101
Epoch 6: loss improved from 3.04886 to 3.03373, saving model to model_weights_saved.hdf5
Epoch 7/101
Epoch 7: loss improved from 3.03373 to 3.01506, saving model to model_weights_saved.hdf5
Epoch 8/101
Epoch 8: loss improved from 3.01506 to 2.96179, saving model to model_weights_saved.hdf5
Epoch 9/101
Epoch 9: loss improved from 2.96179 to 2.89259, saving model to model_weights_saved.hdf5
Epoch 10/101
Epoch 10: loss improved from 2.89259 to 2.81952, saving model

<keras.callbacks.History at 0x2175cb3f8b0>

In [3]:
int_to_char = dict((i, c) for i, c in enumerate(chars))
filename="model_weights_saved.hdf5"
model.load_weights(filename)
model.compile(loss='categorical_crossentropy', optimizer='adam')
#Toma una semilla aleatoria
start = np.random.randint(0, len(x_data)-1)
pattern = x_data[start]
print("Semilla:")
print("\"", ''.join([int_to_char[value] for value in pattern]), "\"")
#Genera los carácteres
for i in range(1000):
  x = np.reshape(pattern, (1, len(pattern), 1))
  x = x / float(n_vocab)
  prediction = model.predict(x, verbose=0)
  index = np.argmax(prediction)
  result = int_to_char[index]
  seq_in = [int_to_char[value] for value in pattern]
  sys.stdout.write(result)
  pattern.append(index)
  pattern = pattern[1:len(pattern)]
print("\nHecho.")

Semilla:
" e directo a la cama de la abuelita y de un bocado se la tragã³. y enseguida se puso ropa de ella, se "
 colocã³ un gorro, se metiã³ en la cama y cerrã³ las cortinas.

mientras tanto, caperucita roja se habã­a quedado colectando flores, y cuando vio que tenã­a tantas que ya no podã­a llevar mã¡s, se acordã³ de su abuelita y se puso en camino hacia ella. cuando llegã³, se sorprendiã³ a  sano hobã³a tartan a la casa, y con una apariencia muy extraã±a. "â¡!oh, abuelita!" dijo, "quã© orejas tan grandes que tienes." - "es para oã­rte mejor, mi niã±a," fue la respuesta. "pero abuelita, quã© ojos tan grandes que tienes." - "son para verte mejor, querida." - "pero abuelita, quã© brazos tan grandes que tienes." - "para abrazarte mejor." - "y quã© boca tan grande que tienes." - "para comerte mejor." y no habã­a terminado de decir lo anterior, cuando de un salto saliã³ de la cama y se tragã³ tambiã©n a caperucita roja.

y colorã­n colorado, este cuento se ha acabado. q no abueltta y de 