# Rede neuronal recurrente

En está práctica construiremos una red neuronal recurrente para generación de texto.

Puedes descargar un conjunto de datos sobre nombres en distintos idiomas aqui: https://download.pytorch.org/tutorial/data.zip

El conjunto de datos consta de nombres en 18 idiomas, se encuentran en archivos .txt 
con el nombre del idioma en el que se encuentran.

**Punto extra**: Modifica el conjunto de datos a uno de tu propia elección, con al menos dos categorias.

In [1]:
from __future__ import unicode_literals, print_function, division
from io import open
import glob
import os
import unicodedata
import string
import torch
import torch.nn as nn

**Lectura de datos.** Dado que en este caso nuestros datos vienen en texto, necesitaremos realizar un 
proceso diferente para obtener los datos.

In [2]:
all_letters = string.ascii_letters + " .,;'-"
n_letters = len(all_letters) + 1 # más uno para marcar el final.

# Función auxiliar que devuelve los nombres de los archivos de una carpeta.
def findFiles(path): return glob.glob(path)

def unicodeToAscii(s):
    '''
    Función auxiliar para transformar elementos de UNICODE a ASCII
    '''
    return ''.join(
        c for c in unicodedata.normalize('NFD', s)
        if unicodedata.category(c) != 'Mn'
        and c in all_letters
    )

def readLines(filename):
    '''
    Función auxiliar para leer las lineas 
    '''
    lines = open(filename, encoding='utf-8').read().strip().split('\n')
    return [unicodeToAscii(line) for line in lines]

category_lines = {}
all_categories = []

# Itera entre los nombres de tus archivos usando findFiles. 
# Agrega cada uno de los nombres a la lista 'all_categories', eliminando la extención del archivo, 
# para ello puedes usar la función de os.path llamada splitext. 
# Lee las lineas del archivo y agregalas como lista al diccionario, usando como llave a la categoria de donde procede.

for filename in findFiles('data/names/*.txt'):
    category = os.path.splitext(os.path.basename(filename))[0]
    all_categories.append(category)
    lines = readLines(filename)
    category_lines[category] = lines

# Verificamos que todo se encuentre correctamente, e imprimimos cuantas categorias tienen los datos.
n_categories = len(all_categories)

if n_categories == 0:
    raise RuntimeError('Datos no encontrados..')

print('Número de categorias:', n_categories, all_categories)

Número de categorias: 18 ['Arabic', 'Chinese', 'Czech', 'Dutch', 'English', 'French', 'German', 'Greek', 'Irish', 'Italian', 'Japanese', 'Korean', 'Polish', 'Portuguese', 'Russian', 'Scottish', 'Spanish', 'Vietnamese']


## Red neuronal recurrente.

El objetivo de esta red es poder generar texto a partir de un elemento de entrada. Para ello necesitaremos 
que por cada entrada de la red, nos de como resultado una nueva letra. Sin embargo, como es una red
recurrente, también tendremos un elemento que pasará integro entre una capa y la siguiente, el cual será una
salida intermedia donde, esperadamente, podamos tener los datos de la configuarición hasta ahora. **Definiremos
el tamaño de está salida intermedia como 128**

La red se compondrá de la siguiente manera:
- Una capa completamente conectada, en donde entre la categoría a la que pertenece el elemento en one-hot encoding, la letra que trataremos en formato one-hot encoding, y el elemento intermedio obtenido por la red en el tiempo anterior. Esta capa dará como resultado la codifición intermedia, a la que llamaremos *hidden*. 
- Una capa completamente conecta donde entrará la categoría a la que pertenece el elemento en one-hot encoding, la letra que recibiremos en one-hot encoding, y el elemento intermedio obtenido en el tiempo anterior. Dara como resultado la cantidad de elementos que tendremos como salida de la red, en este casó, será el mismo tamaño que la representación de las letras en one-hot encoding.
- Una capa donde combinemos los resultados de las dos capas antriores. y obtengamos como resultado una letra en formato one-hot encoding, la cual será el elemento que necesitaremos como salida de nuestra red.
- Una capa de *Dropout* con una probabilidad 0.1 de activarse.
- Pasaremos la salida por una función *LogSoftmax*

Estos elementos se conectarán de la siguiente manera:
- Concatenaremos las entradas de la red en en un único tensor, con el cual alimentaremos a las primeras dos capas. Estpas capas no se conectan entre si.
- Concatenaremos estás dos salidas en un único tensor con el cual alimentaremos a la segunda capa. Entre estás dos capas no hay una función de activación.
- A está última capa aplicaremos la función *Dropout*.
- Al resultado del *Dropout* le aplicaremos la función *LogSoftmax*.

In [None]:
class RNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        '''
        Define las capas de la red, y las funciónes que usaremos. También guarda 
        como atributo del modelo también hidden_size, ya que será útil.
        '''
        super(RNN, self).__init__()
        pass

    def forward(self, category, input, hidden):
        '''
        Define la forma en la que se aplicará el feedforward respecto a lo explicado anteriormente.
        Regresa como resultado tanto la letra obtenida por la tercer capa como la representación 
        intermedia obtenida en la primer capa.
        '''
        pass
    
    def initHidden(self):
        '''
        Debido a que necesitamos un valor de hidden para usar la red, definimos al valor en el tiempo -1 como
        un tensor de ceros.
        '''
        pass


In [None]:
import random

def randomChoice(l):
    '''
    Función para obtener un elemento aleatorio de una lista.
    '''
    return l[random.randint(0, len(l) - 1)]

def randomTrainingPair():
    '''
    Función para obtener una muestra aleatoria de una categoria aleatoria.
    '''
    category = randomChoice(all_categories)
    line = randomChoice(category_lines[category])
    return category, line

In [None]:
def categoryTensor(category):
    '''
    Define una función para obtener la representación en one-hot encoding a partir de la posición
    de la categoría.
    '''

    pass

def inputTensor(line):
    '''
    Define una función para obtener la representación en one-hot encoding de cada una de las letras
    que conforman una línea. Define como resultado un tensor de dimensiones (# letras en la linea, 1, # letras).
    Puedes obtener la letra a partir del string con todas las letras anteriormente definido, y usando el método
    find.
    '''
    pass

def targetTensor(line):
    '''
    Define una función donde tengas los indices de cada una de las letras de una linea,
    y agrega al final de la lista el valor para finalizar, el cual es igual al número de
    letras, ya que estamos contando a parir de 0. Regresa esta lista como un LongTensor.
    '''
    pass

In [None]:
def randomTrainingExample():
    '''
    Usando como base las funciones anteriores, define una función para obtener un ejemplar 
    de entrenamiento aleatorio. Regresa como resultado la categoría a la que pertenece
    en one-hot encoding, las letras de la linea en one-hot encoding, y los valores 
    esperados correctos de está linea, como un LongTensor.
    '''
    pass

In [None]:
def train(category_tensor, input_line_tensor, target_line_tensor, rnn, criterion, optimizer):
    '''
    Define una función de entrenamiento únicamente para una linea. Para ello debes iterar entre los
    elementos de la linea, e ir sumando los errores obtenidos. Recuerda que antes de leer la palabra
    debes de inicializar el valor de hidden. Para poder convertir a un tensor únidimensional a 
    un vector columna puedes utilizar la función unqueeze_().
    
    Para cada letra de la palabra debes obtener su resultado tras pasarlo por la red, junto a su categoria 
    y el hidden obtenido anteriormente. Y como resultado debes obtener la siguiente letra y el nuevo valor
    de hidden. Luego obten el error de tu resultado y sumalo a tu error actual.
    
    Al finalizar la palabra realiza un paso del optmizador.
    
    Retorna el valor de tu loss, dividido entre la cantidad de letras que tenia tu palabra.
    '''
    pass

In [None]:
import time
import math

def timeSince(since):
    '''
    Función auxiliar, nos servirá para monitorizar el tiempo que hemos entrenado.
    '''
    now = time.time()
    s = now - since
    m = math.floor(s / 60)
    s -= m * 60
    return '%dm %ds' % (m, s)

In [None]:
import matplotlib.pyplot as plt

rnn = RNN(n_letters, 128, n_letters)

n_iters = 100000
print_every = 5000
plot_every = 5000
all_losses = []
total_loss = 0 # Reset every plot_every iters

criterion = nn.NLLLoss()

learning_rate = 0.0005

optimizer = torch.optim.SGD(rnn.parameters(),learning_rate)

start = time.time()

# Define un entrenamiento donde en cada iteración tomemos un elemento al azar de nuestro conjunto de datos.
# donde iteres el número de veces definido anteriormente. Suma los errores obtenidos hasta el momento, y 
# descargalos en la lista all_losses cada que pasan plot_every iteraciones, dividelo por la cantidad 
# elementos que sumaste. Imprime cada print_every el porcentaje del entrenamiento que has realizado, 
# así como cuanto tiempo lo has realizado. Al finalizar muestra la gráfica resultante de all_losses. Y 
# guarda tus pesos hasta el momento.


# TODO


In [None]:
max_length = 20

def sample(category, start_letter='A'):
    '''
    Define una función con la cual puedas obtener un nombre generado por tu red. Dode pongas como 
    inicio a la letra que selecciones en start_letter, y continues obteniendo letras a partir de ahí.
    Selecciona un tamaño máximo al cual pueda imprimir, en caso de que tu red nunca decida seleccionar
    el final de la linea.
    
    Regresa como resultado la palabra obtenida en formato string.
    '''
    pass

Para finalizar, muestra una palabra obtenida de cada categoria.