## Introducción a RNN

Esta semana estudiaremos otra arquitectura de redes neuronales: RNN o Recurrent Neural Networks. Este tipo de redes son perfectas para analizar series temporales y secuencias de todo tipo de diferentes longitudes, a diferencia de otras arquitecturas como CNN, donde todos los tensores deben ser del mismo tamaño. 

Las redes RNN pueden servir para:

- Anticipar trayectorias en vehículos autónomos.
- Predecir precios de acciones.
- Resolver problemas de conversión de voz a texto y NLP.
- Reconocer lenguages de senas.
- Procesar sequencias largas de audio.


### Neuronas Recurrentes y sus Capas

Hasta el momento hemos trabajado con redes neuronales tipo “feed-forward” donde las conexiones en las neuronas van en un solo sentido, como es el caso de logistic regression o perceptron y CNN.

Las redes neuronales recurrentes son muy similares a las arquitecturas ya vistas en nuestro curso con la salvedad de que ahora vamos a poder tener una conexión de una neurona consigo misma o bien con otra neurona contigua. 

Veamos el siguiente diagrama que representa este tipo de conexiones nuevas. 

<img src="img/rnn1.png" />

De acuerdo al diagrama, cada neurona recibe 2 inputs: el valor de $X_{(t)}$ para el frame t, y el valor de salida de la neurona anterior $y_{(t-1)}$.

También, la neurona ahora tiene dos sets de pesos: los que corresponden a $x_{(t)}$ y los de la salida de $y_{(t-1)}$. Llamaremos a estos pesos $w_x$ y $w_y$. 

Salida de una neurona: 
- $y_{(t)} = \phi({W_x}^Tx_{(t)}+{W_y}^Ty_{(t-1)}+b)$

Salida de una capa de RNN de todas las instancias (vectorizado):
- $y_{(t)} = \phi(X_{(t)}{W_x}+y_{(t-1)}{W_y}+b)$
- $y_{(t)} = \phi([X_{(t)}y_{(t-1)}]W+b)$
donde:
- $W=[W_x W_y]$

### Celdas de Memoria (Memory Cells)

Se llama celda, a la parte de una red neuronal que preserva el estado a través del tiempo. Usualmente una celda puede almacenar datos de 10 neuronas anteriores, lo que es conveniente para operaciones que ocupan una noción de los estados anteriores. 

Existen modificaciones que permiten aumentar la cantidad de memoria que se puede almacenar.

El estado de una celda en el tiempo t se denota como ht. La letra h significa “hidden”. Ahora este estado h en neuronal simples es equivalente a la salida $y_t$, sin embargo en implementaciones mas complejas esto no es siempre así, por tanto vamos a describir como $h(t)=f(h_{(t-1)},x_{(t)})$.

<img src="img/rnn2.png" />

*Notas importantes*

- Las RNN reciben una sequencia y pruden producir otra sequencia. Esto sirve para generar predicciones en series temporales tipo acciones de la bolsa de valores o bien predecir la direccion de un vehiculo autonomo. (sequence-2-sequence)
- Las RNN reciben una sequencia y pueden ignorar toda la sequencia con excepcion del ultimo elemento. Esto puede servir para predecir la proxima palabra de un texto. (sequence-2-vector)

Con esta introducción, estamos listos para usar keras para crear nuestra primera red neuronal recurrente. Vamos al siguiente notebook para explorar la definición.