# Redes Neurais Recorrentes

As redes neurais recorrentes são as redes que possuem uma realimentação dos neurônios de saída para a entrada da rede.
A figura a seguir mostra uma rede recorrente simples contendo:
- 2 entradas
- 4 neurônios de saídas
- 1 bias

<img src='../figures/RNN_2_3_4_template.png',width=300pt></img>

Se configurarmos esta rede para processar 3 instantes de tempo (de duas entradas cada), teremos a 
rede equivalente conforme figura a seguir:

<img src='../figures/RNN_2_3_4.png',width=500pt></img>

Note entretanto que os parâmetros da rede são os mesmos para cada instante de tempo.
O número total de parâmetros que precisam ser treinados nesta rede são:
- 2 x 4 = parâmetros da rede de entrada (2 entradas x 4 saídas)
- 4 = bias da rede de entrada (um parâmetro para cada saída)
- 4 x 4 = parâmetros da rede recorrente (4 entradas x 4 saídas)

Este notebook é uma demonstração da construção desta rede utilizando valores numérico para poder acompanhar
o processamento da rede recorrente.

## Importação

Iremos exercitar o modelo recorrente mais simples do Keras: `SimpleRNN`

In [13]:
import numpy as np

import torch
from torch.autograd import Variable

In [41]:
rnn = torch.nn.RNN(2, 4, 1) # 2 features, 4 neurônios, 1 camada
input = Variable(torch.randn(1, 3, 2)) # 1 amostra, 3 sequências, 2 features
h0 = Variable(torch.zeros(1, 1, 4))
output, hn = rnn(input, h0)
rnn
print('output:',output)
print('hn:', hn)

output: Variable containing:
(0 ,.,.) = 
  0.8021  0.6147  0.6865 -0.3756
  0.1840  0.4078  0.2435 -0.5098
 -0.5885  0.9225 -0.6590 -0.8538
[torch.FloatTensor of size 1x3x4]

hn: Variable containing:
(0 ,.,.) = 
  0.8021  0.6147  0.6865 -0.3756
  0.1840  0.4078  0.2435 -0.5098
 -0.5885  0.9225 -0.6590 -0.8538
[torch.FloatTensor of size 1x3x4]



In [33]:
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               0.4398  0.4684
               0.2494  0.3805
               0.0833 -0.0748
               0.1569 -0.0851
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
              -0.0990 -0.1667  0.4619  0.2574
               0.3975  0.4400 -0.0138  0.2994
              -0.1573  0.1382 -0.0498 -0.4800
              -0.1424  0.2847 -0.2578  0.1872
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
              -0.1793
               0.1044
              -0.3918
               0.1483
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0.4792
              -0.4073
               0.1504
              -0.4647
              [torch.FloatTensor of size 4])])

## Colocando os parâmetros

### Pesos e Bias da rede de entrada

In [52]:
w_ih = np.array([
    [ 1., 2.,  3., 4. ],
    [ 5,  6.,  7., 8]])
bias_ih = np.array(
    [ 0.1,  0.2,  0.3,  0.4])

### Pesos e Bias da rede recorrente

In [53]:
w_hh = np.array([
    [ 1.,  0.,  0.,  0.],
    [ 0.,  1.,  0.,  0.],
    [ 0.,  0.,  1.,  0.],
    [ 0.,  0.,  0.,  1.]])
bias_hh = np.array(
    [ -0.1,  -0.2,  -0.3,  -0.4])

In [54]:
w_dict = {'weight_ih_l0': torch.FloatTensor(w_ih.T),
          'weight_hh_l0': torch.FloatTensor(w_hh.T),
          'bias_ih_l0':   torch.FloatTensor(bias_ih),
          'bias_hh_l0':   torch.FloatTensor(bias_hh)}

In [56]:
rnn.load_state_dict(w_dict)
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               1  5
               2  6
               3  7
               4  8
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               1  0  0  0
               0  1  0  0
               0  0  1  0
               0  0  0  1
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0.1000
               0.2000
               0.3000
               0.4000
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0.1000
              -0.2000
              -0.3000
              -0.4000
              [torch.FloatTensor of size 4])])

In [72]:
x_in = np.array([[[1.,0],[0,0],[0,0]],
                 [[0.,0],[0,0],[0,0]]])
x_in.shape

(2, 3, 2)

In [73]:
x = Variable(torch.FloatTensor(x_in)) # torch.randn(1, 3, 2)) # 1 amostra, 3 sequências, 2 features
x

Variable containing:
(0 ,.,.) = 
  1  0
  0  0
  0  0

(1 ,.,.) = 
  0  0
  0  0
  0  0
[torch.FloatTensor of size 2x3x2]

In [74]:
h0 = Variable(torch.zeros(1, 1, 4))
y,h1 = rnn(x,h0)
y

Variable containing:
(0 ,.,.) = 
  0.7616  0.9640  0.9951  0.9993
  0.0000  0.0000  0.0000  0.0000
  0.0000  0.0000  0.0000  0.0000

(1 ,.,.) = 
  0.6420  0.7461  0.7595  0.7613
  0.0000  0.0000  0.0000  0.0000
  0.0000  0.0000  0.0000  0.0000
[torch.FloatTensor of size 2x3x4]

<iframe src="https://docs.google.com/forms/d/e/1FAIpQLScvU9jxvImSrQFy0DxV2vJwPGeFZiHquC5x91tdVrMxZJ-vHA/viewform?embedded=true" width="760" height="500" frameborder="0" marginheight="0" marginwidth="0">Loading...</iframe>
