# Redes Neurais Recorrentes

As redes neurais recorrentes são as redes que possuem uma realimentação dos neurônios de saída para a entrada da rede.
A figura a seguir mostra uma rede recorrente simples contendo:
- 2 entradas
- 4 neurônios de saídas
- 1 bias

<img src='../figures/RNN_2_3_4_template.png',width=300pt></img>

Se configurarmos esta rede para processar 3 instantes de tempo (de duas entradas cada), teremos a 
rede equivalente conforme figura a seguir:

<img src='../figures/RNN_2_3_4.png',width=500pt></img>

Note entretanto que os parâmetros da rede são os mesmos para cada instante de tempo.
O número total de parâmetros que precisam ser treinados nesta rede são:
- 2 x 4 = parâmetros da rede de entrada (2 entradas x 4 saídas)
- 4 = bias da rede de entrada (um parâmetro para cada saída)
- 4 x 4 = parâmetros da rede recorrente (4 entradas x 4 saídas)

Este notebook é uma demonstração da construção desta rede utilizando valores numérico para poder acompanhar
o processamento da rede recorrente.

## Importação

Iremos exercitar o modelo recorrente mais simples do Keras: `SimpleRNN`

In [2]:
import numpy as np

import torch
from torch.autograd import Variable

In [3]:
rnn = torch.nn.RNN(2, 4, 1) # 2 features, 4 neurônios, 1 camada
inputs = Variable(torch.randn(1, 3, 2)) # 1 amostra, 3 sequências, 2 features
h0 = Variable(torch.zeros(1, 1, 4))
output, hn = rnn(inputs, h0)
rnn
print('output:',output)
print('hn:', hn)

output: Variable containing:
(0 ,.,.) = 
 -0.2472  0.5989 -0.7437 -0.6323
  0.5233 -0.3061 -0.6141  0.3323
  0.0621  0.3787 -0.8290 -0.6642
[torch.FloatTensor of size 1x3x4]

hn: Variable containing:
(0 ,.,.) = 
 -0.2472  0.5989 -0.7437 -0.6323
  0.5233 -0.3061 -0.6141  0.3323
  0.0621  0.3787 -0.8290 -0.6642
[torch.FloatTensor of size 1x3x4]



In [4]:
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               0.3243  0.4427
              -0.3876 -0.3635
               0.0783 -0.4950
               0.4004 -0.3370
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               0.3533 -0.0823  0.4193  0.3867
              -0.0183 -0.3023 -0.1329 -0.4688
               0.4040 -0.2718 -0.2243  0.1208
               0.1782 -0.3203  0.0297 -0.2013
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
              -0.3316
              -0.1611
              -0.4340
              -0.4542
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
               0.3947
               0.4707
              -0.4318
               0.1233
              [torch.FloatTensor of size 4])])

## Colocando os parâmetros

### Pesos e Bias da rede de entrada

In [29]:
w_ih = np.array([
    [ 1., 2.,  3., 4. ],
    [ 5,  6.,  7., 8]])
bias_ih = np.array(
    [ 0.1,  0.,  0.,  0.])

### Pesos e Bias da rede recorrente

In [30]:
w_hh = np.array([
    [ 1.,  0.,  0.,  0.],
    [ 0.,  1.,  0.,  0.],
    [ 0.,  0.,  1.,  0.],
    [ 0.,  0.,  0.,  1.]])
bias_hh = np.array(
    [ -0.,  -0.,  -0.,  -0.])

In [31]:
w_dict = {'weight_ih_l0': torch.FloatTensor(w_ih.T),
          'weight_hh_l0': torch.FloatTensor(w_hh.T),
          'bias_ih_l0':   torch.FloatTensor(bias_ih),
          'bias_hh_l0':   torch.FloatTensor(bias_hh)}

In [32]:
rnn.load_state_dict(w_dict)
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               1  5
               2  6
               3  7
               4  8
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               1  0  0  0
               0  1  0  0
               0  0  1  0
               0  0  0  1
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0.1000
               0.0000
               0.0000
               0.0000
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0
              -0
              -0
              -0
              [torch.FloatTensor of size 4])])

In [33]:
x_in = np.array([[[0.,0],[0,0],[0,0]],
                 [[0.,0],[0,0],[0,0]]])
x_in.shape

(2, 3, 2)

In [34]:
x = Variable(torch.FloatTensor(x_in)) # torch.randn(1, 3, 2)) # 1 amostra, 3 sequências, 2 features
x

Variable containing:
(0 ,.,.) = 
  0  0
  0  0
  0  0

(1 ,.,.) = 
  0  0
  0  0
  0  0
[torch.FloatTensor of size 2x3x2]

In [35]:
h0 = Variable(torch.zeros(1, 1, 4))
y,h1 = rnn(x,h0)
print('y:',y)
print('h1:',h1)

y: Variable containing:
(0 ,.,.) = 
  0.0997  0.0000  0.0000  0.0000
  0.0997  0.0000  0.0000  0.0000
  0.0997  0.0000  0.0000  0.0000

(1 ,.,.) = 
  0.1971  0.0000  0.0000  0.0000
  0.1971  0.0000  0.0000  0.0000
  0.1971  0.0000  0.0000  0.0000
[torch.FloatTensor of size 2x3x4]

h1: Variable containing:
(0 ,.,.) = 
  0.1971  0.0000  0.0000  0.0000
  0.1971  0.0000  0.0000  0.0000
  0.1971  0.0000  0.0000  0.0000
[torch.FloatTensor of size 1x3x4]



<iframe src="https://docs.google.com/forms/d/e/1FAIpQLScvU9jxvImSrQFy0DxV2vJwPGeFZiHquC5x91tdVrMxZJ-vHA/viewform?embedded=true" width="760" height="500" frameborder="0" marginheight="0" marginwidth="0">Loading...</iframe>
