# Redes Neurais Recorrentes

As redes neurais recorrentes são as redes que possuem uma realimentação dos neurônios de saída para a entrada da rede.
A figura a seguir mostra uma rede recorrente simples contendo:
- 2 entradas
- 4 neurônios de saídas
- 1 bias

<img src='../figures/RNN_2_3_4_template.png',width=300pt></img>

Se configurarmos esta rede para processar 3 instantes de tempo (de duas entradas cada), teremos a 
rede equivalente conforme figura a seguir:

<img src='../figures/RNN_2_3_4.png',width=500pt></img>

Note entretanto que os parâmetros da rede são os mesmos para cada instante de tempo.
O número total de parâmetros que precisam ser treinados nesta rede são:
- 2 x 4 = parâmetros da rede de entrada (2 entradas x 4 saídas)
- 4 = bias da rede de entrada (um parâmetro para cada saída)
- 4 x 4 = parâmetros da rede recorrente (4 entradas x 4 saídas)

Este notebook é uma demonstração da construção desta rede utilizando valores numérico para poder acompanhar
o processamento da rede recorrente.

## Importação

Iremos exercitar o modelo recorrente mais simples do Keras: `SimpleRNN`

In [36]:
import numpy as np

import torch
from torch.autograd import Variable

In [76]:
rnn = torch.nn.RNN(2, 4, 1, nonlinearity='relu') # 2 features, 4 neurônios, 1 camada
inputs = Variable(torch.randn(3, 1, 2)) # 1 amostra, 3 sequências, 2 features
h0 = Variable(torch.zeros(1, 1, 4))
output, hn = rnn(inputs, h0)
rnn
print('output:',output)
print('hn:', hn)

output: Variable containing:
(0 ,.,.) = 
  0.0000  0.3548  0.0000  0.0000

(1 ,.,.) = 
  0.7856  0.7095  0.0000  0.0000

(2 ,.,.) = 
  0.0000  0.0540  0.0000  0.0199
[torch.FloatTensor of size 3x1x4]

hn: Variable containing:
(0 ,.,.) = 
1.00000e-02 *
   0.0000  5.3955  0.0000  1.9920
[torch.FloatTensor of size 1x1x4]



In [77]:
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
              -0.4702 -0.4107
              -0.1610 -0.3270
               0.0620  0.3894
               0.3425 -0.0096
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               0.3385 -0.1965 -0.0696  0.1046
              -0.2797 -0.2349  0.3359  0.2115
              -0.0562  0.2556  0.4885 -0.2631
               0.4985 -0.1545 -0.4274  0.1256
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0.0301
               0.2523
              -0.4757
              -0.2925
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0.4271
              -0.0150
              -0.0805
              -0.1339
              [torch.FloatTensor of size 4])])

## Colocando os parâmetros

### Pesos e Bias da rede de entrada

In [97]:
w_ih = np.array([
    [ 1., 2.,  3., 4. ],
    [ 5,  6.,  7., 8]])
bias_ih = np.array(
    [ 0.1,  0.2,  0.3,  0.4])

### Pesos e Bias da rede recorrente

In [98]:
w_hh = np.array([
    [ 1.,  0.,  0.,  0.],
    [ 0.,  1.,  0.,  0.],
    [ 0.,  0.,  1.,  0.],
    [ 0.,  0.,  0.,  1.]])
bias_hh = np.array(
    [ -0.,  -0.,  -0.,  -0.])

In [99]:
w_dict = {'weight_ih_l0': torch.FloatTensor(w_ih.T),
          'weight_hh_l0': torch.FloatTensor(w_hh.T),
          'bias_ih_l0':   torch.FloatTensor(bias_ih),
          'bias_hh_l0':   torch.FloatTensor(bias_hh)}

In [100]:
rnn.load_state_dict(w_dict)
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               1  5
               2  6
               3  7
               4  8
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               1  0  0  0
               0  1  0  0
               0  0  1  0
               0  0  0  1
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0.1000
               0.2000
               0.3000
               0.4000
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0
              -0
              -0
              -0
              [torch.FloatTensor of size 4])])

In [101]:
x_in = np.array([[[1.,1],[0,0],[0,0]],
                 [[1.,1],[0,0],[0,0]]])
x_in.shape

(2, 3, 2)

In [102]:
x_in = np.array([[[1.,0]],
                 [[0, 0]],
                 [[0, 0]]])
x_in.shape

(3, 1, 2)

In [103]:
x = Variable(torch.FloatTensor(x_in)) # torch.randn(2, 3, 2)) # 2 amostras, 3 sequências, 2 features
x

Variable containing:
(0 ,.,.) = 
  1  0

(1 ,.,.) = 
  0  0

(2 ,.,.) = 
  0  0
[torch.FloatTensor of size 3x1x2]

In [104]:
h0 = Variable(torch.zeros(1, 1, 4))
y,h1 = rnn(x,h0)
print('y:',y)
print('h1:',h1)

y: Variable containing:
(0 ,.,.) = 
  1.1000  2.2000  3.3000  4.4000

(1 ,.,.) = 
  1.2000  2.4000  3.6000  4.8000

(2 ,.,.) = 
  1.3000  2.6000  3.9000  5.2000
[torch.FloatTensor of size 3x1x4]

h1: Variable containing:
(0 ,.,.) = 
  1.3000  2.6000  3.9000  5.2000
[torch.FloatTensor of size 1x1x4]



In [105]:
h0

Variable containing:
(0 ,.,.) = 
  0  0  0  0
[torch.FloatTensor of size 1x1x4]

In [61]:
rnn = torch.nn.RNN(9, 20, 2)
input = Variable(torch.randn(5, 4, 9))
h0 = Variable(torch.randn(2, 4, 20))
output, hn = rnn(input, None)

In [62]:
output.data.shape

torch.Size([5, 4, 20])

In [65]:
hn.data.shape

torch.Size([2, 4, 20])