# Redes Neurais Recorrentes

As redes neurais recorrentes são as redes que possuem uma realimentação dos neurônios de saída para a entrada da rede.
A figura a seguir mostra uma rede recorrente simples contendo:
- 2 entradas
- 4 neurônios de saídas
- 1 bias

<img src='../figures/RNN_2_3_4_template.png',width=300pt></img>

Se configurarmos esta rede para processar 3 instantes de tempo (de duas entradas cada), teremos a 
rede equivalente conforme figura a seguir:

<img src='../figures/RNN_2_3_4.png',width=500pt></img>

Note entretanto que os parâmetros da rede são os mesmos para cada instante de tempo.
O número total de parâmetros que precisam ser treinados nesta rede são:
- 2 x 4 = parâmetros da rede de entrada (2 entradas x 4 saídas)
- 4 = bias da rede de entrada (um parâmetro para cada saída)
- 4 x 4 = parâmetros da rede recorrente (4 entradas x 4 saídas)

Este notebook é uma demonstração da construção desta rede utilizando valores numérico para poder acompanhar
o processamento da rede recorrente.

## Importação

Iremos exercitar o modelo recorrente mais simples do Keras: `SimpleRNN`

In [1]:
import numpy as np

import torch
from torch.autograd import Variable

In [80]:
rnn = torch.nn.RNN(2, 4, 1,nonlinearity='relu') # 2 features, 4 neurônios, 1 camada
inputs = Variable(torch.randn(1, 3, 2)) # 1 amostra, 3 sequências, 2 features
h0 = Variable(torch.zeros(1, 1, 4))
output, hn = rnn(inputs, h0)
rnn
print('output:',output)
print('hn:', hn)

output: Variable containing:
(0 ,.,.) = 
  0.5140  0.0766  0.2477  0.0000
  0.9564  0.4699  0.4704  0.0000
  0.3015  0.0000  0.2087  0.0000
[torch.FloatTensor of size 1x3x4]

hn: Variable containing:
(0 ,.,.) = 
  0.5140  0.0766  0.2477  0.0000
  0.9564  0.4699  0.4704  0.0000
  0.3015  0.0000  0.2087  0.0000
[torch.FloatTensor of size 1x3x4]



In [81]:
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               0.2026 -0.2287
               0.2115 -0.2014
              -0.2792 -0.1390
               0.2774 -0.1664
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               0.4788 -0.2945 -0.2955  0.1271
               0.4515  0.3638  0.2118  0.0962
              -0.4289  0.3415  0.4524 -0.4103
              -0.1688 -0.0343 -0.1805 -0.1065
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0.4567
              -0.0165
               0.1980
               0.0669
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
               0.4086
               0.4443
              -0.2462
              -0.2515
              [torch.FloatTensor of size 4])])

## Colocando os parâmetros

### Pesos e Bias da rede de entrada

In [112]:
w_ih = np.array([
    [ 1., 2.,  3., 4. ],
    [ 5,  6.,  7., 8]])
bias_ih = np.array(
    [ 0.,  0.,  0.,  0.])

### Pesos e Bias da rede recorrente

In [119]:
w_hh = np.array([
    [ 10.,  0.,  0.,  0.],
    [ 0.,  1.,  0.,  0.],
    [ 0.,  0.,  1.,  0.],
    [ 0.,  0.,  0.,  1.]])
bias_hh = np.array(
    [ -0.,  -0.,  -0.,  -0.])

In [120]:
w_dict = {'weight_ih_l0': torch.FloatTensor(w_ih.T),
          'weight_hh_l0': torch.FloatTensor(w_hh.T),
          'bias_ih_l0':   torch.FloatTensor(bias_ih),
          'bias_hh_l0':   torch.FloatTensor(bias_hh)}

In [121]:
rnn.load_state_dict(w_dict)
rnn.state_dict()

OrderedDict([('weight_ih_l0', 
               1  5
               2  6
               3  7
               4  8
              [torch.FloatTensor of size 4x2]), ('weight_hh_l0', 
               10   0   0   0
                0   1   0   0
                0   0   1   0
                0   0   0   1
              [torch.FloatTensor of size 4x4]), ('bias_ih_l0', 
               0
               0
               0
               0
              [torch.FloatTensor of size 4]), ('bias_hh_l0', 
              -0
              -0
              -0
              -0
              [torch.FloatTensor of size 4])])

In [129]:
x_in = np.array([[[1.,1],[0,0],[0,0]],
                 [[1.,1],[0,0],[0,0]]])
x_in.shape

(2, 3, 2)

In [130]:
x = Variable(torch.FloatTensor(x_in)) # torch.randn(2, 3, 2)) # 2 amostras, 3 sequências, 2 features
x

Variable containing:
(0 ,.,.) = 
  1  1
  0  0
  0  0

(1 ,.,.) = 
  1  1
  0  0
  0  0
[torch.FloatTensor of size 2x3x2]

In [131]:
h0 = Variable(torch.zeros(1, 1, 4))
y,h1 = rnn(x,h0)
print('y:',y)
print('h1:',h1)

y: Variable containing:
(0 ,.,.) = 
   6   8  10  12
   0   0   0   0
   0   0   0   0

(1 ,.,.) = 
  66  16  20  24
   0   0   0   0
   0   0   0   0
[torch.FloatTensor of size 2x3x4]

h1: Variable containing:
(0 ,.,.) = 
  66  16  20  24
   0   0   0   0
   0   0   0   0
[torch.FloatTensor of size 1x3x4]



In [125]:
h0

Variable containing:
(0 ,.,.) = 
  0  0  0  0
[torch.FloatTensor of size 1x1x4]