### Rekurentne neuronske mreze

<img src='RNN.png'>
<p style='text-align: right; color: gray; font-size: 10px;'> Slika je pozajmljena iz prezentacije Recurrent Neural Networks Momcila Vasiljevica, MDCS </p>

#### Jedan prolaz unapred kroz rekurentnu neuronsku mrezu.

In [44]:
import numpy as np

In [45]:
# velicina ulaza
input_size = 32 

# velicina izlaza
output_size = 64 

# duzina sekvence koja se obradjuje
timestamps = 100

In [46]:
# mreza obradjuje sekvencu po sekvencu
# izmedju dvedju razlicitih sekvenci, stanje mreze se resetuje
inputs = np.random.random((timestamps, input_size))

# pocetno stanje mreze 
state_t = np.zeros(output_size)

In [47]:
# matrice parametrizacija
W = np.random.random((output_size, input_size))
U = np.random.random((output_size, output_size))
b = np.random.random(output_size)

In [48]:
successive_outputs = []

# za svaki ulaz u sekvenci
for input_t in inputs:
    
    # kombinuje se tekuci ulaz i trenutno stanje mreze da bi se dobio izlaz mreze
    output_t = np.tanh(np.dot(W, input_t) + np.dot(U, state_t) + b)
    
    # tekuci izlaz postaje stanje mreze za narednu iteraciju
    state_t = output_t
    
    successive_outputs.append(output_t)

In [49]:
len(successive_outputs)

100

In [50]:
np.array(successive_outputs).shape

(100, 64)

#### Odgovarajuca Keras podrska. 

Rad sa rekurentnim neuronskim mrezama je moguc kroz **SimpleRNN** sloj. Ulaz u mrezu je oblika **(batch_size, timestamps, input_size)** gde batch_size predstavlja broj sekvenci koje mreza ocekuje na ulazu, a izlaz moze da bude ili u formi **(batch_size, timestamps, output_size)** ili u formi **(batch_size, output_size)**. Ovo ponasanje se kontrolise kroz **return_sequence** argument sloja i u prvom slucaju naglasava da treba vratiti izlaz za svaki ulaz svake sekvence, dok u drugom slucaju naglasava da treba vratiti izlaz samo poslednjeg ulaza sekvence.   

In [84]:
from keras.models import Sequential
from keras.layers import SimpleRNN

In [85]:
# velicina ulaza
input_size = 32 

# velicina izlaza
output_size = 64 

# duzina sekvence koja se obradjuje
timestamps = 100

# broj sekvenci sa kojima se radi
batch_size = 32

In [86]:
# ulaz u mrezu je oblika (batch_size, timestamps, input_size)
inputs = np.random.random((batch_size, timestamps, input_size))

In [114]:
# varijanta 1: vracaju se izlazi svih ulaza svih sekvenci
model = Sequential()
model.add(SimpleRNN(batch_size, input_shape=(timestamps, input_size), return_sequences=True))

In [115]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
simple_rnn_31 (SimpleRNN)    (None, 100, 32)           2080      
Total params: 2,080
Trainable params: 2,080
Non-trainable params: 0
_________________________________________________________________


In [116]:
# varijanta 2: vraca se izlaz samo poslednjeg ulaza pojedinacnih sekvenci
model = Sequential()
model.add(SimpleRNN(batch_size, input_shape = (timestamps, input_size)))

In [117]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
simple_rnn_32 (SimpleRNN)    (None, 32)                2080      
Total params: 2,080
Trainable params: 2,080
Non-trainable params: 0
_________________________________________________________________


Keras biblioteka nudi mogucnost koriscenja i nesto kompleksnijih rekurentnih celija kao sto su LSTM celije i GRU celije. Njihovo koriscenje ce biti simulirano u narednim primerima. 

** Koriscena literatura: **
* Deep Learning with Python, Francois Chollet