# Videoaula: Cases com redes neurais recorrentes

**Redes Neurais Artificiais Recorrentes no Processamento de Linguagem Natural**

> A persistência destes modelos é uma de suas maiores vantagens.
> 
> Neste modelo ocorrem loops transitando a informação entre camadas, propagando pela rede. Nos modelos tradicionais não se armazena informação
> 
> As RNNs são estruturadas de modo que possuam um loop no qual a informação é passada de uma camada para a outra, permitindo assim, que se propague através da rede.
> 
> Aplicações: Reconhecimento de padrões em textos, traduções, legendas de imagens, reconhecimento de voz.
> 
> Este recurso permite automatizar processos pelo uso da simulação da linguagem humana, nos setores industrial, educacional e comercial.

**Modelo Transformers**
> Um modelo de rede neural que aprende pelo contexto, significado e com as relações em dados sequenciais.
> 
> Usa técnicas matemáticas de atenção ou autodetecção, para detectar a dependência entre os dados, mesmo que excessivamente distantes.
> 
> Considerado um modelo novo e de grande força e efetividade já criados, surge em um artigo de 2017 oferecido pelo Google.
> 
> Transformers são capazes de traduzir um texto, uma fala em tempo real, o que, se aplicado na tradução de idiomas, permite conversas entre pessoas de outras nações.
> 
> O DNA é uma aplicação importante, com os transformers facilitando a compreensão das cadeias de genes, permitindo desenvolvimento de novos medicamentos mais facilmente.

**Sequence to Sequence**
> Usa uma sequência como entrada, passa a sequência para ser representada em outro domínio.
> 
> Pega uma sequência de probabilidades de saida e maximiza a probabilidade de certa sequência anterior como sua entrada.
> 
> Aplicações
>> Software capaz de realizar perguntas e respostas automaticamente.
>>
>> Treinamento de chatbots.
>>
>> Criação de bases de conhecimento.
>>
>> Interpretação de textos.
>>
>> Tradução neural de máquinas.

**Encoders e Decoders**
> Forma de aumentar a capacidade das redes neurais de aprender representações.
> 
> Com base em uma rede de codificadores as entradas são mapeadas em estado bruto para representações de recursos.
> 
> Em seguida, a rede de descodificadores se apropria desta representação de recursos como sendo sua entrada.
> 
> Esta entrada é processada, uma decisão é tomada e produz uma saída.
> 
> Sua vantagem é poder usar o codificador e descodificador de forma independente. Mas usar em conjunto melhora seu desempenho.

In [None]:
# Importamos as bibliotecas necessárias

from tf_keras.models import Sequential

from tf_keras.layers import Dense, Dropout, LSTM

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import tensorflow_datasets as tfds

import tensorflow as tf

In [None]:
dataset, info = tfds.load('imdb_reviews/subwords8k',

                          with_info=True,

                          as_supervised=True)

train_dataset, test_dataset = dataset['train'], dataset['test']

In [None]:
encoder = info.features['text'].encoder

test_string = 'Esta é uma frase de teste'4

encoded_string = encoder.encode(test_string)

print('String codificada is {}'.format(encoded_string))

original_string = encoder.decode(encoded_string)

print('String original: "{}"'.format(original_string))

In [None]:
BUFFER_SIZE = 10

BATCH_SIZE = 64

train_dataset = train_dataset.shuffle(BUFFER_SIZE)

train_dataset = train_dataset.padded_batch(BATCH_SIZE)

test_dataset = test_dataset.padded_batch(BATCH_SIZE)

In [None]:
model = tf.keras.Sequential([

    tf.keras.layers.Embedding(encoder.vocab_size, 16),

    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(16)),

    tf.keras.layers.Dense(16, activation='relu'),

    tf.keras.layers.Dense(1)

])

model.summary()

model.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),

              optimizer=tf.keras.optimizers.Adam(),

              metrics=['accuracy'])

train_history1 = model.fit(train_dataset, epochs=20,

                           validation_data=test_dataset,

                           validation_steps=100)

In [None]:
def plot_training(history, lw = 3):

    plt.figure(figsize=(10,10))
    
    plt.subplot(2,1,1)
    
    plt.plot(history.history['accuracy'], label = 'training', marker = '*', linewidth = lw)
    
    plt.plot(history.history['val_accuracy'], label = 'validation', marker = 'o', linewidth = lw)
    
    plt.title('Accuracy')
    
    plt.xlabel('Epochs')
    
    plt.ylabel('Accuracy')
    
    plt.grid(True)
    
    plt.legend(fontsize = 'x-large')
    
    plt.subplot(2,1,2)
    
    plt.plot(history.history['loss'], label = 'training', marker = '*', linewidth = lw)
    
    plt.plot(history.history['val_loss'], label = 'validation', marker = 'o', linewidth = lw)
    
    plt.title('Loss')
    
    plt.xlabel('Epochs')
    
    plt.ylabel('Loss')
    
    plt.legend(fontsize = 'x-large')
    
    plt.grid(True)
    
    plt.show()

In [None]:
test_loss, test_acc = model.evaluate(test_dataset)

print('Test Loss: {}'.format(test_loss))

print('Test Accuracy: {}'.format(test_acc))