#LSTM

**Objetivo**: Criação de um modelo utilizando arquitetura LSTM

Para a criação de um modelo com arquitetura LSTM (Long short term memory) iremos utilizar o pacote tensorflow.

1. Carregamento dos dados

Batch: conjunto de observações que será passada por vez na rede neural, diferente dos modelos usuais de machine learning para redes neurais passamos um pequeno conjunto de dados a cada iteração.

In [None]:
import tensorflow as tf
import tensorflow_datasets as tfds

import numpy as np
import matplotlib.pyplot as plt

In [None]:
dataset = tfds.load('imdb_reviews', as_supervised=True)

train_dataset, test_dataset = dataset['train'], dataset['test']

batch_size = 128
train_dataset = train_dataset.shuffle(15)
train_dataset = train_dataset.batch(batch_size)
test_dataset = test_dataset.batch(batch_size)

2. Camada encoder
A primeira camada da nossa rede neural será a camada de enconder, essa camada irá converter as palavras para indexes. Para isso usaremos a função TextVectorization.

```python
import tensorflow as tf
encoder = tf.keras.layers.TextVectorization()
encoder.adapt(train_dataset.map(lambda text, _: text))
```

Com essa função iremos criar um vetor codificado das palavras do texto. O parâmetro max_tokens controla o tamanho do vocabulário na vetorização. A função adapt irá adequar o vocabulário do texto.

Exercício:
1. Crie a camada encoder
2. Veja como fica um exemplo de texto na camada encoder (use encoder(texto).numpy())

3. Criação do modelo

Iremos criar uma arquitetura sequencial que seguirá a seguinte ordem:

1. Encoder
2. Camada de embedding
3. Camada bidirecional
4. Camada Densa com ativação relu
5. Camada Densa com ativação linear


Para a construção do modelo iremos usar
```python
model = tf.keras.Sequential
model.add(camada)
```

Onde em camada iremos substituir pelas camadas desejadas, por exemplo na camada de encoder usamos
```python
model.add(encoder)
```

Para a criação da camada de embedding usaremos a função tf.keras.layers.Embedding, esta função possui dois parâmetros importantes
1. Input dimension - dimensão da entrada dos dados
2. Output dimension - dimensão da saída dos dados
Outro parâmetro importante é mask_zero que deve ser configurado como True caso as frases sejam de tamanho diferente.

Exemplo de uso:
```python
tf.keras.layers.Embedding(10000, 32, mask_zero=True)
```

Neste exemplo o input é de dimensão 10000 e o output de dimensão 32;

Para a criação da camada BiLSTM usaremos a função tf.keras.layers.Bidirectional e a função tf.keras.layers.LSTM. Iremos configurar apenas a camada LSTM, nela temos que colocar o tamanho do output e um dos seus parâmetros é return_sequences que deve ser configurado como True caso desejamos o output de toda a frase e não apenas o último (default é falso).

```python
tf.keras.layers.Bidirectional(
        tf.keras.layers.LSTM(32,  return_sequences=True))
```
Ira criar a camada LSTM com saída 32 e irá retorna toda a sequencia.

Por último a camada densa que é a camada mais simples, nela iremos passar o tamanho do output e a função de ativação; exemplos de função de ativação:

* linear
* softmax (sigmoid)
* relu (max(0,x))

```python
tf.keras.layers.Dense(64, activation='relu')
```

Exercício construa o modelo com a seguinte arquitetura:
1. Encoder
2. Camada de embedding com output 64 e mask_zero=True
3. Camada BiLSTM, com output 64
4. Camada Densa com output 64 e ativação relu
5. Camada Densa com output 1

4. Treino

Para resumir a arquitetura usamos a função summary
```python
model.summary()
```

Após montar a arquitetura precisamos definir a função de perda, o otimizador e uma métrica de acompanhamento. Para isso usamos a função compile no nosso exemplo usaremos a função de perda de Crossentropy Binaria e o otimizador Adam como no exemplo.

```python
model.compile(
    loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
    optimizer=tf.keras.optimizers.Adam(),
    metrics=['accuracy']
)
```
 E para ajustar o modelo iremos usar .fit passando o dado de treino, o número de epochs (quantas vezes iremos passar o dado para a rede) e o banco de validação.

```python
model.fit(
    train_dataset,  
    epochs=5,
    validation_data=test_dataset,
)
```

Exercício:
1. Sumarize o modelo
2. Compile o modelo como no exemplo
3. Ajuste o modelo. Obs.: ao ajustar o modelo atribua o ajuste a um objeto.