<a href="https://colab.research.google.com/github/vladimiralencar/DeepLearning-LANA/blob/master/LSTM/LSTM03_Acuracia_100.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Aplicando o Método Time Step ao Mapeamento das Letras do Alfabeto

Para obter os benefícios em utilizar as LSTMs precisamos fornecer contexto na forma de etapas de tempo (time steps), em vez de recursos em janelas (windows), como outros tipos de rede. Vamos considerar nosso primeiro exemplo (LSTM01) e simplesmente alterar o comprimento da sequência de 1 para 3. A diferença é que o reshape dos dados de entrada recebe a sequência de time steps de um atributo, ao invés do método window que recebe um único time step de diversos atributos.

In [1]:
# Imports
import numpy
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from keras.utils import np_utils

# Random seed
numpy.random.seed(7)

# Dataset
alphabet = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"

# Cria mapeamento de caracteres para números inteiros (0-25) e o reverso
char_to_int = dict((c, i) for i, c in enumerate(alphabet))
int_to_char = dict((i, c) for i, c in enumerate(alphabet))

# Prepara o conjunto de dados de pares de entrada/saída codificados como números inteiros
seq_length = 3
dataX = []
dataY = []

for i in range(0, len(alphabet) - seq_length, 1):
    seq_in = alphabet[i:i + seq_length]
    seq_out = alphabet[i + seq_length]
    dataX.append([char_to_int[char] for char in seq_in])
    dataY.append(char_to_int[seq_out])
    print (seq_in, '->', seq_out)
    
# Reshape de X para [samples, time steps, features] - Time Step = Seq_length = 3
X = numpy.reshape(dataX, (len(dataX), seq_length, 1))

# Normalização
X = X / float(len(alphabet))

# One-Hot Encoding para as variáveis de saída
y = np_utils.to_categorical(dataY)

# Fit do Modelo
model = Sequential()
model.add(LSTM(32, input_shape=(X.shape[1], X.shape[2])))
model.add(Dense(y.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X, y, epochs=500, batch_size=1, verbose=2)

Using TensorFlow backend.


ABC -> D
BCD -> E
CDE -> F
DEF -> G
EFG -> H
FGH -> I
GHI -> J
HIJ -> K
IJK -> L
JKL -> M
KLM -> N
LMN -> O
MNO -> P
NOP -> Q
OPQ -> R
PQR -> S
QRS -> T
RST -> U
STU -> V
TUV -> W
UVW -> X
VWX -> Y
WXY -> Z
Epoch 1/500
 - 4s - loss: 3.2698 - acc: 0.0000e+00
Epoch 2/500
 - 1s - loss: 3.2547 - acc: 0.0000e+00
Epoch 3/500
 - 1s - loss: 3.2465 - acc: 0.0000e+00
Epoch 4/500
 - 1s - loss: 3.2391 - acc: 0.0435
Epoch 5/500
 - 0s - loss: 3.2311 - acc: 0.0435
Epoch 6/500
 - 0s - loss: 3.2228 - acc: 0.0435
Epoch 7/500
 - 0s - loss: 3.2139 - acc: 0.0435
Epoch 8/500
 - 0s - loss: 3.2048 - acc: 0.0435
Epoch 9/500
 - 0s - loss: 3.1935 - acc: 0.0435
Epoch 10/500
 - 0s - loss: 3.1817 - acc: 0.0435
Epoch 11/500
 - 0s - loss: 3.1696 - acc: 0.0435
Epoch 12/500
 - 1s - loss: 3.1547 - acc: 0.0435
Epoch 13/500
 - 1s - loss: 3.1390 - acc: 0.0435
Epoch 14/500
 - 1s - loss: 3.1231 - acc: 0.0435
Epoch 15/500
 - 1s - loss: 3.1054 - acc: 0.0435
Epoch 16/500
 - 1s - loss: 3.0877 - acc: 0.0000e+00
Epoch 17/500
 - 1s

<keras.callbacks.History at 0x7fe3b21cd198>

In [2]:
# Performance do Modelo
scores = model.evaluate(X, y, verbose=0)
print("\nAcurácia do Modelo: %.2f%%" % (scores[1]*100))


Acurácia do Modelo: 100.00%


In [3]:
print(X.shape)

(23, 3, 1)


In [4]:
X[0]

array([[0.        ],
       [0.03846154],
       [0.07692308]])

In [5]:
y[0]

array([0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0.], dtype=float32)

In [6]:
# Previsões
for pattern in dataX:
    x = numpy.reshape(pattern, (1, len(pattern), 1))
    x = x / float(len(alphabet))
    prediction = model.predict(x, verbose=0)
    index = numpy.argmax(prediction)
    result = int_to_char[index]
    seq_in = [int_to_char[value] for value in pattern]
    print (seq_in, "->", result)

['A', 'B', 'C'] -> D
['B', 'C', 'D'] -> E
['C', 'D', 'E'] -> F
['D', 'E', 'F'] -> G
['E', 'F', 'G'] -> H
['F', 'G', 'H'] -> I
['G', 'H', 'I'] -> J
['H', 'I', 'J'] -> K
['I', 'J', 'K'] -> L
['J', 'K', 'L'] -> M
['K', 'L', 'M'] -> N
['L', 'M', 'N'] -> O
['M', 'N', 'O'] -> P
['N', 'O', 'P'] -> Q
['O', 'P', 'Q'] -> R
['P', 'Q', 'R'] -> S
['Q', 'R', 'S'] -> T
['R', 'S', 'T'] -> U
['S', 'T', 'U'] -> V
['T', 'U', 'V'] -> W
['U', 'V', 'W'] -> X
['V', 'W', 'X'] -> Y
['W', 'X', 'Y'] -> Z


Podemos ver que o modelo aprende perfeitamente o problema como evidenciado pela avaliação do modelo e as previsões em teste. Especificamente, aprendeu a prever a próxima letra de uma sequência de três letras no alfabeto. As redes LSTM são stateful. Elas devem ser capazes de aprender toda a sequência do alfabeto, mas por padrão, a implementação do Keras redefine o estado da rede após cada lote de treinamento.