# LSTM
기존의 RNN이 데이터의 연속성을 기억할 수 없다는 단점을 보완하여 장/단기 기억을 가능하게 설계한 신경망의 구조를 말합니다. 주로 시계열 처리나, 자연어 처리에 사용됩니다.

## 0. 최소 필요 라이브러리

In [1]:
from numpy import array 
from keras.models import Sequential
from keras.layers import Dense, LSTM
 

## 1. 데이터

- 3 개의 값을 통해 다음 값을 유추해내는 것을 목표로 데이터를 구성했습니다.

In [2]:
x = array([[1,2,3], [2,3,4], [3,4,5], [4,5,6], [5,6,7]])
y = array([4,5,6,7,8])
 
print('x shape : ', x.shape)
print('y shape : ', y.shape)

x shape :  (5, 3)
y shape :  (5,)


- LSTM 은 그냥 데이터 값 외에 연속성에 대한 관계도 저장되어야 하기 때문에 차원이 하나 더 필요합니다.

In [3]:
print('-------x reshape-----------')
x = x.reshape((x.shape[0], x.shape[1], 1)) # (4,3,1) reshape 전체 곱 수 같아야 4*3=4*3*1
print('x shape : ', x.shape)
print(x)

-------x reshape-----------
x shape :  (5, 3, 1)
[[[1]
  [2]
  [3]]

 [[2]
  [3]
  [4]]

 [[3]
  [4]
  [5]]

 [[4]
  [5]
  [6]]

 [[5]
  [6]
  [7]]]


## 2. 모델 구성

In [4]:
model = Sequential()
# 들어온 데이터보다 많은 레이어를 잡아줘야 값이 잘 나오는 것 같음.
model.add(LSTM(10, activation = 'relu', input_shape=(x.shape[1],x.shape[2])))  # timestep, feature
# 예전 Tensorflow 에서는 LSTM 에서 연결되게 작업을 해주는게 있었으나 이제 그냥 연결 됨.
model.add(Dense(1))

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
lstm (LSTM)                  (None, 10)                480       
_________________________________________________________________
dense (Dense)                (None, 1)                 11        
Total params: 491
Trainable params: 491
Non-trainable params: 0
_________________________________________________________________


In [5]:
model.compile(optimizer='adam', loss='mse')

## 3. 모델 학습

In [11]:
model.fit(x, y, epochs=400, batch_size=1)

Epoch 1/400
Epoch 2/400
Epoch 3/400
Epoch 4/400
Epoch 5/400
Epoch 6/400
Epoch 7/400
Epoch 8/400
Epoch 9/400
Epoch 10/400
Epoch 11/400
Epoch 12/400
Epoch 13/400
Epoch 14/400
Epoch 15/400
Epoch 16/400
Epoch 17/400
Epoch 18/400
Epoch 19/400
Epoch 20/400
Epoch 21/400
Epoch 22/400
Epoch 23/400
Epoch 24/400
Epoch 25/400
Epoch 26/400
Epoch 27/400
Epoch 28/400
Epoch 29/400
Epoch 30/400
Epoch 31/400
Epoch 32/400
Epoch 33/400
Epoch 34/400
Epoch 35/400
Epoch 36/400
Epoch 37/400
Epoch 38/400
Epoch 39/400
Epoch 40/400
Epoch 41/400
Epoch 42/400
Epoch 43/400
Epoch 44/400
Epoch 45/400
Epoch 46/400
Epoch 47/400
Epoch 48/400
Epoch 49/400
Epoch 50/400
Epoch 51/400
Epoch 52/400
Epoch 53/400
Epoch 54/400
Epoch 55/400
Epoch 56/400
Epoch 57/400
Epoch 58/400
Epoch 59/400
Epoch 60/400
Epoch 61/400
Epoch 62/400
Epoch 63/400
Epoch 64/400
Epoch 65/400
Epoch 66/400
Epoch 67/400
Epoch 68/400
Epoch 69/400
Epoch 70/400
Epoch 71/400
Epoch 72/400
Epoch 73/400
Epoch 74/400
Epoch 75/400
Epoch 76/400
Epoch 77/400
Epoch 78

<keras.callbacks.History at 0x7ff20b0280d0>

## 4. 예측

In [12]:
x_input = array([6,7,8])
x_input = x_input.reshape((1,3,1))

yhat = model.predict(x_input)
print(yhat) # 예상 값 9

[[8.821246]]


## 5. 모델 평가
R2score 로 평가해준다. 1에 가까울 수록 좋은 모델이다.

In [13]:
from sklearn.metrics import explained_variance_score, mean_squared_error, mean_absolute_error, r2_score
from sklearn.preprocessing import MinMaxScaler
from sklearn.linear_model import LinearRegression
def PrintRegScore(y_true, y_pred):
    print('explained_variance_score: {}'.format(explained_variance_score(y_true, y_pred)))
    print('mean_squared_errors: {}'.format(mean_squared_error(y_true, y_pred)))
    print('r2_score: {}'.format(r2_score(y_true, y_pred)))

# 예측용 데이터
y_true = [8,9,12,14]
x2 = array([[5,6,7], [6,7,8], [9,10,11], [11,12,13]])
x_scaled = x2.reshape((x2.shape[0], x2.shape[1], 1))
y_pred = model.predict(x_scaled)
PrintRegScore(y_true, y_pred)

explained_variance_score: 0.949625380330732
mean_squared_errors: 0.6611579100137988
r2_score: 0.8837524553821893


In [14]:
y_true

[8, 9, 12, 14]

In [15]:
y_pred

array([[ 7.9380627],
       [ 8.821246 ],
       [11.189388 ],
       [12.602949 ]], dtype=float32)