# Sequence Models & How to use them

**학습목표**
1. RNN, LSTM, GRU의 구조를 이해한다.
2. 위 모델을 사용하기 위한 데이터 구조를 이해한다.
3. 위 모든 내용을 코딩할 수 있다.

-----------------
* Thanks to : 한기영 대표님 @ Data Insight

## 1.환경 및 데이터 준비

### Import Packages

In [None]:
#라이브러리들을 불러오자.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.utils import plot_model
from sklearn.metrics import mean_squared_error

### Data Loading

In [None]:
data = pd.read_csv('https://raw.githubusercontent.com/DA4BAM/dataset/master/temperature.csv')
data.head(10)

In [None]:
data.tail()

## 2.데이터 이해

### 탐색하기

온도의 흐름(trend)을 살펴봅시다.

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(data.AvgTemp)
plt.show()

##3.데이터 준비

### 불필요한 데이터 정리 

In [None]:
data = data.drop(['year','week'], axis=1)
data.head()

## 4.Sequence 데이터 구조로 만들기

내일의 기온을 예측 하려면?

In [None]:
data = data.values

In [None]:
# 여기에 의미있는 기간(timestep을 지정해 봅시다.)
timestep= 21

# x의 데이터 구조를 3차원으로 만들어줘야 합니다.
x = np.array([data[i : i + timestep] for i in range( len(data) - timestep ) ])
y = np.array([data[i + timestep, -1] for i in range( len(data) - timestep ) ])

x_train, x_val, x_test = x[:160], x[160:200], x[200:]
y_train, y_val, y_test = y[:160], y[160:200], y[200:]

print(x.shape, y.shape)
print('-------------------------------')
print(x_train.shape, y_train.shape)
print(x_val.shape, y_val.shape)
print(x_test.shape, y_test.shape)
print('-------------------------------')
print('[ # , timestep, feature수 ] <-- 데이터의 구조 : ')

데이터의 구조 : [n, timestep, feature수]

## 5.RNN 모델링

### [실습]무작정 RNN 모델링 수행해보기

In [None]:
# 1.세션클리어
keras.backend.clear_session()

# 2.Sequential 모델 선언하기
model = keras.models.Sequential()

# 3. 레이어 쌓기 SimpleRNN의 default activation은 'tanh' 입니다.
# input_shape = [timestep, feature수]
# simplernn의 히든스테이트 노드는 16개로 작성해 봅시다.

model.add(keras.layers.SimpleRNN(     , input_shape = [     ,     ] ) )
model.add(   회귀를 위한 아웃풋 레이어.   )

# compile
model.compile(      )

# 학습
history = model.fit( x_train , y_train  , epochs = 30 , validation_data=(x_val, y_val))

In [None]:
# 학습 곡선을 그려봅시다.
plt.plot(history.history["loss"], label = 'train')
plt.plot(history.history["val_loss"], label = 'valid')
plt.legend()
plt.show()

In [None]:
from sklearn.metrics import mean_squared_error as MSE

In [None]:
# Q1. 테스트 셋에서의 RMSE를 출력하여라.



In [None]:
model.summary()

In [None]:
plot_model(model, show_shapes=True)

### More Exercises

1. 적절한 인풋 레이어를 구성할 것
2. 첫번째 히든레이어 : SimpleRNN
    * 히든스테이트 노드 16개, return_sequences=True
3. 두번째 히든레이어 : SimpleRNN
    * 히든스테이트 노드 32개, return_sequences=True
4. 플래튼
5. 회귀를 위한 적절한 아웃풋 레이어

In [None]:
####################
## Your Code Here ##
####################



In [None]:
## 학습도 시킬 것



In [None]:
# Q1. 테스트 셋에서의 RMSE를 출력하여라.



## 6.LSTM 모델링

1. 적절한 인풋 레이어를 구성할 것
2. 첫번째 히든레이어 : LSTM
    * 히든스테이트 노드 16개, return_sequences=True
3. 두번째 히든레이어 : LSTM
    * 히든스테이트 노드 32개, return_sequences=True
4. 플래튼
5. 회귀를 위한 적절한 아웃풋 레이어


In [None]:
####################
## Your Code Here ##
####################



In [None]:
## 학습도 시킬 것



In [None]:
# Q1. 테스트 셋에서의 RMSE를 출력하여라.



## 7.GRU 모델링


1. 적절한 인풋 레이어를 구성할 것
2. 첫번째 히든레이어 : GRU
    * 히든스테이트 노드 24개, return_sequences=True
3. 두번째 히든레이어 : GRU
    * 히든스테이트 노드 32개
4. 회귀를 위한 적절한 아웃풋 레이어

In [None]:
####################
## Your Code Here ##
####################



In [None]:
## 학습도 시킬 것



In [None]:
# Q1. 테스트 셋에서의 RMSE를 출력하여라.

