# 序列資料預測 - MLP (DIY資料集)

## 1.DIY Dataset 序列資料
建立序列 Dataset，以等差數列，長度取 12
例如：x=[15, 25, 35, 45, 55, 65, 75, 85, 95, 105, 115, 125] y=135

### 1.1 DIY 製作『數字序列』資料之準備工作

In [None]:
# 定義DIY函式
from numpy import array

# 傳入序列內容 raw, 指定每組序列長度 seq
def DIY(raw, seq):
	x, y = list(), list()
	for i in range(len(raw)):
		end = i + seq  # 設定序列結束點
		if end > len(raw)-1:  # 檢查是否結束序列
			break
		# 產生序列(x數據/題目 ,y標籤/答案)
		seq_x, seq_y = raw[i:end], raw[end]
		x.append(seq_x)  # 元素加入list
		y.append(seq_y)  # 元素加入list
	return array(x), array(y)  # list轉矩陣 並傳回

# 自訂顯示函數
def show(x, y):
  for i in range(len(x)):
    print(x[i], y[i])  # 同時列出 x, y

### 1.2 原始數據

In [None]:
# 設定序列內容
raw_data = []
for i in range(15,550,10):
    raw_data.append(i)

# 序列長度 seq
seq = 12

### 1.3 建立訓練集 x_train, y_train

In [None]:
# 使用函式 DIY() 及 show()
x_train, y_train = DIY(raw_data, seq)
show(x_train, y_train)

### 1.4 建立測試集 x_test, y_test

In [None]:
# 使用未知數字建立測試集
test_data = []
for i in range(710,950,10): # x_train 15,550
    test_data.append(i)

# 序列長度 seq
seq = 12
x_test, y_test = DIY(test_data, seq)
show(x_test, y_test)

### 1.5 查詢 DIY Dataset 資料筆數

In [None]:
# 查看資料結構
print(x_train.shape , x_test.shape)
print(y_train.shape , y_test.shape)

## 2.建模與訓練參數調整

### 2.1 匯入TensorFlow

In [None]:
# 匯入TensorFlow
import tensorflow

# 匯入建模所需的模組
import matplotlib.pyplot as plt
from tensorflow.keras.models import Model     #模型工具
from tensorflow.keras.models import Sequential  #順序序模型
from tensorflow.keras.layers import Dense    #全連接層
from tensorflow.keras import backend       #後端模組

### 2.2 MLP 建模與編譯
- 每一層加上 name，方便理解

In [None]:
# MLP 模型
model = Sequential()
model.add(Dense(10, activation='relu', input_dim=seq, name='Hidden-1'))  #隱藏層
model.add(Dense(100, activation='relu', name='Hidden-2'))
model.add(Dense(1, name='Out')) #輸出層
model.summary()

# 編譯模型
model.compile(optimizer='adam', loss='mse', metrics=['accuracy'])


In [None]:
# 圖形顯示模型
from tensorflow.keras.utils import plot_model

# plot_model(model)
plot_model(model, show_shapes=True)
# plot_model(model, show_shapes=True, to_file='model.png')

### 2.3 調整模型 "訓練" 參數
- 傳回 model.fit() 的歷史記錄

In [None]:
# 開始訓練
%%time
history = model.fit(x_train, y_train, epochs=1000, verbose=0)
# 訓練參數 epochs=10 100 1000
# verbose: 0=無顯示, 1=進度條, 2=每輪一行。

In [None]:
# 查看
print(history.history)
print(history.history.keys())
print(len(history.history['loss']))

### 2.4 顯示訓練成效loss
- 同時檢視 loss 與 accuracy

In [None]:
# 評估
# Train
loss, accuracy = model.evaluate(x_train, y_train)
print('Train loss: {:.6f}'.format(loss))
print('Train accuracy: {:.6f}'.format(accuracy))

# Test
loss, accuracy = model.evaluate(x_test, y_test)
print('Test loss: {:.6f}'.format(loss))
print('Test accuracy: {:.6f}'.format(accuracy))

### 2.5 查看訓練的過程

In [None]:
# 顯示圖表來分析模型的訓練過程
import matplotlib.pyplot as plt

# 顯示訓練和驗證損失
loss = history.history["loss"]
epochs = range(1, len(loss)+1)
plt.plot(epochs, loss, "bo-", label="Training Loss")
plt.title("Training Loss")
plt.xlabel("Epochs")
plt.ylabel("Loss")
plt.legend()
plt.show()


### 2.6 重新建模前先刪除舊模組
- 重覆執行 model.fit() 是繼續之前，再增加訓練
- 繼續訓練：重覆執行訓練 model.fit()，查看每次的結果
- 比較重新建模後再執行的結果

In [None]:
# 調整的參數與訓練成效，會累積影響現有模型
# 清除與刪除現有模型，調整參數才有意義

# backend.clear_session()
# del model

## 3.模型預測

### 3.1 預測

In [None]:
# 預測

test = model.predict(x_test, verbose=1)
show(y_test, test) #自定義函式
