<a href="https://colab.research.google.com/github/hsuancheyang/114-1-GenAI/blob/main/DNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# DNN 神經網路範例

## 匯入基本相關函式庫

In [1]:
from keras.models import Sequential, load_model
from keras.layers import Dense, Dropout
import numpy as np
import os

## 準備訓練資料
1000筆資料，每筆資料中有20個特徵值。

每個特徵值為0~1間的隨機浮點數。

標註：分類一（0） 與 分類二（1），也是隨機亂給。

In [2]:
train_data = np.random.rand(1000, 20)  # 1000 samples, 20 features each
train_labels = np.random.randint(0, 2, size=(1000,))  # Binary classification (0 or 1)

# 列印第0~第5筆資料與其對應的「標註」
print(f'Training data[0~5]: \n{train_data[0:5]}')
print(f'Training labels[0~5]: \n{train_labels[0:5]}')

Training data[0~5]: 
[[3.98518316e-01 4.73129314e-01 7.76152343e-01 7.66902860e-01
  8.94900887e-01 5.92796607e-01 4.84496995e-01 9.77894780e-01
  3.26614357e-01 6.38597481e-01 3.38426311e-01 8.14146406e-01
  5.77303392e-01 2.33563419e-01 6.87741897e-01 3.02315644e-01
  6.25016350e-01 8.19970848e-01 3.75464412e-01 5.37621180e-01]
 [8.84114482e-01 7.16643008e-01 5.06788929e-02 2.75241781e-01
  3.91885210e-01 3.93435554e-01 9.83770776e-01 8.92308515e-01
  4.98987586e-01 5.02975116e-01 6.48705304e-01 3.50077347e-01
  9.03935489e-01 9.14165344e-01 2.81048001e-01 1.77071736e-01
  2.35413601e-01 3.72099546e-01 2.33087579e-01 4.46784664e-01]
 [2.98374750e-01 4.69222575e-01 7.12944948e-01 4.41456729e-01
  1.75297100e-01 9.58893697e-01 8.14129776e-02 1.08162858e-01
  8.57633410e-01 5.92973396e-02 5.97826002e-01 5.75859089e-01
  4.29773957e-03 2.83577685e-01 7.76257210e-02 1.43622663e-01
  6.67808255e-01 7.92260233e-01 5.13246806e-01 7.91642398e-04]
 [7.46269822e-01 9.54261034e-01 7.78579844e-01

### 輸入的特徵有20個
### 最後輸出的標註有2個（0 or 1）

1. 建立一個簡單的神經網路串列，第一層使用全連接的神經網路 `Dense (DNN)`。

> 內含：64個神經元。使用ReLu激活函式。

2. 加入一個Dropout：

> Dropout：此為用於防止過度擬合的正則規化技術。在訓練過程中，它會在每次更新時隨機將部分輸入單元設為 0。

> (0.5)：此參數代表 Dropout 率，意指前一層中 50% 的神經元將在每次訓練迭代中被隨機剔除。透過隨機剔除神經元，網路對單一神經元的依賴性降低，從而提升對未見數據的泛化能力。

3. 新增另一個含32個神經元的全連接層，採用ReLU激活函數。

4. 添加最終全連接層，輸出維度為 output_dim（此處為 2）。採用 softmax 激活函數，該函數能輸出類別間的概率分佈，適用於多類分類問題。

In [3]:
# DNN model definition
input_dim = 20  # input dimension to match synthetic data
output_dim = 2  # output dimension for binary classification

model = Sequential()

# Add layers to the model
model.add(Dense(64, activation='relu', input_shape=(input_dim,)))
model.add(Dropout(0.5))
model.add(Dense(32, activation='relu'))
# Add more layers as needed
model.add(Dense(output_dim, activation='softmax'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


### 編譯神經網路模型：

1. model.compile(...): 此函式用於配置模型以進行訓練。
2. optimizer=『adam』: 此參數指定訓練過程中使用的優化演算法。Adam 是一種廣受歡迎且高效的優化器。
3. loss= 'sparse_categorical_crossentropy': 此處定義損失函數。當標籤為整數（此處為 0 或 1）時，應採用稀疏類別交叉熵損失函數，此函數適用於二元分類問題。
4. metrics=[『accuracy』]: 此參數指定訓練與測試階段的評估指標。『accuracy』 將衡量模型正確預測類別的頻率。

In [4]:
# Compile the model
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',  # Use sparse categorical crossentropy for integer labels
    metrics=['accuracy'])

model.fit(...): 此函式使用提供的資料訓練模型。
 * train_data: 此為模型將學習的訓練資料（特徵）。
 * train_labels: 此為 train_data 的對應標籤（分類）。
 * epochs=10：此參數指定模型將完整遍歷訓練資料集的次數。本例中將循環處理資料10次。
 * batch_size=32：此參數定義每次梯度更新的樣本數量。訓練資料將被劃分為每批32個樣本的批次，模型權重將在處理完每批資料後更新。


In [5]:
# Train the model
model.fit(train_data, train_labels, epochs=10, batch_size=32)

Epoch 1/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 5ms/step - accuracy: 0.5254 - loss: 0.7169
Epoch 2/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.4556 - loss: 0.7166
Epoch 3/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.4995 - loss: 0.7014
Epoch 4/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.4995 - loss: 0.7025
Epoch 5/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.5100 - loss: 0.6987
Epoch 6/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5331 - loss: 0.6896
Epoch 7/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5060 - loss: 0.6917
Epoch 8/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5429 - loss: 0.6927
Epoch 9/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[

<keras.src.callbacks.history.History at 0x7c3b96049490>

In [6]:
# Save the trained model
model_dir = 'saved_models'
model_path = os.path.join(model_dir, 'dnn_model.h5')
model.save(model_path)
print(f"模型已保存至 {model_path}")

model.summary()



模型已保存至 saved_models/dnn_model.h5


In [10]:
#
# Generate some synthetic test data for prediction
#
new_data = np.random.rand(10, 20)
print("\n新的測試數據：")
print(new_data)

# Predict using the loaded model
print("\n開始進行預測...")
predictions = model.predict(new_data)
print("原始預測結果 (機率分佈)：")
print(predictions)

predicted_classes = np.argmax(predictions, axis=1) # axis=1 表示在每個樣本的機率分佈中取最大值
print("\n預測的類別標籤 (0 或 1)：")
print(predicted_classes)

# 為了更好地理解，我們手動為每個樣本顯示預測結果
print("\n每個樣本的預測結果：")
for i, (prob, cls) in enumerate(zip(predictions, predicted_classes)):
    print(f"  樣本 {i+1}: 預測機率 = {prob}, 預測類別 = {cls}")


新的測試數據：
[[0.86347884 0.06033171 0.93764377 0.51939837 0.43341539 0.83017314
  0.35225854 0.90019706 0.09924296 0.50142386 0.23691591 0.51570904
  0.49499783 0.34358389 0.11110142 0.05553029 0.79101457 0.7841049
  0.5165522  0.05100846]
 [0.33162996 0.19833296 0.89306267 0.20967086 0.41249406 0.7855817
  0.57662314 0.24505117 0.88079845 0.73484144 0.46563229 0.37551528
  0.67689508 0.33508262 0.70648945 0.66122111 0.99631679 0.9502268
  0.20063639 0.68756302]
 [0.46548491 0.22457713 0.0782265  0.57941674 0.1408073  0.08773819
  0.8213534  0.4884904  0.42236536 0.95897612 0.97067182 0.73532454
  0.01887388 0.66677145 0.54542298 0.6166649  0.0130004  0.98331552
  0.93315777 0.39011684]
 [0.01323737 0.74156359 0.04966213 0.23743457 0.76103469 0.60511701
  0.08718056 0.39558485 0.11019133 0.2666486  0.12116495 0.35654944
  0.9525466  0.55311596 0.62399706 0.3175274  0.87296879 0.19750069
  0.21326869 0.71725427]
 [0.1744422  0.44850515 0.02246775 0.62574977 0.84198664 0.17637172
  0.597153