# 深度神經網路（DNN）分類基礎教學

在這份教學中，我們將介紹如何使用 TensorFlow 來建構一個基礎的深度神經網路（DNN）進行分類任務。分類問題是機器學習中的一種重要任務，主要用於預測樣本屬於哪一個類別，例如圖片分類、垃圾郵件過濾等。在這裡，我們將一步步地帶領你學習如何從資料處理、模型構建到模型訓練，逐步掌握 DNN 分類的核心概念。

## 1. 載入套件

首先，我們匯入必要的套件：

In [1]:
import tensorflow as tf
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

2024-10-26 15:01:19.518389: I tensorflow/tsl/cuda/cudart_stub.cc:28] Could not find cuda drivers on your machine, GPU will not be used.
2024-10-26 15:01:19.556731: E tensorflow/compiler/xla/stream_executor/cuda/cuda_dnn.cc:9342] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-10-26 15:01:19.556757: E tensorflow/compiler/xla/stream_executor/cuda/cuda_fft.cc:609] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-10-26 15:01:19.556787: E tensorflow/compiler/xla/stream_executor/cuda/cuda_blas.cc:1518] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2024-10-26 15:01:19.564285: I tensorflow/tsl/cuda/cudart_stub.cc:28] Could not find cuda drivers on your machine, GPU will not be used.
2024-10-26 15:01:19.564791: I tensorflow/core/platform/cpu_feature_guard.cc:182] This Tens

## 2. 資料準備
在分類任務中，我們需要一組帶標籤的數據集。在這裡，我們將使用經典鳶尾花數據集（Iris Dataset），這是一個包含三個類別的數據集，用於預測鳶尾花的種類。

In [2]:
# 載入鳶尾花數據集
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 取得資料
iris = load_iris()
x = iris.data
y = iris.target

# 將數據分為訓練集和測試集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)

# 標準化數據
scaler = StandardScaler()
x_train = scaler.fit_transform(x_train)
x_test = scaler.transform(x_test)

這段程式使用 scikit-learn 來載入鳶尾花數據集，並將其分為訓練集和測試集，最後使用 `StandardScaler` 進行標準化處理，讓數據在訓練時能更快收斂。

## 3. 建構 DNN 模型
接下來，我們來建構一個簡單的深度神經網路模型。這個模型將包含兩層全連接層，用於分類三個鳶尾花的類別。

In [3]:
# 建構 DNN 模型
model = tf.keras.Sequential([
    tf.keras.layers.InputLayer(input_shape=(4,)),
    tf.keras.layers.Dense(16, activation='relu'),
    tf.keras.layers.Dense(16, activation='relu'),
    tf.keras.layers.Dense(3, activation='softmax')
])

# 編譯模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

2024-10-26 15:01:59.181852: E tensorflow/compiler/xla/stream_executor/cuda/cuda_driver.cc:268] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected


在這裡，我們使用了 `tf.keras.Sequential` 來建立模型，包含兩層隱藏層，每層有 16 個神經元，並使用 ReLU 作激發函數。最後一層是輸出層，有三個神經元，使用 Softmax 激發函數來進行分類。損失函數選擇了 `sparse_categorical_crossentropy`，適合用於多類別分類問題。

## 4. 模型訓練
我們已經建構了模型，接下來我們將模型與數據進行訓練。這段程式將模型訓練 100 個 epoch，每次使用 10 個數據進行更新。

In [4]:
# 訓練模型
model.fit(x_train, y_train, epochs=100, batch_size=10, verbose=1)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.src.callbacks.History at 0x7f96ac2bdaf0>

透過調整 epoch 和 batch_size 的值，我們可以控制模型訓練的速度和效果。

## 5. 模型評估與預測
訓練完模型後，我們可以使用它來進行預測，並評估模型的效果。這段程式碼首先評估了模型在測試數據上的表現，並使用訓練好的模型對新數據進行預測。

In [5]:
# 評估模型效果
loss, accuracy = model.evaluate(x_test, y_test)
print(f'模型損失（Loss）：{loss}, 準確率（Accuracy）：{accuracy}')

# 進行預測
sample = np.array([[5.0, 3.6, 1.4, 0.2]])  # 一筆測試數據
predicted_class = model.predict(sample)
print(f'預測的類別：{np.argmax(predicted_class)}')

模型損失（Loss）：0.028565410524606705, 準確率（Accuracy）：1.0
預測的類別：1


這段程式碼使用模型對測試數據進行評估，並計算損失和準確率，最後使用模型對新的數據樣本進行分類預測。

## 6. 模型保存與輸出
最後，我們可以將訓練好的模型保存起來，以便日後使用或部署。這段程式將模型保存為 SavedModel 格式，以便在生產環境中使用。

In [6]:
# 保存模型
model.save('dnn_classification_model')
print('模型已成功保存至 dnn_classification_model')

INFO:tensorflow:Assets written to: dnn_classification_model/assets


INFO:tensorflow:Assets written to: dnn_classification_model/assets


模型已成功保存至 dnn_classification_model


In [7]:
# 載入模型並進行推論
loaded_model = tf.keras.models.load_model('dnn_classification_model')
print('模型已成功載入')

# 使用載入的模型進行推論
predicted_class = loaded_model.predict(sample)
print(f'當輸入樣本為 {sample} 時，預測的類別為：{np.argmax(predicted_class)}')

模型已成功載入
當輸入樣本為 [[5.  3.6 1.4 0.2]] 時，預測的類別為：1


## 結論
在本教學中，我們學會了如何使用 TensorFlow 構建一個簡單的深度神經網路來進行分類任務。我們從資料準備開始，一直到模型建構、訓練和評估，完整地了解了整個過程。接下來，你可以嘗試使用其他不同的資料集或改變模型結構，來進一步提高模型的準確度和效果。