# NN Model for TCM Project (pseudo code)

## Steps of CNN

2. 文本處理

    文本向量化：將文本數據轉換為數值表示形式，比如將中文文字轉換成詞向量或字符向量。
    填充序列：確保所有文本序列的長度相同，如果需要，進行填充或截斷操作。

3. 建立CNN模型

    卷積層與池化層：設計卷積層和池化層來提取特徵並減少輸入的維度。
    Flatten層與全連接層：將卷積池化後的特徵展平成向量，然後添加全連接層進行分類。

4. 模型訓練與評估

    編譯模型：選擇損失函數、優化器和評估指標。
    訓練模型：使用已處理的數據訓練CNN模型，通常通過反向傳播算法來更新權重。
    評估模型：使用測試集來評估模型的性能，看準確度或其他指標。

5. 模型調整和優化

    超參數調整：調整卷積層的數量、大小，池化層的選擇等，以提高模型性能。
    防止過擬合：使用正則化方法，如dropout層，以防止模型在訓練集上表現好但在測試集上表現差。

In [None]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

In [None]:
# 創建序列模型
model = Sequential()

# 添加卷積層和池化層
model.add(Conv2D(
    filters=32, 
    kernel_size=(3, 3), 
    activation='relu', 
    input_shape=(height, width, channels)))

model.add(MaxPooling2D((2, 2)))

# 添加更多卷積層和池化層（根據需要）
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))

#Drop掉一定比例的神經元來避免Overfit的狀況
model.add(Dropout(0.25))

# 將特徵展平成一維向量
model.add(Flatten())

# 添加全連接層
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))  # num_classes是你的分類數量


In [None]:
# 訓練模型

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# parameter to tune:
# optimizer
# Optimizer Selection
# loss
# Loss Function: The 'loss' argument defines the loss function used to compute the error between predicted and actual values
# metrics 
# specifies the evaluation metrics used to monitor the model's performance


In [None]:
# 顯示模型摘要
model.summary()
train_history = model.fit(......)

#plot graph
show_train_history(.....)