# HUẤN LUYỆN MÔ HÌNH ANN
Thực hiện huấn luyện mô hình mạng nơ-ron nhân tạo (ANN) trên tập dữ liệu đã chia.


#### Khai báo thư viện

In [None]:
# Import các thư viện cần thiết
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from keras import Input, Sequential
from keras.src.callbacks import EarlyStopping
from keras.src.layers import Dense, Dropout

#### Khai báo đường dẫn

In [None]:
# Đường dẫn dữ liệu
split_dir = "../data/old_data/splits"
model_dir = "../models"
plot_dir = "../plots/model_training"
os.makedirs(model_dir, exist_ok=True)
os.makedirs(plot_dir, exist_ok=True)

### Tải dữ liệu
Dữ liệu train và test được đọc từ: `data/old_data/splits/`.


In [None]:
# Đọc dữ liệu
X_train = pd.read_csv(f"{split_dir}/X_train.csv")
y_train = pd.read_csv(f"{split_dir}/y_train.csv")
X_test = pd.read_csv(f"{split_dir}/X_test.csv")
y_test = pd.read_csv(f"{split_dir}/y_test.csv")

print(f"Kích thước tập train: {X_train.shape}")
print(f"Kích thước tập test: {X_test.shape}")


### Định nghĩa mô hình ANN
Mô hình ANN được định nghĩa với: 2 lớp ẩn (64 và 32 neuron).     
   Lớp đầu ra dùng hàm Sigmoid để phân loại.


In [None]:
# Khởi tạo mô hình ANN
model = Sequential([
    Input(shape=(X_train.shape[1],)),  # Lớp đầu vào
    Dense(64, activation='relu'),
    Dropout(0.2),
    Dense(32, activation='relu'),
    Dropout(0.2),
    Dense(16, activation='relu'),
    Dense(1, activation='sigmoid')
])

# Compile mô hình
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Hiển thị kiến trúc mô hình
model.summary()

### Huấn luyện mô hình



In [None]:
# Cài đặt Early Stopping
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)

# Huấn luyện mô hình
history = model.fit(
    X_train, y_train,
    epochs=50,
    batch_size=32,
    validation_split=0.2,
    callbacks=[early_stopping],
    verbose=1
)


### Vẽ biểu đồ

In [None]:
# Hiển thị lịch sử huấn luyện
plt.figure(figsize=(12, 6))

# Biểu đồ loss
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

# Biểu đồ accuracy
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()

plt.tight_layout()

plt.savefig(os.path.join(plot_dir, "ann_loss_accuracy.png"))
plt.show()


### Lưu mô hình ANN
Mô hình được lưu vào file `models/ann_model.keras`.


In [None]:
# Lưu mô hình đã huấn luyện
model.save(f"{model_dir}/ann_model.keras")
print("Mô hình ANN đã được lưu tại: ann_model.keras")
