# Bài tập lập trình: Softmax Regression với TensorFlow Keras

### Hướng dẫn làm bài 
- Trong bài tập này bạn sẽ sử dụng Python 3 và TensorFlow/Keras.
- Sau khi bạn viết Code của mình xong, hãy chạy dòng Code đó để xem kết quả bên dưới. 

### [Quan trọng] Chú ý
- **Không sử dụng hàm `input()` tại bất kỳ dòng lệnh nào**
- **Không thay đổi dòng code return của hàm**

Các bạn sẽ thực hiện `code` trong các phần hiển thị `#TODO: Lập trình tại đây` và thay thế các vị trí `None`. Có những câu hỏi chỉ cần trả về đáp án.

Sau khi viết xong Code của bạn, bạn hãy ấn "SHIFT"+"ENTER" để thực hiện chạy lệnh của Cell đó. 

---
Điểm số:
* 10 điểm / Câu

Tiêu chí chấm điểm:
* Các bài tập sẽ được chấm dựa trên các Test-case.
* Các bạn không khởi tạo lại giá trị đầu vào bên trong hàm. Có thể khởi tạo các giá trị này ngoài hàm nhằm mục đích kiểm thử.

## Import thư viện

In [None]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns

# Set random seeds for reproducibility
np.random.seed(42)
tf.random.set_seed(42)

print("TensorFlow version:", tf.__version__)

## 1. Tải dữ liệu MNIST

In [None]:
# Load MNIST dataset
(X_train, Y_train), (X_val, Y_val) = tf.keras.datasets.mnist.load_data()

print(f"Training data shape: {X_train.shape}")
print(f"Training labels shape: {Y_train.shape}")
print(f"Validation data shape: {X_val.shape}")
print(f"Validation labels shape: {Y_val.shape}")

## 2. Tiền xử lý dữ liệu

### 2.1. Chuẩn hóa và reshape dữ liệu

```TODO 1:``` Viết hàm tiền xử lý dữ liệu

In [None]:
def preprocess_data(X_train, Y_train, X_val, Y_val, num_classes=10):
    """
    Tiền xử lý dữ liệu MNIST cho Softmax Regression
    Đầu vào:
        X_train: numpy array, ảnh training (60000, 28, 28)
        Y_train: numpy array, nhãn training (60000,)
        X_val: numpy array, ảnh validation (10000, 28, 28)
        Y_val: numpy array, nhãn validation (10000,)
        num_classes: int, số lượng lớp (10)
    Đầu ra:
        Tuple: (X_train_processed, Y_train_processed, X_val_processed, Y_val_processed)
    """
    # TODO: Lập trình tại đây
    
    # Bước 1: Reshape ảnh từ (batch_size, 28, 28) thành (batch_size, 784)
    X_train_processed = None
    X_val_processed = None
    
    # Bước 2: Chuẩn hóa pixel values từ [0, 255] thành [0, 1]
    X_train_processed = None
    X_val_processed = None
    
    # Bước 3: Chuyển đổi nhãn thành categorical (one-hot encoding)
    Y_train_processed = None
    Y_val_processed = None
    
    return X_train_processed, Y_train_processed, X_val_processed, Y_val_processed

Test code

In [None]:
# Test function
try:
    X_train_proc, Y_train_proc, X_val_proc, Y_val_proc = preprocess_data(X_train, Y_train, X_val, Y_val)
    
    print(f"Processed training data shape: {X_train_proc.shape}")
    print(f"Processed training labels shape: {Y_train_proc.shape}")
    print(f"Processed validation data shape: {X_val_proc.shape}")
    print(f"Processed validation labels shape: {Y_val_proc.shape}")
    print(f"Pixel value range: [{X_train_proc.min():.3f}, {X_train_proc.max():.3f}]")
    print(f"First label one-hot: {Y_train_proc[0]}")
except Exception as e:
    print("Lỗi thực thi: ", e)

**Kết quả mong đợi:**

```
Processed training data shape: (60000, 784)
Processed training labels shape: (60000, 10)
Processed validation data shape: (10000, 784)
Processed validation labels shape: (10000, 10)
Pixel value range: [0.000, 1.000]
First label one-hot: [0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
```

## 3. Xây dựng mô hình Softmax Regression với Keras

### 3.1. Tạo mô hình Sequential

```TODO 2:``` Xây dựng mô hình Softmax Regression

In [None]:
def create_softmax_model(input_dim=784, num_classes=10):
    """
    Tạo mô hình Softmax Regression sử dụng Keras Sequential API
    Đầu vào:
        input_dim: int, số chiều đầu vào (784 cho MNIST)
        num_classes: int, số lượng lớp (10 cho MNIST)
    Đầu ra:
        model: tf.keras.Model object
    """
    # TODO: Lập trình tại đây
    
    # Tạo mô hình Sequential
    model = None
    
    # Thêm Dense layer với activation='softmax'
    # Lưu ý: Không cần hidden layer, chỉ cần 1 Dense layer duy nhất
    
    return model

Test code

In [None]:
# Tạo mô hình
try:
    model = create_softmax_model()
    
    # Hiển thị thông tin mô hình
    model.summary()
    
    # Kiểm tra số tham số
    total_params = model.count_params()
    expected_params = 784 * 10 + 10  # weights + biases
    print(f"Total parameters: {total_params}")
    print(f"Expected parameters: {expected_params}")
    print(f"Correct number of parameters: {total_params == expected_params}")
except Exception as e:
    print("Lỗi thực thi: ", e)

### 3.2. Compile mô hình

```TODO 3:``` Compile mô hình với optimizer, loss function và metrics phù hợp

In [None]:
def compile_model(model, learning_rate=0.01):
    """
    Compile mô hình với optimizer, loss function và metrics
    Đầu vào:
        model: tf.keras.Model object
        learning_rate: float, tốc độ học
    Đầu ra:
        model: compiled model
    """
    # TODO: Lập trình tại đây
    
    # Chọn optimizer (sử dụng SGD với learning rate được chỉ định)
    optimizer = None
    
    # Chọn loss function (categorical crossentropy cho multi-class classification)
    loss_function = None
    
    # Chọn metrics (accuracy)
    metrics = None
    
    # Compile model
    model.compile(
        optimizer=optimizer,
        loss=loss_function,
        metrics=metrics
    )
    
    return model

Test code

In [None]:
# Compile mô hình
try:
    model = compile_model(model, learning_rate=0.01)
    print("Model compiled successfully!")
except Exception as e:
    print("Lỗi thực thi: ", e)

## 4. Training mô hình

### 4.1. Thiết kế callback functions

```TODO 4:``` Tạo callback functions để theo dõi quá trình training

In [None]:
def create_callbacks():
    """
    Tạo callback functions cho training process
    Đầu ra:
        callbacks: list of callback functions
    """
    # TODO: Lập trình tại đây
    
    callbacks = []
    
    # Early Stopping callback
    early_stopping = None
    
    # Learning Rate Reduction callback
    lr_reduction = None
    
    callbacks.append(early_stopping)
    callbacks.append(lr_reduction)
    
    return callbacks

Test code

In [None]:
try:
    callbacks = create_callbacks()
    print(f"Created {len(callbacks)} callbacks")
    for i, callback in enumerate(callbacks):
        print(f"Callback {i+1}: {type(callback).__name__}")
except Exception as e:
    print("Lỗi thực thi: ", e)

### 4.2. Training mô hình

```TODO 5:``` Huấn luyện mô hình

In [None]:
def train_model(model, X_train, Y_train, X_val, Y_val, epochs=50, batch_size=128, callbacks=None):
    """
    Huấn luyện mô hình Softmax Regression
    Đầu vào:
        model: tf.keras.Model object
        X_train, Y_train: training data và labels
        X_val, Y_val: validation data và labels  
        epochs: int, số epochs
        batch_size: int, kích thước batch
        callbacks: list of callbacks
    Đầu ra:
        history: training history object
    """
    # TODO: Lập trình tại đây
    
    history = None
    
    return history

Test code

In [None]:
# Train mô hình
try:
    history = train_model(
        model, 
        X_train_proc, Y_train_proc, 
        X_val_proc, Y_val_proc, 
        epochs=30, 
        batch_size=128,
        callbacks=callbacks
    )
    print("Training completed!")
except Exception as e:
    print("Lỗi thực thi: ", e)

## 5. Đánh giá mô hình

### 5.1. Vẽ đồ thị training history

```TODO 6:``` Tạo hàm vẽ đồ thị loss và accuracy

In [None]:
def plot_training_history(history):
    """
    Vẽ đồ thị training history (loss và accuracy)
    Đầu vào:
        history: training history object
    """
    # TODO: Lập trình tại đây
    
    # Tạo subplot với 2 đồ thị
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 4))
    
    # Đồ thị Loss
    # Plot training & validation loss
    
    # Đồ thị Accuracy  
    # Plot training & validation accuracy
    
    plt.tight_layout()
    plt.show()

Test code

In [None]:
# Vẽ đồ thị
try:
    plot_training_history(history)
except Exception as e:
    print("Lỗi thực thi: ", e)

### 5.2. Tính toán metrics chi tiết

```TODO 7:``` Tính toán và hiển thị metrics chi tiết

In [None]:
def evaluate_model(model, X_test, Y_test_categorical, Y_test_original):
    """
    Đánh giá mô hình và hiển thị metrics chi tiết
    Đầu vào:
        model: trained model
        X_test: test data
        Y_test_categorical: test labels (one-hot)
        Y_test_original: test labels (original format)
    """
    # TODO: Lập trình tại đây
    
    # Dự đoán trên test set
    predictions = None
    predicted_classes = None
    
    # Tính accuracy
    test_accuracy = None
    
    # Classification report
    print("Classification Report:")
    print(None)
    
    # Confusion Matrix
    print("\nConfusion Matrix:")
    cm = None
    
    # Vẽ confusion matrix
    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
    plt.title('Confusion Matrix')
    plt.xlabel('Predicted Label')
    plt.ylabel('True Label')
    plt.show()
    
    return test_accuracy, predictions

Test code

In [None]:
# Đánh giá mô hình
try:
    test_acc, predictions = evaluate_model(model, X_val_proc, Y_val_proc, Y_val)
    print(f"\nFinal Test Accuracy: {test_acc:.4f}")
except Exception as e:
    print("Lỗi thực thi: ", e)

### 5.3. Visualize predictions

```TODO 8:``` Tạo hàm hiển thị một số predictions

In [None]:
def visualize_predictions(X_test, Y_test, predictions, num_samples=10):
    """
    Hiển thị một số ảnh với predictions
    Đầu vào:
        X_test: test images (flattened)
        Y_test: true labels
        predictions: model predictions
        num_samples: số lượng mẫu hiển thị
    """
    # TODO: Lập trình tại đây
    
    # Reshape lại ảnh từ (784,) thành (28, 28)
    X_images = None
    
    # Random chọn indices
    indices = None
    
    # Tạo subplot
    fig, axes = plt.subplots(2, 5, figsize=(12, 6))
    axes = axes.ravel()
    
    for i, idx in enumerate(indices):
        # Hiển thị ảnh
        
        # Lấy true label và predicted label
        true_label = None
        pred_label = None
        confidence = None
        
        # Set title và color
        color = 'green' if true_label == pred_label else 'red'
        
    plt.tight_layout()
    plt.show()

Test code

In [None]:
# Hiển thị predictions
try:
    visualize_predictions(X_val_proc, Y_val, predictions, num_samples=10)
except Exception as e:
    print("Lỗi thực thi: ", e)

## Kết thúc bài tập

Chúc mừng bạn đã hoàn thành bài tập về Softmax Regression với TensorFlow Keras! Hãy chắc chắn rằng bạn đã hoàn thành tất cả các phần và kiểm tra kỹ lưỡng kết quả của mình trước khi nộp bài.