# Bài tập lập trình: Softmax Regression với TensorFlow

### Hướng dẫn làm bài 
- Trong bài tập này bạn sẽ sử dụng TensorFlow 2.x để xây dựng mô hình Softmax Regression.
- Sau khi bạn viết code của mình xong, hãy chạy dòng code đó để xem kết quả bên dưới. 

### [Quan trọng] Chú ý
- **Không sử dụng hàm `input()` tại bất kỳ dòng lệnh nào**
- **Không thay đổi dòng code return của hàm**

Các bạn sẽ thực hiện `code` trong các phần hiển thị `#TODO: Lập trình tại đây` và thay thế các vị trí `None`.

---
Điểm số:
* 10 điểm / Câu

Tiêu chí chấm điểm:
* Các bài tập sẽ được chấm dựa trên các test-case.
* Sử dụng TensorFlow API một cách hiệu quả và đúng cách.

In [None]:
import tensorflow as tf
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers, losses, metrics, optimizers
import matplotlib.pyplot as plt

print(f"TensorFlow version: {tf.__version__}")

## 1. Tải dữ liệu MNIST

In [None]:
(X_train, Y_train), (X_val, Y_val) = tf.keras.datasets.mnist.load_data()

In [None]:
# Số lượng nhãn 
num_classes = 10

num_of_train_images, width, height = X_train.shape
image_vector_size = width * height

print(f"""
  Số lượng ảnh train: {num_of_train_images}
  Chiều dài ảnh train: {width}
  Chiều cao ảnh train: {height}
  Chiều ảnh được duỗi: {image_vector_size}
""")

## 2. Tiền xử lý dữ liệu với TensorFlow

### 2.1. Chuẩn hóa và reshape dữ liệu

```TODO 1:``` Preprocessing dữ liệu với TensorFlow

In [None]:
def preprocess_data(X, Y):
  """
  Tiền xử lý dữ liệu: reshape và chuẩn hóa
  Đầu vào:
    X: numpy array, shape (batch_size, 28, 28)
    Y: numpy array, shape (batch_size,)
  Đầu ra:
    X_processed: tf.Tensor, shape (batch_size, 784), giá trị từ 0-1
    Y_processed: tf.Tensor, shape (batch_size, 10), one-hot encoded
  """
  # TODO: Lập trình tại đây
  
  # Chuyển đổi sang tensor và chuẩn hóa
  X_processed = None  # Reshape về (batch_size, 784) và chia cho 255.0
  
  # Chuyển đổi nhãn sang one-hot encoding
  Y_processed = None  # Sử dụng tf.one_hot
  
  return X_processed, Y_processed

In [None]:
# Test code
try:
  X_train_processed, Y_train_processed = preprocess_data(X_train[:100], Y_train[:100])
  X_val_processed, Y_val_processed = preprocess_data(X_val[:100], Y_val[:100])
  
  print(f"X_train shape: {X_train_processed.shape}")
  print(f"Y_train shape: {Y_train_processed.shape}")
  print(f"X values range: [{tf.reduce_min(X_train_processed):.1f}, {tf.reduce_max(X_train_processed):.1f}]")
  print(f"Y one-hot sum: {tf.reduce_sum(Y_train_processed[0]):.1f}")
except Exception as e:
  print(f"Lỗi thực thi: {e}")

**Kết quả mong đợi:**
```
X_train shape: (100, 784)
Y_train shape: (100, 10)
X values range: [0.0, 1.0]
Y one-hot sum: 1.0
```

```TODO 2:``` Tiến hành preprocessing toàn bộ dữ liệu

In [None]:
try:
  # TODO: Lập trình tại đây
  X_train_processed, Y_train_processed = None, None  # Preprocessing train set
  X_val_processed, Y_val_processed = None, None      # Preprocessing validation set
  
  print(f"Training data shape: {X_train_processed.shape}")
  print(f"Validation data shape: {X_val_processed.shape}")
except Exception as e:
  print(f"Lỗi thực thi: {e}")

## 3. Xây dựng mô hình Softmax Regression với TensorFlow

### 3.1. Tạo mô hình sử dụng Keras Sequential API

```TODO 3:``` Xây dựng Softmax Regression model

In [None]:
def create_softmax_model(input_size, num_classes):
  """
  Tạo mô hình Softmax Regression
  Đầu vào:
    input_size: int, kích thước input (784)
    num_classes: int, số lượng classes (10)
  Đầu ra:
    model: tf.keras.Model
  """
  # TODO: Lập trình tại đây
  
  model = None  # Tạo Sequential model với 1 Dense layer có activation='softmax'
  
  return model

In [None]:
# Test code
try:
  model = create_softmax_model(784, 10)
  print("Model architecture:")
  model.summary()
  
  # Test với 1 batch nhỏ
  test_input = tf.random.normal((5, 784))
  test_output = model(test_input)
  print(f"\nTest output shape: {test_output.shape}")
  print(f"Output sum (should be ~1.0): {tf.reduce_sum(test_output[0]):.3f}")
  
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### 3.2. Compile mô hình

```TODO 4:``` Compile mô hình với optimizer, loss và metrics phù hợp

In [None]:
def compile_model(model, learning_rate=0.01):
  """
  Compile mô hình với optimizer, loss, và metrics
  Đầu vào:
    model: tf.keras.Model
    learning_rate: float, tốc độ học
  """
  # TODO: Lập trình tại đây
  
  # Compile model với:
  # - optimizer: SGD với learning_rate
  # - loss: categorical_crossentropy 
  # - metrics: accuracy
  model.compile(
    optimizer=None,
    loss=None,
    metrics=None
  )
  
  return model

In [None]:
# Test code
try:
  model = create_softmax_model(784, 10)
  model = compile_model(model, learning_rate=0.01)
  
  print("Model compiled successfully!")
  print(f"Optimizer: {type(model.optimizer).__name__}")
  print(f"Loss function: {model.loss}")
  print(f"Metrics: {[m.name for m in model.metrics]}")
  
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### 3.3. Training với validation

```TODO 5:``` Thiết lập training loop

In [None]:
def train_model(model, X_train, Y_train, X_val, Y_val, epochs=10, batch_size=32):
  """
  Train mô hình
  Đầu vào:
    model: tf.keras.Model
    X_train, Y_train: training data
    X_val, Y_val: validation data 
    epochs: số epoch
    batch_size: kích thước batch
  Đầu ra:
    history: training history
  """
  # TODO: Lập trình tại đây
  
  # Sử dụng model.fit() để train
  history = None
  
  return history

### 3.4. Thực hiện training

In [None]:
try:
  # Tạo và compile model
  model = create_softmax_model(784, 10)
  model = compile_model(model, learning_rate=0.01)
  
  # Training
  history = train_model(
    model, X_train_processed, Y_train_processed, 
    X_val_processed, Y_val_processed, 
    epochs=10, batch_size=128
  )
  
  print("Training completed!")
  
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### 3.5. Visualization và Evaluation

```TODO 6:``` Vẽ đồ thị loss và accuracy

In [None]:
def plot_training_history(history):
  """
  Vẽ đồ thị training history
  Đầu vào:
    history: keras History object
  """
  # TODO: Lập trình tại đây
  
  # Tạo subplot với 2 đồ thị: loss và accuracy
  fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 4))
  
  # Vẽ loss
  # ax1.plot loss và val_loss
  
  # Vẽ accuracy  
  # ax2.plot accuracy và val_accuracy
  
  plt.tight_layout()
  plt.show()

In [None]:
# Test visualization
try:
  if 'history' in locals():
    plot_training_history(history)
  else:
    print("Chạy training trước để có history data")
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### 3.6. Evaluation và Prediction

```TODO 7:``` Tạo hàm đánh giá và dự đoán

In [None]:
def evaluate_model(model, X_test, Y_test):
  """
  Đánh giá mô hình
  Đầu vào:
    model: trained model
    X_test, Y_test: test data
  Đầu ra:
    loss, accuracy: float values
  """
  # TODO: Lập trình tại đây
  
  # Sử dụng model.evaluate()
  results = None
  loss, accuracy = None, None
  
  return loss, accuracy

def predict_samples(model, X_samples, Y_true, num_samples=5):
  """
  Dự đoán và hiển thị một số mẫu
  Đầu vào:
    model: trained model
    X_samples: input samples (flattened)
    Y_true: true labels (not one-hot)
    num_samples: số mẫu cần hiển thị
  """
  # TODO: Lập trình tại đây
  
  # Dự đoán
  predictions = None  # model.predict()
  predicted_classes = None  # tf.argmax()
  
  # Hiển thị kết quả
  print("Prediction Results:")
  for i in range(min(num_samples, len(Y_true))):
    print(f"Sample {i}: True={Y_true[i]}, Predicted={predicted_classes[i]}, Confidence={tf.reduce_max(predictions[i]):.3f}")

In [None]:
# Test evaluation
try:
  if 'model' in locals():
    # Evaluate on validation set
    val_loss, val_accuracy = evaluate_model(model, X_val_processed, Y_val_processed)
    print(f"Validation Loss: {val_loss:.4f}")
    print(f"Validation Accuracy: {val_accuracy:.4f}")
    
    # Predict some samples
    predict_samples(model, X_val_processed[:10], Y_val[:10])
  else:
    print("Train model trước khi evaluate")
    
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### 3.7. So sánh với implementation từ scratch

```TODO 8:``` Tạo custom training loop để hiểu rõ hơn về cách TensorFlow hoạt động

In [None]:
def custom_training_loop(model, X_train, Y_train, X_val, Y_val, epochs=5, batch_size=128):
  """
  Custom training loop sử dụng GradientTape
  Đầu vào:
    model: tf.keras.Model (chưa compile)
    X_train, Y_train: training data
    X_val, Y_val: validation data
    epochs: số epoch
    batch_size: kích thước batch
  """
  # TODO: Lập trình tại đây
  
  # Thiết lập optimizer và loss function
  optimizer = None  # SGD optimizer
  loss_fn = None    # CategoricalCrossentropy
  
  # Training metrics
  train_loss = tf.keras.metrics.Mean()
  train_accuracy = tf.keras.metrics.CategoricalAccuracy()
  
  # Training loop
  for epoch in range(epochs):
    print(f"Epoch {epoch + 1}/{epochs}")
    
    # Reset metrics
    train_loss.reset_states()
    train_accuracy.reset_states()
    
    # Create batches
    dataset = tf.data.Dataset.from_tensor_slices((X_train, Y_train))
    dataset = dataset.batch(batch_size)
    
    # Training step
    for batch_x, batch_y in dataset:
      # TODO: Implement training step với GradientTape
      with tf.GradientTape() as tape:
        # Forward pass
        predictions = None
        # Compute loss
        loss = None
      
      # Compute gradients
      gradients = None
      # Apply gradients
      optimizer.apply_gradients(zip(gradients, model.trainable_variables))
      
      # Update metrics
      train_loss.update_state(loss)
      train_accuracy.update_state(batch_y, predictions)
    
    # Validation
    val_predictions = model(X_val)
    val_loss = loss_fn(Y_val, val_predictions)
    val_accuracy = tf.keras.metrics.categorical_accuracy(Y_val, val_predictions)
    val_accuracy = tf.reduce_mean(val_accuracy)
    
    print(f"Loss: {train_loss.result():.4f}, Accuracy: {train_accuracy.result():.4f}, "
          f"Val Loss: {val_loss:.4f}, Val Accuracy: {val_accuracy:.4f}")

In [None]:
# Test custom training loop
try:
  # Tạo model mới cho custom training
  custom_model = create_softmax_model(784, 10)
  
  # Custom training (không cần compile)
  print("Training với custom loop:")
  custom_training_loop(
    custom_model, 
    X_train_processed[:5000], Y_train_processed[:5000],  # Subset for faster training
    X_val_processed[:1000], Y_val_processed[:1000],
    epochs=3, batch_size=64
  )
  
except Exception as e:
  print(f"Lỗi thực thi: {e}")

### Vậy là bạn đã xây dựng thành công mô hình Softmax Regression với TensorFlow/Keras!

**Những điều bạn đã học được:**
1. Sử dụng TensorFlow/Keras để preprocessing dữ liệu
2. Xây dựng mô hình Sequential với Dense layer và Softmax activation
3. Compile mô hình với optimizer, loss function và metrics
4. Training mô hình với validation
5. Visualization training history
6. Evaluation và prediction
7. Custom training loop với GradientTape

**So sánh với NumPy thuần:**
- TensorFlow tự động tính gradient và backpropagation
- Built-in optimizer và loss functions
- GPU acceleration tự động
- Dễ dàng scaling và deployment