In [1]:
!rm -rf /kaggle/working/ds201_BTTH2
!git clone https://github.com/UngHoangLong/ds201_BTTH2.git

Cloning into 'ds201_BTTH2'...
remote: Enumerating objects: 28, done.[K
remote: Counting objects: 100% (28/28), done.[K
remote: Compressing objects: 100% (19/19), done.[K
remote: Total 28 (delta 8), reused 24 (delta 7), pack-reused 0 (from 0)[K
Receiving objects: 100% (28/28), 242.16 KiB | 2.78 MiB/s, done.
Resolving deltas: 100% (8/8), done.


In [2]:
import torch
import torch.nn as nn
from torch.optim import Adam
from sklearn.metrics import precision_score, recall_score, f1_score
import matplotlib.pyplot as plt

import sys
sys.path.append("/kaggle/working/ds201_BTTH2")

from data_loader import get_vinfood_dataloaders
from module import GoogLeNet
from tqdm.auto import tqdm

In [3]:
train_data_path = "/kaggle/input/vinafood21/VinaFood21/train"
test_data_path = "/kaggle/input/vinafood21/VinaFood21/test"

In [4]:
BATCH_SIZE = 16
GOOGLENET_IMG_SIZE = 224
train_loader, val_loader, test_loader, NUM_CLASSES = get_vinfood_dataloaders(batch_size=BATCH_SIZE, train_path=train_data_path, test_path=test_data_path, val_split=0.2, image_size=GOOGLENET_IMG_SIZE)

Đã tải data thành công. Tổng cộng 21 lớp.


In [5]:
# Cấu hình
LEARNING_RATE = 0.001 # theo tiêu chuẩn của Adam optimizer
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Sử dụng thiết bị: {device}")

# Khởi tạo model với đúng số lớp
model = GoogLeNet(num_classes=NUM_CLASSES).to(device)

# Hàm loss
criterion = nn.CrossEntropyLoss()

# Optimizer Adam theo yêu cầu
optimizer = Adam(model.parameters(), lr=LEARNING_RATE)

print("Đã khởi tạo model, criterion, và optimizer.")
print(model)

Sử dụng thiết bị: cuda
Đã khởi tạo model, criterion, và optimizer.
GoogLeNet(
  (stem): Sequential(
    (0): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3))
    (1): ReLU(inplace=True)
    (2): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
    (3): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1))
    (4): ReLU(inplace=True)
    (5): Conv2d(64, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  )
  (inception_3a): InceptionBlock(
    (branch1): Sequential(
      (0): Conv2d(192, 64, kernel_size=(1, 1), stride=(1, 1))
      (1): ReLU(inplace=True)
    )
    (branch2): Sequential(
      (0): Conv2d(192, 96, kernel_size=(1, 1), stride=(1, 1))
      (1): ReLU(inplace=True)
      (2): Conv2d(96, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
      (3): ReLU(inplace=True)
    )
    (branch3): Sequential(
      (0): Conv2

In [6]:
NUM_EPOCHS = 50 # Số epochs bạn muốn chạy
history = {'train_loss': [], 'val_f1': [], 'val_precision': [], 'val_recall': []}

# --- THÊM MỚI: Biến để theo dõi model tốt nhất ---
best_val_f1 = 0.0  # Bắt đầu với F1 = 0
MODEL_SAVE_PATH = "best_googlenet_model.pth" # Tên file để lưu model
# -----------------------------------------------

print('Bắt đầu quá trình huấn luyện')
for epoch in range(NUM_EPOCHS):
    
    # --- Training ---
    model.train()
    running_loss = 0.0 # biến này lưu trữ loss của từng epoch
    
    train_progress_bar = tqdm(train_loader, desc=f'Epoch {epoch+1}/{NUM_EPOCHS} - Train', leave=False)
    
    for images, labels in train_progress_bar: # Lặp qua progress bar mới
        # print('bắt đầu batch') # Bạn có thể bỏ comment này nếu muốn xem chi tiết
        images, labels = images.to(device), labels.to(device)

        output = model(images) # chạy def forward
        loss = criterion(output, labels) #

        optimizer.zero_grad() # xoá grad của batch cũ
        loss.backward() # tính toán gradient (tìm đường xuống dốc)
        optimizer.step() # Cập nhật trọng số (bước xuống dốc)
        running_loss += loss.item() # 
        
        train_progress_bar.set_postfix(batch_loss=loss.item())

    epoch_train_loss = running_loss / len(train_loader) # tổng loss chia cho tổng số batch
    history['train_loss'].append(epoch_train_loss)

    # --- Validation ---
    model.eval()
    val_preds=[]
    val_labels=[]
    
    val_progress_bar = tqdm(val_loader, desc=f'Epoch {epoch+1}/{NUM_EPOCHS} - Val', leave=False)
    
    with torch.no_grad(): # không theo dõi hay tính gradient gì 
        for images, labels in val_progress_bar: # Lặp qua progress bar mới
            images, labels = images.to(device), labels.to(device)
            output = model(images)
            _, predicted = torch.max(output.data, 1) # không cần softmax vì logits lớn thì xác xuất cũng lớn

            val_preds.extend(predicted.cpu().numpy())
            val_labels.extend(labels.cpu().numpy())

    # Tính metrics trên tập Validation
    precision = precision_score(val_labels, val_preds, average='macro', zero_division=0)
    recall = recall_score(val_labels, val_preds, average='macro', zero_division=0)
    f1 = f1_score(val_labels, val_preds, average='macro', zero_division=0)
    
    history['val_precision'].append(precision)
    history['val_recall'].append(recall)
    history['val_f1'].append(f1)
    
    # Print kết quả của tập Validation
    print(f"Epoch {epoch+1}/{NUM_EPOCHS} - Train Loss: {epoch_train_loss:.4f} | Val F1 (Macro): {f1:.4f}")

    # --- THÊM MỚI: Logic lưu model ---
    if f1 > best_val_f1:
        best_val_f1 = f1 # Cập nhật F1 tốt nhất
        # Lưu lại "trạng thái" (state_dict) của model
        torch.save(model.state_dict(), MODEL_SAVE_PATH)
        print(f"  -> Đã lưu model tốt nhất mới! F1: {best_val_f1:.4f} tại {MODEL_SAVE_PATH}")
    # ------------------------------------

print(f"\nHuấn luyện hoàn tất! F1 tốt nhất trên Validation là: {best_val_f1:.4f}")

Bắt đầu quá trình huấn luyện


Epoch 1/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 1/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]



Epoch 1/50 - Train Loss: 2.9864 | Val F1 (Macro): 0.0079
  -> Đã lưu model tốt nhất mới! F1: 0.0079 tại best_googlenet_model.pth


Epoch 2/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 2/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 2/50 - Train Loss: 2.9804 | Val F1 (Macro): 0.0079


Epoch 3/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 3/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 3/50 - Train Loss: 2.9801 | Val F1 (Macro): 0.0079


Epoch 4/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 4/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 4/50 - Train Loss: 2.9783 | Val F1 (Macro): 0.0079


Epoch 5/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 5/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 5/50 - Train Loss: 2.9789 | Val F1 (Macro): 0.0073


Epoch 6/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 6/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 6/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 7/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 7/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 7/50 - Train Loss: 2.9789 | Val F1 (Macro): 0.0079


Epoch 8/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 8/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 8/50 - Train Loss: 2.9785 | Val F1 (Macro): 0.0079


Epoch 9/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 9/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 9/50 - Train Loss: 2.9777 | Val F1 (Macro): 0.0073


Epoch 10/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 10/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 10/50 - Train Loss: 2.9770 | Val F1 (Macro): 0.0079


Epoch 11/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 11/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 11/50 - Train Loss: 2.9776 | Val F1 (Macro): 0.0079


Epoch 12/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 12/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 12/50 - Train Loss: 2.9771 | Val F1 (Macro): 0.0079


Epoch 13/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 13/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 13/50 - Train Loss: 2.9772 | Val F1 (Macro): 0.0079


Epoch 14/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 14/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 14/50 - Train Loss: 2.9780 | Val F1 (Macro): 0.0079


Epoch 15/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 15/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 15/50 - Train Loss: 2.9775 | Val F1 (Macro): 0.0079


Epoch 16/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 16/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 16/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 17/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 17/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 17/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 18/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 18/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 18/50 - Train Loss: 2.9780 | Val F1 (Macro): 0.0079


Epoch 19/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 19/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 19/50 - Train Loss: 2.9771 | Val F1 (Macro): 0.0079


Epoch 20/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 20/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 20/50 - Train Loss: 2.9777 | Val F1 (Macro): 0.0079


Epoch 21/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 21/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 21/50 - Train Loss: 2.9777 | Val F1 (Macro): 0.0079


Epoch 22/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 22/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 22/50 - Train Loss: 2.9777 | Val F1 (Macro): 0.0079


Epoch 23/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 23/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 23/50 - Train Loss: 2.9765 | Val F1 (Macro): 0.0079


Epoch 24/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 24/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 24/50 - Train Loss: 2.9780 | Val F1 (Macro): 0.0079


Epoch 25/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 25/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 25/50 - Train Loss: 2.9776 | Val F1 (Macro): 0.0079


Epoch 26/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 26/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 26/50 - Train Loss: 2.9772 | Val F1 (Macro): 0.0079


Epoch 27/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 27/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 27/50 - Train Loss: 2.9770 | Val F1 (Macro): 0.0079


Epoch 28/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 28/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 28/50 - Train Loss: 2.9765 | Val F1 (Macro): 0.0079


Epoch 29/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 29/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 29/50 - Train Loss: 2.9759 | Val F1 (Macro): 0.0079


Epoch 30/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 30/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 30/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 31/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 31/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 31/50 - Train Loss: 2.9770 | Val F1 (Macro): 0.0079


Epoch 32/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 32/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 32/50 - Train Loss: 2.9772 | Val F1 (Macro): 0.0079


Epoch 33/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 33/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 33/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 34/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 34/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 34/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 35/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 35/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 35/50 - Train Loss: 2.9776 | Val F1 (Macro): 0.0079


Epoch 36/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 36/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 36/50 - Train Loss: 2.9759 | Val F1 (Macro): 0.0079


Epoch 37/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 37/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 37/50 - Train Loss: 2.9770 | Val F1 (Macro): 0.0079


Epoch 38/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 38/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 38/50 - Train Loss: 2.9766 | Val F1 (Macro): 0.0079


Epoch 39/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 39/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 39/50 - Train Loss: 2.9778 | Val F1 (Macro): 0.0079


Epoch 40/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 40/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 40/50 - Train Loss: 2.9769 | Val F1 (Macro): 0.0079


Epoch 41/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 41/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 41/50 - Train Loss: 2.9771 | Val F1 (Macro): 0.0079


Epoch 42/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 42/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 42/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 43/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 43/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 43/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 44/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 44/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 44/50 - Train Loss: 2.9763 | Val F1 (Macro): 0.0079


Epoch 45/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 45/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 45/50 - Train Loss: 2.9746 | Val F1 (Macro): 0.0079


Epoch 46/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 46/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 46/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 47/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 47/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 47/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 48/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 48/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 48/50 - Train Loss: 2.9762 | Val F1 (Macro): 0.0079


Epoch 49/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 49/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 49/50 - Train Loss: 2.9767 | Val F1 (Macro): 0.0079


Epoch 50/50 - Train:   0%|          | 0/503 [00:00<?, ?it/s]

Epoch 50/50 - Val:   0%|          | 0/126 [00:00<?, ?it/s]

Epoch 50/50 - Train Loss: 2.9774 | Val F1 (Macro): 0.0079

Huấn luyện hoàn tất! F1 tốt nhất trên Validation là: 0.0079


In [7]:
# (Cell 5 - Đánh giá cuối cùng trên tập Test)

print("Đang đánh giá kết quả cuối cùng trên tập Test...")

# 1. Khởi tạo lại kiến trúc model (phải giống hệt)
# Đảm bảo `LeNet` và `NUM_CLASSES` đã được định nghĩa ở các cell trên
test_model = GoogLeNet(num_classes=NUM_CLASSES).to(device)

# 2. Tải trọng số (weights) đã lưu từ file
test_model.load_state_dict(torch.load(MODEL_SAVE_PATH))

# 3. Chuyển sang chế độ đánh giá
test_model.eval()

test_preds = []
test_labels = []

# Thêm tqdm cho vòng lặp test
test_progress_bar = tqdm(test_loader, desc="Testing", leave=False)

with torch.no_grad(): # không theo dõi hay tính gradient gì 
    for images, labels in test_progress_bar:
        images, labels = images.to(device), labels.to(device)
        
        # Dùng test_model (đã được tải) để dự đoán
        outputs = test_model(images)
        
        _, predicted = torch.max(outputs.data, 1) # không cần softmax
        
        test_preds.extend(predicted.cpu().numpy())
        test_labels.extend(labels.cpu().numpy())

# Tính toán các độ đo cuối cùng
test_precision = precision_score(test_labels, test_preds, average='macro', zero_division=0)
test_recall = recall_score(test_labels, test_preds, average='macro', zero_division=0)
test_f1 = f1_score(test_labels, test_preds, average='macro', zero_division=0)

print("\n--- KẾT QUẢ CUỐI CÙNG TRÊN TẬP TEST (từ model tốt nhất) ---")
print(f"Test Precision (Macro): {test_precision:.4f}")
print(f"Test Recall (Macro):    {test_recall:.4f}")
print(f"Test F1-Score (Macro):  {test_f1:.4f}")

Đang đánh giá kết quả cuối cùng trên tập Test...


Testing:   0%|          | 0/418 [00:00<?, ?it/s]


--- KẾT QUẢ CUỐI CÙNG TRÊN TẬP TEST (từ model tốt nhất) ---
Test Precision (Macro): 0.0043
Test Recall (Macro):    0.0476
Test F1-Score (Macro):  0.0079


## Phân tích kết quả: Tại sao GoogLeNet tệ hơn LeNet?

Sau khi huấn luyện 50 epochs, mô hình GoogLeNet của chúng ta đạt F1-Score (macro) trên tập Validation và Test chỉ khoảng **~0.079**.

Đáng chú ý hơn, chỉ số **Test Recall (Macro) là `0.0476`**.

Trong khi đó, chúng ta có 21 lớp (món ăn). Nếu mô hình đoán mò ngẫu nhiên, tỷ lệ đoán trúng của nó sẽ là $1/21 \approx 0.0476$.

**Kết luận:** Điều này chứng tỏ mô hình GoogLeNet của chúng ta **hoàn toàn không học được bất cứ điều gì** và chỉ đang đưa ra dự đoán ngẫu nhiên.

---

### Lý do: Huấn luyện "Từ đầu" (Training from Scratch)

Nguyên nhân cốt lõi là sự không tương xứng giữa **độ phức tạp của mô hình** và **phương pháp huấn luyện**.

#### 1. LeNet (Mô hình 5 lớp - "Học sinh tiểu học")
* **Độ phức tạp:** Rất thấp (~60,000 tham số).
* **Kết quả:** Là một mô hình đơn giản, nó có thể học nhanh các quy tắc đơn giản (như màu sắc, hình dạng cơ bản) từ bộ VinaFood21. Vì vậy, nó cho kết quả **tốt hơn là đoán mò**.

#### 2. GoogLeNet (Mô hình 22 lớp - "Thiên tài sơ sinh")
* **Độ phức tạp:** Cực kỳ cao (**~7 triệu tham số**).
* **Phương pháp:** Chúng ta đang huấn luyện 7 triệu tham số này "từ đầu" (từ các giá trị ngẫu nhiên).
* **Vấn đề:**
    1.  **Dữ liệu quá nhỏ:** Bộ VinaFood21 là quá nhỏ để "dạy" cho 7 triệu tham số.
    2.  **Epoch quá ít:** 50 epochs là **hoàn toàn không đủ** để 7 triệu tham số này hội tụ. Các mô hình lớn như thế này khi huấn luyện "từ đầu" cần hàng trăm (thậm chí hàng ngàn) epochs trên các bộ dữ liệu khổng lồ (như ImageNet 1.2 triệu ảnh).

**Tóm lại:** Mô hình LeNet hoạt động tốt hơn vì nó đủ đơn giản để học được *một chút gì đó* từ bộ dữ liệu nhỏ. Mô hình GoogLeNet, vì quá phức tạp, nên **chưa kịp học được bất cứ điều gì** sau 50 epochs và vẫn đang ở trạng thái "đoán mò".

---
###  Giải pháp (Cách làm tiêu chuẩn)

Cách làm đúng khi sử dụng một mô hình lớn như GoogLeNet là dùng **Học Chuyển giao (Transfer Learning)**:
1.  Tải GoogLeNet **đã được huấn luyện trước** (`pretrained=True`).
2.  "Đóng băng" các lớp đầu và chỉ thay thế lớp `FC` cuối cùng.
3.  Huấn luyện (fine-tune) lại chỉ lớp `FC` đó.