In [1]:
# --- CÀI ĐẶT MÔI TRƯỜNG VÀ IMPORTS ---

# Xóa thư mục cũ để đảm bảo phiên bản mới nhất
!rm -rf Deep-Learning-Based-Signature-Forgery-Detection-for-Personal-Identity-Authentication-Update

# Tải repository về
!git clone https://github.com/trongjhuongwr/Deep-Learning-Based-Signature-Forgery-Detection-for-Personal-Identity-Authentication-Update.git

# Di chuyển vào thư mục dự án
%cd Deep-Learning-Based-Signature-Forgery-Detection-for-Personal-Identity-Authentication-Update

Cloning into 'Deep-Learning-Based-Signature-Forgery-Detection-for-Personal-Identity-Authentication-Update'...
remote: Enumerating objects: 93, done.[K
remote: Counting objects: 100% (93/93), done.[K
remote: Compressing objects: 100% (69/69), done.[K
remote: Total 93 (delta 36), reused 74 (delta 20), pack-reused 0 (from 0)[K
Receiving objects: 100% (93/93), 184.57 KiB | 5.43 MiB/s, done.
Resolving deltas: 100% (36/36), done.
/kaggle/working/Deep-Learning-Based-Signature-Forgery-Detection-for-Personal-Identity-Authentication-Update


In [2]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import transforms
import numpy as np
import random
import os
from tqdm.notebook import tqdm

# Imports từ các modules của bạn
from dataloader.tSSN_trainloader import SignatureTrainDataset
from models.Triplet_Siamese_Similarity_Network import tSSN
from losses.triplet_loss import TripletLoss

print("Cài đặt và import thành công!")

Cài đặt và import thành công!


In [3]:
# --- CẤU HÌNH VÀ TẢI DỮ LIỆU ---

# Cấu hình
NUM_EPOCHS = 35  # Chỉ cần khoảng 30-50 epochs cho tiền huấn luyện
LEARNING_RATE = 1e-4
BATCH_SIZE = 32
DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu'
SAVE_DIR = '/kaggle/working/pretrained_models'
os.makedirs(SAVE_DIR, exist_ok=True)

# Seed để đảm bảo kết quả có thể tái lặp
SEED = 42
random.seed(SEED)
np.random.seed(SEED)
torch.manual_seed(SEED)
if torch.cuda.is_available():
    torch.cuda.manual_seed_all(SEED)

# Transform ảnh (giống như trong các notebook khác)
transform = transforms.Compose([
    transforms.Resize((220, 150)),
    transforms.Grayscale(),
    transforms.ToTensor(),
    transforms.Lambda(lambda x: x.repeat(3, 1, 1)),
    transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

# Sử dụng toàn bộ dữ liệu từ tSSN_trainloader để tiền huấn luyện
# LƯU Ý: Sử dụng đường dẫn dữ liệu trên Kaggle
BASE_DATA_DIR = '/kaggle/input/cedardataset'
full_dataset = SignatureTrainDataset(
    org_dir=os.path.join(BASE_DATA_DIR, 'signatures/full_org'),
    forg_dir=os.path.join(BASE_DATA_DIR, 'signatures/full_forg'),
    transform=transform
)

train_loader = DataLoader(full_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2)

print(f"Sử dụng thiết bị: {DEVICE}")
print(f"Đã tải {len(full_dataset)} triplets để tiền huấn luyện.")
print(f"Mô hình sẽ được lưu tại: {SAVE_DIR}")

Sử dụng thiết bị: cuda
Đã tải 1320 triplets để tiền huấn luyện.
Mô hình sẽ được lưu tại: /kaggle/working/pretrained_models


In [4]:
# --- KHỞI TẠO VÀ HUẤN LUYỆN ---

# Khởi tạo mô hình tSSN với backbone ResNet-34
model = tSSN(backbone_name='resnet34', output_dim=512).to(DEVICE)

# Sử dụng Triplet Loss với khoảng cách Euclidean tiêu chuẩn
loss_fn = TripletLoss(margin=0.5, mode='euclidean').to(DEVICE)

# Optimizer
optimizer = optim.Adam(model.parameters(), lr=LEARNING_RATE)

# Vòng lặp huấn luyện
print("--- Bắt đầu tiền huấn luyện Feature Extractor ---")
model.train()
for epoch in range(NUM_EPOCHS):
    running_loss = 0.0
    progress_bar = tqdm(train_loader, desc=f"Epoch {epoch+1}/{NUM_EPOCHS}")
    
    for anchor, positive, negative in progress_bar:
        anchor, positive, negative = anchor.to(DEVICE), positive.to(DEVICE), negative.to(DEVICE)
        
        optimizer.zero_grad()
        
        anchor_feat, positive_feat, negative_feat = model(anchor, positive, negative)
        
        loss = loss_fn(anchor_feat, positive_feat, negative_feat)
        
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        progress_bar.set_postfix(loss=loss.item())
        
    epoch_loss = running_loss / len(train_loader)
    print(f"Epoch {epoch+1}/{NUM_EPOCHS} - Average Loss: {epoch_loss:.4f}")

print("--- Hoàn thành tiền huấn luyện ---")

# --- LƯU LẠI TRỌNG SỐ CỦA FEATURE EXTRACTOR ---
feature_extractor_state_dict = model.feature_extractor.state_dict()
save_path = os.path.join(SAVE_DIR, 'pretrained_feature_extractor.pth')
torch.save(feature_extractor_state_dict, save_path)

print(f"Trọng số của Feature Extractor đã được lưu tại: {save_path}")

Downloading: "https://download.pytorch.org/models/resnet34-b627a593.pth" to /root/.cache/torch/hub/checkpoints/resnet34-b627a593.pth
100%|██████████| 83.3M/83.3M [00:00<00:00, 184MB/s]


--- Bắt đầu tiền huấn luyện Feature Extractor ---


Epoch 1/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 1/35 - Average Loss: 0.0463


Epoch 2/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 2/35 - Average Loss: 0.0062


Epoch 3/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 3/35 - Average Loss: 0.0069


Epoch 4/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 4/35 - Average Loss: 0.0053


Epoch 5/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 5/35 - Average Loss: 0.0138


Epoch 6/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 6/35 - Average Loss: 0.0040


Epoch 7/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 7/35 - Average Loss: 0.0032


Epoch 8/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 8/35 - Average Loss: 0.0113


Epoch 9/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 9/35 - Average Loss: 0.0131


Epoch 10/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 10/35 - Average Loss: 0.0120


Epoch 11/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 11/35 - Average Loss: 0.0079


Epoch 12/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 12/35 - Average Loss: 0.0028


Epoch 13/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 13/35 - Average Loss: 0.0020


Epoch 14/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 14/35 - Average Loss: 0.0033


Epoch 15/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 15/35 - Average Loss: 0.0000


Epoch 16/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 16/35 - Average Loss: 0.0009


Epoch 17/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 17/35 - Average Loss: 0.0038


Epoch 18/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 18/35 - Average Loss: 0.0077


Epoch 19/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 19/35 - Average Loss: 0.0019


Epoch 20/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 20/35 - Average Loss: 0.0000


Epoch 21/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 21/35 - Average Loss: 0.0009


Epoch 22/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 22/35 - Average Loss: 0.0017


Epoch 23/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 23/35 - Average Loss: 0.0038


Epoch 24/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 24/35 - Average Loss: 0.0040


Epoch 25/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 25/35 - Average Loss: 0.0036


Epoch 26/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 26/35 - Average Loss: 0.0005


Epoch 27/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 27/35 - Average Loss: 0.0011


Epoch 28/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 28/35 - Average Loss: 0.0007


Epoch 29/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 29/35 - Average Loss: 0.0067


Epoch 30/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 30/35 - Average Loss: 0.0022


Epoch 31/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 31/35 - Average Loss: 0.0019


Epoch 32/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 32/35 - Average Loss: 0.0017


Epoch 33/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 33/35 - Average Loss: 0.0017


Epoch 34/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 34/35 - Average Loss: 0.0080


Epoch 35/35:   0%|          | 0/42 [00:00<?, ?it/s]

Epoch 35/35 - Average Loss: 0.0022
--- Hoàn thành tiền huấn luyện ---
Trọng số của Feature Extractor đã được lưu tại: /kaggle/working/pretrained_models/pretrained_feature_extractor.pth
