In [None]:
import os
import random
import shutil  # Dùng để di chuyển file

# Đường dẫn tới thư mục gốc chứa ảnh
image_dir = "/kaggle/input/data-image-vie/256"

# Đường dẫn để lưu ảnh đã chia
output_dir = "/kaggle/working/dataset"
train_dir = os.path.join(output_dir, "train")
val_dir = os.path.join(output_dir, "val")

# Tạo thư mục train/ và val/
os.makedirs(train_dir, exist_ok=True)
os.makedirs(val_dir, exist_ok=True)

# Lấy danh sách tất cả ảnh có trong thư mục
image_files = [f for f in os.listdir(image_dir) if f.endswith(".jpg")]

# Xáo trộn danh sách ảnh để tránh bias
random.shuffle(image_files)

# Chia 80% train, 20% val
split_ratio = 0.8
split_index = int(len(image_files) * split_ratio)

train_files = image_files[:split_index]
val_files = image_files[split_index:]

# Di chuyển file vào thư mục train/ và val/
for file in train_files:
    shutil.copy(os.path.join(image_dir, file), os.path.join(train_dir, file))

for file in val_files:
    shutil.copy(os.path.join(image_dir, file), os.path.join(val_dir, file))

# Kiểm tra số lượng ảnh sau khi chia
print(f"✅ Chia dữ liệu thành công!")
print(f"📂 {len(train_files)} ảnh trong thư mục train/: {train_dir}")
print(f"📂 {len(val_files)} ảnh trong thư mục val/: {val_dir}")

In [None]:
# Tạo file txt chứa danh sách ảnh
train_txt = os.path.join(output_dir, "train.txt")
val_txt = os.path.join(output_dir, "val.txt")

with open(train_txt, "w") as f:
    for file in train_files:
        f.write(file + "\n")

with open(val_txt, "w") as f:
    for file in val_files:
        f.write(file + "\n")

print(f"📄 Danh sách train lưu tại: {train_txt}")
print(f"📄 Danh sách val lưu tại: {val_txt}")

In [None]:
import torch
print(torch.cuda.is_available())  # True nếu GPU hoạt động
print(torch.cuda.device_count())  # Số lượng GPU
print(torch.cuda.get_device_name(0))  # Tên GPU

In [None]:
!pip install --no-cache-dir Pillow>=9.0.1
!pip install --no-cache-dir scipy==1.11.2
!pip install --no-cache-dir awscli
!pip install --no-cache-dir botocore
!pip install --no-cache-dir mlxtend
!pip install --no-cache-dir scikit-learn==1.3.1
!pip install --no-cache-dir matplotlib==3.8.0

In [None]:
!git clone https://github.com/sonhung3200/fixed_srec.git

In [None]:
!python3 -um src.train \
  --train-path "/kaggle/working/dataset/train" \
  --train-file "/kaggle/working/dataset/train.txt" \
  --eval-path "/kaggle/working/dataset/val" \
  --eval-file "/kaggle/working/dataset/val.txt" \
  --plot "/kaggle/working/model_output" \
  --batch 32 \
  --epochs 10 \
  --workers 4 \
  --lr-epochs 1 \
  --crop 64