# AuraNet Training on Kaggle

Notebook này dùng để chạy training AuraNet trên môi trường Kaggle.

## Thiết lập môi trường

Trước tiên, thiết lập các thư mục và sao chép các file cần thiết.

In [None]:
import os
import sys
import shutil

# Thiết lập các đường dẫn
WORKING_DIR = "/kaggle/working/AuraNet"
INPUT_DIR = "/kaggle/input"
AURANET_CODE_DIR = "/kaggle/input/auranet-code"  # Thay đổi tùy theo tên dataset của bạn

# Tạo thư mục làm việc
os.makedirs(WORKING_DIR, exist_ok=True)

# Thêm đường dẫn vào Python path
sys.path.append(WORKING_DIR)
sys.path.append(os.path.join(WORKING_DIR, 'src'))

print("Environment setup completed.")

## Sao chép mã nguồn AuraNet

In [None]:
# Sao chép tất cả file từ input dataset vào working directory
!cp -r {AURANET_CODE_DIR}/* {WORKING_DIR}/

# Kiểm tra file đã được sao chép
!ls -la {WORKING_DIR}

## Cài đặt thư viện cần thiết

In [None]:
# Cài đặt các thư viện cần thiết
!pip install -r {WORKING_DIR}/requirements_kaggle.txt

## Cấu hình training

In [None]:
# Thiết lập các tham số training
CONFIG_FILE = os.path.join(WORKING_DIR, "config_celeb_df_memory_optimized.yaml")
MODE = "pretrain"  # Options: pretrain, finetune, both
NUM_GPUS = 2
USE_PRETRAINED = "yes"
PRETRAINED_PATH = "/kaggle/input/convnextv2-pico/pytorch/default/1/convnextv2_pico_1k_224_fcmae.pt"

print(f"Training configuration:\n")
print(f"- Config file: {CONFIG_FILE}")
print(f"- Mode: {MODE}")
print(f"- GPUs: {NUM_GPUS}")
print(f"- Use pretrained: {USE_PRETRAINED}")
print(f"- Pretrained path: {PRETRAINED_PATH}")

## Kiểm tra GPU

In [None]:
# Kiểm tra GPU có sẵn
!nvidia-smi

## Bắt đầu training

In [None]:
# Chạy training
!python {WORKING_DIR}/train_celeb_df.py \
    --config {CONFIG_FILE} \
    --mode {MODE} \
    --data_root {INPUT_DIR} \
    --gpus {NUM_GPUS} \
    --use_pretrained {USE_PRETRAINED} \
    --pretrained_path {PRETRAINED_PATH} \
    --kaggle \
    --kaggle_working_dir {WORKING_DIR}

## Kiểm tra kết quả

In [None]:
# Kiểm tra thư mục logs
LOGS_DIR = os.path.join(WORKING_DIR, "logs")
!ls -la {LOGS_DIR}/celeb_df/

## Lưu checkpoints

Đảm bảo lưu checkpoints ra ngoài để có thể tiếp tục training sau này.

In [None]:
# Nén thư mục logs để tải xuống
!tar -czvf /kaggle/working/auranet_logs.tar.gz {LOGS_DIR}

print("Logs compressed and ready for download.")