In [2]:
import os
import xml.etree.ElementTree as ET
import random
from tqdm import tqdm
import shutil
import cv2
from pathlib import Path
from PIL import Image

# Process positive image set

In [None]:
def convert_txt_to_yolo(label_file, img_dir, img_ext=".jpg"):
    label_file = Path(label_file)
    name = label_file.stem
    img_path = Path(img_dir) / f"{name}{img_ext}"

    if not img_path.exists():
        print(f"Không tìm thấy ảnh cho {label_file}")
        return

    # Lấy kích thước ảnh
    with Image.open(img_path) as im:
        w, h = im.size

    new_lines = []
    with open(label_file, "r") as f:
        for line in f:
            line = line.strip().replace("(", "").replace(")", "")
            if not line:
                continue
            x1, y1, x2, y2, cls_id = map(int, line.split(","))

            # YOLO format (normalize về [0,1])
            xc = ((x1 + x2) / 2) / w
            yc = ((y1 + y2) / 2) / h
            ww = (x2 - x1) / w
            hh = (y2 - y1) / h

            cls_id = cls_id - 1  # đổi class 1–10 -> 0–9
            new_lines.append(f"{cls_id} {xc:.6f} {yc:.6f} {ww:.6f} {hh:.6f}")

    # Ghi đè chính file txt đó
    with open(label_file, "w") as f:
        f.write("\n".join(new_lines))

    print(f"✔ Đã convert: {label_file.name}")

In [6]:
gt_dir = Path("/media/HDD3/datvo/Yolo_with_NWPU-VHR-10_ObjectDetection/NWPU VHR-10 dataset/ground truth")
img_dir = Path("/media/HDD3/datvo/Yolo_with_NWPU-VHR-10_ObjectDetection/NWPU VHR-10 dataset/positive image set")


img_ext = ".jpg"

for label_file in sorted(gt_dir.glob("*.txt")):
    convert_txt_to_yolo(label_file, img_dir, img_ext)

print("Hoàn tất convert toàn bộ nhãn sang YOLO format!")

✔ Đã convert: 001.txt
✔ Đã convert: 002.txt
✔ Đã convert: 003.txt
✔ Đã convert: 004.txt
✔ Đã convert: 005.txt
✔ Đã convert: 006.txt
✔ Đã convert: 007.txt
✔ Đã convert: 008.txt
✔ Đã convert: 009.txt
✔ Đã convert: 010.txt
✔ Đã convert: 011.txt
✔ Đã convert: 012.txt
✔ Đã convert: 013.txt
✔ Đã convert: 014.txt
✔ Đã convert: 015.txt
✔ Đã convert: 016.txt
✔ Đã convert: 017.txt
✔ Đã convert: 018.txt
✔ Đã convert: 019.txt
✔ Đã convert: 020.txt
✔ Đã convert: 021.txt
✔ Đã convert: 022.txt
✔ Đã convert: 023.txt
✔ Đã convert: 024.txt
✔ Đã convert: 025.txt
✔ Đã convert: 026.txt
✔ Đã convert: 027.txt
✔ Đã convert: 028.txt
✔ Đã convert: 029.txt
✔ Đã convert: 030.txt
✔ Đã convert: 031.txt
✔ Đã convert: 032.txt
✔ Đã convert: 033.txt
✔ Đã convert: 034.txt
✔ Đã convert: 035.txt
✔ Đã convert: 036.txt
✔ Đã convert: 037.txt
✔ Đã convert: 038.txt
✔ Đã convert: 039.txt
✔ Đã convert: 040.txt
✔ Đã convert: 041.txt
✔ Đã convert: 042.txt
✔ Đã convert: 043.txt
✔ Đã convert: 044.txt
✔ Đã convert: 045.txt
✔ Đã conve

# Process Negative Set

In [None]:
neg_img_dir = Path("/media/HDD3/datvo/Yolo_with_NWPU-VHR-10_ObjectDetection/NWPU VHR-10 dataset/negative image set")
out_label_dir = Path("/media/HDD3/datvo/Yolo_with_NWPU-VHR-10_ObjectDetection/NWPU VHR-10 dataset/labels_negative")
out_label_dir.mkdir(parents=True, exist_ok=True)

ext_candidates = [".jpg", ".png", ".jpeg", ".JPG", ".PNG", ".JPEG"]

for ext in ext_candidates:
    for img_path in neg_img_dir.glob(f"*{ext}"):
        stem = img_path.stem
        out_file = out_label_dir / f"{stem}.txt"
        out_file.write_text("", encoding="utf-8")  
        print(f"Tạo nhãn rỗng cho: {out_file.name}")

print("Hoàn tất tạo nhãn rỗng cho negative images")



Tạo nhãn rỗng cho: 073.txt
Tạo nhãn rỗng cho: 060.txt
Tạo nhãn rỗng cho: 124.txt
Tạo nhãn rỗng cho: 066.txt
Tạo nhãn rỗng cho: 075.txt
Tạo nhãn rỗng cho: 051.txt
Tạo nhãn rỗng cho: 048.txt
Tạo nhãn rỗng cho: 043.txt
Tạo nhãn rỗng cho: 128.txt
Tạo nhãn rỗng cho: 086.txt
Tạo nhãn rỗng cho: 007.txt
Tạo nhãn rỗng cho: 134.txt
Tạo nhãn rỗng cho: 144.txt
Tạo nhãn rỗng cho: 113.txt
Tạo nhãn rỗng cho: 055.txt
Tạo nhãn rỗng cho: 071.txt
Tạo nhãn rỗng cho: 026.txt
Tạo nhãn rỗng cho: 141.txt
Tạo nhãn rỗng cho: 004.txt
Tạo nhãn rỗng cho: 044.txt
Tạo nhãn rỗng cho: 023.txt
Tạo nhãn rỗng cho: 097.txt
Tạo nhãn rỗng cho: 003.txt
Tạo nhãn rỗng cho: 015.txt
Tạo nhãn rỗng cho: 034.txt
Tạo nhãn rỗng cho: 076.txt
Tạo nhãn rỗng cho: 104.txt
Tạo nhãn rỗng cho: 147.txt
Tạo nhãn rỗng cho: 126.txt
Tạo nhãn rỗng cho: 119.txt
Tạo nhãn rỗng cho: 028.txt
Tạo nhãn rỗng cho: 149.txt
Tạo nhãn rỗng cho: 032.txt
Tạo nhãn rỗng cho: 011.txt
Tạo nhãn rỗng cho: 116.txt
Tạo nhãn rỗng cho: 098.txt
Tạo nhãn rỗng cho: 040.txt
T

In [12]:
start_idx = 651

for i, img_path in enumerate(sorted(neg_img_dir.glob("*.jpg")), start=start_idx):
    new_name = f"{i}.jpg"
    new_img_path = img_path.parent / new_name

   
    img_path.rename(new_img_path)

    
    old_label = out_label_dir / f"{img_path.stem}.txt"
    new_label = out_label_dir / f"{i}.txt"
    if old_label.exists():
        old_label.rename(new_label)
    else:
        new_label.write_text("", encoding="utf-8")

    print(f"✔ {img_path.name} -> {new_name}, nhãn {new_label.name}")

print("Hoàn tất đổi tên ảnh negative và nhãn rỗng từ 651-800")

✔ 001.jpg -> 651.jpg, nhãn 651.txt
✔ 002.jpg -> 652.jpg, nhãn 652.txt
✔ 003.jpg -> 653.jpg, nhãn 653.txt
✔ 004.jpg -> 654.jpg, nhãn 654.txt
✔ 005.jpg -> 655.jpg, nhãn 655.txt
✔ 006.jpg -> 656.jpg, nhãn 656.txt
✔ 007.jpg -> 657.jpg, nhãn 657.txt
✔ 008.jpg -> 658.jpg, nhãn 658.txt
✔ 009.jpg -> 659.jpg, nhãn 659.txt
✔ 010.jpg -> 660.jpg, nhãn 660.txt
✔ 011.jpg -> 661.jpg, nhãn 661.txt
✔ 012.jpg -> 662.jpg, nhãn 662.txt
✔ 013.jpg -> 663.jpg, nhãn 663.txt
✔ 014.jpg -> 664.jpg, nhãn 664.txt
✔ 015.jpg -> 665.jpg, nhãn 665.txt
✔ 016.jpg -> 666.jpg, nhãn 666.txt
✔ 017.jpg -> 667.jpg, nhãn 667.txt
✔ 018.jpg -> 668.jpg, nhãn 668.txt
✔ 019.jpg -> 669.jpg, nhãn 669.txt
✔ 020.jpg -> 670.jpg, nhãn 670.txt
✔ 021.jpg -> 671.jpg, nhãn 671.txt
✔ 022.jpg -> 672.jpg, nhãn 672.txt
✔ 023.jpg -> 673.jpg, nhãn 673.txt
✔ 024.jpg -> 674.jpg, nhãn 674.txt
✔ 025.jpg -> 675.jpg, nhãn 675.txt
✔ 026.jpg -> 676.jpg, nhãn 676.txt
✔ 027.jpg -> 677.jpg, nhãn 677.txt
✔ 028.jpg -> 678.jpg, nhãn 678.txt
✔ 029.jpg -> 679.jpg

In [13]:
# Copy ảnh negative -> positive image set
for img_path in sorted(neg_img_dir.glob("*.jpg")):
    shutil.copy(img_path, img_dir / img_path.name)
    print(f"Copy ảnh {img_path.name} -> {img_dir.name}")

# Copy nhãn negative (rỗng) -> ground truth
for lbl_path in sorted(out_label_dir.glob("*.txt")):
    shutil.copy(lbl_path, gt_dir / lbl_path.name)
    print(f"Copy nhãn {lbl_path.name} -> {gt_dir.name}")

print("Hoàn tất gộp negative vào positive")

Copy ảnh 651.jpg -> positive image set
Copy ảnh 652.jpg -> positive image set
Copy ảnh 653.jpg -> positive image set
Copy ảnh 654.jpg -> positive image set
Copy ảnh 655.jpg -> positive image set
Copy ảnh 656.jpg -> positive image set
Copy ảnh 657.jpg -> positive image set
Copy ảnh 658.jpg -> positive image set
Copy ảnh 659.jpg -> positive image set
Copy ảnh 660.jpg -> positive image set
Copy ảnh 661.jpg -> positive image set
Copy ảnh 662.jpg -> positive image set
Copy ảnh 663.jpg -> positive image set
Copy ảnh 664.jpg -> positive image set
Copy ảnh 665.jpg -> positive image set
Copy ảnh 666.jpg -> positive image set
Copy ảnh 667.jpg -> positive image set
Copy ảnh 668.jpg -> positive image set
Copy ảnh 669.jpg -> positive image set
Copy ảnh 670.jpg -> positive image set
Copy ảnh 671.jpg -> positive image set
Copy ảnh 672.jpg -> positive image set
Copy ảnh 673.jpg -> positive image set
Copy ảnh 674.jpg -> positive image set
Copy ảnh 675.jpg -> positive image set
Copy ảnh 676.jpg -> posit

# Split_Train_Test

In [14]:
out_dir = Path("/media/HDD3/datvo/Yolo_with_NWPU-VHR-10_ObjectDetection/NWPU VHR-10 dataset/data_truth")
train_ratio = 0.7
val_ratio = 0.15
test_ratio = 0.15

for split in ["train", "val", "test"]:
    os.makedirs(os.path.join(out_dir, "images", split), exist_ok=True)
    os.makedirs(os.path.join(out_dir, "labels", split), exist_ok=True)
    
image_files = [f for f in os.listdir(img_dir) if f.endswith(('.jpg', '.png'))]
image_files = [f for f in image_files if os.path.exists(os.path.join(gt_dir, os.path.splitext(f)[0] + ".txt"))]

random.shuffle(image_files)

n_total = len(image_files)
n_train = int(train_ratio * n_total)
n_val = int(val_ratio * n_total)
n_test = n_total - n_train - n_val


train_files = image_files[:n_train]
val_files = image_files[n_train:n_train + n_val]
test_files = image_files[n_train + n_val:]


def copy_files(files, split):
    for file in tqdm(files, desc=f"Copying {split}"):
        name = os.path.splitext(file)[0]
        img_src = os.path.join(img_dir, file)
        label_src = os.path.join(gt_dir, name + ".txt")

        img_dst = os.path.join(out_dir, "images", split, file)
        label_dst = os.path.join(out_dir, "labels", split, name + ".txt")

        shutil.copy(img_src, img_dst)
        shutil.copy(label_src, label_dst)
        
        
copy_files(train_files, "train")
copy_files(val_files, "val")
copy_files(test_files, "test")

Copying train: 100%|██████████| 560/560 [00:00<00:00, 4722.00it/s]
Copying val: 100%|██████████| 120/120 [00:00<00:00, 3658.06it/s]
Copying test: 100%|██████████| 120/120 [00:00<00:00, 6269.20it/s]
