In [2]:
import os
import shutil
import random

def split_dataset_by_class(input_dir, output_dir, train_ratio=0.7, val_ratio=0.2, test_ratio=0.1):
    # assert train_ratio + val_ratio + test_ratio == 1.0, "比例總和必須為 1"

    # 對每個類別資料夾進行處理
    for class_name in os.listdir(input_dir):
        class_path = os.path.join(input_dir, class_name)
        if not os.path.isdir(class_path):
            continue  # 跳過非資料夾

        # 收集該類別的所有圖片
        images = [f for f in os.listdir(class_path) if f.lower().endswith(('.jpg', '.jpeg', '.png'))]
        random.shuffle(images)

        total = len(images)
        train_end = int(total * train_ratio)
        val_end = train_end + int(total * val_ratio)

        train_files = images[:train_end]
        val_files = images[train_end:val_end]
        test_files = images[val_end:]

        # 複製到各目的資料夾，保持類別結構
        for file_list, split in [(train_files, 'train'), (val_files, 'validation'), (test_files, 'test')]:
            split_class_dir = os.path.join(output_dir, split, class_name)
            os.makedirs(split_class_dir, exist_ok=True)
            for filename in file_list:
                src = os.path.join(class_path, filename)
                dst = os.path.join(split_class_dir, filename)
                shutil.copy(src, dst)

        print(f"類別 [{class_name}] 分配完成：Train={len(train_files)}, Val={len(val_files)}, Test={len(test_files)}")

# 🧪 使用範例
input_folder = 'done_image'       # 你的原始資料夾
output_folder = 'dataset_19'       # 要儲存分好類別的資料夾

split_dataset_by_class(input_folder, output_folder)


類別 [asparagus] 分配完成：Train=599, Val=171, Test=87
類別 [Baby Corn] 分配完成：Train=522, Val=149, Test=76
類別 [Beef Tomato] 分配完成：Train=334, Val=95, Test=49
類別 [chili] 分配完成：Train=300, Val=85, Test=44
類別 [Chinese chives] 分配完成：Train=251, Val=71, Test=37
類別 [coriander] 分配完成：Train=384, Val=109, Test=56
類別 [French beans] 分配完成：Train=454, Val=130, Test=66
類別 [Garlic sprouts] 分配完成：Train=175, Val=50, Test=25
類別 [Green bamboo shoots] 分配完成：Train=289, Val=82, Test=42
類別 [Okra] 分配完成：Train=732, Val=209, Test=105
類別 [onion] 分配完成：Train=211, Val=60, Test=31
類別 [pumpkin] 分配完成：Train=347, Val=99, Test=50
類別 [Shallots] 分配完成：Train=361, Val=103, Test=53
類別 [sweet potato] 分配完成：Train=270, Val=77, Test=39
類別 [Sweet potato leaves] 分配完成：Train=305, Val=87, Test=44
類別 [Water Lily] 分配完成：Train=93, Val=26, Test=15
類別 [White radish] 分配完成：Train=683, Val=195, Test=99
類別 [Winter melon] 分配完成：Train=190, Val=54, Test=28
類別 [zucchini] 分配完成：Train=326, Val=93, Test=47
