In [1]:
import os
import shutil
import random
from tqdm import tqdm

def prepare_dataset(src_root, dest_root, label_list=['COVID', 'Normal'], split_ratio=(0.7, 0.15, 0.15)):
    assert sum(split_ratio) == 1.0, "Ratios must sum to 1.0"
    os.makedirs(dest_root, exist_ok=True)

    for label in label_list:
        src_dir = os.path.join(src_root, label, 'images')
        files = os.listdir(src_dir)
        random.shuffle(files)

        n_total = len(files)
        n_train = int(split_ratio[0] * n_total)
        n_val = int(split_ratio[1] * n_total)

        split_sets = {
            'train': files[:n_train],
            'val': files[n_train:n_train + n_val],
            'test': files[n_train + n_val:]
        }

        for split in ['train', 'val', 'test']:
            dest_dir = os.path.join(dest_root, split, label.upper())
            os.makedirs(dest_dir, exist_ok=True)
            for fname in tqdm(split_sets[split], desc=f"{split.upper()} - {label}"):
                src_file = os.path.join(src_dir, fname)
                dest_file = os.path.join(dest_dir, fname)
                shutil.copy(src_file, dest_file)

# Usage
source = r"E:\covid_xray_classification\data\COVID-19_Radiography_Dataset"
target = r"E:\covid_xray_classification\data"
prepare_dataset(source, target, label_list=['COVID', 'Normal'])


TRAIN - COVID: 100%|███████████████████████████████████████████████████████████████| 2531/2531 [00:31<00:00, 81.02it/s]
VAL - COVID: 100%|███████████████████████████████████████████████████████████████████| 542/542 [00:06<00:00, 81.95it/s]
TEST - COVID: 100%|██████████████████████████████████████████████████████████████████| 543/543 [00:07<00:00, 76.60it/s]
TRAIN - Normal: 100%|██████████████████████████████████████████████████████████████| 7134/7134 [01:35<00:00, 74.84it/s]
VAL - Normal: 100%|████████████████████████████████████████████████████████████████| 1528/1528 [00:19<00:00, 78.31it/s]
TEST - Normal: 100%|███████████████████████████████████████████████████████████████| 1530/1530 [00:19<00:00, 77.03it/s]
