Розбиває підготовлені зображення на тренувальну і валідаційну вибірки (80/20)

In [None]:
import shutil
from pathlib import Path
from sklearn.model_selection import train_test_split

def split_dataset(source_root="data/processed",
                  target_root="data/final",
                  val_ratio=0.2,
                  seed=42):
    """
    Бере підпапки в source_root (color, grayscale, segmented),
    розбиває вміст кожної по класах на train/val та копіює в target_root.
    """
    source_root = Path(source_root)
    target_root = Path(target_root)

    for split in ("train", "val"):
        for t in source_root.iterdir():
            (target_root / split / t.name).mkdir(parents=True, exist_ok=True)

    for t in source_root.iterdir():
        if not t.is_dir():
            continue
        for cls in (t).iterdir():
            if not cls.is_dir():
                continue
            imgs = list(cls.glob("*.*"))
            train_imgs, val_imgs = train_test_split(imgs, test_size=val_ratio, random_state=seed)
            for img in train_imgs:
                shutil.copy(img, target_root / "train" / t.name / img.name)
            for img in val_imgs:
                shutil.copy(img, target_root / "val" / t.name / img.name)

    print(f"✅ Dataset split into train/val in {target_root}")

if __name__ == "__main__":
    split_dataset()
