In [3]:
import os
import shutil
from glob import glob
import numpy as np

def split_data(source_folder, dest_folder, train_size=0.8, val_size=0.1, test_size=0.1):
    # train, val, testディレクトリを作成
    train_dir = os.path.join(dest_folder, 'train')
    val_dir = os.path.join(dest_folder, 'valid')
    test_dir = os.path.join(dest_folder, 'test')
    
    if not os.path.exists(train_dir):
        os.makedirs(train_dir)
    if not os.path.exists(val_dir):
        os.makedirs(val_dir)
    if not os.path.exists(test_dir):
        os.makedirs(test_dir)
    
    # 各サブフォルダに対して処理
    for folder_name in os.listdir(source_folder):
        folder_path = os.path.join(source_folder, folder_name)
        
        # 各データセットのサブフォルダを作成
        train_subdir = os.path.join(train_dir, folder_name)
        val_subdir = os.path.join(val_dir, folder_name)
        test_subdir = os.path.join(test_dir, folder_name)
        os.makedirs(train_subdir, exist_ok=True)
        os.makedirs(val_subdir, exist_ok=True)
        os.makedirs(test_subdir, exist_ok=True)
        
        # 画像ファイルリストを取得
        images = glob(os.path.join(folder_path, '*.jpg'))  # JPEG形式を想定
        np.random.shuffle(images)
        
        # 分割ポイントを計算
        train_split = int(len(images) * train_size)
        val_split = train_split + int(len(images) * val_size)
        
        # データを対応するフォルダに移動
        for i, img in enumerate(images):
            if i < train_split:
                shutil.copy(img, os.path.join(train_subdir, os.path.basename(img)))
            elif i < val_split:
                shutil.copy(img, os.path.join(val_subdir, os.path.basename(img)))
            else:
                shutil.copy(img, os.path.join(test_subdir, os.path.basename(img)))

# パス設定
source_folder = './images'
dest_folder = './data'

# データを分割
split_data(source_folder, dest_folder)
