In [1]:
#ランダムサンプリング用のコード
#入力元のディレクトリの画像をランダムで選んで出力先へ．
#入力ディレクトリ直下よりも下のディレクトリからもファイル取ってくる

import random
import shutil
from pathlib import Path

# 使用例
input_directory = r"C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\PatchPNG\Intact"
output_directory = r"C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\PatchPNG\Intact_DownSampled"
num_files_to_copy = 1963

def copy_random_images(input_dir, output_dir, num_files):
    # 対象となる画像ファイルの拡張子
    valid_extensions = {'.jpg', '.jpeg', '.png', '.bmp', '.gif', '.tiff', '.webp'}

    # 入力ディレクトリ配下（サブディレクトリ含む）の画像ファイルをリストアップ
    input_path = Path(input_dir)
    image_files = [
        p for p in input_path.rglob("*")
        if p.is_file() and p.suffix.lower() in valid_extensions
    ]

    # 指定された数だけランダムに選択
    selected_files = random.sample(image_files, min(num_files, len(image_files)))

    # 出力先ディレクトリが存在しない場合は作成
    output_path = Path(output_dir)
    output_path.mkdir(parents=True, exist_ok=True)

    # ファイルをコピー
    for src_path in selected_files:
        file_name = src_path.name
        dst_path = output_path / file_name

        # 同名のファイルが既に存在する場合、連番を付加して重複を回避
        base_name = src_path.stem
        ext = src_path.suffix
        counter = 1
        while dst_path.exists():
            dst_path = output_path / f"{base_name}_{counter}{ext}"
            counter += 1

        shutil.copy(src_path, dst_path)
        print(f"コピーしました: {file_name} → {dst_path.name}")



copy_random_images(input_directory, output_directory, num_files_to_copy)


コピーしました: b10_Intact_1772.png → b10_Intact_1772.png
コピーしました: g2_Intact_270.png → g2_Intact_270.png
コピーしました: r9_Intact_107.png → r9_Intact_107.png
コピーしました: b11_Intact_1150.png → b11_Intact_1150.png
コピーしました: b10_Intact_972.png → b10_Intact_972.png
コピーしました: s7_Intact_1009.png → s7_Intact_1009.png
コピーしました: b11_Intact_1437.png → b11_Intact_1437.png
コピーしました: r2_Intact_713.png → r2_Intact_713.png
コピーしました: r2_Intact_188.png → r2_Intact_188.png
コピーしました: b10_Intact_1482.png → b10_Intact_1482.png
コピーしました: g4_Intact_418.png → g4_Intact_418.png
コピーしました: r2_Intact_1005.png → r2_Intact_1005.png
コピーしました: r6_Intact_1974.png → r6_Intact_1974.png
コピーしました: r2_Intact_581.png → r2_Intact_581.png
コピーしました: r6_Intact_1469.png → r6_Intact_1469.png
コピーしました: g2_Intact_808.png → g2_Intact_808.png
コピーしました: b10_Intact_856.png → b10_Intact_856.png
コピーしました: r5_Intact_98.png → r5_Intact_98.png
コピーしました: g2_Intact_499.png → g2_Intact_499.png
コピーしました: g2_Intact_365.png → g2_Intact_365.png
コピーしました: b10_Intact_5.png → b10_In

In [2]:
#テストデータと訓練検証データをランダムで分けるためのコード
from pathlib import Path
import random
import shutil

# 使用例
input_directory = r"C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact"
output_directory1 = r"C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact"
output_directory2 = r"C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Test\Intact"
split_ratio = (0.8, 0.2) #dir1とdir2の比

def split_images(input_dir, output_dir1, output_dir2, ratio=(0.8, 0.2)):
    """
    画像を指定比率で2つのディレクトリにランダムに分割コピーする
    （サブディレクトリも含む）

    Parameters:
    - input_dir: 入力ディレクトリ
    - output_dir1: 出力ディレクトリ1
    - output_dir2: 出力ディレクトリ2
    - ratio: 分割比率のタプル (例: (0.8, 0.2))
    """
    input_path = Path(input_dir)
    output_path1 = Path(output_dir1)
    output_path2 = Path(output_dir2)

    valid_extensions = {'.jpg', '.jpeg', '.png', '.bmp', '.gif', '.tiff', '.webp'}

    # サブディレクトリも含めて画像ファイルを取得
    image_files = [f for f in input_path.rglob('*') if f.suffix.lower() in valid_extensions and f.is_file()]

    random.shuffle(image_files)
    total = len(image_files)
    split_index = int(total * ratio[0])

    images1 = image_files[:split_index]
    images2 = image_files[split_index:]

    # 出力ディレクトリを作成
    output_path1.mkdir(parents=True, exist_ok=True)
    output_path2.mkdir(parents=True, exist_ok=True)

    def copy_with_suffix(files, dest_dir):
        for file in files:
            dest_file = dest_dir / file.name
            counter = 1
            while dest_file.exists():
                dest_file = dest_dir / f"{file.stem}_{counter}{file.suffix}"
                counter += 1
            shutil.copy(file, dest_file)
            print(f"コピーしました: {file} → {dest_file}")

    copy_with_suffix(images1, output_path1)
    copy_with_suffix(images2, output_path2)



split_images(input_directory, output_directory1, output_directory2, split_ratio)


コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact\b10_Intact_1620.png → C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact\b10_Intact_1620.png
コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact\s7_Intact_100.png → C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact\s7_Intact_100.png
コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact\b10_Intact_2466.png → C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact\b10_Intact_2466.png
コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact\b11_Intact_309.png → C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact\b11_Intact_309.png
コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Train_KFold\Intact\b10_Intact_564.png → C:\Users\kyohe\Aerial_Photo_Classifier\20251209Data\Trainval\Intact\b10_Intact_564.png
コピーしました: C:\Users\kyohe\Aerial_Photo_Classifier\20251209Da