In [None]:
import os
import shutil
import random

# 파일을 train과 valid 폴더로 분할하는 함수
def split_data(images_dir, labels_dir, output_dir, split_ratio=0.9):
    # 파일 목록 가져오기 (이미지 파일과 레이블 파일은 동일한 이름을 가짐)
    image_files = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
    total_files = len(image_files)

    # 데이터를 무작위로 섞기
    random.shuffle(image_files)

    # train 데이터와 valid 데이터를 나누는 기준
    split_point = int(total_files * split_ratio)
    
    # train과 valid 폴더 경로 설정
    train_images_dir = os.path.join(output_dir, 'train', 'images')
    train_labels_dir = os.path.join(output_dir, 'train', 'labels')
    valid_images_dir = os.path.join(output_dir, 'valid', 'images')
    valid_labels_dir = os.path.join(output_dir, 'valid', 'labels')

    # 폴더가 존재하지 않으면 생성
    os.makedirs(train_images_dir, exist_ok=True)
    os.makedirs(train_labels_dir, exist_ok=True)
    os.makedirs(valid_images_dir, exist_ok=True)
    os.makedirs(valid_labels_dir, exist_ok=True)

    # train 데이터 복사
    for image_file in image_files[:split_point]:
        label_file = image_file.replace('.jpg', '.txt')
        
        # 이미지 파일과 레이블 파일을 각각의 폴더로 복사
        shutil.copy(os.path.join(images_dir, image_file), os.path.join(train_images_dir, image_file))
        shutil.copy(os.path.join(labels_dir, label_file), os.path.join(train_labels_dir, label_file))

    # valid 데이터 복사
    for image_file in image_files[split_point:]:
        label_file = image_file.replace('.jpg', '.txt')
        
        # 이미지 파일과 레이블 파일을 각각의 폴더로 복사
        shutil.copy(os.path.join(images_dir, image_file), os.path.join(valid_images_dir, image_file))
        shutil.copy(os.path.join(labels_dir, label_file), os.path.join(valid_labels_dir, label_file))

    print(f"Train data: {split_point} images")
    print(f"Valid data: {total_files - split_point} images")

# 경로 설정
images_dir = "images"  # 원본 이미지 파일이 있는 경로
labels_dir = "labels"  # 원본 레이블 파일이 있는 경로
output_dir = "output"  # 데이터를 저장할 train/valid 폴더를 만들 경로

# 분할 실행
split_data(images_dir, labels_dir, output_dir, split_ratio=0.9)
