In [1]:
import os
import shutil
from pathlib import Path

# 경로 설정
train_dir = "train"  # 원본 데이터가 있는 폴더
output_img_dir = "datasets/images"
output_mask_dir = "datasets/masks"

# 필요한 디렉토리 생성
for d in [output_img_dir, output_mask_dir]:
    os.makedirs(d, exist_ok=True)

def copy_and_duplicate_files(train_folder, img_output_dir, mask_output_dir):
    """
    train 폴더에서 이미지와 마스크를 분류해서 복사하고 2배로 만들기
    """
    train_path = Path(train_folder)
    
    # 모든 파일 가져오기
    all_files = list(train_path.glob("*"))
    
    # 이미지와 마스크 파일 분리
    image_files = []
    mask_files = []
    
    for file in all_files:
        if file.suffix.lower() in ['.jpg', '.jpeg', '.png', '.bmp', '.tiff']:
            if 'mask' in file.name.lower():
                mask_files.append(file)
            else:
                image_files.append(file)
    
    print(f"찾은 이미지 파일: {len(image_files)}개")
    print(f"찾은 마스크 파일: {len(mask_files)}개")
    
    # 이미지 파일 복사 (원본 + 복사본)
    for i, img_file in enumerate(image_files):
        # 원본 복사
        original_name = f"{i:04d}{img_file.suffix}"
        shutil.copy2(img_file, os.path.join(img_output_dir, original_name))
        
        # 복사본 생성 (파일명에 _copy 추가)
        copy_name = f"{i:04d}_copy{img_file.suffix}"
        shutil.copy2(img_file, os.path.join(img_output_dir, copy_name))
        
        print(f"이미지 복사 완료: {img_file.name} -> {original_name}, {copy_name}")
    
    # 마스크 파일 복사 (원본 + 복사본)
    for i, mask_file in enumerate(mask_files):
        # 원본 복사
        original_name = f"{i:04d}{mask_file.suffix}"
        shutil.copy2(mask_file, os.path.join(mask_output_dir, original_name))
        
        # 복사본 생성
        copy_name = f"{i:04d}_copy{mask_file.suffix}"
        shutil.copy2(mask_file, os.path.join(mask_output_dir, copy_name))
        
        print(f"마스크 복사 완료: {mask_file.name} -> {original_name}, {copy_name}")
    
    print(f"\n✅ 복사 완료!")
    print(f"이미지: {len(image_files) * 2}개 ({len(image_files)}개 -> {len(image_files) * 2}개)")
    print(f"마스크: {len(mask_files) * 2}개 ({len(mask_files)}개 -> {len(mask_files) * 2}개)")

# 실행
if __name__ == "__main__":
    copy_and_duplicate_files(train_dir, output_img_dir, output_mask_dir)

찾은 이미지 파일: 266개
찾은 마스크 파일: 266개
이미지 복사 완료: -10_png.rf.f482d15a73019b4e4973cfc2132865b3.jpg -> 0000.jpg, 0000_copy.jpg
이미지 복사 완료: -1_png.rf.2fd50081316b06310c32410a3e3528b9.jpg -> 0001.jpg, 0001_copy.jpg
이미지 복사 완료: -2025-05-02-114817_png.rf.9a882713be7482ee2d7badbe430197a6.jpg -> 0002.jpg, 0002_copy.jpg
이미지 복사 완료: -2025-05-02-114844_png.rf.a4f44d91c223fa3ac9de95b2930ec3ef.jpg -> 0003.jpg, 0003_copy.jpg
이미지 복사 완료: -2025-05-02-114955_png.rf.6d49cb1d45fad8bd8f56a518d079933e.jpg -> 0004.jpg, 0004_copy.jpg
이미지 복사 완료: -2025-05-29-101121_png.rf.07ad51ee8f7af02d8a39177524680960.jpg -> 0005.jpg, 0005_copy.jpg
이미지 복사 완료: -2025-05-29-101419_png.rf.602c4714025518726a65ceb5c1d330c1.jpg -> 0006.jpg, 0006_copy.jpg
이미지 복사 완료: -2_png.rf.11d2f8894033019ad0bafb256e048af9.jpg -> 0007.jpg, 0007_copy.jpg
이미지 복사 완료: -2_png.rf.acd06f3011ad0c94460854be0c5f8222.jpg -> 0008.jpg, 0008_copy.jpg
이미지 복사 완료: -3_png.rf.3d4ebda322b6934d6c4fc6ced06d8d42.jpg -> 0009.jpg, 0009_copy.jpg
이미지 복사 완료: -3_png.rf.599792fbdc5ec93c