In [5]:
import os
import shutil
from tqdm import tqdm

# 원본 ImageNet1k 디렉토리 경로
src_dir = '/mnt/nas65/Dataset/ImageNet1K/ILSVRC/Data/CLS-LOC/train'
# 목표 디렉토리 경로
dst_dir = '/ssd_1/tak/train_10percent'

In [6]:
sampling_ratio = 0.1
# 각 클래스 폴더 탐색
for class_folder in tqdm(os.listdir(src_dir), desc="Copying images"):
    src_class_folder = os.path.join(src_dir, class_folder)
    dst_class_folder = os.path.join(dst_dir, class_folder)
    
    # 목표 디렉토리에 클래스 폴더 생성
    os.makedirs(dst_class_folder, exist_ok=True)
    
    # 클래스 폴더 내 이미지 정렬
    image_files = sorted(os.listdir(src_class_folder))
    num_samples = int(len(image_files) * sampling_ratio)

    
    
    # 상위 n개 이미지 선택
    selected_images = image_files[:num_samples]
      
    # 선택된 이미지를 목표 디렉토리로 복사
    for image in selected_images:
        src_image_path = os.path.join(src_class_folder, image)
        dst_image_path = os.path.join(dst_class_folder, image)
        shutil.copy(src_image_path, dst_image_path)

Copying images:   0%|          | 0/1000 [00:00<?, ?it/s]

Copying images: 100%|██████████| 1000/1000 [6:07:24<00:00, 22.04s/it]   


In [None]:
# 복사한 이미지가 있는 원래의 폴더
src_dir = '/data1/ImageNet1K/Annotations/Data/CLS-LOC/train_1000'

# 대응하는 이미지를 찾을 폴더
lookup_dir = '/mnt/nas65/Dataset/ImageNet1K/ILSVRC/Data/CLS-LOC/train_diff'

# 이미지를 복사할 새로운 폴더
dst_dir = '/ssd1/tak/train_10percent_IBT'

In [None]:
for class_folder in tqdm(os.listdir(src_dir), desc="Copying corresponding images"):
    src_class_folder = os.path.join(src_dir, class_folder)
    lookup_class_folder = os.path.join(lookup_dir, class_folder)
    dst_class_folder = os.path.join(dst_dir, class_folder)
    
    # 새로운 폴더에 클래스 폴더 생성
    os.makedirs(dst_class_folder, exist_ok=True)
    
    # 원래의 클래스 폴더 내 이미지 탐색
    for image_file in os.listdir(src_class_folder):
        # 이미지 파일 이름에서 확장자를 제거하고 마지막 부분만 추출 (예: n01440764_10026)
        base_name = os.path.splitext(image_file)[0].split('_')[-1]
        
        # 대응하는 이미지 파일들 찾기 (예: 10026_0.png, 10026_1.png, ..., 10026_5.png)
        for i in range(5):  # 0부터 5까지
            corresponding_image = f"{base_name}_{i}.png"
            src_image_path = os.path.join(lookup_class_folder, corresponding_image)
            dst_image_path = os.path.join(dst_class_folder, corresponding_image)
            
            # 대응하는 이미지 파일을 새로운 폴더에 복사
            if os.path.exists(src_image_path):
                shutil.copy(src_image_path, dst_image_path)