In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [5]:
import os
import shutil
from sklearn.model_selection import train_test_split

# 리사이즈된 이미지 카테고리가 위치한 기본 디렉토리
base_dir = '/content/drive/MyDrive/GDSC/'

# 카테고리 목록
categories = ['can', 'glass', 'paper', 'pet', 'plastic', 'styro', 'vinyl']

# 훈련, 검증, 테스트 디렉토리 생성
for category in categories:
    os.makedirs(os.path.join(base_dir, 'train', category), exist_ok=True)
    os.makedirs(os.path.join(base_dir, 'val', category), exist_ok=True)
    os.makedirs(os.path.join(base_dir, 'test', category), exist_ok=True)

# 데이터 분할 및 파일 이동
for category in categories:
    # 현재 카테고리에 대한 리사이즈된 이미지 경로
    category_path = os.path.join(base_dir, category + '_resized')

    # 모든 이미지 파일 경로 목록
    images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    # 훈련 및 테스트 분할
    train_val_imgs, test_imgs = train_test_split(images, test_size=0.1, random_state=42)

    # 훈련 분할을 훈련 및 검증으로 분할
    train_imgs, val_imgs = train_test_split(train_val_imgs, test_size=0.1, random_state=42)

    # 이미지를 해당 폴더로 이동하는 함수
    def move_images(image_paths, set_name):
        for img_path in image_paths:
            # 파일 이름 추출
            file_name = os.path.basename(img_path)

            # 목적지 경로 정의
            dest_path = os.path.join(base_dir, set_name, category, file_name)

            # 파일 이동
            shutil.move(img_path, dest_path)

    # 이미지 이동
    move_images(train_imgs, 'train')
    move_images(val_imgs, 'val')
    move_images(test_imgs, 'test')

print("이미지가 각각의 디렉토리로 성공적으로 이동되었습니다.")


이미지가 각각의 디렉토리로 성공적으로 이동되었습니다.


In [9]:
import os

# 이미지 개수를 확인하는 함수 정의
def count_images_in_subfolders(base_path, set_name):
    count = {}
    set_path = os.path.join(base_path, set_name)
    categories = os.listdir(set_path)

    for category in categories:
        category_path = os.path.join(set_path, category)
        images = os.listdir(category_path)
        count[category] = len(images)

    return count

# 기본 데이터셋 경로 설정
base_dir = '/content/drive/MyDrive/GDSC/'

# 훈련 세트 내의 각 카테고리별 이미지 개수 확인
train_images_count = count_images_in_subfolders(base_dir, 'train')
val_images_count = count_images_in_subfolders(base_dir, 'val')
test_images_count = count_images_in_subfolders(base_dir, 'test')


# 결과 출력
print("train 세트 내 이미지:")
for category, num_images in train_images_count.items():
    print(f"{category}: {num_images}개의 이미지")

print("val 세트 내 이미지:")
for category, num_images in val_images_count.items():
    print(f"{category}: {num_images}개의 이미지")

print("test 세트 내 이미지:")
for category, num_images in test_images_count.items():
    print(f"{category}: {num_images}개의 이미지")


train 세트 내 이미지:
can: 348개의 이미지
glass: 149개의 이미지
paper: 121개의 이미지
pet: 213개의 이미지
plastic: 214개의 이미지
styro: 122개의 이미지
vinyl: 225개의 이미지
val 세트 내 이미지:
can: 39개의 이미지
glass: 17개의 이미지
paper: 14개의 이미지
pet: 24개의 이미지
plastic: 24개의 이미지
styro: 14개의 이미지
vinyl: 25개의 이미지
test 세트 내 이미지:
can: 44개의 이미지
glass: 19개의 이미지
paper: 16개의 이미지
pet: 27개의 이미지
plastic: 27개의 이미지
styro: 16개의 이미지
vinyl: 28개의 이미지
