In [4]:
import torch
from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor
import matplotlib.pyplot as plt

### 데이터셋 불러오기
- root: 학습/테스트 데이터가 저장되는 경로
- train: 학습용 또는 테스트용 데이터셋 여부를 지정
- download=True: root 에 데이터가 없는 경우 인터넷에서 다운로드
- transform 과 target_transform: 특징(feature)과 정답(label) 변형(transform)을 지정합니다.

In [None]:
training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor()
)

test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

In [None]:
# 파일에서 사용자 정의 데이터셋 만들기
#  __init__: 객체 생성 때 한 번만 실행됨, 이미지+주석 파일 초기화
# __len__: 데이터셋의 샘플 개수 반환
# __getitem__: 주어진 인덱스 idx 에 해당하는 샘플을 데이터셋에서 불러오고 반환
            #  이미지 위치 식별, read_image: 이미지를 텐서로 변환, label(정답) 가져옴,  
            #  텐서 이미지, 라벨 --> dict으로 반환
            
import os
import pandas as pd
from torchvision.io import read_image

class CustomImageDataset(Dataset):
    def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
        self.img_labels = pd.read_csv(annotations_file, names=['file_name', 'label'])
        self.img_dir = img_dir
        self.transform = transform
        self.target_transform = target_transform

    def __len__(self):
        return len(self.img_labels)

    def __getitem__(self, idx):
        img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
        image = read_image(img_path)
        label = self.img_labels.iloc[idx, 1]
        if self.transform:
            image = self.transform(image)
        if self.target_transform:
            label = self.target_transform(label)
        return image, label