In [15]:
import torch
import torchvision #  컴퓨터 비전 작업을 위한 여러 유틸리티와 사전 훈련된 모델을 제공
import torchvision.transforms as tr # : 데이터 전처리를 위한 torchvision.transforms 모듈을 불러오기
from torch.utils.data import DataLoader, Dataset
import numpy as np

In [16]:
transf = tr.Compose([tr.Resize(8),tr.ToTensor()])

# tr.Compose: 여러 개의 전처리 작업을 묶기 위한 메서드입니다. 리스트 안에 있는 전처리 작업들을 순차적으로 적용할 수 있도록 합니다.
# tr.ToTensor(): 이미지를 PyTorch 텐서로 변환하는 작업입니다. PyTorch에서는 모델에 입력으로 사용하기 위해 이미지를 텐서 형식으로 변환하는 것이 일반적입니다.

In [17]:
trainset = torchvision.datasets.CIFAR10(root='./data',train=True, download=True, transform=transf)
testset = torchvision.datasets.CIFAR10(root='./data',train=False, download=True, transform=transf)

# CIFAR-10은 "Canadian Institute for Advanced Research"에서 제공하는 이미지 데이터셋 중 하나로, 주로 컴퓨터 비전 분야에서 딥러닝 모델을 학습하고 평가하는데 사용됩니다.
# 이 데이터셋은 10개의 다른 클래스에 속하는 60,000장의 32x32 크기의 컬러 이미지로 구성되어 있습니다.
# CIFAR-10의 10개의 클래스는 다음과 같습니다:
'''
Airplane (비행기)
Automobile (자동차)
Bird (새)
Cat (고양이)
Deer (사슴)
Dog (개)
Frog (개구리)
Horse (말)
Ship (배)
Truck (트럭)
'''

# train=True: 학습용 데이터를 가져옵니다.
# download=True: 데이터가 로컬에 없는 경우 다운로드합니다.
# transform=transf: 지정한 전처리를 적용합니다.

Files already downloaded and verified
Files already downloaded and verified


'\nAirplane (비행기)\nAutomobile (자동차)\nBird (새)\nCat (고양이)\nDeer (사슴)\nDog (개)\nFrog (개구리)\nHorse (말)\nShip (배)\nTruck (트럭)\n'

In [18]:
trainset[0][0].size()

torch.Size([3, 8, 8])

In [19]:
trainloader = DataLoader(trainset,batch_size = 50, shuffle = True, num_workers = 2)
testloader = DataLoader(testset,batch_size = 50, shuffle = True, num_workers = 2)

# trainset: 로드할 학습 데이터셋을 지정합니다.
# batch_size=50: 한 번에 로드할 배치 크기를 지정합니다. 여기서는 50개의 데이터를 한 배치로 사용하겠다고 설정했습니다.
# num_workers=2: 데이터를 로드하는 데 사용할 worker(작업자)의 수를 지정합니다. 이를 통해 데이터 로딩이 병렬로 처리되어 속도를 향상시킬 수 있습니다.

# 이해를 잘 하지를 못해서 추가 설명

# batch_size=50: 학습에 사용될 데이터를 한 번에 몇 개씩 모델에 입력으로 제공할지를 결정하는 파라미터입니다.
# 여기서는 한 번에 50개의 데이터를 모델에 제공하겠다고 설정했습니다. 배치 크기는 메모리 사용과 모델 학습의 효율성에 영향을 미칩니다. 더 큰 배치 크기는 더 많은 메모리를 사용하지만, 계산 효율이 높아질 수 있습니다.

In [20]:
len(trainloader) #  1000번의 반복(iteration)을 통해 모델이 학습될 것이라는 의미입니다.

1000

In [21]:
# dataiter = iter(trainloader)
# images, labels = dataiter.next()
# 왜 실행이 안 되지...?

AttributeError: '_MultiProcessingDataLoaderIter' object has no attribute 'next'

In [None]:
# images.size()
# 왜 실행이 안 되지...?