PyTorch에서 데이터를 전처리하는 과정은 일반적으로 torchvision 라이브러리의 transforms 모듈을 사용하여 이루어집니다. 여기서는 이미지 데이터를 처리하는 예시를 중심으로 설명하겠습니다. transforms는 이미지의 크기 조정, 정규화, 텐서 변환 등의 작업을 도와줍니다.

1. 기본적인 이미지 전처리 예시
아래는 PyTorch를 사용하여 이미지 데이터를 전처리하는 기본적인 예시입니다.

In [None]:
import torchvision.transforms as transforms
from PIL import Image

# 전처리 작업 정의
transform = transforms.Compose([
    transforms.Resize((256, 256)),       # 이미지 크기 조정
    transforms.CenterCrop(224),          # 중앙을 기준으로 크롭
    transforms.ToTensor(),               # 이미지를 텐서로 변환
    transforms.Normalize(mean=[0.485, 0.456, 0.406], 
                         std=[0.229, 0.224, 0.225])  # 정규화
])

# 이미지 로드 및 전처리 적용
image = Image.open('path_to_image.jpg')
image = transform(image)


2. 전처리를 Dataset과 함께 사용하기
PyTorch에서는 Dataset 클래스와 DataLoader를 함께 사용하여 데이터를 로드하고 전처리합니다.

In [None]:
from torchvision.datasets import ImageFolder
from torch.utils.data import DataLoader

# Dataset 생성
dataset = ImageFolder(root='data/train', transform=transform)

# DataLoader 생성
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)


3. 사용자 정의 전처리
필요한 경우, 사용자 정의 전처리 함수를 작성할 수 있습니다. 이를 위해 transforms.Lambda를 사용합니다.

In [None]:
def custom_preprocessing(img):
    # 사용자 정의 전처리 코드
    return img

transform = transforms.Compose([
    transforms.Resize((256, 256)),
    transforms.Lambda(lambda img: custom_preprocessing(img)),
    transforms.ToTensor(),
])
