In [5]:
print(torch.__version__)

1.11.0+cu102


In [6]:
import torch
from torch import nn, optim
from torch.utils.data import (Dataset, DataLoader, TensorDataset)
import tqdm

from torchvision.datasets import ImageFolder
from torchvision import transforms

# ImageFolder 함수를 사용해서 Dataset 작성
train_imgs = ImageFolder("taco_and_burrito/train/",
    transform=transforms.Compose([
        transforms.RandomCrop(224),
        transforms.ToTensor()]
))
test_imgs = ImageFolder("taco_and_burrito/test/",
    transform=transforms.Compose([
        transforms.CenterCrop(224),
        transforms.ToTensor()]
))

# DataLoader 작성
train_loader = DataLoader(
    train_imgs, batch_size=32, shuffle=True)
test_loader = DataLoader(
    test_imgs, batch_size=32, shuffle=False)

In [7]:
print(train_imgs.classes)
print(train_imgs.class_to_idx)

['burrito', 'taco']
{'burrito': 0, 'taco': 1}


In [8]:
from torchvision import models

# 사전 학습이 완료된 resnet18 불러오기
net = models.resnet18(pretrained=True)

# 모든 파라미터를 미분 대상에서 제외한다
for p in net.parameters():
    p.requires_grad=False

# 마지막 선형 계층을 변경한다
fc_input_dim = net.fc.in_features
net.fc = nn.Linear(fc_input_dim, 2)

In [9]:
def eval_net(net, data_loader, device="cpu"):
    # Dropout 및 BatchNorm을 무효화
    net.eval()
    ys = []
    ypreds = []
    for x, y in data_loader:
        # to 메서드로 계산을 실행할 디바이스로 전송
        x = x.to(device)
        y = y.to(device)
        # 확률이 가장 큰 클래스를 예측(리스트 2.1 참조)
        # 여기선 forward（추론） 계산이 전부이므로 자동 미분에
        # 필요한 처리는 off로 설정해서 불필요한 계산을 제한다
        with torch.no_grad():
            _, y_pred = net(x).max(1)
        ys.append(y)
        ypreds.append(y_pred)
    
    # 미니 배치 단위의 예측 결과 등을 하나로 묶는다
    ys = torch.cat(ys)
    ypreds = torch.cat(ypreds)
    # 예측 정확도 계산
    acc = (ys == ypreds).float().sum() / len(ys)
    return acc.item()

def train_net(net, train_loader, test_loader,only_fc=True,
              optimizer_cls=optim.Adam,
              loss_fn=nn.CrossEntropyLoss(),
              n_iter=10, device="cpu"):
    train_losses = []
    train_acc = []
    val_acc = []
    if only_fc:
        # 마지막 선형 계층의 파라미터만
        # optimizer에 전달
        optimizer = optimizer_cls(net.fc.parameters())
    else:
        optimizer = optimizer_cls(net.parameters())
    for epoch in range(n_iter):
        running_loss = 0.0
        # 신경망을 훈련 모드로 설정
        net.train()
        n = 0
        n_acc = 0
        # 시간이 많이 걸리므로 tqdm을 사용해서 진행바를 표시
        for i, (xx, yy) in tqdm.tqdm(enumerate(train_loader),
            total=len(train_loader)):
            xx = xx.to(device)
            yy = yy.to(device)
            h = net(xx)
            loss = loss_fn(h, yy)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
            n += len(xx)
            _, y_pred = h.max(1)
            n_acc += (yy == y_pred).float().sum().item()
        train_losses.append(running_loss / i)
        # 훈련 데이터의 예측 정확도
        train_acc.append(n_acc / n)

        # 검증 데이터의 예측 정확도
        val_acc.append(eval_net(net, test_loader, device))
        # epoch의 결과 표시
        print(epoch, train_losses[-1], train_acc[-1],
            val_acc[-1], flush=True)

In [10]:

# 신경망의 모든 파라미터를 GPU로 전송
net.to("cuda:0")
# 훈련 실행
train_net(net, train_loader, test_loader, n_iter=20, device="cuda:0")

100%|██████████| 23/23 [00:03<00:00,  6.08it/s]


0 0.7656007842584089 0.526685393258427 0.7166666984558105


100%|██████████| 23/23 [00:03<00:00,  6.11it/s]


1 0.5902653119780801 0.6980337078651685 0.6833333969116211


100%|██████████| 23/23 [00:03<00:00,  6.11it/s]


2 0.5325598052956841 0.7471910112359551 0.8000000715255737


100%|██████████| 23/23 [00:03<00:00,  6.22it/s]


3 0.46176799860867584 0.8286516853932584 0.8833333849906921


100%|██████████| 23/23 [00:03<00:00,  6.34it/s]


4 0.4307839240540158 0.8230337078651685 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.30it/s]


5 0.4079471840099855 0.8497191011235955 0.8833333849906921


100%|██████████| 23/23 [00:03<00:00,  6.21it/s]


6 0.36808416789228265 0.8595505617977528 0.8833333849906921


100%|██████████| 23/23 [00:03<00:00,  6.14it/s]


7 0.3639252978292378 0.8497191011235955 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.13it/s]


8 0.40293981676751917 0.8412921348314607 0.8833333849906921


100%|██████████| 23/23 [00:03<00:00,  6.17it/s]


9 0.40311451798135584 0.8328651685393258 0.8500000238418579


100%|██████████| 23/23 [00:03<00:00,  6.24it/s]


10 0.35035781833258545 0.8637640449438202 0.8833333849906921


100%|██████████| 23/23 [00:03<00:00,  6.24it/s]


11 0.3468848256902261 0.8764044943820225 0.8500000238418579


100%|██████████| 23/23 [00:03<00:00,  6.34it/s]


12 0.3231729441745715 0.8735955056179775 0.8333333730697632


100%|██████████| 23/23 [00:03<00:00,  6.37it/s]


13 0.34229322048750793 0.8707865168539326 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.35it/s]


14 0.3519919081167741 0.8525280898876404 0.8666667342185974


100%|██████████| 23/23 [00:03<00:00,  6.37it/s]


15 0.3364802267063748 0.8637640449438202 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.35it/s]


16 0.3145074295726689 0.8820224719101124 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.36it/s]


17 0.3287848796356808 0.8637640449438202 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.37it/s]


18 0.3640044223178517 0.848314606741573 0.9000000357627869


100%|██████████| 23/23 [00:03<00:00,  6.34it/s]


19 0.2829644388773225 0.8764044943820225 0.9000000357627869
