In [1]:
import os
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

import torch
import torch.nn.functional as F
import torch.nn as nn
from torch.utils.data import Dataset
from torchvision import datasets, transforms
from torchvision.datasets import ImageFolder
from torch.utils.data import DataLoader
import torchvision.models as models
from torchsummary import summary

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
!unzip -qq "/content/drive/MyDrive/selected_dataset.zip"

In [4]:
dataset = ImageFolder(root='/content/selected_dataset',                   # 다운로드 받은 폴더의 root 경로를 지정합니다.
                      transform=transforms.Compose([
                          transforms.ToTensor(), 
                      ]))

data_loader = DataLoader(dataset, 
                         batch_size=32, 
                         shuffle=True,
                        #  num_workers=8
                        )

In [5]:
# def make_weights(dataset, classes):
#     for cls in classes:
#         labels_map = {v:k for k, v in dataset.class_to_idx.items()}
#         count = len(labels_map[cls])    #각 클래스 데이터 수 카운트 
#         weight = 1/count    
#         weights = [weight] * count    #라벨이 뽑힐 가중치를 1/count로 동일하게 전체 라벨에 할당 
#         weight_list += weights
 
#     # return weight_list

In [6]:
# weights = make_weights(dataset, len(dataset.classes))
# weights = torch.DoubleTensor(weights)

In [7]:
dataset.classes

['L2_10',
 'L2_12',
 'L2_15',
 'L2_20',
 'L2_21',
 'L2_24',
 'L2_25',
 'L2_27',
 'L2_3',
 'L2_30',
 'L2_33',
 'L2_34',
 'L2_39',
 'L2_40',
 'L2_41',
 'L2_44',
 'L2_45',
 'L2_46',
 'L2_50',
 'L2_52']

In [8]:
images, labels = next(iter(data_loader))

In [9]:
images[0].shape

torch.Size([3, 100, 100])

In [10]:
# import matplotlib.pyplot as plt

# # ImageFolder의 속성 값인 class_to_idx를 할당
# labels_map = {v:k for k, v in dataset.class_to_idx.items()}
# # print(labels_map)
# figure = plt.figure(figsize=(12, 8))
# cols, rows = 8, 4

# # 이미지를 출력합니다. RGB 이미지로 구성되어 있습니다.
# for i in range(1, cols * rows + 1):
#     sample_idx = torch.randint(len(images), size=(1,)).item()
#     img, label = images[sample_idx], labels[sample_idx].item()
#     figure.add_subplot(rows, cols, i)
#     plt.title(labels_map[label])
#     plt.axis("off")
#     # 본래 이미지의 shape은 (3, 300, 300) 입니다.
#     # 이를 imshow() 함수로 이미지 시각화 하기 위하여 (300, 300, 3)으로 shape 변경을 한 후 시각화합니다.
#     plt.imshow(torch.permute(img, (1, 2, 0)))
# plt.show()

## Image Augmentation

In [11]:
# Image Transform을 지정합니다.
image_transform = transforms.Compose([
    # transforms.Resize(),                
    transforms.RandomHorizontalFlip(0.5),  # 50% 확률로 Horizontal Flip
    transforms.ToTensor(),                 # Tensor 변환 (정규화)
    transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)),
])

In [12]:
# 이미지 폴더로부터 데이터를 로드합니다.
dataset = ImageFolder(root='selected_dataset',            # 다운로드 받은 폴더의 root 경로를 지정합니다.
                      transform=image_transform) # Image Augmentation 적용      

In [13]:
# # Image Augmentation 이 적용된 DataLoader를 로드 합니다.
# data_loader = DataLoader(dataset, 
#                          batch_size=128, 
#                          shuffle=True,
#                          num_workers=8
#                         )

# # 1개의 배치를 추출합니다.
# images, labels = next(iter(data_loader))

In [14]:
# # ImageFolder의 속성 값인 class_to_idx를 할당
# labels_map = {v:k for k, v in dataset.class_to_idx.items()}
# figure = plt.figure(figsize=(24, 80))
# cols, rows = 8, 32

# # 이미지를 출력합니다. RGB 이미지로 구성되어 있습니다.
# for i in range(1, cols * rows + 1):
#     sample_idx = torch.randint(len(images), size=(1,)).item()
#     img, label = images[sample_idx], labels[sample_idx].item()
#     figure.add_subplot(rows, cols, i)
#     plt.title(labels_map[label])
#     plt.axis("off")

#     plt.imshow(torch.permute(img, (1, 2, 0)))
# plt.show()

In [15]:
from torch.utils.data import random_split


ratio = 0.8 # 학습셋(train set)의 비율을 설정합니다.

train_size = int(ratio * len(dataset))
test_size = len(dataset) - train_size
print(f'total: {len(dataset)}\ntrain_size: {train_size}\ntest_size: {test_size}')

# random_split으로 8:2의 비율로 train / test 세트를 분할합니다.
train_data, test_data = random_split(dataset, [train_size, test_size])

total: 23320
train_size: 18656
test_size: 4664


In [16]:
batch_size = 128 # batch_size 지정
# num_workers = 8 # Thread 숫자 지정 (병렬 처리에 활용할 쓰레드 숫자 지정)

train_loader = DataLoader(train_data, 
                          batch_size=batch_size,
                          shuffle=True, 
                        #   num_workers=num_workers
                         )
test_loader = DataLoader(test_data, 
                         batch_size=batch_size,
                         shuffle=False, 
                        #  num_workers=num_workers
                        )

In [17]:
images, labels = next(iter(train_loader))
images.shape, labels.shape

(torch.Size([128, 3, 100, 100]), torch.Size([128]))

In [18]:
# 1개의 이미지의 shape를 확인합니다.
images[0].shape

torch.Size([3, 100, 100])

In [19]:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

cuda:0


In [20]:
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

model_name = 'resnet18'

class resnet18(nn.Module):
    def __init__(self,):
        super().__init__()
        self.model = models.resnet18(pretrained=False)
        #self.model = EfficientNet.from_name('efficientnet-b1') efficient net 사용
        self.dropout = nn.Dropout(0.2)
        
        self.classifier = nn.Linear(1000, 20)
    
    def forward(self, images):
        outputs = self.model(images)
        outputs = self.dropout(outputs)
        outputs = self.classifier(outputs)
        return outputs   

In [21]:
model = resnet18() # Model 생성
model.to(device)  

  f"The parameter '{pretrained_param}' is deprecated since 0.13 and will be removed in 0.15, "


resnet18(
  (model): ResNet(
    (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
    (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (relu): ReLU(inplace=True)
    (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
    (layer1): Sequential(
      (0): BasicBlock(
        (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
      (1): BasicBlock(
        (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_runn

In [22]:
from torchsummary import summary

summary(model, (3, 100, 100))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1           [-1, 64, 50, 50]           9,408
       BatchNorm2d-2           [-1, 64, 50, 50]             128
              ReLU-3           [-1, 64, 50, 50]               0
         MaxPool2d-4           [-1, 64, 25, 25]               0
            Conv2d-5           [-1, 64, 25, 25]          36,864
       BatchNorm2d-6           [-1, 64, 25, 25]             128
              ReLU-7           [-1, 64, 25, 25]               0
            Conv2d-8           [-1, 64, 25, 25]          36,864
       BatchNorm2d-9           [-1, 64, 25, 25]             128
             ReLU-10           [-1, 64, 25, 25]               0
       BasicBlock-11           [-1, 64, 25, 25]               0
           Conv2d-12           [-1, 64, 25, 25]          36,864
      BatchNorm2d-13           [-1, 64, 25, 25]             128
             ReLU-14           [-1, 64,

In [23]:
# 옵티마이저를 정의합니다. 옵티마이저에는 model.parameters()를 지정해야 합니다.
optimizer = optim.Adam(model.parameters(), lr=0.0005)

# 손실함수(loss function)을 지정합니다. Multi-Class Classification 이기 때문에 CrossEntropy 손실을 지정하였습니다.
loss_fn = nn.CrossEntropyLoss()

In [24]:
from tqdm import tqdm  # Progress Bar 출력

def model_train(model, data_loader, loss_fn, optimizer, device):
    # 모델을 훈련모드로 설정합니다. training mode 일 때 Gradient 가 업데이트 됩니다. 반드시 train()으로 모드 변경을 해야 합니다.
    model.train()
    
    # loss와 accuracy 계산을 위한 임시 변수 입니다. 0으로 초기화합니다.
    running_loss = 0
    corr = 0
    
    # 예쁘게 Progress Bar를 출력하면서 훈련 상태를 모니터링 하기 위하여 tqdm으로 래핑합니다.
    prograss_bar = tqdm(data_loader)
    
    # mini-batch 학습을 시작합니다.
    for img, lbl in prograss_bar:
        # image, label 데이터를 device에 올립니다.
        img, lbl = img.to(device), lbl.to(device)
        # 누적 Gradient를 초기화 합니다.
        optimizer.zero_grad()
        
        # Forward Propagation을 진행하여 결과를 얻습니다.
        output = model(img)

        # 손실함수에 output, label 값을 대입하여 손실을 계산합니다.
        loss = loss_fn(output, lbl)

        # 오차역전파(Back Propagation)을 진행하여 미분 값을 계산합니다.
        loss.backward()
        
        # 계산된 Gradient를 업데이트 합니다.
        optimizer.step()
        
        # output의 max(dim=1)은 max probability와 max index를 반환합니다.
        # max probability는 무시하고, max index는 pred에 저장하여 label 값과 대조하여 정확도를 도출합니다.
        _, pred = output.max(dim=1)
        
        # pred.eq(lbl).sum() 은 정확히 맞춘 label의 합계를 계산합니다. item()은 tensor에서 값을 추출합니다.
        # 합계는 corr 변수에 누적합니다.
        corr += pred.eq(lbl).sum().item()
        
        # loss 값은 1개 배치의 평균 손실(loss) 입니다. img.size(0)은 배치사이즈(batch size) 입니다.
        # loss 와 img.size(0)를 곱하면 1개 배치의 전체 loss가 계산됩니다.
        # 이를 누적한 뒤 Epoch 종료시 전체 데이터셋의 개수로 나누어 평균 loss를 산출합니다.
        running_loss += loss.item() * img.size(0)
        
    # 누적된 정답수를 전체 개수로 나누어 주면 정확도가 산출됩니다.
    acc = corr / len(data_loader.dataset)
    
    # 평균 손실(loss)과 정확도를 반환합니다.
    # train_loss, train_acc
    return running_loss / len(data_loader.dataset), acc


In [25]:

def model_evaluate(model, data_loader, loss_fn, device):
    # model.eval()은 모델을 평가모드로 설정을 바꾸어 줍니다. 
    # dropout과 같은 layer의 역할 변경을 위하여 evaluation 진행시 꼭 필요한 절차 입니다.
    model.eval()
    
    # Gradient가 업데이트 되는 것을 방지 하기 위하여 반드시 필요합니다.
    with torch.no_grad():
        # loss와 accuracy 계산을 위한 임시 변수 입니다. 0으로 초기화합니다.
        corr = 0
        running_loss = 0
        
        # 배치별 evaluation을 진행합니다.
        for img, lbl in data_loader:
            # device에 데이터를 올립니다.
            img, lbl = img.to(device), lbl.to(device)
            
            # 모델에 Forward Propagation을 하여 결과를 도출합니다.
            output = model(img)
            
            # output의 max(dim=1)은 max probability와 max index를 반환합니다.
            # max probability는 무시하고, max index는 pred에 저장하여 label 값과 대조하여 정확도를 도출합니다.
            _, pred = output.max(dim=1)
            
            # pred.eq(lbl).sum() 은 정확히 맞춘 label의 합계를 계산합니다. item()은 tensor에서 값을 추출합니다.
            # 합계는 corr 변수에 누적합니다.
            corr += torch.sum(pred.eq(lbl)).item()
             # loss 값은 1개 배치의 평균 손실(loss) 입니다. img.size(0)은 배치사이즈(batch size) 입니다.
            # loss 와 img.size(0)를 곱하면 1개 배치의 전체 loss가 계산됩니다.
            # 이를 누적한 뒤 Epoch 종료시 전체 데이터셋의 개수로 나누어 평균 loss를 산출합니다.
            running_loss += loss_fn(output, lbl).item() * img.size(0)
        
        # validation 정확도를 계산합니다.
        # 누적한 정답숫자를 전체 데이터셋의 숫자로 나누어 최종 accuracy를 산출합니다.
        acc = corr / len(data_loader.dataset)
        
        # 결과를 반환합니다.
        # val_loss, val_acc
        return running_loss / len(data_loader.dataset), acc

In [26]:
# 최대 Epoch을 지정합니다.
num_epochs = 25

min_loss = np.inf

# Epoch 별 훈련 및 검증을 수행합니다.
for epoch in range(num_epochs):
    # Model Training
    # 훈련 손실과 정확도를 반환 받습니다.
    train_loss, train_acc = model_train(model, train_loader, loss_fn, optimizer, device)

    # 검증 손실과 검증 정확도를 반환 받습니다.
    val_loss, val_acc = model_evaluate(model, test_loader, loss_fn, device)   
    
    # val_loss 가 개선되었다면 min_loss를 갱신하고 model의 가중치(weights)를 저장합니다.
    if val_loss < min_loss:
        print(f'[INFO] val_loss has been improved from {min_loss:.5f} to {val_loss:.5f}. Saving Model!')
        min_loss = val_loss
        torch.save(model.state_dict(), f'{model_name}.pth')
    
    # Epoch 별 결과를 출력합니다.
    print(f'epoch {epoch+1:02d}, loss: {train_loss:.5f}, acc: {train_acc:.5f}, val_loss: {val_loss:.5f}, val_accuracy: {val_acc:.5f}')

100%|██████████| 146/146 [00:31<00:00,  4.69it/s]


[INFO] val_loss has been improved from inf to 4.85477. Saving Model!
epoch 01, loss: 1.54386, acc: 0.55542, val_loss: 4.85477, val_accuracy: 0.10656


100%|██████████| 146/146 [00:29<00:00,  4.99it/s]


[INFO] val_loss has been improved from 4.85477 to 2.19608. Saving Model!
epoch 02, loss: 1.00006, acc: 0.70958, val_loss: 2.19608, val_accuracy: 0.41081


100%|██████████| 146/146 [00:29<00:00,  4.94it/s]


epoch 03, loss: 0.74598, acc: 0.77911, val_loss: 3.21853, val_accuracy: 0.33769


100%|██████████| 146/146 [00:31<00:00,  4.70it/s]


epoch 04, loss: 0.58008, acc: 0.82488, val_loss: 9.02323, val_accuracy: 0.11149


100%|██████████| 146/146 [00:29<00:00,  4.89it/s]


epoch 05, loss: 0.47376, acc: 0.85367, val_loss: 5.20265, val_accuracy: 0.13572


100%|██████████| 146/146 [00:29<00:00,  4.89it/s]


[INFO] val_loss has been improved from 2.19608 to 0.91412. Saving Model!
epoch 06, loss: 0.38098, acc: 0.88325, val_loss: 0.91412, val_accuracy: 0.74228


100%|██████████| 146/146 [00:29<00:00,  4.88it/s]


[INFO] val_loss has been improved from 0.91412 to 0.58681. Saving Model!
epoch 07, loss: 0.31865, acc: 0.89928, val_loss: 0.58681, val_accuracy: 0.83019


100%|██████████| 146/146 [00:29<00:00,  4.92it/s]


epoch 08, loss: 0.25206, acc: 0.92045, val_loss: 1.00321, val_accuracy: 0.75579


100%|██████████| 146/146 [00:31<00:00,  4.68it/s]


epoch 09, loss: 0.22366, acc: 0.92769, val_loss: 1.41143, val_accuracy: 0.71377


100%|██████████| 146/146 [00:29<00:00,  4.91it/s]


[INFO] val_loss has been improved from 0.58681 to 0.47850. Saving Model!
epoch 10, loss: 0.20358, acc: 0.93466, val_loss: 0.47850, val_accuracy: 0.86557


100%|██████████| 146/146 [00:29<00:00,  4.92it/s]


epoch 11, loss: 0.17152, acc: 0.94447, val_loss: 0.58202, val_accuracy: 0.84391


100%|██████████| 146/146 [00:31<00:00,  4.70it/s]


epoch 12, loss: 0.14438, acc: 0.95347, val_loss: 1.39650, val_accuracy: 0.68268


100%|██████████| 146/146 [00:29<00:00,  4.90it/s]


epoch 13, loss: 0.14099, acc: 0.95326, val_loss: 0.71633, val_accuracy: 0.83062


100%|██████████| 146/146 [00:29<00:00,  4.91it/s]


epoch 14, loss: 0.12704, acc: 0.95846, val_loss: 5.53410, val_accuracy: 0.34627


100%|██████████| 146/146 [00:29<00:00,  4.93it/s]


epoch 15, loss: 0.10335, acc: 0.96457, val_loss: 11.02962, val_accuracy: 0.17860


100%|██████████| 146/146 [00:29<00:00,  4.94it/s]


epoch 16, loss: 0.10659, acc: 0.96612, val_loss: 0.56256, val_accuracy: 0.86943


100%|██████████| 146/146 [00:31<00:00,  4.69it/s]


epoch 17, loss: 0.09554, acc: 0.96854, val_loss: 2.56441, val_accuracy: 0.55146


100%|██████████| 146/146 [00:29<00:00,  4.94it/s]


epoch 18, loss: 0.07991, acc: 0.97347, val_loss: 4.68974, val_accuracy: 0.48049


100%|██████████| 146/146 [00:29<00:00,  4.96it/s]


epoch 19, loss: 0.11148, acc: 0.96264, val_loss: 0.61474, val_accuracy: 0.83426


100%|██████████| 146/146 [00:30<00:00,  4.74it/s]


epoch 20, loss: 0.09367, acc: 0.96896, val_loss: 1.96895, val_accuracy: 0.65137


100%|██████████| 146/146 [00:29<00:00,  4.94it/s]


epoch 21, loss: 0.06100, acc: 0.97915, val_loss: 0.74226, val_accuracy: 0.84970


100%|██████████| 146/146 [00:29<00:00,  4.94it/s]


epoch 22, loss: 0.08308, acc: 0.97309, val_loss: 2.03887, val_accuracy: 0.62672


100%|██████████| 146/146 [00:29<00:00,  4.95it/s]


epoch 23, loss: 0.07005, acc: 0.97524, val_loss: 0.65385, val_accuracy: 0.84455


100%|██████████| 146/146 [00:29<00:00,  4.93it/s]


epoch 24, loss: 0.05808, acc: 0.98113, val_loss: 2.21314, val_accuracy: 0.63379


100%|██████████| 146/146 [00:30<00:00,  4.73it/s]


[INFO] val_loss has been improved from 0.47850 to 0.41652. Saving Model!
epoch 25, loss: 0.06122, acc: 0.97802, val_loss: 0.41652, val_accuracy: 0.90523


In [27]:
model.load_state_dict(torch.load(f'{model_name}.pth'))

# 최종 검증 손실(validation loss)와 검증 정확도(validation accuracy)를 산출합니다.
final_loss, final_acc = model_evaluate(model, test_loader, loss_fn, device)
print(f'evaluation loss: {final_loss:.5f}, evaluation accuracy: {final_acc:.5f}')

evaluation loss: 0.40892, evaluation accuracy: 0.90437
