In [40]:
import timm

In [41]:
import numpy as np
import pandas as pd
import torch
import cv2 as cv
import os
import glob
import matplotlib.pyplot as plt
import torch.nn as nn
import torchvision
import timm
import torchvision.transforms as transforms
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm
import random as rand

In [42]:
device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')

In [43]:
file_path = "./"
train_df = pd.read_csv('train.csv')
train_df.head(10)

Unnamed: 0,file_name,label
0,001.PNG,9
1,002.PNG,4
2,003.PNG,1
3,004.PNG,1
4,005.PNG,6
5,006.PNG,1
6,007.PNG,5
7,008.PNG,8
8,009.PNG,7
9,010.PNG,7


In [69]:
img_set[1]

'087.PNG'

In [44]:
img_folder = file_path  + 'train'
img_set  = os.listdir(img_folder)
print(img_folder)
img_set[0]

./train


'001.PNG'

In [45]:
img_list = []
for i in range(len(os.listdir(img_folder))):
    img_list.append(img_folder +'/' + os.listdir((os.path.join(img_folder)))[0])

In [46]:
def get_train_data(data_dir):
    img_path_list = []
    label_list = []
    
    for i in range(len(os.listdir(data_dir))):
        img_path_list.append(data_dir +'/' + os.listdir((os.path.join(data_dir)))[i])
        img_path_list.sort(key = lambda x : int(x.split('/')[-1].split('.')[0]))
    
    label_list.extend(train_df['label'])
    
    return img_path_list,label_list

def get_test_data(data_dir):
    img_path_list = []
    for i in range(len(os.listdir(data_dir))):
        img_path_list.append(data_dir +'/' + os.listdir((os.path.join(data_dir)))[i])
        img_path_list.sort(key = lambda x : int(x.split('/')[-1].split('.')[0]))

    return img_path_list

In [47]:
img_folder
img_folder2 = file_path +'test'

In [48]:
all_img_path, all_label = get_train_data(img_folder)
test_img_path = get_test_data(img_folder2)

In [49]:
len(test_img_path)

199

In [50]:
min(all_label)

0

In [51]:
class Custom_dataset(Dataset):
    def __init__(self, img_path_list, label_list, train_mode = True, transforms = None):
        self.train_mode = train_mode
        self.img_path_list = img_path_list
        self.label_list = label_list
        self.transforms = transforms
    
    def __len__(self):
        return len(self.label)
    
    def __getitem__(self, idx):
        img_path = self.img_path_list[idx]
        image = cv.imread(img_path)

            
        if self.train_mode and transforms is not None:
            label = self.label_list[idx]
            augmentation = rand.randint(0,8)
            if augmentation < 3:
                pass
            
            elif augmentation == 3:
                image = cv.rotate(image, cv.ROTATE_90_CLOCKWISE)
            
            elif augmentation == 4:
                image = cv.rotate(image, cv.ROTATE_90_CLOCKWISE)
            
            elif augmentation == 5:
                image = image[::-1].copy()
                
            elif augmentation == 6:
                image = image[:,::-1].copy()
            
            elif augmentation == 7:
                image = image[::-1,::-1,:].copy()
            image = self.transforms(image)
            

            return image, label
        else:
            return self.transforms(image)
        
    def __len__(self):
        return len(self.img_path_list)

In [52]:
train_len = int(len(all_img_path) * 0.8)
val_len = int(len(all_img_path) * 0.8)

train_img_path = all_img_path[:train_len]
train_label  = all_label[:train_len]

val_img_path = all_img_path[train_len:]
val_label = all_label[train_len:]

In [53]:
print(len(val_label))
print(len(train_label))

145
578


In [54]:
train_trans = transforms.Compose([
        transforms.ToPILImage(), #numpy에서 pil이미지로
        transforms.Resize([128, 128]),
        transforms.ToTensor(),
        transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

test_trans = transforms.Compose([
    transforms.ToPILImage(),
    transforms.Resize([128, 128]),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

In [55]:
traindataset = Custom_dataset(train_img_path, train_label, True, train_trans)
train_loader = DataLoader(traindataset, batch_size = 16, shuffle = True)

valdataset = Custom_dataset(val_img_path, val_label, True, test_trans)
val_loader = DataLoader(valdataset, batch_size = 16, shuffle = False)

In [56]:
from torchsummary import summary

In [57]:
class Custom_model(nn.Module):
    def __init__(self):
        super(Custom_model, self).__init__()
        self.model = timm.create_model('vgg16', pretrained = True, num_classes = 10)
        
    def forward(self, x):
        x = self.model(x)
        return x

In [58]:
model = Custom_model().to(device)

In [59]:
summary(model, input_size = (3, 128, 128))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1         [-1, 64, 128, 128]           1,792
              ReLU-2         [-1, 64, 128, 128]               0
            Conv2d-3         [-1, 64, 128, 128]          36,928
              ReLU-4         [-1, 64, 128, 128]               0
         MaxPool2d-5           [-1, 64, 64, 64]               0
            Conv2d-6          [-1, 128, 64, 64]          73,856
              ReLU-7          [-1, 128, 64, 64]               0
            Conv2d-8          [-1, 128, 64, 64]         147,584
              ReLU-9          [-1, 128, 64, 64]               0
        MaxPool2d-10          [-1, 128, 32, 32]               0
           Conv2d-11          [-1, 256, 32, 32]         295,168
             ReLU-12          [-1, 256, 32, 32]               0
           Conv2d-13          [-1, 256, 32, 32]         590,080
             ReLU-14          [-1, 256,

In [60]:
criterion = nn.CrossEntropyLoss()
optim = torch.optim.Adam(model.parameters(), lr = 1e-3)

In [61]:
def train(model, dataloader, val_loader, optimizer):
    n = len(dataloader)
    
    for epoch in range(1, 10):
        model.train()
        running_loss = 0
        
        for img, label in tqdm(iter(dataloader)):
            img, label = img.to(device), label.to(device)
            optimizer.zero_grad()
            
            pred = model(img)
            loss = criterion(pred, label)
            
            loss.backward()
            optimizer.step()
            
            running_loss += loss.item()
        print('Epoch : ', epoch, 'Loss : ', running_loss / len(dataloader))
        
        model.eval()
        
        val_loss = 0
        correct = 0
        with torch.no_grad():
            for img, label in tqdm(iter(val_loader)):
                img, label = img.to(device), label.to(device)
                pred = model(img)
                val_loss += criterion(pred, label)
                pred = pred.argmax(dim = 1, keepdim = True)
                correct += pred.eq(label.view_as(pred)).sum().item()
        val_acc = 100 * correct / len(val_loader)
        print('Val loss : ', val_loss / len(val_loader), 'Accuracy : ', val_acc , 'correct : ', correct)
        torch.save(model.state_dict(), 'best_model.pth')    

In [62]:
train(model, train_loader, val_loader, optim)

100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.50it/s]


Epoch :  1 Loss :  2.7200521069603996


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.17it/s]


Val loss :  tensor(2.3254, device='cuda:0') Accuracy :  120.0 correct :  12


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.46it/s]


Epoch :  2 Loss :  2.3215243494188464


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.11it/s]


Val loss :  tensor(2.3052, device='cuda:0') Accuracy :  120.0 correct :  12


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.50it/s]


Epoch :  3 Loss :  2.2534547528705082


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.15it/s]


Val loss :  tensor(3.7013, device='cuda:0') Accuracy :  130.0 correct :  13


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.50it/s]


Epoch :  4 Loss :  2.439782000876762


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.14it/s]


Val loss :  tensor(2.3112, device='cuda:0') Accuracy :  230.0 correct :  23


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.48it/s]


Epoch :  5 Loss :  2.2169705178286576


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.16it/s]


Val loss :  tensor(2.0922, device='cuda:0') Accuracy :  380.0 correct :  38


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.50it/s]


Epoch :  6 Loss :  2.2169615352475964


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.10it/s]


Val loss :  tensor(2.4063, device='cuda:0') Accuracy :  250.0 correct :  25


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.51it/s]


Epoch :  7 Loss :  2.249227398150676


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.09it/s]


Val loss :  tensor(2.2935, device='cuda:0') Accuracy :  130.0 correct :  13


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.48it/s]


Epoch :  8 Loss :  2.034423451165895


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.14it/s]


Val loss :  tensor(2.0417, device='cuda:0') Accuracy :  380.0 correct :  38


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.49it/s]


Epoch :  9 Loss :  1.8999107302846134


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.11it/s]


Val loss :  tensor(2.2696, device='cuda:0') Accuracy :  310.0 correct :  31


In [63]:
check_point = 'best_model.pth'

check_point = torch.load(check_point)
model = Custom_model().to(device)
model.load_state_dict(check_point)
train(model, train_loader, val_loader, optim)

100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.55it/s]


Epoch :  1 Loss :  1.9859446480467513


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.04it/s]


Val loss :  tensor(2.2958, device='cuda:0') Accuracy :  340.0 correct :  34


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.51it/s]


Epoch :  2 Loss :  1.9773171753496737


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.04it/s]


Val loss :  tensor(1.9707, device='cuda:0') Accuracy :  390.0 correct :  39


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.55it/s]


Epoch :  3 Loss :  1.9581925675675675


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.14it/s]


Val loss :  tensor(2.1302, device='cuda:0') Accuracy :  300.0 correct :  30


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.55it/s]


Epoch :  4 Loss :  1.9633793669777948


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.08it/s]


Val loss :  tensor(2.1843, device='cuda:0') Accuracy :  300.0 correct :  30


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.55it/s]


Epoch :  5 Loss :  1.9583353480777226


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.09it/s]


Val loss :  tensor(2.2501, device='cuda:0') Accuracy :  310.0 correct :  31


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.58it/s]


Epoch :  6 Loss :  1.9544097958384334


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.08it/s]


Val loss :  tensor(2.1317, device='cuda:0') Accuracy :  270.0 correct :  27


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.59it/s]


Epoch :  7 Loss :  2.0022925009598604


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.18it/s]


Val loss :  tensor(2.2679, device='cuda:0') Accuracy :  280.0 correct :  28


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.50it/s]


Epoch :  8 Loss :  1.991623056901468


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.04it/s]


Val loss :  tensor(2.2191, device='cuda:0') Accuracy :  320.0 correct :  32


100%|███████████████████████████████████████████████████████████████████████████████████| 37/37 [00:10<00:00,  3.54it/s]


Epoch :  9 Loss :  1.977701728408401


100%|███████████████████████████████████████████████████████████████████████████████████| 10/10 [00:02<00:00,  4.01it/s]


Val loss :  tensor(2.2162, device='cuda:0') Accuracy :  280.0 correct :  28


In [64]:
def predict(model, test_loader):
  model.eval()
  pred_list = []

  with torch.no_grad():
    for img in tqdm(iter(test_loader)):
      img = img.to(device)

      pred = model(img)
      pred = pred.argmax(dim = 1, keepdim = True).squeeze(1)

      pred_list.extend(pred.tolist())

    return pred_list

In [65]:
test_dataset = Custom_dataset(test_img_path, None, train_mode = False, transforms = test_trans)
test_loader = DataLoader(test_dataset, batch_size = 8, shuffle = False)

check_point = 'best_model.pth'

check_point = torch.load(check_point)
model = Custom_model().to(device)
model.load_state_dict(check_point)

preds = predict(model, test_loader)

100%|███████████████████████████████████████████████████████████████████████████████████| 25/25 [00:03<00:00,  8.12it/s]


In [66]:
preds[:10]

[5, 2, 9, 7, 2, 4, 3, 5, 3, 2]

In [67]:
submission = pd.read_csv('sample_submission.csv')
submission['label'] = preds

In [68]:
submission.to_csv('first_submission.csv', index = False)