In [2]:
import sys
import os
import json
import tqdm
import argparse
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
from torchvision.io import read_image
import matplotlib.pyplot as plt
import torchvision.transforms.functional as F
from torch.optim import Adam
from torchvision.io import read_image
import torcheval.metrics as metrics

In [3]:
args = {
    'modelfile':'wikiart.pth',
    'trainingdir':'/home/guserbto@GU.GU.SE/wikiart/train',
    'validationdir': '/home/guserbto@GU.GU.SE/wikiart/valid',
    'testingdir': '/home/guserbto@GU.GU.SE/wikiart/test',
    'device': 'cuda:3',
    'epochs':10,
    'batch_size':32,
    
}

modelfile = args['modelfile']
trainingdir = args['trainingdir']
validationdir = args['validationdir']
testingdir = args['testingdir']
device = args['device']
epochs = args['epochs']
batch_size = args['batch_size']

In [4]:
class WikiArtImage:
    def __init__(self, imgdir, label, filename):
        self.imgdir = imgdir
        self.label = label
        self.filename = filename
        self.image = None
        self.loaded = False

    def get(self):
        if not self.loaded:
            self.image = read_image(os.path.join(self.imgdir, self.label, self.filename)).float()
            self.loaded = True
            self.image /= 255.0

        return self.image

In [5]:
class WikiArtDataset(Dataset):
    def __init__(self, imgdir, device="cpu"):
        walking = os.walk(imgdir)
        filedict = {}
        indices = []
        classes = set()
        print("Gathering files for {}".format(imgdir))
        for item in walking:
            sys.stdout.write('.')
            arttype = os.path.basename(item[0])
            artfiles = item[2]
            for art in artfiles:
                filedict[art] = WikiArtImage(imgdir, arttype, art)
                indices.append(art)
                classes.add(arttype)
        print("...finished")
        self.filedict = filedict
        self.imgdir = imgdir
        self.indices = indices
        self.classes = list(classes)
        self.device = device
        
    def __len__(self):
        return len(self.filedict)

    def __getitem__(self, idx):
        imgname = self.indices[idx]
        imgobj = self.filedict[imgname]
        ilabel = self.classes.index(imgobj.label)
        image = imgobj.get().to(self.device)

        return image, ilabel

In [6]:
class WikiArtModel(nn.Module):
    def __init__(self, num_classes=27):
        super(WikiArtModel, self).__init__()
        self.conv2d_1 = nn.Conv2d(3, 32, kernel_size=4, padding=2)  # Output: (32, 416, 416)
        self.maxpool2d_1 = nn.MaxPool2d(kernel_size=2, padding=1)   # Output: (32, 209, 209)
        
        self.conv2d_2 = nn.Conv2d(32, 64, kernel_size=4, padding=2) # Output: (64, 209, 209)
        self.maxpool2d_2 = nn.MaxPool2d(kernel_size=2, padding=1)   # Output: (64, 106, 106) (rounded up from 105.5)

        self.flatten = nn.Flatten()
        self.batchnorm1d = nn.BatchNorm1d(64 * 106 * 106)
        self.linear1 = nn.Linear(64 * 106 * 106, 300)
        self.dropout = nn.Dropout(0.3)
        self.relu = nn.ReLU()
        self.linear2 = nn.Linear(300, num_classes)
        self.softmax = nn.LogSoftmax(dim=1)

    def forward(self, image):
        output = self.conv2d_1(image)
        output = self.relu(output)
        output = self.maxpool2d_1(output)

        output = self.conv2d_2(output)
        output = self.relu(output)
        output = self.maxpool2d_2(output)

        output = self.flatten(output)
        output = self.batchnorm1d(output)
        output = self.linear1(output)
        output = self.dropout(output)
        output = self.relu(output)
        output = self.linear2(output)
        return self.softmax(output)

In [6]:
# TRAIN

print("Time to train...")


traindataset = WikiArtDataset(trainingdir, device)

the_image, the_label = traindataset[5]
print(the_image, the_image.size())

def train(epochs=3, batch_size=32, modelfile=None, device="cpu"):
    train_loader = DataLoader(traindataset, batch_size=batch_size, shuffle=True)

    model = WikiArtModel().to(device)
    optimizer = Adam(model.parameters(), lr=0.001)
    criterion = nn.NLLLoss().to(device)
    
    for epoch in range(epochs):
        print("Starting epoch {}".format(epoch))
        accumulate_loss = 0
        for batch_id, batch in enumerate(tqdm.tqdm(train_loader)):
            X, y = batch
            y = y.to(device)
            optimizer.zero_grad()
            output = model(X)
            loss = criterion(output, y)
            loss.backward()
            accumulate_loss += loss
            optimizer.step()

        print("In epoch {}, loss = {}".format(epoch, accumulate_loss))

    if modelfile:
        torch.save(model.state_dict(), modelfile)

    return model

Time to train...
Gathering files for /home/guserbto@GU.GU.SE/wikiart/train
...............................finished
tensor([[[0.6706, 0.6118, 0.5804,  ..., 1.0000, 1.0000, 1.0000],
         [0.5412, 0.7176, 0.9137,  ..., 1.0000, 1.0000, 1.0000],
         [0.5961, 0.5333, 0.5176,  ..., 1.0000, 1.0000, 1.0000],
         ...,
         [0.6431, 0.6392, 0.6275,  ..., 0.6275, 0.6314, 0.6314],
         [0.6314, 0.6235, 0.6118,  ..., 0.6275, 0.6431, 0.6588],
         [0.6275, 0.6118, 0.5961,  ..., 0.6000, 0.6235, 0.6549]],

        [[0.6784, 0.6157, 0.5804,  ..., 1.0000, 1.0000, 1.0000],
         [0.5490, 0.7216, 0.9137,  ..., 1.0000, 1.0000, 1.0000],
         [0.6000, 0.5373, 0.5137,  ..., 1.0000, 1.0000, 1.0000],
         ...,
         [0.6941, 0.6902, 0.6784,  ..., 0.7059, 0.6941, 0.6824],
         [0.6824, 0.6745, 0.6627,  ..., 0.7059, 0.7059, 0.7098],
         [0.6784, 0.6627, 0.6471,  ..., 0.6784, 0.6863, 0.7059]],

        [[0.4863, 0.4431, 0.4392,  ..., 1.0000, 1.0000, 1.0000],
        

In [7]:
model = train(args["epochs"], args["batch_size"], modelfile=args["modelfile"], device=device)

Starting epoch 0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:34<00:00,  2.71it/s]


In epoch 0, loss = 3125.10400390625
Starting epoch 1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [01:34<00:00,  4.41it/s]


In epoch 1, loss = 1206.542724609375
Starting epoch 2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [01:49<00:00,  3.81it/s]


In epoch 2, loss = 1189.5909423828125
Starting epoch 3


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:13<00:00,  3.14it/s]


In epoch 3, loss = 1166.2662353515625
Starting epoch 4


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:36<00:00,  2.66it/s]


In epoch 4, loss = 1146.133544921875
Starting epoch 5


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:36<00:00,  2.66it/s]


In epoch 5, loss = 1132.095947265625
Starting epoch 6


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:37<00:00,  2.66it/s]


In epoch 6, loss = 1118.5960693359375
Starting epoch 7


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [02:18<00:00,  3.02it/s]


In epoch 7, loss = 1109.4715576171875
Starting epoch 8


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [01:31<00:00,  4.56it/s]


In epoch 8, loss = 1102.123046875
Starting epoch 9


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 418/418 [01:31<00:00,  4.58it/s]


In epoch 9, loss = 1100.4359130859375


In [7]:
# TEST

print("Testing...")

testingdataset = WikiArtDataset(testingdir, device)

def test(modelfile=None, device="cpu"):
    loader = DataLoader(testingdataset, batch_size=1)

    model = WikiArtModel()
    model.load_state_dict(torch.load(modelfile, weights_only=True))
    model = model.to(device)
    model.eval()

    predictions = []
    truth = []
    for batch_id, batch in enumerate(tqdm.tqdm(loader)):
        X, y = batch
        y = y.to(device)
        output = model(X)
        predictions.append(torch.argmax(output).unsqueeze(dim=0))
        truth.append(y)

    #print("predictions {}".format(predictions))
    print("truth {}".format(truth))
    predictions = torch.concat(predictions)
    truth = torch.concat(truth)
    metric = metrics.MulticlassAccuracy()
    metric.update(predictions, truth)
    print("Accuracy: {}".format(metric.compute()))
    confusion = metrics.MulticlassConfusionMatrix(27)
    confusion.update(predictions, truth)
    print("Confusion Matrix\n{}".format(confusion.compute()))

Testing...
Gathering files for /home/guserbto@GU.GU.SE/wikiart/test
..............................finished


In [8]:
test(modelfile=modelfile, device=device)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 629/629 [00:02<00:00, 211.28it/s]


truth [tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([1], device='cuda:3'), tensor([9], device='cuda:3'), tensor([9], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), tensor([7], device='cuda:3'), ten