In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy
from tensorboardX import SummaryWriter

plt.ion()   # interactive mode
%matplotlib inline

Load Data
---------


In [2]:
data_transforms = {
    'train': transforms.Compose([
        transforms.Resize(224),
        transforms.CenterCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
    'val': transforms.Compose([
        transforms.Resize(224),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
}

data_dir = 'data'
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x),
                                          data_transforms[x])
                  for x in ['train', 'val']}
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=8,
                                             shuffle=True, num_workers=4)
              for x in ['train', 'val']}
dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

Training the model
------------------

Now, let's write a general function to train a model. Here, we will
illustrate:

-  Scheduling the learning rate
-  Saving the best model

In the following, parameter ``scheduler`` is an LR scheduler object from
``torch.optim.lr_scheduler``.



In [3]:
from tqdm import tqdm

def train_model(model, criterion, optimizer, scheduler, writer=None, num_epochs=25):
    since = time.time()

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0

    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch, num_epochs - 1))
        print('-' * 10)

        # Each epoch has a training and validation phase
        for phase in ['train', 'val']:
            if phase == 'train':
                scheduler.step()
                model.train()  # Set model to training mode
            else:
                model.eval()   # Set model to evaluate mode

            running_loss = 0.0
            running_corrects = 0

            # Iterate over data.
            for inputs, labels in tqdm(dataloaders[phase]):
                inputs = inputs.to(device)
                labels = labels.to(device)

                # zero the parameter gradients
                optimizer.zero_grad()

                # forward
                # track history if only in train
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    _, preds = torch.max(outputs, 1)
                    loss = criterion(outputs, labels)

                    # backward + optimize only if in training phase
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                # statistics
                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects.double() / dataset_sizes[phase]

            print('{} Loss: {:.4f} Acc: {:.4f}'.format(
                phase, epoch_loss, epoch_acc))
            

            writer.add_scalar(phase+"/loss", epoch_loss, epoch)
            writer.add_scalar(phase+"/acc", epoch_acc, epoch)


            # deep copy the model
            if phase == 'val' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = copy.deepcopy(model.state_dict())

        print()

    time_elapsed = time.time() - since
    print('Training complete in {:.0f}m {:.0f}s'.format(
        time_elapsed // 60, time_elapsed % 60))
    print('Best val Acc: {:4f}'.format(best_acc))

    # load best model weights
    model.load_state_dict(best_model_wts)
    return model

Finetuning the convnet
----------------------

Load a pretrained model and reset final fully connected layer.




In [16]:
class classifier(nn.Module):
    def __init__(self):
        super(classifier, self).__init__()
        self.model = models.vgg19_bn(pretrained=True)
        self.fc = nn.Linear(in_features=1000, out_features=len(class_names),bias=True)
        
    def forward(self, x):
        x = self.model(x)
        return self.fc(x)

In [17]:
model_ft = classifier()

model_ft = model_ft.to(device)

criterion = nn.CrossEntropyLoss()

# Observe that all parameters are being optimized
optimizer_ft = optim.SGD(model_ft.parameters(), lr=0.0005, momentum=0.9)

# Decay LR by a factor of 0.1 every 7 epochs
exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=6, gamma=0.1)

writer = SummaryWriter('./logs/vgg_19_bn')

### Train and evaluate



In [None]:
model_ft = train_model(model_ft, criterion, optimizer_ft, exp_lr_scheduler, writer,
                       num_epochs=35)

Epoch 0/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:18<00:00,  2.93it/s]


train Loss: 1.0320 Acc: 0.6128


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.58it/s]


val Loss: 0.5310 Acc: 0.7976

Epoch 1/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.4015 Acc: 0.8529


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.43it/s]


val Loss: 0.3000 Acc: 0.8785

Epoch 2/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.2668 Acc: 0.9093


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.57it/s]


val Loss: 0.2890 Acc: 0.9150

Epoch 3/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.88it/s]


train Loss: 0.1612 Acc: 0.9473


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.44it/s]


val Loss: 0.3470 Acc: 0.8826

Epoch 4/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.1315 Acc: 0.9574


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.59it/s]


val Loss: 0.1910 Acc: 0.9271

Epoch 5/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:19<00:00,  2.92it/s]


train Loss: 0.1132 Acc: 0.9570


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.54it/s]


val Loss: 0.1576 Acc: 0.9352

Epoch 6/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:19<00:00,  2.91it/s]


train Loss: 0.0621 Acc: 0.9811


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.66it/s]


val Loss: 0.1374 Acc: 0.9595

Epoch 7/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.91it/s]


train Loss: 0.0309 Acc: 0.9905


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.59it/s]


val Loss: 0.1148 Acc: 0.9595

Epoch 8/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.0311 Acc: 0.9901


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.54it/s]


val Loss: 0.1177 Acc: 0.9636

Epoch 9/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.89it/s]


train Loss: 0.0243 Acc: 0.9933


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.61it/s]


val Loss: 0.1211 Acc: 0.9636

Epoch 10/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:23<00:00,  2.86it/s]


train Loss: 0.0197 Acc: 0.9948


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.44it/s]


val Loss: 0.1184 Acc: 0.9636

Epoch 11/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:23<00:00,  2.86it/s]


train Loss: 0.0224 Acc: 0.9920


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:05<00:00,  6.12it/s]


val Loss: 0.1344 Acc: 0.9676

Epoch 12/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:24<00:00,  2.84it/s]


train Loss: 0.0176 Acc: 0.9957


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.39it/s]


val Loss: 0.1372 Acc: 0.9595

Epoch 13/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:24<00:00,  2.84it/s]


train Loss: 0.0191 Acc: 0.9948


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.51it/s]


val Loss: 0.1374 Acc: 0.9636

Epoch 14/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:23<00:00,  2.85it/s]


train Loss: 0.0146 Acc: 0.9966


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.48it/s]


val Loss: 0.1278 Acc: 0.9636

Epoch 15/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:22<00:00,  2.88it/s]


train Loss: 0.0157 Acc: 0.9963


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.65it/s]


val Loss: 0.1329 Acc: 0.9595

Epoch 16/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.0189 Acc: 0.9946


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.59it/s]


val Loss: 0.1270 Acc: 0.9676

Epoch 17/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.88it/s]


train Loss: 0.0151 Acc: 0.9957


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.69it/s]


val Loss: 0.1419 Acc: 0.9636

Epoch 18/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.0161 Acc: 0.9957


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.58it/s]


val Loss: 0.1267 Acc: 0.9676

Epoch 19/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:20<00:00,  2.90it/s]


train Loss: 0.0145 Acc: 0.9959


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.49it/s]


val Loss: 0.1321 Acc: 0.9636

Epoch 20/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.89it/s]


train Loss: 0.0167 Acc: 0.9951


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.68it/s]


val Loss: 0.1331 Acc: 0.9636

Epoch 21/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.89it/s]


train Loss: 0.0156 Acc: 0.9951


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.36it/s]


val Loss: 0.1299 Acc: 0.9676

Epoch 22/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:21<00:00,  2.89it/s]


train Loss: 0.0129 Acc: 0.9966


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.56it/s]


val Loss: 0.1339 Acc: 0.9676

Epoch 23/34
----------


100%|████████████████████████████████████████████████████████████████████████████████| 582/582 [03:22<00:00,  2.88it/s]


train Loss: 0.0174 Acc: 0.9948


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [00:04<00:00,  6.53it/s]


val Loss: 0.1255 Acc: 0.9676

Epoch 24/34
----------


 67%|█████████████████████████████████████████████████████▎                          | 388/582 [02:16<01:08,  2.85it/s]

ConvNet as fixed feature extractor
----------------------------------




In [None]:
model_conv = torchvision.models.resnet152(pretrained=True)

# Parameters of newly constructed modules have requires_grad=True by default
num_ftrs = model_conv.fc.in_features
model_conv.fc = nn.Linear(num_ftrs, len(class_names))

model_conv = model_conv.to(device)

criterion = nn.CrossEntropyLoss()

optimizer_conv = optim.SGD(list(model_conv.fc.parameters())+list(model_conv.layer4.parameters())+list(model_conv.layer3.parameters())+list(model_conv.layer2.parameters()), lr=0.0005, momentum=0.9)

# Decay LR by a factor of 0.1 every 7 epochs
exp_lr_scheduler = lr_scheduler.StepLR(optimizer_conv, step_size=6, gamma=0.1)

writer = SummaryWriter('./logs/resnet152_last4layers')

### Train and evaluate

In [None]:
model_conv = train_model(model_conv, criterion, optimizer_conv,
                         exp_lr_scheduler, writer, num_epochs=40)