# CE-40719: Deep Learning
## HW3 - CNN / CNN Case Studies / CNN Applications
(23 points)

#### Name:
#### Student No.:

In this assignment we go through the following topics:
- Writing custome pytorch modules
- Using `tensorboard` for logging and visualization
- Data Augmentation
- Saving / Loading Models

Please Keep in mind that:
- You can not use out-of-the-box pytorch modules (nn.Conv2d, nn.Linear, nn.BatchNorm, nn.Dropout, ...)
- You can run this notebook on your computer. If you prefer using Google Colab you may lose some of the functionalities of `tensorboard` (like Projector). You can install `tensorboard` on your computer using package manager of your choice, and download `runs` folder from Google Colab and run it locally using `tensorboard --logdir=runs`.
- Use the [documentation](https://pytorch.org/docs/stable/index.html).

In this assignment we are going to train a convolutional neural network to classify images from [fashion-mnist](https://github.com/zalandoresearch/fashion-mnist) dataset. Fashion-mnist is a simple dataset containing 60000 training and 10000 test $28 \times 28$ grayscale images of 10 different classes. Each class corresponds to a different kind of clothing. 

## 1. Setup (1.5 pts)

In [0]:
import torch
from torch import nn, optim
from torch.nn import functional as F
from torchvision import datasets, transforms, utils
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

In [20]:
print(torch.__version__)

1.4.0


In [0]:
# For visualizing with tensorboard in Google Colab using ngrok

!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
!unzip ngrok-stable-linux-amd64.zip

import os
LOG_DIR = 'runs'
os.makedirs(LOG_DIR, exist_ok=True)
get_ipython().system_raw(
    'tensorboard --logdir {} --host 0.0.0.0 --port 6006 &'
    .format(LOG_DIR)
)

get_ipython().system_raw('./ngrok http 6006 &')
! curl -s http://localhost:4040/api/tunnels | python3 -c \
    "import sys, json; print(json.load(sys.stdin)['tunnels'][0]['public_url'])"

To easily train your model on different gpu devices or your computer's cpu you can define a `torch.device` object corresponding to that device and use `.to(device)` method to easily move modules or tensors to different devices. Pytorch provides helper functions in [torch.cuda](https://pytorch.org/docs/stable/cuda.html) package.

In [21]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# create a cpu device if cuda is not available or cuda_device=None otherwise
# create a cuda:{cuda_device} device.
#################################################################################
cuda_device = torch.cuda.current_device()
device = torch.cuda.device(cuda_device)
pass
#################################################################################
#                                   THE END                                     #
#################################################################################
print(device)

<torch.cuda.device object at 0x7fd6cc1e3be0>


Fashion-mnist dataset is available in `torchvision.datasets` package.

In [0]:
batch_size = 32
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# Initialize and download trainset and testset with datasets.FashionMNIST and
# transform data into torch.Tensor. Initialize trainloader and testloader with
# given batch_size.
#################################################################################

transform = transforms.Compose([transforms.ToTensor()])
trainset = datasets.FashionMNIST(root='./data',
                                    train=True,
                                    download=True,
                                    transform=transform)

testset = datasets.FashionMNIST(root='./data',
                                   train=False,
                                   download=True,
                                   transform=transform)

trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size)
testloader = torch.utils.data.DataLoader(testset, batch_size=batch_size)

#################################################################################
#                                   THE END                                     #
#################################################################################
classes = ('T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
           'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle Boot')

To get a sense of data it is always helpfull to see a few of samples. We can do this using `tensorboard`. Please read [this](https://pytorch.org/docs/stable/tensorboard.html) documentation page to get familiar with tensorboard. Run the following cell to intialize a SummaryWriter and log some of the training images to tensorboard. You can run tensorboard using `tensorboard --logdir=runs` and view images.

In [0]:
writer = SummaryWriter('./runs/FashionMNIST')

dataiter = iter(trainloader)
images, labels = dataiter.next()

img_grid = utils.make_grid(images[:16], nrow=4)

writer.add_image('FashionMNIST', img_grid)

We can also visualize data (or any representation of it) using dimmensionality reduction techniques provided by tensorboard. The following cell adds raw pixel values as embeddings to visualize data. You can see visualizations in projector tab of tensorboard after running the following cell.

In [29]:
def select_n_random(data, labels, n=100):
    perm = torch.randperm(len(data))
    return data[perm][:n], labels[perm][:n]

nimages, nlabels = select_n_random(trainset.data, trainset.targets)

writer.add_embedding(nimages.view(-1, 28 * 28), 
                     metadata=[classes[label] for label in nlabels],
                     label_img=nimages.unsqueeze(1), 
                     tag='raw_pixels')
writer.flush()

AttributeError: ignored

## 2. Modules (7 pts)

In this part you will define all the required modules for a convolutional model. You can only use functional package `torch.nn.functional` unless stated otherwise.

### 2.1 Convolution Module (1.5 pts)

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# define convolution parameters using nn.Parameter.
# initialize weihgt using nn.init.kaiming_uniform and bias by zeroes
# use F.conv2d in forward method.
#################################################################################
class Conv2d(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0, bias=True):
        super(Conv2d, self).__init__()
        pass

    def forward(self, x):
        out = 
        return out
#################################################################################
#                                   THE END                                     #
#################################################################################

### 2.2 Linear (Fully-connected) Module (1.5 pts)

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# define parameters using nn.Parameter.
# initialize weihgt using nn.init.kaiming_uniform and bias by zeroes
# use F.linear in forward method.
#################################################################################
class Linear(nn.Module):
    def __init__(self, in_features, out_features, bias=True):
        super(Linear, self).__init__()
        pass

    def forward(self, x):
        out = 
        return out
#################################################################################
#                                   THE END                                     #
#################################################################################

### 2.3 1D Batch Normalization Module (2 pts)

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# define and intitialize running_mean and running_var by zeroes and ones
# respectively.
# define weight and bias using nn.Parameter. initialize weights to a 
# normal distribution (std=1) and bias to zero.
# use F.batch_norm in forward method.
# use self.training to differ between training and test phase.
#################################################################################
class BatchNorm(nn.Module):
    def __init__(self, num_features):
        super(BatchNorm, self).__init__()
        pass
        
    def forward(self, x):
        out = 
        return out
#################################################################################
#                                   THE END                                     #
#################################################################################

### 2.4 2D Batch Normalization Module (2 pts)

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# define and intitialize running_mean and running_var by zeroes and ones
# respectively.
# define weight and bias using nn.Parameter. initialize weights to a
# normal distribution (std=1) and bias to zero.
# use F.batch_norm in forward method.
# use self.training to differ between training and test phase.
# more info on 2d batch normalization:
# https://stackoverflow.com/questions/38553927/batch-normalization-in-convolutional-neural-network
#################################################################################
class BatchNorm2d(nn.Module):
    def __init__(self, num_features):
        super(BatchNorm2d, self).__init__()
        pass
        
    def forward(self, x):
        out = 
        return out
#################################################################################
#                                   THE END                                     #
#################################################################################

## 3. Model (3.5 pts)

Using the modules defined in previous part define the following model:

`[Conv2d(3, 3), channels=8, stride=1, padding=1] > [BatchNorm2d] > [relu]`

`[Conv2d(5, 5), channels=16, stride=1, padding=0] > [BatchNorm2d] > [relu] > [max_pool2d(2, 2), stride=(2, 2), padding=0]`

`[Conv2d(5, 5), channels=32, stride=1, padding=0] > [BatchNorm2d] > [relu] > [max_pool2d(2, 2), stride=(2, 2), padding=0]`

`[Linear(128)] > [BatchNorm] > [relu]`

`[Linear(64)] > [BatchNorm] > [relu]`        __(features)__

`[Linear(10)]`

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################

class Model(nn.Module):
    def __init__(self, dropout=None):
        super(Model, self).__init__()
        pass

    def forward(self, x):
        pass
        return out, features
#################################################################################
#                                   THE END                                     #
#################################################################################

## 4. Training the Model (5 pts)

In [0]:
def train(model, optimizer, trainloader, testloader, device, num_epoches, label):
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# write the main training loop procedure:
# move data to defined device
# zero_grad optimizer
# forward
# compute loss using F.cross_entropy
# backward
# step the optimizer
# accumulate running loss
#################################################################################
    for epoch in range(num_epoches):
        print('EPOCH {:2d}:'.format(epoch + 1))
        running_loss = 0.
        for i, (x, y) in enumerate(trainloader):
            pass
#################################################################################
#                                   THE END                                     #
#################################################################################
       
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# compute test loss:
# dont forget to change model mode from train to eval
# write the code in a with torch.no_grad() block to prevent computing and 
# accumulating gradients
# accumulate loss in test_loss variable
#################################################################################
            if i % 100 == 99:
                test_loss = 0.
                pass
#################################################################################
#                                   THE END                                     #
#################################################################################
                writer.add_scalars('loss/'+label, 
                                   {'train': running_loss/100, 'test': test_loss/len(testloader)},
                                  global_step=epoch * len(trainloader) + i + 1)
                writer.flush()
                print('\titeration {:4d}: training_loss = {:5f}, test_loss = {:5f}'.format(i + 1, running_loss/100, test_loss/len(testloader)))
                running_loss = 0.
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# compute test accuracy:
# dont forget to change model mode from train to eval
# write the code in a with torch.no_grad() block to prevent computing and 
# accumulating gradients
# accumulate number of correct predictions in correct variable and total test
# samples in total variable
# accumulate number of classwise correct predictions in class_correct list 
# and total classwise test samples in class_total list
#################################################################################
        model.eval()
        with torch.no_grad():
            correct = 0
            total = 0
            
            class_correct = [0.] * 10
            class_total = [0.] * 10
            pass
#################################################################################
#                                   THE END                                     #
#################################################################################
        writer.add_scalars('accuracy/'+label, {'test': correct / total},
                           global_step=(epoch + 1) * len(trainloader))
        print('test_accuracy = {:5f}'.format(correct / total))
        
        writer.add_scalars('classwise_accuracy/'+label, 
                           {classes[i]: class_correct[i]/class_total[i] for i in range(10)},
                           global_step=(epoch + 1) * len(trainloader))
        for i in range(10):
            print('  >> {:11s}: {:5f}'.format(classes[i], class_correct[i]/class_total[i]))
            
        writer.flush()
        torch.save(model.state_dict(), './saved_models/model_{}.chkpt'.format(label))

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# initilize model and train for 10 epoches using Adam optimizer
#################################################################################
num_epoches = 10
pass

writer.add_graph(model, images)
train(model, optimizer, trainloader, testloader, device, num_epoches, 'base')
#################################################################################
#                                   THE END                                     #
#################################################################################

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# add model features corresponding to nimages as embedding to tensorboard
#################################################################################
pass
writer.flush()
#################################################################################
#                                   THE END                                     #
#################################################################################

## 5. Dropout and Data Augmentation (6 pts)

Add dropout with p=0.5 to first two linear layers of the model using `F.dropout`. You can either modify the model module to take an additional parameter or write a seperate module. 

Data Augmentation is a strategy for increasing dataset size to prevent overfitting and better generalization. Dataset can be augmented by any transformation on data that do not change its label.

Pytorch provides data augmentation transforms in `torchvision.transforms` package.

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# compose a transform using transforms.Compose that horizontally flips images 
# and use transforms.RandomResizedCrop to crop a 20 * 20 patch of the image 
# and resizing back to 28 * 28
#################################################################################
transform = 
trainset = 
testset = 

trainloader = 
testloader = 

#################################################################################
#                                   THE END                                     #
#################################################################################

In [0]:
dataiter = iter(trainloader)
images, labels = dataiter.next()

img_grid = utils.make_grid(images[:16], nrow=4)

writer.add_image('FashionMNIST/augmented', img_grid)
writer.flush()

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# initilize model and train using augmented dataset for 10 epoches
#################################################################################
pass

writer.add_graph(model, images)
train(model2, optimizer, trainloader, testloader, device, num_epoches, 'dropout')
#################################################################################
#                                   THE END                                     #
#################################################################################

In [0]:
#################################################################################
#                          COMPLETE THE FOLLOWING SECTION                       #
#################################################################################
# add model features corresponding to nimages as embedding to tensorboard
#################################################################################
pass

writer.flush()
writer.close()
#################################################################################
#                                   THE END                                     #
#################################################################################