In [2]:
%load_ext autoreload
%autoreload 2

In [3]:
from baseline_cnn import *
from datetime import datetime
import copy

In [4]:
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
        #nn.init.xavier_normal_(m.weight.data)
    #elif classname.find('Linear') != -1:
     #   nn.init.xavier_normal_(m.weight.data)
    
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

In [None]:
def xavier_weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
        nn.init.xavier_normal_(m.weight.data)
    elif classname.find('Linear') != -1:
        nn.init.xavier_normal_(m.weight.data)
    
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

In [5]:
# Check if your system supports CUDA
use_cuda = torch.cuda.is_available()

# Setup GPU optimization if CUDA is supported
if use_cuda:
    computing_device = torch.device("cuda")
    extras = {"num_workers": 1, "pin_memory": True}
    print("CUDA is supported")
else: # Otherwise, train on the CPU
    computing_device = torch.device("cpu")
    extras = False
    print("CUDA NOT supported")

net=Nnet().to(computing_device)
net.apply(weights_init)

# Print the model
print(net)

#loss criteria are defined in the torch.nn package
criterion = nn.CrossEntropyLoss()

#Instantiate the gradient descent optimizer - use Adam optimizer with default parameters
optimizer = optim.Adam(net.parameters(),lr = 0.001)

CUDA is supported
Nnet(
  (main): Sequential(
    (0): Conv2d(3, 21, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (1): ReLU(inplace)
    (2): Conv2d(21, 20, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (3): BatchNorm2d(20, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (4): ReLU(inplace)
    (5): Conv2d(20, 15, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (6): BatchNorm2d(15, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (7): ReLU(inplace)
    (8): Conv2d(15, 7, kernel_size=(5, 5), stride=(2, 2), padding=(1, 1), bias=False)
    (9): BatchNorm2d(7, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (10): ReLU(inplace)
  )
  (fc): Sequential(
    (0): Linear(in_features=343, out_features=500, bias=True)
    (1): ReLU(inplace)
    (2): Linear(in_features=500, out_features=201, bias=True)
  )
)


In [6]:
transform = transforms.Compose([transforms.Resize(128), transforms.CenterCrop(128), transforms.ToTensor()])
dataset = loader('train.csv','/datasets/cs154-fa19-public/',transform=transform)
batch_size = 64
validation_split = .2
shuffle_dataset = True
random_seed= 42

# Creating data indices for training and validation splits:
dataset_size = len(dataset)
indices = list(range(dataset_size))
split = int(np.floor(validation_split * dataset_size))
if shuffle_dataset :
    np.random.seed(random_seed)
    np.random.shuffle(indices)
train_indices, val_indices = indices[split:], indices[:split]

# Creating PT data samplers and loaders:
train_sampler = SubsetRandomSampler(train_indices)
valid_sampler = SubsetRandomSampler(val_indices)

train_loader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, 
                                           sampler=train_sampler)
validation_loader = torch.utils.data.DataLoader(dataset, batch_size=batch_size,
                                                sampler=valid_sampler)

In [None]:
def train_model(model, criterion, optimizer, scheduler, num_epochs=25):
    since = time.time()

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0

    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch, num_epochs - 1))
        print('-' * 10)

        # Each epoch has a training and validation phase
        for phase in ['train', 'val']:
            if phase == 'train':
                model.train()  # Set model to training mode
            else:
                model.eval()   # Set model to evaluate mode

            running_loss = 0.0
            running_corrects = 0

            # Iterate over data.
            for inputs, labels in dataloaders[phase]:
                inputs = inputs.to(device)
                labels = labels.to(device)

                # zero the parameter gradients
                optimizer.zero_grad()

                # forward
                # track history if only in train
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    _, preds = torch.max(outputs, 1)
                    loss = criterion(outputs, labels)

                    # backward + optimize only if in training phase
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                # statistics
                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)
            if phase == 'train':
                scheduler.step()

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects.double() / dataset_sizes[phase]

            print('{} Loss: {:.4f} Acc: {:.4f}'.format(
                phase, epoch_loss, epoch_acc))

            # deep copy the model
            if phase == 'val' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = copy.deepcopy(model.state_dict())

        print()

    time_elapsed = time.time() - since
    print('Training complete in {:.0f}m {:.0f}s'.format(
        time_elapsed // 60, time_elapsed % 60))
    print('Best val Acc: {:4f}'.format(best_acc))

    # load best model weights
    model.load_state_dict(best_model_wts)
    return model

In [None]:
import copy
# Track the loss across training
total_loss = []
total_accu = []

train_losses = []
train_accuracies = []

avg_minibatch_loss = []
avg_minibatch_accu = []
N = 50

all_models = []

valid_losses = []
valid_accuracies = []

#Helper function for calculating accuracy
def calculate_accu(outputs, labels, batch_size):
    num_correct = torch.sum(torch.max(outputs, dim = 1)[1] == labels).item()
    return num_correct / batch_size
early_stop_counter = 0  # track number of epochs where val loss increases
for epoch in range(50):
    epoch_start_time = datetime.now()
    N_minibatch_loss = 0.0
    N_minibatch_accu = 0.0

    # Get the next minibatch of images, labels for training
    for minibatch_count, (images, labels) in enumerate(train_loader, 0):
        print("mini_batch", minibatch_count)
        # Zero out the stored gradient (buffer) from the previous iteration
        optimizer.zero_grad()
        # Put the minibatch data in CUDA Tensors and run on the GPU if supported
        images, labels = images.to(computing_device), labels.to(computing_device)
        # Perform the forward pass through the network and compute the loss
        outputs = net(images)
        
        loss = criterion(outputs, labels)
        accu = calculate_accu(outputs, labels, batch_size)
        # Automagically compute the gradients and backpropagate the loss through the network
        loss.backward()

        # Update the weights
        optimizer.step()    
        # Add this iteration's loss to the total_loss
        total_loss.append(loss.item())
        total_accu.append(accu)
        
        N_minibatch_loss += loss.item()
        N_minibatch_accu += accu
        
        if minibatch_count % N == 49:
            #Print the loss averaged over the last N mini-batches
            N_minibatch_loss /= N
            N_minibatch_accu /= N
            
            print('Epoch %d, average minibatch %d loss: %.3f' % (epoch + 1, minibatch_count+1, N_minibatch_loss))
            # Add the averaged loss over N minibatches and reset the counter
            avg_minibatch_loss.append(N_minibatch_loss)
            avg_minibatch_accu.append(N_minibatch_accu)
            
            N_minibatch_loss = 0.0
            N_minibatch_accu = 0.0
    
    train_losses.append(np.average(total_loss))
    train_accuracies.append(np.average(total_accu))
    
    # TODO: Implement validation 
    with torch.no_grad():
        
        valid_loss = 0
        valid_accu = 0
        
        for minibatch_count, (images, labels) in enumerate(validation_loader, 0):
            
            #Apply current model to the data
            images, labels = images.to(computing_device), labels.to(computing_device)
            outputs = net(images)
            
            valid_accu += calculate_accu(outputs, labels, batch_size)
            valid_loss += criterion(outputs, labels).item()
        
        avg_valid_accu = valid_accu/minibatch_count
        avg_valid_loss = valid_loss/minibatch_count
        
        print("Valid loss for validation set is ", avg_valid_loss, "%.")
        print("Accuracy for validation set is", avg_valid_accu * 100, "%.")
        
        all_models.append(copy.deepcopy(net))
        
        if not valid_losses:
            model = copy.deepcopy(net)
        elif avg_valid_loss > valid_losses[-1]:
            early_stop_counter += 1
            
            valid_losses.append(avg_valid_loss)
            valid_accuracies.append(avg_valid_accu)
            if early_stop_counter == 2:
                print("stopped")
                break
        elif avg_valid_loss < min(valid_losses):
            model = copy.deepcopy(net)
        early_stop_counter = 0
        
        valid_losses.append(avg_valid_loss)
        valid_accuracies.append(avg_valid_accu)
    end_time = datetime.now()
    
    epoch_runtime = end_time - epoch_start_time
    print("epoch {} time: {}".format(epoch, epoch_runtime))

mini_batch 0
mini_batch 1
mini_batch 2
mini_batch 3
mini_batch 4
mini_batch 5
mini_batch 6
mini_batch 7
mini_batch 8
mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_batch 16
mini_batch 17
mini_batch 18
mini_batch 19
mini_batch 20
mini_batch 21
mini_batch 22
mini_batch 23
mini_batch 24
mini_batch 25
mini_batch 26
mini_batch 27
mini_batch 28
mini_batch 29
mini_batch 30
mini_batch 31
mini_batch 32
mini_batch 33
mini_batch 34
mini_batch 35
mini_batch 36
mini_batch 37
mini_batch 38
mini_batch 39
mini_batch 40
mini_batch 41
mini_batch 42
mini_batch 43
mini_batch 44
mini_batch 45
mini_batch 46
mini_batch 47
mini_batch 48
mini_batch 49
Epoch 1, average minibatch 50 loss: 2.024
mini_batch 50
mini_batch 51
mini_batch 52
mini_batch 53
mini_batch 54
mini_batch 55
mini_batch 56
mini_batch 57
mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mi

mini_batch 151
mini_batch 152
mini_batch 153
mini_batch 154
mini_batch 155
mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 163
mini_batch 164
mini_batch 165
mini_batch 166
mini_batch 167
mini_batch 168
mini_batch 169
mini_batch 170
mini_batch 171
mini_batch 172
mini_batch 173
mini_batch 174
mini_batch 175
mini_batch 176
mini_batch 177
mini_batch 178
mini_batch 179
mini_batch 180
mini_batch 181
mini_batch 182
mini_batch 183
mini_batch 184
mini_batch 185
mini_batch 186
mini_batch 187
mini_batch 188
mini_batch 189
mini_batch 190
mini_batch 191
mini_batch 192
mini_batch 193
mini_batch 194
mini_batch 195
mini_batch 196
mini_batch 197
mini_batch 198
mini_batch 199
Epoch 2, average minibatch 200 loss: 1.547
mini_batch 200
mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 213
mini_batch 2

mini_batch 295
mini_batch 296
mini_batch 297
mini_batch 298
mini_batch 299
Epoch 3, average minibatch 300 loss: 1.262
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 303
mini_batch 304
mini_batch 305
mini_batch 306
mini_batch 307
mini_batch 308
mini_batch 309
mini_batch 310
mini_batch 311
mini_batch 312
mini_batch 313
mini_batch 314
mini_batch 315
mini_batch 316
mini_batch 317
mini_batch 318
mini_batch 319
mini_batch 320
mini_batch 321
mini_batch 322
mini_batch 323
mini_batch 324
mini_batch 325
mini_batch 326
mini_batch 327
mini_batch 328
mini_batch 329
mini_batch 330
mini_batch 331
mini_batch 332
mini_batch 333
mini_batch 334
mini_batch 335
mini_batch 336
mini_batch 337
mini_batch 338
mini_batch 339
mini_batch 340
mini_batch 341
mini_batch 342
mini_batch 343
mini_batch 344
mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 3, average minibatch 350 loss: 1.200
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 353
mini_batch 354
mini_batch 355

mini_batch 56
mini_batch 57
mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mini_batch 69
mini_batch 70
mini_batch 71
mini_batch 72
mini_batch 73
mini_batch 74
mini_batch 75
mini_batch 76
mini_batch 77
mini_batch 78
mini_batch 79
mini_batch 80
mini_batch 81
mini_batch 82
mini_batch 83
mini_batch 84
mini_batch 85
mini_batch 86
mini_batch 87
mini_batch 88
mini_batch 89
mini_batch 90
mini_batch 91
mini_batch 92
mini_batch 93
mini_batch 94
mini_batch 95
mini_batch 96
mini_batch 97
mini_batch 98
mini_batch 99
Epoch 5, average minibatch 100 loss: 0.636
mini_batch 100
mini_batch 101
mini_batch 102
mini_batch 103
mini_batch 104
mini_batch 105
mini_batch 106
mini_batch 107
mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117
mini_batch 118
mini_batch 119
mini_batch 120
mini_batch 121
mini_batch 

mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 213
mini_batch 214
mini_batch 215
mini_batch 216
mini_batch 217
mini_batch 218
mini_batch 219
mini_batch 220
mini_batch 221
mini_batch 222
mini_batch 223
mini_batch 224
mini_batch 225
mini_batch 226
mini_batch 227
mini_batch 228
mini_batch 229
mini_batch 230
mini_batch 231
mini_batch 232
mini_batch 233
mini_batch 234
mini_batch 235
mini_batch 236
mini_batch 237
mini_batch 238
mini_batch 239
mini_batch 240
mini_batch 241
mini_batch 242
mini_batch 243
mini_batch 244
mini_batch 245
mini_batch 246
mini_batch 247
mini_batch 248
mini_batch 249
Epoch 6, average minibatch 250 loss: 0.556
mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 257
mini_batch 258
mini_batch 259
mini_batch 260
mini_batch 261
mini_batch 262
mini_batch 263
mini_batch 2

mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 7, average minibatch 350 loss: 0.424
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 353
mini_batch 354
mini_batch 355
mini_batch 356
mini_batch 357
mini_batch 358
mini_batch 359
mini_batch 360
mini_batch 361
mini_batch 362
mini_batch 363
mini_batch 364
mini_batch 365
mini_batch 366
mini_batch 367
mini_batch 368
mini_batch 369
mini_batch 370
mini_batch 371
mini_batch 372
mini_batch 373
mini_batch 374
mini_batch 375
Valid loss for validation set is  2.2319366688369424 %.
Accuracy for validation set is 57.4260752688172 %.
epoch 6 time: 0:01:42.022386
mini_batch 0
mini_batch 1
mini_batch 2
mini_batch 3
mini_batch 4
mini_batch 5
mini_batch 6
mini_batch 7
mini_batch 8
mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_batch 16
mini_batch 17
mini_batch 18
mini_batch 19
mini_batch 20
mini_batch 21
mini_batch 22
mini_batch 23
mini_batch 24
mini_batch 25
mi

mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117
mini_batch 118
mini_batch 119
mini_batch 120
mini_batch 121
mini_batch 122
mini_batch 123
mini_batch 124
mini_batch 125
mini_batch 126
mini_batch 127
mini_batch 128
mini_batch 129
mini_batch 130
mini_batch 131
mini_batch 132
mini_batch 133
mini_batch 134
mini_batch 135
mini_batch 136
mini_batch 137
mini_batch 138
mini_batch 139
mini_batch 140
mini_batch 141
mini_batch 142
mini_batch 143
mini_batch 144
mini_batch 145
mini_batch 146
mini_batch 147
mini_batch 148
mini_batch 149
Epoch 9, average minibatch 150 loss: 0.170
mini_batch 150
mini_batch 151
mini_batch 152
mini_batch 153
mini_batch 154
mini_batch 155
mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 163
mini_batch 164
mini_batch 165
mini_batch 166
mini_batch 167
mini_batch 168
mini_batch 169
mini_batch 170
mini_batch 1

mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 257
mini_batch 258
mini_batch 259
mini_batch 260
mini_batch 261
mini_batch 262
mini_batch 263
mini_batch 264
mini_batch 265
mini_batch 266
mini_batch 267
mini_batch 268
mini_batch 269
mini_batch 270
mini_batch 271
mini_batch 272
mini_batch 273
mini_batch 274
mini_batch 275
mini_batch 276
mini_batch 277
mini_batch 278
mini_batch 279
mini_batch 280
mini_batch 281
mini_batch 282
mini_batch 283
mini_batch 284
mini_batch 285
mini_batch 286
mini_batch 287
mini_batch 288
mini_batch 289
mini_batch 290
mini_batch 291
mini_batch 292
mini_batch 293
mini_batch 294
mini_batch 295
mini_batch 296
mini_batch 297
mini_batch 298
mini_batch 299
Epoch 10, average minibatch 300 loss: 0.166
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 303
mini_batch 304
mini_batch 305
mini_batch 306
mini_batch 307
mini_batch 308
mini_batch 309
mini_batch 310
mini_batch 311
mini_batch 312
mini_batch 

mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_batch 16
mini_batch 17
mini_batch 18
mini_batch 19
mini_batch 20
mini_batch 21
mini_batch 22
mini_batch 23
mini_batch 24
mini_batch 25
mini_batch 26
mini_batch 27
mini_batch 28
mini_batch 29
mini_batch 30
mini_batch 31
mini_batch 32
mini_batch 33
mini_batch 34
mini_batch 35
mini_batch 36
mini_batch 37
mini_batch 38
mini_batch 39
mini_batch 40
mini_batch 41
mini_batch 42
mini_batch 43
mini_batch 44
mini_batch 45
mini_batch 46
mini_batch 47
mini_batch 48
mini_batch 49
Epoch 12, average minibatch 50 loss: 0.134
mini_batch 50
mini_batch 51
mini_batch 52
mini_batch 53
mini_batch 54
mini_batch 55
mini_batch 56
mini_batch 57
mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mini_batch 69
mini_batch 70
mini_batch 71
mini_batch 72
mini_batch 73
mini_batch 74
mini_batch 75
mini_batch 76
mini_b

mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 163
mini_batch 164
mini_batch 165
mini_batch 166
mini_batch 167
mini_batch 168
mini_batch 169
mini_batch 170
mini_batch 171
mini_batch 172
mini_batch 173
mini_batch 174
mini_batch 175
mini_batch 176
mini_batch 177
mini_batch 178
mini_batch 179
mini_batch 180
mini_batch 181
mini_batch 182
mini_batch 183
mini_batch 184
mini_batch 185
mini_batch 186
mini_batch 187
mini_batch 188
mini_batch 189
mini_batch 190
mini_batch 191
mini_batch 192
mini_batch 193
mini_batch 194
mini_batch 195
mini_batch 196
mini_batch 197
mini_batch 198
mini_batch 199
Epoch 13, average minibatch 200 loss: 0.101
mini_batch 200
mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 213
mini_batch 214
mini_batch 215
mini_batch 216
mini_batch 217
mini_batch 218
mini_batch 

mini_batch 299
Epoch 14, average minibatch 300 loss: 0.153
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 303
mini_batch 304
mini_batch 305
mini_batch 306
mini_batch 307
mini_batch 308
mini_batch 309
mini_batch 310
mini_batch 311
mini_batch 312
mini_batch 313
mini_batch 314
mini_batch 315
mini_batch 316
mini_batch 317
mini_batch 318
mini_batch 319
mini_batch 320
mini_batch 321
mini_batch 322
mini_batch 323
mini_batch 324
mini_batch 325
mini_batch 326
mini_batch 327
mini_batch 328
mini_batch 329
mini_batch 330
mini_batch 331
mini_batch 332
mini_batch 333
mini_batch 334
mini_batch 335
mini_batch 336
mini_batch 337
mini_batch 338
mini_batch 339
mini_batch 340
mini_batch 341
mini_batch 342
mini_batch 343
mini_batch 344
mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 14, average minibatch 350 loss: 0.149
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 353
mini_batch 354
mini_batch 355
mini_batch 356
mini_batch 357
mini_batch 358
mini_batch 3

mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mini_batch 69
mini_batch 70
mini_batch 71
mini_batch 72
mini_batch 73
mini_batch 74
mini_batch 75
mini_batch 76
mini_batch 77
mini_batch 78
mini_batch 79
mini_batch 80
mini_batch 81
mini_batch 82
mini_batch 83
mini_batch 84
mini_batch 85
mini_batch 86
mini_batch 87
mini_batch 88
mini_batch 89
mini_batch 90
mini_batch 91
mini_batch 92
mini_batch 93
mini_batch 94
mini_batch 95
mini_batch 96
mini_batch 97
mini_batch 98
mini_batch 99
Epoch 16, average minibatch 100 loss: 0.076
mini_batch 100
mini_batch 101
mini_batch 102
mini_batch 103
mini_batch 104
mini_batch 105
mini_batch 106
mini_batch 107
mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117
mini_batch 118
mini_batch 119
mini_batch 120
mini_batch 121
mini_batch 122
mini_batch 123
mini_bat

mini_batch 200
mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 213
mini_batch 214
mini_batch 215
mini_batch 216
mini_batch 217
mini_batch 218
mini_batch 219
mini_batch 220
mini_batch 221
mini_batch 222
mini_batch 223
mini_batch 224
mini_batch 225
mini_batch 226
mini_batch 227
mini_batch 228
mini_batch 229
mini_batch 230
mini_batch 231
mini_batch 232
mini_batch 233
mini_batch 234
mini_batch 235
mini_batch 236
mini_batch 237
mini_batch 238
mini_batch 239
mini_batch 240
mini_batch 241
mini_batch 242
mini_batch 243
mini_batch 244
mini_batch 245
mini_batch 246
mini_batch 247
mini_batch 248
mini_batch 249
Epoch 17, average minibatch 250 loss: 0.088
mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 257
mini_batch 258
mini_batch 259
mini_batch 260
mini_batch 261
mini_batch 262
mini_batch 

mini_batch 342
mini_batch 343
mini_batch 344
mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 18, average minibatch 350 loss: 0.117
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 353
mini_batch 354
mini_batch 355
mini_batch 356
mini_batch 357
mini_batch 358
mini_batch 359
mini_batch 360
mini_batch 361
mini_batch 362
mini_batch 363
mini_batch 364
mini_batch 365
mini_batch 366
mini_batch 367
mini_batch 368
mini_batch 369
mini_batch 370
mini_batch 371
mini_batch 372
mini_batch 373
mini_batch 374
mini_batch 375
Valid loss for validation set is  3.4745555744376233 %.
Accuracy for validation set is 56.36760752688173 %.
epoch 17 time: 0:01:54.251621
mini_batch 0
mini_batch 1
mini_batch 2
mini_batch 3
mini_batch 4
mini_batch 5
mini_batch 6
mini_batch 7
mini_batch 8
mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_batch 16
mini_batch 17
mini_batch 18
mini_batch 19
mini_batch 20
mini_batch 21
mini_batch

mini_batch 104
mini_batch 105
mini_batch 106
mini_batch 107
mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117
mini_batch 118
mini_batch 119
mini_batch 120
mini_batch 121
mini_batch 122
mini_batch 123
mini_batch 124
mini_batch 125
mini_batch 126
mini_batch 127
mini_batch 128
mini_batch 129
mini_batch 130
mini_batch 131
mini_batch 132
mini_batch 133
mini_batch 134
mini_batch 135
mini_batch 136
mini_batch 137
mini_batch 138
mini_batch 139
mini_batch 140
mini_batch 141
mini_batch 142
mini_batch 143
mini_batch 144
mini_batch 145
mini_batch 146
mini_batch 147
mini_batch 148
mini_batch 149
Epoch 20, average minibatch 150 loss: 0.071
mini_batch 150
mini_batch 151
mini_batch 152
mini_batch 153
mini_batch 154
mini_batch 155
mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 163
mini_batch 164
mini_batch 165
mini_batch 166
mini_batch 

mini_batch 248
mini_batch 249
Epoch 21, average minibatch 250 loss: 0.054
mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 257
mini_batch 258
mini_batch 259
mini_batch 260
mini_batch 261
mini_batch 262
mini_batch 263
mini_batch 264
mini_batch 265
mini_batch 266
mini_batch 267
mini_batch 268
mini_batch 269
mini_batch 270
mini_batch 271
mini_batch 272
mini_batch 273
mini_batch 274
mini_batch 275
mini_batch 276
mini_batch 277
mini_batch 278
mini_batch 279
mini_batch 280
mini_batch 281
mini_batch 282
mini_batch 283
mini_batch 284
mini_batch 285
mini_batch 286
mini_batch 287
mini_batch 288
mini_batch 289
mini_batch 290
mini_batch 291
mini_batch 292
mini_batch 293
mini_batch 294
mini_batch 295
mini_batch 296
mini_batch 297
mini_batch 298
mini_batch 299
Epoch 21, average minibatch 300 loss: 0.052
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 303
mini_batch 304
mini_batch 305
mini_batch 306
mini_batch 307
mini_batch 3

mini_batch 3
mini_batch 4
mini_batch 5
mini_batch 6
mini_batch 7
mini_batch 8
mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_batch 16
mini_batch 17
mini_batch 18
mini_batch 19
mini_batch 20
mini_batch 21
mini_batch 22
mini_batch 23
mini_batch 24
mini_batch 25
mini_batch 26
mini_batch 27
mini_batch 28
mini_batch 29
mini_batch 30
mini_batch 31
mini_batch 32
mini_batch 33
mini_batch 34
mini_batch 35
mini_batch 36
mini_batch 37
mini_batch 38
mini_batch 39
mini_batch 40
mini_batch 41
mini_batch 42
mini_batch 43
mini_batch 44
mini_batch 45
mini_batch 46
mini_batch 47
mini_batch 48
mini_batch 49
Epoch 23, average minibatch 50 loss: 0.077
mini_batch 50
mini_batch 51
mini_batch 52
mini_batch 53
mini_batch 54
mini_batch 55
mini_batch 56
mini_batch 57
mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mini_batch 69
mini_batch 70
mini_batch 7

mini_batch 150
mini_batch 151
mini_batch 152
mini_batch 153
mini_batch 154
mini_batch 155
mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 163
mini_batch 164
mini_batch 165
mini_batch 166
mini_batch 167
mini_batch 168
mini_batch 169
mini_batch 170
mini_batch 171
mini_batch 172
mini_batch 173
mini_batch 174
mini_batch 175
mini_batch 176
mini_batch 177
mini_batch 178
mini_batch 179
mini_batch 180
mini_batch 181
mini_batch 182
mini_batch 183
mini_batch 184
mini_batch 185
mini_batch 186
mini_batch 187
mini_batch 188
mini_batch 189
mini_batch 190
mini_batch 191
mini_batch 192
mini_batch 193
mini_batch 194
mini_batch 195
mini_batch 196
mini_batch 197
mini_batch 198
mini_batch 199
Epoch 24, average minibatch 200 loss: 0.053
mini_batch 200
mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 

mini_batch 293
mini_batch 294
mini_batch 295
mini_batch 296
mini_batch 297
mini_batch 298
mini_batch 299
Epoch 25, average minibatch 300 loss: 0.076
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 303
mini_batch 304
mini_batch 305
mini_batch 306
mini_batch 307
mini_batch 308
mini_batch 309
mini_batch 310
mini_batch 311
mini_batch 312
mini_batch 313
mini_batch 314
mini_batch 315
mini_batch 316
mini_batch 317
mini_batch 318
mini_batch 319
mini_batch 320
mini_batch 321
mini_batch 322
mini_batch 323
mini_batch 324
mini_batch 325
mini_batch 326
mini_batch 327
mini_batch 328
mini_batch 329
mini_batch 330
mini_batch 331
mini_batch 332
mini_batch 333
mini_batch 334
mini_batch 335
mini_batch 336
mini_batch 337
mini_batch 338
mini_batch 339
mini_batch 340
mini_batch 341
mini_batch 342
mini_batch 343
mini_batch 344
mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 25, average minibatch 350 loss: 0.118
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 3

mini_batch 51
mini_batch 52
mini_batch 53
mini_batch 54
mini_batch 55
mini_batch 56
mini_batch 57
mini_batch 58
mini_batch 59
mini_batch 60
mini_batch 61
mini_batch 62
mini_batch 63
mini_batch 64
mini_batch 65
mini_batch 66
mini_batch 67
mini_batch 68
mini_batch 69
mini_batch 70
mini_batch 71
mini_batch 72
mini_batch 73
mini_batch 74
mini_batch 75
mini_batch 76
mini_batch 77
mini_batch 78
mini_batch 79
mini_batch 80
mini_batch 81
mini_batch 82
mini_batch 83
mini_batch 84
mini_batch 85
mini_batch 86
mini_batch 87
mini_batch 88
mini_batch 89
mini_batch 90
mini_batch 91
mini_batch 92
mini_batch 93
mini_batch 94
mini_batch 95
mini_batch 96
mini_batch 97
mini_batch 98
mini_batch 99
Epoch 27, average minibatch 100 loss: 0.077
mini_batch 100
mini_batch 101
mini_batch 102
mini_batch 103
mini_batch 104
mini_batch 105
mini_batch 106
mini_batch 107
mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117


mini_batch 197
mini_batch 198
mini_batch 199
Epoch 28, average minibatch 200 loss: 0.069
mini_batch 200
mini_batch 201
mini_batch 202
mini_batch 203
mini_batch 204
mini_batch 205
mini_batch 206
mini_batch 207
mini_batch 208
mini_batch 209
mini_batch 210
mini_batch 211
mini_batch 212
mini_batch 213
mini_batch 214
mini_batch 215
mini_batch 216
mini_batch 217
mini_batch 218
mini_batch 219
mini_batch 220
mini_batch 221
mini_batch 222
mini_batch 223
mini_batch 224
mini_batch 225
mini_batch 226
mini_batch 227
mini_batch 228
mini_batch 229
mini_batch 230
mini_batch 231
mini_batch 232
mini_batch 233
mini_batch 234
mini_batch 235
mini_batch 236
mini_batch 237
mini_batch 238
mini_batch 239
mini_batch 240
mini_batch 241
mini_batch 242
mini_batch 243
mini_batch 244
mini_batch 245
mini_batch 246
mini_batch 247
mini_batch 248
mini_batch 249
Epoch 28, average minibatch 250 loss: 0.052
mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 2

mini_batch 336
mini_batch 337
mini_batch 338
mini_batch 339
mini_batch 340
mini_batch 341
mini_batch 342
mini_batch 343
mini_batch 344
mini_batch 345
mini_batch 346
mini_batch 347
mini_batch 348
mini_batch 349
Epoch 29, average minibatch 350 loss: 0.063
mini_batch 350
mini_batch 351
mini_batch 352
mini_batch 353
mini_batch 354
mini_batch 355
mini_batch 356
mini_batch 357
mini_batch 358
mini_batch 359
mini_batch 360
mini_batch 361
mini_batch 362
mini_batch 363
mini_batch 364
mini_batch 365
mini_batch 366
mini_batch 367
mini_batch 368
mini_batch 369
mini_batch 370
mini_batch 371
mini_batch 372
mini_batch 373
mini_batch 374
mini_batch 375
Valid loss for validation set is  4.003965088116225 %.
Accuracy for validation set is 57.14045698924731 %.
epoch 28 time: 0:01:48.841204
mini_batch 0
mini_batch 1
mini_batch 2
mini_batch 3
mini_batch 4
mini_batch 5
mini_batch 6
mini_batch 7
mini_batch 8
mini_batch 9
mini_batch 10
mini_batch 11
mini_batch 12
mini_batch 13
mini_batch 14
mini_batch 15
mini_

mini_batch 100
mini_batch 101
mini_batch 102
mini_batch 103
mini_batch 104
mini_batch 105
mini_batch 106
mini_batch 107
mini_batch 108
mini_batch 109
mini_batch 110
mini_batch 111
mini_batch 112
mini_batch 113
mini_batch 114
mini_batch 115
mini_batch 116
mini_batch 117
mini_batch 118
mini_batch 119
mini_batch 120
mini_batch 121
mini_batch 122
mini_batch 123
mini_batch 124
mini_batch 125
mini_batch 126
mini_batch 127
mini_batch 128
mini_batch 129
mini_batch 130
mini_batch 131
mini_batch 132
mini_batch 133
mini_batch 134
mini_batch 135
mini_batch 136
mini_batch 137
mini_batch 138
mini_batch 139
mini_batch 140
mini_batch 141
mini_batch 142
mini_batch 143
mini_batch 144
mini_batch 145
mini_batch 146
mini_batch 147
mini_batch 148
mini_batch 149
Epoch 31, average minibatch 150 loss: 0.056
mini_batch 150
mini_batch 151
mini_batch 152
mini_batch 153
mini_batch 154
mini_batch 155
mini_batch 156
mini_batch 157
mini_batch 158
mini_batch 159
mini_batch 160
mini_batch 161
mini_batch 162
mini_batch 

mini_batch 243
mini_batch 244
mini_batch 245
mini_batch 246
mini_batch 247
mini_batch 248
mini_batch 249
Epoch 32, average minibatch 250 loss: 0.065
mini_batch 250
mini_batch 251
mini_batch 252
mini_batch 253
mini_batch 254
mini_batch 255
mini_batch 256
mini_batch 257
mini_batch 258
mini_batch 259
mini_batch 260
mini_batch 261
mini_batch 262
mini_batch 263
mini_batch 264
mini_batch 265
mini_batch 266
mini_batch 267
mini_batch 268
mini_batch 269
mini_batch 270
mini_batch 271
mini_batch 272
mini_batch 273
mini_batch 274
mini_batch 275
mini_batch 276
mini_batch 277
mini_batch 278
mini_batch 279
mini_batch 280
mini_batch 281
mini_batch 282
mini_batch 283
mini_batch 284
mini_batch 285
mini_batch 286
mini_batch 287
mini_batch 288
mini_batch 289
mini_batch 290
mini_batch 291
mini_batch 292
mini_batch 293
mini_batch 294
mini_batch 295
mini_batch 296
mini_batch 297
mini_batch 298
mini_batch 299
Epoch 32, average minibatch 300 loss: 0.079
mini_batch 300
mini_batch 301
mini_batch 302
mini_batch 3

In [None]:
torch.save(net, "trained_model.pt")

# Apply Model On the Test Dataset

In [None]:
from loadModel import *

In [None]:
#Create test set
test_dataset = loader('test.csv','/datasets/cs154-fa19-public/',
                      transform = transform)

test_loader = torch.utils.data.DataLoader(test_dataset, 
                                          batch_size = batch_size)

## Test Set Preformance

In [None]:
#helper functions

#model for performance
def per_class_model_performance(performances):
    
    perf_df = []
    
    #for each class, calculate accuracy, recall, precision and bcr
    for i in range(len(performances)):
        
        cur_perf = performances[i]
        accu, recall, precision, bcr = get_per_class_values(cur_perf)
        
        perf_df.append([accu, precision, recall, bcr])
        
    #make it to a dataframe
    perf_df = pd.DataFrame(perf_df)
    perf_df.columns = ['Accuracy', 'Precision', 'Recall', 'BCR']
    
    return perf_df
 

#get measurement recall, accuracy, precision and bcr value for the current class
def get_per_class_values(cur_perf):    
    
    tp = cur_perf['TP']
    fp = cur_perf['FP']
    tn = cur_perf['TN']
    fn = cur_perf['FN']
    
    #accuracy
    accu = (tp + tn)/(tp + tn + fp + fn)
    
    #recall
    if tp + fn == 0:
        recall = 0
    else:
        recall = tp / (tp + fn)
    
    #precision
    if fp + tp == 0:
        precision = 0
    else:
        precision = tp / (fp + tp)
        
    #bcr
    bcr = (precision + recall) / 2
    
    return accu, recall, precision, bcr

In [None]:
#Apply to test set and test Performances
all_class_performance = []
test_accuracies = []

#turn list into a sparse matrix
def make_matrix(lst):
    mat = []
    for i in lst:
        cur = [0] * 201
        cur[i] = 1
        mat.append(cur)
    return np.array(mat)


for i in range(201):
    all_class_performance.append({'TP': 0, 'FP': 0, 'TN': 0, 'FN': 0})

with torch.no_grad(): 
    
    test_accu = 0
    
    for minibatch_count, (images, labels) in enumerate(test_loader, 0):
        
        print("current minibatch: ", minibatch_count)
        # Put the minibatch data in CUDA Tensors and run on the GPU if supported
        images, labels = images.to(computing_device), labels.to(computing_device) 
        outputs = model(images)
        
        test_accu += calculate_accu(outputs, labels, batch_size)
        
        predictions = torch.max(outputs, dim = 1)[1]

        pred = make_matrix(predictions.tolist())
        lab = make_matrix(labels.tolist())

        for i in range(pred.shape[0]):
            for j in range(201):
                if (pred[i][j] == 1) and (lab[i][j] == 1):
                    all_class_performance[j]['TP'] += 1
                elif (pred[i][j] == 1) and (lab[i][j] == 0):
                    all_class_performance[j]['FP'] += 1
                elif (pred[i][j] == 0) and (lab[i][j] == 0):
                    all_class_performance[j]['TN'] += 1
                else:
                    all_class_performance[j]['FN'] += 1
                    
    test_accuracies = (test_accu/minibatch_count)

In [None]:
per_class_model_performance(all_class_performance)

## Visualizations

In [None]:
import matplotlib.pyplot as plt

### Training and Validation Loss Curves

In [None]:
graph_title = 'Training vs Validation Losses for Baseline CNN with Early Stopping'

fig = plt.figure(figsize=(10, 8))
ax = plt.subplot()
ax.plot(np.arange(1, len(train_losses) + 1), train_losses, label='Training Losses')
ax.plot(np.arange(1, len(valid_losses) + 1), valid_losses, label='Validation Losses')
ax.set(xlabel='Number of Epochs', ylabel='Losses',
           title=graph_title)
leg = ax.legend(loc=4)
fig.savefig('graphs/baseline_train_vad_loss.png')

### Plot on Training and Testing Accuracy Curves

In [None]:
graph_title = 'Training vs Validation Accuracies for for Baseline CNN with Early Stopping'

fig = plt.figure(figsize=(10, 8))
ax = plt.subplot()
ax.plot(np.arange(1, len(train_accuracies) + 1), np.array(train_accuracies) * 100, label='Training Accuracies(%)')
ax.plot(np.arange(1, len(valid_accuracies) + 1), np.array(valid_accuracies) * 100, label='Validation Accuracies(%)')
ax.set(xlabel='Number of Epochs', ylabel='Accuracy(%)',
           title=graph_title)
leg = ax.legend(loc=4)
fig.savefig('graphs/baseline_train_test_accu.png')

In [None]:
print('The test accuracy is ' + str(test_accu/minibatch_count))

### Filter Maps

# Transfer Learning

In [None]:
model_ft = models.resnet18(pretrained=True)
num_ftrs = model_ft.fc.in_features
model_ft.fc = nn.Linear(num_ftrs, 200)

model_ft = model_ft.to(computing_device)
criterion = nn.CrossEntropyLoss()

optimizer_conv = optim.SGD(model_conv.fc.parameters(), lr=0.001, momentum=0.9)
exp_lr_scheduler = lr_scheduler.StepLR(optimizer_conv, step_size=7, gamma=0.1)

model_conv = train_model(model_conv, criterion, optimizer_conv,
                         exp_lr_scheduler, num_epochs=25)