In [1]:
import numpy as np
import pandas as pd

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import Dataset, DataLoader


import matplotlib.pyplot as plt

In [2]:
# Device configuration
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Binary Classification

In [3]:
# input_dim: Number of the features
# hidden_size: Number of the hidden nodes

class BinaryClassification(nn.Module):
    def __init__(self,input_dim,hidden_size,output_dim):
        super(BinaryClassification,self).__init__()
        
        self.BCmodel = nn.Sequential(
                                    nn.Linear(input_dim,hidden_size),
                                    nn.ReLU(),
                                    nn.Linear(hidden_size,output_dim),
                                    nn.Sigmoid()
                                    )
    def forward(self,x):
        return self.BCmodel(x)

In [4]:
criterion = nn.BCELoss()

# Multi-class Classification

In [5]:
class MultiClassification(nn.Module):
    def __init__(self,input_dim,hidden_size,output_dim):
        super(MultiClassification,self).__init__()
        
        self.MultiCmodel = nn.Sequential(
                                    nn.Linear(input_dim,hidden_size),
                                    nn.ReLU(),
                                    nn.Linear(hidden_size,output_dim)
                                    # No Softmax at the end 
                                    )
    def forward(self,x):
        return self.MultiCmodel(x)

In [6]:
criterion = nn.CrossEntropyLoss() # Applies Softmax

# Example

In [3]:
# Constants
input_size = 784 # 28*28
hidden_size = 100
output_size = 10
learning_rate = 0.001
n_epochs = 20
batch_size = 100

In [4]:
# MNIST
train_data = torchvision.datasets.MNIST(root='./data', train=True, transform=transforms.ToTensor(),download=True)
test_data = torchvision.datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor())

In [5]:
train_loader = DataLoader(dataset=train_data,batch_size=batch_size,shuffle=True)
test_loader = DataLoader(dataset=test_data,batch_size=batch_size,shuffle=False)

In [6]:
examples = iter(train_loader)
sample, label = examples.next()
print(sample.shape, label.shape)

torch.Size([100, 1, 28, 28]) torch.Size([100])


In [7]:
class MultiClassification(nn.Module):
    def __init__(self,input_dim,hidden_size,output_dim):
        super(MultiClassification,self).__init__()
        
        self.MultiCmodel = nn.Sequential(
                                    nn.Linear(input_dim,hidden_size),
                                    nn.ReLU(),
                                    nn.Linear(hidden_size,output_dim)
                                    # No Softmax at the end 
                                    )
    def forward(self,x):
        return self.MultiCmodel(x)

In [8]:
model = MultiClassification(input_size,hidden_size,output_size)

In [9]:
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(),lr=learning_rate)

In [10]:
from tqdm import tqdm

In [11]:
n_total_steps = len(train_loader)

for epoch in range(n_epochs):
    for i, (images,labels) in enumerate(tqdm(train_loader)):
        
        images = images.reshape(-1,28*28).to(device)
        labels = labels.to(device)
        
        model = model.to(device)
        criterion = criterion.to(device)
    
        # Predict
        y_pred = model(images)
        # Compare
        loss = criterion(y_pred,labels)
        # Learn
        dw = loss.backward()
        optimizer.step()
        optimizer.zero_grad()
        if (i+1) % 600 ==0:
            print(f'epoch {epoch+1} / {n_epochs}, loss = {loss.item():.4f}')

100%|██████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:16<00:00, 37.19it/s]


epoch 1 / 20, loss = 0.3177


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.61it/s]


epoch 2 / 20, loss = 0.1455


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.79it/s]


epoch 3 / 20, loss = 0.1594


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.32it/s]


epoch 4 / 20, loss = 0.0811


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.85it/s]


epoch 5 / 20, loss = 0.1051


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 132.06it/s]


epoch 6 / 20, loss = 0.0841


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.70it/s]


epoch 7 / 20, loss = 0.0429


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.66it/s]


epoch 8 / 20, loss = 0.0391


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.21it/s]


epoch 9 / 20, loss = 0.0981


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.15it/s]


epoch 10 / 20, loss = 0.0288


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.26it/s]


epoch 11 / 20, loss = 0.0220


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.60it/s]


epoch 12 / 20, loss = 0.0231


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 130.00it/s]


epoch 13 / 20, loss = 0.0234


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.17it/s]


epoch 14 / 20, loss = 0.0266


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 130.69it/s]


epoch 15 / 20, loss = 0.0327


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 130.30it/s]


epoch 16 / 20, loss = 0.0118


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 129.98it/s]


epoch 17 / 20, loss = 0.0066


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 131.39it/s]


epoch 18 / 20, loss = 0.0474


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 130.98it/s]


epoch 19 / 20, loss = 0.0393


100%|█████████████████████████████████████████████████████████████████████████████████████| 600/600 [00:04<00:00, 129.78it/s]

epoch 20 / 20, loss = 0.0083





In [24]:
with torch.no_grad():
    n_correct = 0
    n_samples = 0
    for images, labels in test_loader:
        images = images.reshape(-1,28*28).to(device)
        labels = labels.to(device)
        y_predicted = model(images)
        _ , y_predictions = torch.max(y_predicted,1)
        n_samples += labels.shape[0]
        n_correct += (y_predictions == labels).sum().item()

In [32]:
acc = 100.0 * n_correct / n_samples
print(f'accuracy={acc}')

accuracy=97.73
