In [1]:
# Import module torch dan torchvision yang memiliki dataset mnist
import torch
from torch.autograd import Variable
import torchvision.transforms as transforms
import torchvision.datasets as dsets

In [2]:
# Pisahkan antara dataset untuk training dan dataset untuk test, perlu diingat disini pytorch menggunakan format
# data tensor, sehingga ToTensor() disini berguna untuk mengubah format data menjadi tensor
train_dataset = dsets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = dsets.MNIST(root='./data', train=False, transform=transforms.ToTensor())

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./data/MNIST/raw/train-images-idx3-ubyte.gz


  0%|          | 0/9912422 [00:00<?, ?it/s]

Extracting ./data/MNIST/raw/train-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./data/MNIST/raw/train-labels-idx1-ubyte.gz


  0%|          | 0/28881 [00:00<?, ?it/s]

Extracting ./data/MNIST/raw/train-labels-idx1-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw/t10k-images-idx3-ubyte.gz


  0%|          | 0/1648877 [00:00<?, ?it/s]

Extracting ./data/MNIST/raw/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz


  0%|          | 0/4542 [00:00<?, ?it/s]

Extracting ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw



In [12]:
# Definisi variabel dalam optimisasi

# Batch size merupakan banyaknya data yang di proses misal jika kita mempunyai data 10000
# dengan batch size 200, berarti kita memiliki 50 batch dengan per batch kita mengeksekusi 200 data 
batch_size = 100

# Banyaknya iterasi pada gradient
n_iters = 6000

# Epoch berarti berapa kali algoritma kita akan bekerja untuk memproses semua data/per batch
epochs = n_iters / (len(train_dataset) / batch_size)
# Banyaknya input data kita, ingat kita memiliki gambar MNIST dengan dimensi 28 x 28 sehingga kita memiliki
# Vektorisasi 784
input_dim = 784
# Banyaknya kelas, disini kita ingin mengklasifikasikan multikelas dari 0,1,..9
output_dim = 10
# Learning rate merupakan parameter skala dalam turunan, ingat parameter alpha
lr_rate = 0.001

In [13]:
# Variabel training data dan test data
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

In [14]:
# Dalam pytorch kita harus mendefinisikan class, ingat dalam class di object oriented program
# Kita memiliki beberapa atribut, atau metoda, dsini kita memiliki constructor __init__
# yang menggunakan fungsi super agar kita mendapatkan properti dari paremt torch.nn.Module
# Metoda forward merupakan forward model kita

class LogisticRegression(torch.nn.Module):
    def __init__(self, input_dim, output_dim):
        super(LogisticRegression, self).__init__()
        self.linear = torch.nn.Linear(input_dim, output_dim)

    def forward(self, x):
        outputs = self.linear(x)
        return outputs

In [15]:
# Kita buat instance dari kelas LogisticRegresion dengan input dimensi sebanyak gambar kita dan output dimensi 
# Banyaknya kelas
model = LogisticRegression(input_dim, output_dim)

In [16]:
# Disini kita menentukan cost function kita, yaitu seperti yang kita pelajari disebut juga cross entropy
criterion = torch.nn.CrossEntropyLoss() # computes softmax and then the cross entropy

In [17]:
# Metode gradient method yang kita gunakan, di dalam modul yang kita pelajari kita hanya menggunakan simpel gradient
# Namun pada kenyataannya sekarang ada banyak variasi metode gradient, disini kita menggunakan SGD (Stochastic Gradient Method)
# Dengan learning rate yang kita tentukan
optimizer = torch.optim.SGD(model.parameters(), lr=lr_rate)

In [18]:
# Masuk kedalam iterasi per epoch
iter = 0
for epoch in range(int(epochs)):
    # Load semua data dan label nya
    for i, (images, labels) in enumerate(train_loader):
        images = Variable(images.view(-1, 28 * 28))
        labels = Variable(labels)
        
        # Definisikan dan inisialisasi gradient dengan 0
        optimizer.zero_grad()
        # Hitung instance kita dengan input data dan disini
        # Kita hitung forward model
        outputs = model(images)
        # Bandingkan dengan label dengan menggunakan cost function kita
        loss = criterion(outputs, labels)
        # Lakukan prosess backward dengan stepsize
        loss.backward()
        optimizer.step()
        
        # Tambah iterasi
        iter+=1
        # Condisi agar kita menampilkan nilai tiap iterasi yang habis dibagi 500
        if iter%500==0:
            # Hitung akurasi network kita dan print hasilnya
            # Dengan menggunakan test data
            correct = 0
            total = 0
            for images, labels in test_loader:
                images = Variable(images.view(-1, 28*28))
                outputs = model(images)
                _, predicted = torch.max(outputs.data, 1)
                total+= labels.size(0)
                # Untuk gpu, kembalikan predicted and labels ke cpu
                correct+= (predicted == labels).sum()
            accuracy = 100 * correct/total
            print("Iteration: {}. Loss: {}. Accuracy: {}.".format(iter, loss.item(), accuracy))

Iteration: 500. Loss: 1.9379119873046875. Accuracy: 66.80999755859375.
Iteration: 1000. Loss: 1.5509116649627686. Accuracy: 76.0999984741211.
Iteration: 1500. Loss: 1.332176923751831. Accuracy: 78.8499984741211.
Iteration: 2000. Loss: 1.204288363456726. Accuracy: 80.51000213623047.
Iteration: 2500. Loss: 1.0564988851547241. Accuracy: 81.7300033569336.
Iteration: 3000. Loss: 1.0266402959823608. Accuracy: 82.62000274658203.
Iteration: 3500. Loss: 0.9627998471260071. Accuracy: 83.30999755859375.
Iteration: 4000. Loss: 0.8270407915115356. Accuracy: 83.72000122070312.
Iteration: 4500. Loss: 0.8181248307228088. Accuracy: 84.20999908447266.
Iteration: 5000. Loss: 0.7286779880523682. Accuracy: 84.58999633789062.
Iteration: 5500. Loss: 0.8189718127250671. Accuracy: 84.91999816894531.
Iteration: 6000. Loss: 0.7198503613471985. Accuracy: 85.33000183105469.
