# Compare Training Time in Different Hardware

**Description**: Pada notebook ini, akan dibangun model CNN untuk proses pengenalan karakter tulisan tangan untuk digit 0-9 yang berasal dari dataset MNIST yang sudah disediakan oleh Tensorflow. Notebook ini akan dijalankan pada beberapa perangkat yang berbeda dengan spesifikasi yang berbeda kemudian akan dibandingkan waktu trainingnya untuk melihat apakah ada perbedaan yang signifikan untuk setiap spesifikasi perangkat yang berbeda.

**Objective**: Membandingkan waktu training model pada beberapa tipe hardware berbeda (CPU, RAM size, GPU)

## Import Library

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from PIL import Image

# Load Dataset
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

import time

## Preprocessing Data

Pada bagian ini, akan dibuat fungsi untuk melakukan preprocessing data yaitu fungsi `load_dataset()`. Fungsi tersebut akan mencoba untuk memuat data, resizing gambar, normalisasi gambar, dan mengubah tipe data target variabel menjadi tipe kategorikal. Selain itu akan dibangun juga fungsi `create_model()` yang berfungsi untuk membangun model CNN untuk mengenali karakter

In [2]:
# Load dataset
def load_dataset():
    '''
    Function to load and preprocessing the dataset
    '''
    
    # Load data
    (trainX, trainY), (testX, testY) = mnist.load_data()
    
    # Reshaping data
    trainX = trainX.reshape((trainX.shape[0], 28, 28, 1))
    testX = testX.reshape((testX.shape[0], 28, 28, 1))
    
    # Normalize data
    train_norm = trainX.astype('float32')
    train_norm = train_norm/255
    
    test_norm = testX.astype('float32')
    test_norm = test_norm/255

    # Change target variable to categorical type
    trainY = to_categorical(trainY)
    testY = to_categorical(testY)


    return train_norm, trainY, test_norm, testY

Berikut adalah ilustrasi model CNN yang akan dibuat:

![](./assets/model.png)

In [3]:
def create_model():
    '''
    Function to create model and setup training configuration
    '''
    
    # Model architecture
    model = tf.keras.models.Sequential([
        tf.keras.layers.Conv2D(16, (3, 3), activation='relu', input_shape=(28, 28, 1)),
        tf.keras.layers.MaxPooling2D(2, 2),
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dropout(0.5),
        tf.keras.layers.Dense(16, activation='relu'),
        tf.keras.layers.Dense(10, activation='softmax')
    ])
    
    # Configuration training
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=1e-3),
                    loss='categorical_crossentropy',
                    metrics=['accuracy'])
    
    
    return model

## Execution

Pada bagian ini kita akan menjalankan fungsi yang telah dibuat sebelumnya. Kemudian, dilanjut dengan proses training hingga 20 epochs. Kemudian akan dihitung waktu yang dibutuhkan untuk menjalankan proses training tersebut.

In [4]:
# Call the function
X_train, y_train, X_test, y_test = load_dataset()
model = create_model()

In [5]:
# Training model
start = time.time()
history = model.fit(x = X_train,
                     y = y_train,
                     epochs = 20,
                     batch_size = 32,
                     validation_data = (X_test, y_test),
                     verbose = 2)
end = time.time()

Epoch 1/20
1875/1875 - 28s - loss: 0.3320 - accuracy: 0.9002 - val_loss: 0.1163 - val_accuracy: 0.9660
Epoch 2/20
1875/1875 - 24s - loss: 0.1483 - accuracy: 0.9551 - val_loss: 0.0854 - val_accuracy: 0.9744
Epoch 3/20
1875/1875 - 24s - loss: 0.1179 - accuracy: 0.9627 - val_loss: 0.0699 - val_accuracy: 0.9764
Epoch 4/20
1875/1875 - 23s - loss: 0.1060 - accuracy: 0.9676 - val_loss: 0.0624 - val_accuracy: 0.9805
Epoch 5/20
1875/1875 - 22s - loss: 0.0965 - accuracy: 0.9703 - val_loss: 0.0553 - val_accuracy: 0.9818
Epoch 6/20
1875/1875 - 24s - loss: 0.0886 - accuracy: 0.9722 - val_loss: 0.0591 - val_accuracy: 0.9797
Epoch 7/20
1875/1875 - 22s - loss: 0.0808 - accuracy: 0.9742 - val_loss: 0.0534 - val_accuracy: 0.9818
Epoch 8/20
1875/1875 - 23s - loss: 0.0773 - accuracy: 0.9760 - val_loss: 0.0515 - val_accuracy: 0.9822
Epoch 9/20
1875/1875 - 24s - loss: 0.0732 - accuracy: 0.9765 - val_loss: 0.0496 - val_accuracy: 0.9828
Epoch 10/20
1875/1875 - 35s - loss: 0.0699 - accuracy: 0.9773 - val_loss:

In [6]:
# Calculate the duration
duration = end - start
print(f'Duration : {duration:.2f} s')
print(f'Duration per Epoch : {(duration/20):.2f} s')

Duration : 469.15 s
Duration per Epoch : 23.46 s


## Hardware Specification

Pada bagian ini, kita akan mengambil informasi terkait spesifikasi hardware dari perangkat yang digunakan.

In [7]:
# Check CPU
import platform
print(f'Processor Machine: {platform.machine()}')
print(f'OS: {platform.platform()}')
print(f'Processor Name: {platform.processor()}')

Processor Machine: AMD64
OS: Windows-10-10.0.19044-SP0
Processor Name: AMD64 Family 22 Model 48 Stepping 1, AuthenticAMD


In [8]:
# Check RAM
import psutil

svmem = psutil.virtual_memory()
print(f"Total: {svmem.total/(1024 ** 3):.2f} GB")
print(f"Available: {svmem.available/(1024 ** 3):.2f} GB")
print(f"Used: {svmem.used/(1024 ** 3):.2f} GB")
print(f"Percentage: {svmem.percent}%")

Total: 6.96 GB
Available: 2.18 GB
Used: 4.78 GB
Percentage: 68.7%


In [9]:
# Check GPU
tf.config.list_physical_devices('GPU')

[]