# Thực hiện phân loại hình ảnh sử dụng kiến trúc CNN sử dụng GPU

Trong bài toán này ta sẽ sử dụng deep neural network CNN để thực hiện phân loại đa lớp trên bộ dữ liệu Fashion-MNIST. Bộ dữ liệu này bao gồm 70.000 hình ảnh 28x28 gray của các sản phẩm thời trang từ 10 danh mục, với 7.000 hình ảnh cho mỗi danh mục,  chẳng hạn như giày dép, áo phông, váy, v.v. Ánh xạ số nguyên từ 0-9 vào class được liệt kê dưới đây:

    0: T-shirt/top
    1: Trouser
    2: Pullover
    3: Dress
    4: Coat
    5: Sandal
    6: Shirt
    7: Sneaker
    8: Bag
    9: Ankle boot

### Download the Fashion-MNIST dataset

In [1]:
import io
import tensorflow as tf
import tensorflow_datasets as tfds
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPool2D, BatchNormalization
from tensorflow.keras import datasets, layers, models
from tensorflow import keras
import matplotlib.pyplot as plt
import numpy as np
import os

### Download the dataset

In [2]:
datasets, info = tfds.load(name='fashion_mnist', with_info=True, as_supervised=True)

mnist_train, mnist_test = datasets['train'], datasets['test']

### Xác định distribution strategy

In [3]:
strategy = tf.distribute.MirroredStrategy()

INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)


INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)


In [4]:
print('Number of devices: {}'.format(strategy.num_replicas_in_sync))

Number of devices: 1


### Setup input pipeline

Khi đào tạo một mô hình có nhiều GPU, ta có thể sử dụng hiệu quả sức mạnh tính toán bằng cách tăng kích thước batch. Nói chung, hãy sử dụng kích thước batch lớn nhất phù hợp với bộ nhớ GPU và điều chỉnh learning rate cho phù hợp.

In [5]:
num_train_examples = info.splits['train'].num_examples
num_test_examples = info.splits['test'].num_examples
print("train examples: {}".format(num_train_examples))
print("test examples: {}".format(num_test_examples))
buffer_size = 10000

batch_size_per_device = 64
batch_size = batch_size_per_device * strategy.num_replicas_in_sync

train examples: 60000
test examples: 10000


**Rescale**

Chuẩn hóa dữ liệu: CNN thực hiện dữ liệu trên [0..1] nhanh hơn trên [0..255].

In [6]:
def scale(image, label):
    
    image = tf.cast(image, tf.float32)
    image /= 255
    
    return image, label

Áp dụng function này cho dữ liệu đào tạo, xáo trộn dữ liệu đào tạo và batch.

In [7]:
eval_dataset = mnist_train.take(int(num_train_examples*0.1))
train_dataset = mnist_train.skip(int(num_train_examples*0.1))

test_dataset = mnist_test.map(scale).batch(batch_size)
train_dataset = train_dataset.map(scale).cache().shuffle(buffer_size).batch(batch_size)
eval_dataset = eval_dataset.map(scale).batch(batch_size)

### Xây dựng model

Vì chúng ta đang training trên đa GPU nên ta sẽ xây dưng model bên trong strategy.scope

Ở đây ta sử dụng Squential API Keras, nơi ta chỉ cần thêm từng lớp một, bắt đầu từ đầu vào.

- Đầu tiên là lớp chập (Conv2D). Nó giống như một tập hợp các bộ lọc có thể học được. Ma trận bộ lọc được áp dụng trên toàn bộ hình ảnh. Bộ lọc có thể được xem như một sự biến đổi của hình ảnh.

- Lớp quan trọng thứ hai trong CNN là lớp gộp (MaxPool2D). Nó nhìn vào 2 pixel lân cận và chọn giá trị lớn nhất. Chúng được sử dụng để giảm chi phí tính toán và ở một mức độ nào đó cũng làm giảm việc overfiting

- Dropout là một phương pháp regularization , trong đó tỷ lệ các nút trong lớp được bỏ qua ngẫu nhiên cho mỗi mẫu đào tạo. Kỹ thuật này giảm bớt overfiting trong một mang neural phức tạp

- 'RELU' (activation function max(0,x)).Được sử dụng để thêm tính phi tuyến tính vào network

- Batch normalization thực hiện việc chuẩn hóa (normalizing) và zero centering (mean substracting) dữ liệu trước khi đưa qua hàm activation (giá trị trung bình (mean) sẽ được đưa về 0 và phương sai (variance) sẽ được đưa về 1). Để thực hiện 2 công việc trên, batch normalization tính toán phương sai và độ lệch chuẩn của dữ liệu dựa trên các batchs, rồi sử dụng 2 tham số gamma và beta tinh chỉnh đầu ra.

- Lớp Flatten được sử dụng để chuyển đổi các features cuối cùng thành một vectơ 1D duy nhất.

- Cuối cùng, sử dụng các layer Dense để đưa ra kết quả

Thêm một layers Conv2D-> MaxPool2D-> Dropout có thể giúp mạng nắm bắt các tính năng phức tạp hơn. Nhưng hãy nhớ mạng càng sâu thì chi phí tính toán càng đắt.

API tf.distribute.Strategy cung cấp một bản tóm tắt để phân phối đào tạo trên nhiều đơn vị xử lý. Mục đích là cho phép người dùng kích hoạt đào tạo phân tán bằng cách sử dụng các mô hình và mã đào tạo hiện có, với những thay đổi tối thiểu. Từ đó giúp tăng đáng kể hiệu suất training trên những tập dữ liệu lớn sử dụng GPU.

In [8]:
strategy = tf.distribute.MirroredStrategy()

INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)


INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)


In [9]:
print('Số lượng thiết bị: {}'.format(strategy.num_replicas_in_sync))

Số lượng thiết bị: 1


In [10]:
with strategy.scope():
    model = tf.keras.Sequential([
        Conv2D(filters = 16, kernel_size = (3, 3), activation='relu', input_shape = (28, 28, 1)),
        BatchNormalization(),
        Conv2D(filters = 16, kernel_size = (3, 3), activation='relu'),
        BatchNormalization(),
        MaxPool2D(strides=(2,2)),
        Dropout(0.25),

        Conv2D(filters = 32, kernel_size = (3, 3), activation='relu'),
        BatchNormalization(),
        Conv2D(filters = 32, kernel_size = (3, 3), activation='relu'),
        BatchNormalization(),
        MaxPool2D(strides=(2,2)),
        Dropout(0.25),

        Flatten(),
        Dense(512, activation='relu'),
        Dropout(0.25),
        Dense(1024, activation='relu'),
        Dropout(0.5),
        Dense(10)
    ])

    model.compile(loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
                optimizer=tf.keras.optimizers.Adam(learning_rate = 1e-4),
                metrics=['accuracy'])

INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


INFO:tensorflow:Reduce to /job:localhost/replica:0/task:0/device:CPU:0 then broadcast to ('/job:localhost/replica:0/task:0/device:CPU:0',).


In [11]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 16)        160       
_________________________________________________________________
batch_normalization (BatchNo (None, 26, 26, 16)        64        
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 24, 24, 16)        2320      
_________________________________________________________________
batch_normalization_1 (Batch (None, 24, 24, 16)        64        
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 12, 12, 16)        0         
_________________________________________________________________
dropout (Dropout)            (None, 12, 12, 16)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 10, 10, 32)        4

### Định nghĩa callbacks

Callback là một công cụ mạnh mẽ để tùy chỉnh hành vi của mô hình Keras trong quá trình đào tạo, đánh giá hoặc suy luận. Các ví dụ bao gồm tf.keras.callbacks.TensorBoard nơi quá trình và kết quả đào tạo có thể được xuất và hiển thị bằng TensorBoard, hoặc tf.keras.callbacks.ModelCheckpoint nơi mô hình được lưu tự động trọng số trong quá trình đào tạo .... Callback là một class python có nghĩa là được phân lớp để cung cấp chức năng cụ thể, với một tập hợp các phương thức được gọi ở các giai đoạn đào tạo khác nhau.

In [12]:
# Xác định thư mục để lưu trữ các checkpoint
checkpoint_dir = './training_checkpoints'
checkpoint_prefix = os.path.join(checkpoint_dir, "ckpt_{epoch}")

In [13]:
callbacks = [
    tf.keras.callbacks.TensorBoard(log_dir='./logs'),
    tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_prefix,
                                       save_weights_only=True)
]

### Train and evaluate

In [14]:
model.fit(train_dataset, epochs=50, callbacks=callbacks, validation_data= eval_dataset)





Epoch 1/50
Instructions for updating:
Use `tf.data.Iterator.get_next_as_optional()` instead.


Instructions for updating:
Use `tf.data.Iterator.get_next_as_optional()` instead.


Instructions for updating:
use `tf.profiler.experimental.stop` instead.


Instructions for updating:
use `tf.profiler.experimental.stop` instead.






Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<tensorflow.python.keras.callbacks.History at 0x2502f2b9788>

Sau khi train xong, trên command line ta nhập: tensorboard --logdir logs để quan sát quá trình đào tạo của model

<img src="board.png" style="width:1000px;height:250;">

Tiếp theo hãy load checkpoint mới nhất và đánh giá trên dữ liệu thử nghiệm.

In [15]:
model.load_weights(tf.train.latest_checkpoint(checkpoint_dir))

test_loss, test_acc = model.evaluate(test_dataset)

print('test loss: {}, test Accuracy: {}'.format(test_loss, test_acc))

test loss: 0.21900200843811035, test Accuracy: 0.9251999855041504


### SavedModel

In [16]:
path = 'saved_model/'

In [17]:
model.save(path, save_format='tf')

Instructions for updating:
This property should not be used in TensorFlow 2.0, as updates are applied automatically.


Instructions for updating:
This property should not be used in TensorFlow 2.0, as updates are applied automatically.


Instructions for updating:
This property should not be used in TensorFlow 2.0, as updates are applied automatically.


Instructions for updating:
This property should not be used in TensorFlow 2.0, as updates are applied automatically.


INFO:tensorflow:Assets written to: saved_model/assets


INFO:tensorflow:Assets written to: saved_model/assets
