<a href="https://colab.research.google.com/github/PTson2207/Deployment-Model-App/blob/main/model_training.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Training someone model, then deploy ...

- Want: Save_model and then upload Google Storage
- Data: From Kaggle-Food 101
- Model(s): 10, 11, 12 classes

Setup some Function

In [1]:
# thư viện
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import zipfile
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.layers.experimental import preprocessing

In [2]:
# Hàm unzip dowload_data file

def unzip_data(file_name):
    zip_ref = zipfile.ZipFile(file_name, 'r')
    zip_ref.extractall()
    zip_ref.close()

In [3]:
# Setup dataset input
IMG_SIZE = (224, 224)

def create_data_loader(train_dir, test_dir, img_size=IMG_SIZE):
    train_data = tf.keras.preprocessing.image_dataset_from_directory(train_dir,
                                                                     label_mode="categorical",
                                                                     img_size=img_size)
    
    test_data = tf.keras.preprocessing.image_dataset_from_directory(test_dir,
                                                                    label_mode="categorical",
                                                                    img_size=img_size)
    return train_data, test_data

In [5]:
data_augument = keras.Sequential([
                                  preprocessing.RandomFlip('horizontal'),
                                  preprocessing.RandomRotation(0.2),
                                  preprocessing.RandomHeight(0.2),
                                  preprocessing.RandomWidth(0.2),
                                  preprocessing.RandomZoom(0.2),
                                  #preprocessing.Rescaling(1./255) # cho Resnet50V2, không cần thiết với EfficientNetB0
], name="data_augument")

In [7]:
# setup input_shape and base_model
INPUT_SHAPE = (244, 244, 3)
BASE_MODEL = tf.keras.applications.EfficientNetB0(include_top=False)

In [8]:
def create_model(input_shape=INPUT_SHAPE, base_model=BASE_MODEL, num_classes=10):
    # Fine tune model
    base_model.trainable = False
    # tạo layers
    inputs = layers.Input(shape=INPUT_SHAPE, name="input_layer")
    # thêm data_augument như một layer
    x = data_augument(inputs)
    # give model inputs (after augument) nhưng không train
    x = base_model(x, training= False)
    # Pool layer
    x = layers.GlobalAveragePooling2D(name='pooling_layers')(x)
    # put a dense layer as a out_put
    outputs = layers.Dense(num_classes, activation='softmax', name='output_layers')(x)

    # model từ input và output
    model = keras.Model(inputs, outputs)

    model.complie(loss="categorical_crossentropy",
                  optimizer=tf.keras.optimizers.Adam(),
                  metrics=['accuracy'])
    model.summary()

    return model

In [9]:
# Hàm import ảnh và resize ảnh
def load_and_prep_img(filename, img_shape=244, scale=False):
    # đọc ảnh
    img = tf.io.read_file(file_name)
    # dịch ảnh sang tensor unit8
    img = tf.image.decode_jpeg(img)
    # thay đổi kích thước ảnh
    img = tf.image.resize(img, [img_shape, img_shape])
    # đổi giá trị ảnh về giữa đoạn 0 đến 1
    if scale:
        return img/255
    else:
        return img

Download Data

In [10]:
!wget https://storage.googleapis.com/ztm_tf_course/food_vision/10_food_classes_all_data.zip

unzip_data("10_food_classes_all_data.zip")

--2021-03-19 06:49:24--  https://storage.googleapis.com/ztm_tf_course/food_vision/10_food_classes_all_data.zip
Resolving storage.googleapis.com (storage.googleapis.com)... 74.125.137.128, 142.250.101.128, 2607:f8b0:4023:c03::80, ...
Connecting to storage.googleapis.com (storage.googleapis.com)|74.125.137.128|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 519183241 (495M) [application/zip]
Saving to: ‘10_food_classes_all_data.zip’


2021-03-19 06:49:27 (218 MB/s) - ‘10_food_classes_all_data.zip’ saved [519183241/519183241]



In [12]:
# có bao nhiêu ảnh trong mỗi folder ?
import os

for dirpath, dirnames, filenames in os.walk("10_food_classes_all_data"):
    print(f"Có {len(dirnames)} thư mục con và có {len(filenames)} ảnh trong thư mục '{dirpath}'.")

Có 2 thư mục con và có 0 ảnh trong thư mục '10_food_classes_all_data'.
Có 10 thư mục con và có 0 ảnh trong thư mục '10_food_classes_all_data/train'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/pizza'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/fried_rice'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/sushi'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/hamburger'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/steak'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/grilled_salmon'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/ice_cream'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/chicken_curry'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10_food_classes_all_data/train/chicken_wings'.
Có 0 thư mục con và có 750 ảnh trong thư mục '10

In [13]:
# hàm tạo nhằm mục đích load lại mỗi khi chạy mới mô hình
import datetime

def create_tensorboard_callback(dir_name, experiment_name):
    log_dir = dir_name + "/" + experiment_name + "/" + datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
    tensorboard_callback = tf.keras.callbacks.TensorBoard(
        log_dir = log_dir
    )
    print(f"Lưu tệp nhật kí vào {log_dir}")
    return tensorboard_callback

    Vì ta có khả năng có thể chạy lại model nhiều lần, vì thế ta có thể theo dõi chúng theo một cách nào đó.
    Hàm trên lưu lại nhật kí hiệu suất mô hình ở thư mục: [dir_name]/[experiment_name]/[current_timestamp]:
    - dir_name:  thư mục lưu lại nhật kí tổng thể.
    - experiment_name: thử nghiệm cụ thể.
    - current_timestamp: thời gian thử nghiệm chi tiết.