In [None]:
#===========================================================================================
# 資料集：CIFAR-10資料集(CIFAR-10)
# 功能　：觀察後是單純預測種類
# 作者　：顏瑋良 (WeiLiang,Yan)
# 用意　：因中文範例教學較少，故撰寫此範本希望可以幫助剛學習的中文使用者，加速理解。
# 　　　　也在此作紀錄，給予lab未來學弟妹學習教學使用。
# 備註　：最近剛好正在閱讀 EfficientNet 網路，也因tensorflow有支援故本次使用 EfficientNet 做簡易預測
#        筆者也是剛接觸 tensorflow 與 CNN 為了加速學習故寫成筆記，若大家有看到筆者的錯誤請給予指導，謝謝。 
#===========================================================================================

In [None]:
#=========================================================================
# 以個人經驗做出簡易的作業標準流程(SOP)如下圖:
# 大致步驟分為三部分：(模型與資料處理皆很彈性沒有一定，所以參考即可)
# Step1.資料的御處理(Preprocessing data)
# Step2.模型選擇與建立(Data choose and build)
# STep3.模型驗證(Model validation)
#=========================================================================

In [None]:
print("\n簡易作業流程圖： \n\n")
from IPython.display import Image
from IPython.core.display import HTML 
Image(url= "https://i.imgur.com/6FQ3BZA.png")

In [None]:
#==================================================
# 載入需要的套件，做資料的預處理(在後續執行時會一一講解)。
#==================================================

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.datasets import cifar10

In [None]:
#================================================================================
# Step1：資料觀察與預處理
# Step1-1 開啟檔案
# Step1-2 觀察資料
# Step1-3 處理資料的NAN
# Step1-4 特徵挑選及資料正規化與編碼
#================================================================================

In [None]:
#===============================================================================================
# Step1：資料觀察與預處理
#　｜
#　｜
#　－－－Step1-1 開啟檔案
#  (因 tensorflow dataset 有收錄此資料集，故直接載入 cifar10 資料集)
#===============================================================================================

(train_image, train_label), (test_image, test_label) = tf.keras.datasets.cifar10.load_data()

print("\n\n訓練集特徵資料(圖像)：\n\n",train_image)
print("\n\n訓練集特徵資料(標籤)：\n\n",train_label)
print("\n\n測試集特徵資料(圖像)：\n\n",test_image)
print("\n\n測試集特徵資料(標籤)：\n\n",test_label)

In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-2 觀察資料 (介紹筆者喜愛使用指令)
#　　　　　｜　　　　
#　　　　　－－－ Step1-2-1　Pandas.DataFrame 類型
#　　　　　｜　　　　｜
#　　　　　｜　　　　－－－Step1-2-1-1 .columns      :判斷資料的行數及名稱
#　　　　　｜　　　　｜
#　　　　　｜　　　　－－－Step1-2-1-2 .info()　　　　：主因方便確認每行(column)是否有缺值(NAN)，和資料型態大小與行列數。
#　　　　　｜　　　　｜
#　　　　　｜　　　　－－－Step1-2-1-3 .shape        :這也可也用來單純確認，資料行列數(形狀)
#　　　　　｜　　　　｜
#　　　　　｜　　　　－－－Step1-2-1-4 .describe()　 ：描述資料基本狀態(如:平均值、標準差、最大值...等)
#　　　　　｜
#　　　　　｜　　　　
#　　　　　－－－Step1-2-2　Numpy.narray 類型
#　　　　　　　　　｜
#　　　　　　　　　－－－1-2-1 .unique()　　　：可以顯現出所有不重複的元素，可以判別標籤(label)內有幾類等。 
#　　　　　　　　　｜
#　　　　　　　　　－－－1-2-2 np.sort()　　　：蠻常需要將數值比大小等，可以將資料排序方便觀察。
#=============================================================================================================

In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-2 觀察資料 (介紹筆者喜愛使用指令)
#　　　　　｜　　　　
#　　　　　－－－ Step1-2-1　Pandas.DataFrame 類型
#　　　　　 　　　　｜
#　　　　　 　　　　－－－Step1-2-1-1 .columns      :判斷資料的行數及名稱
#=============================================================================================================
# 因為這裡為 numpy.ndarray 沒辦法直接看出類別名稱得對應
# 這裡使用 matplotlib 套件將資料視覺化，可以觀察這裡 畫出資料集中第0到第24張圖與他對應的標籤 (圖片大小 10*10)
#=============================================================================================================

plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_image[i])
    plt.xlabel(train_label[i])
plt.show()

In [None]:
#=============================================================================================================
# 這裡稍微偷懶一下，因為圖片不太清楚所以我先上網查了一下各標籤的種類名稱，類別如下為了方便後續驗證比較好辨認。
#=============================================================================================================

label_names = ['airplane', 'automobile', 'bird', 'cat', 'deer','dog', 'frog', 'horse', 'ship', 'truck']


In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-2 觀察資料 (介紹筆者喜愛使用指令)
#　　　　　｜　　　　
#　　　　　－－－ Step1-2-1　Pandas.DataFrame 類型
#　　　　　 　　　　｜
#　　　　　　 　　　－－－Step1-2-1-2 .info()　　　　：主因方便確認每行(column)是否有缺值(NAN)，和資料型態大小與行列數。
#=============================================================================================================
# 因資料並不是pandas型態故跳過此步驟
#=============================================================================================================

In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-2 觀察資料 (介紹筆者喜愛使用指令)
#　　　　　｜　　　　
#　　　　　－－－ Step1-2-1　Pandas.DataFrame 類型
#　　　　　 　　　　｜
#　　　　　 　　　　－－－Step1-2-1-4 .describe()　 ：描述資料基本狀態(如:平均值、標準差、最大值...等)
#
#=============================================================================================================
# 因資料並不是pandas型態故跳過此步驟
#=============================================================================================================

In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-3 處理資料的NAN (沒有一定硬性規定，只要能讓資料變得好訓練都可以)
#　　　　　｜　　　　
#　　　　　－－－Step1-3-1 遺失比例極小以至於不影響Data時
#　　　　　｜　　　　｜
#　　　　　｜　　　　－－－Step1-3-1 .columns      :直接捨棄
#　　　　　｜　　　  (例如：有1000筆資料只有1筆資料填寫不完整，此時只皆捨棄使用999筆資料去訓練，論時間成本會好些)
#　　　　　｜
#　　　　　｜
#　　　　　－－－Step1-3-2 遺失比例極高以至於不影響Data時
#　　　　　　　　　｜
#　　　　　　　　　－－－1-3-1 當遺失資料為數值型(連續)：可以使用平均數代替缺失值。
#　　　　　　　　　｜
#　　　　　　　　　－－－1-3-2 當遺失資料為分類型(離散)：可以使用眾數值代替缺失值。
#
#=============================================================================================================
# 依上述可觀察出，此資料集印出後為數值矩陣，而每個矩陣都是代表一張圖，這種資料集合故無缺值問題。
#=============================================================================================================

In [None]:
#=============================================================================================================
# Step1：資料觀察與預處理
#　｜
# 　－－－Step1-4 挑選特徵並將資料正規化與編碼
#　　　　　｜－－－Step1-4-1 挑選特徵
#　　　　　｜　　　　(淘汰不重要的特徵，例如名字、學號...等具備唯一性值，通常沒有什麼參考性，因為大家都不一樣較難有共通點)
#　　　　　｜
#　　　　　｜－－－Step1-4-2 將資料正規化
#                 (將數值型資料正規化，映射至[0,1]之間，避免overflow也可以加快運算)
#　　　　　｜－－－Step1-4-3 將資料編碼
#                 (將分類型資料編碼，因若是字串比較時間複雜度會比數值型高上許多，所以需要做編碼加快運算)
#=============================================================================================================
# 直接看矩陣看不出關聯，因為為圖片所以所有特徵皆保留，此步驟只做正規化(由於矩陣內數值為0-255)只需要直接/255則可達到正規化效果
#=============================================================================================================

train_image = train_image/255 
test_image = test_image/255

print("\n\n訓練集特徵資料(圖像)：\n\n",train_image)
print("\n\n訓練集特徵資料(圖像)：\n\n",test_image)

In [None]:
#================================================================================
# Step2.模型建立(model build)
#　｜
#　－－－這裡直接使用 EfficientNet-B7 () 網路
#  (等研讀完會在補充較詳細的 EfficientNet-B7 網路架構及效能原理，這裡先放架構圖)
#================================================================================
print("\n\n EfficientNet-B7 架構圖： \n\n")
from IPython.display import Image
from IPython.core.display import HTML 
Image(url= "https://i.imgur.com/At1bloW.png")
#================================================================================

In [None]:
model = tf.keras.applications.efficientnet.EfficientNetB7(
    include_top=True,
    weights=None,
    input_tensor=None,
    input_shape=(32,32,3),
    pooling=None,
    classes=10,
    classifier_activation='relu')

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

history = model.fit(train_image, train_label, epochs=20, 
                    validation_data=(test_image, test_label))

In [None]:
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0.5, 1])
plt.legend(loc='lower right')

test_loss, test_acc = model.evaluate(test_image,  test_label, verbose=2)