In [1]:
"""
作業目標
嘗試比較用 color histogram 和 HOG 特徵來訓練的 SVM 分類器在 cifar10 training 和 testing data 上準確度的差別
"""

'\n作業目標\n嘗試比較用 color histogram 和 HOG 特徵來訓練的 SVM 分類器在 cifar10 training 和 testing data 上準確度的差別\n'

In [2]:
import os
import keras
os.environ["CUDA_VISIBLE_DEVICES"] = "" # 使用 CPU

import numpy as np
import cv2 # 載入 cv2 套件
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score
train, test = keras.datasets.cifar10.load_data()

Using TensorFlow backend.


In [3]:
x_train, y_train = train
x_test, y_test = test
y_train = y_train.astype(int)
y_test = y_test.astype(int)

In [9]:
x_train_histogram = [] #histogram()函数，它是数据的频率分布的图形表示
x_test_histogram = []

# 對於所有訓練資料
for i in range(len(x_train)):
    chans = cv2.split(x_train[i]) # 把圖像的 3 個 channel 切分出來
    # 對於所有 channel
    hist_feature = []
    for chan in chans:
        # 計算該 channel 的直方圖
        hist = cv2.calcHist([chan], [0], None, [16], [0, 256]) # 切成 16 個 bin
        hist_feature.extend(hist.flatten())#feature 特徵 extend 延伸 flatten 扁平化的意思
    # 把計算的直方圖特徵收集起來
    x_train_histogram.append(hist_feature) 
"""
通過調用 cv2.calcHist(images, channels, mask, histSize, ranges) 函數來得到統計後的直方圖值

images (list of array)：要分析的圖片
channels：產生的直方圖類型。例：[0]→灰度圖，[0, 1, 2]→RGB三色。
mask：optional，若有提供則僅計算 mask 部份的直方圖。
histSize：要切分的像素強度值範圍，預設為256。每個channel皆可指定一個範圍。例如，[32,32,32] 表示RGB三個channels皆切分為32區段。
ranges：像素的範圍，預設為[0,256]，表示<256。

"""

# 對於所有測試資料也做一樣的處理
for i in range(len(x_test)):
    chans = cv2.split(x_test[i]) # 把圖像的 3 個 channel 切分出來
    # 對於所有 channel
    hist_feature = []
    for chan in chans:
        # 計算該 channel 的直方圖
        hist = cv2.calcHist([chan], [0], None, [16], [0, 256]) # 切成 16 個 bin
        hist_feature.extend(hist.flatten())
    x_test_histogram.append(hist_feature)

x_train_histogram = np.array(x_train_histogram)
x_test_histogram = np.array(x_test_histogram)

In [None]:
"""
產生 HOG 特徵的訓練資料
HOG 特徵通過計算和統計圖像局部區域的梯度方向直方圖來構建特徵，具體細節不在我們涵蓋的範圍裡面，有興趣的同學請參考補充資料哦
"""


In [10]:
# SZ=20
bin_n = 16 # Number of bins

def hog(img):
    img = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
    gx = cv2.Sobel(img, cv2.CV_32F, 1, 0)
    """
    Sobel是一種獲得影像一階梯度的手法，常見應用於邊緣檢測，有分成水平和垂直方向的模板，就像以下的Gx和Gy模板，Gx用來檢測垂直邊緣，Gy用來檢查水平邊緣，通常會分別對影像進行水平和垂直模板的運算，得到像素的梯度，梯度是一個有距離和方向的二維向量，距離表示變化的幅度，方向表示強度變化最大的方向。

"""
    gy = cv2.Sobel(img, cv2.CV_32F, 0, 1)
    mag, ang = cv2.cartToPolar(gx, gy) #使用函式 cv2.cartToPolar()會同時得到幅度和相位,此函式也是直角座標轉換為極座標的函式。
    bins = np.int32(bin_n*ang/(2*np.pi))    # quantizing binvalues in (0...16) 量化（0 ... 16）中的bin值
    bin_cells = bins[:10,:10], bins[10:,:10], bins[:10,10:], bins[10:,10:]
    mag_cells = mag[:10,:10], mag[10:,:10], mag[:10,10:], mag[10:,10:]
    hists = [np.bincount(b.ravel(), m.ravel(), bin_n) for b, m in zip(bin_cells, mag_cells)] #bincount bin計數 ravel()：如果没有必要，不会产生源数据的副本 
    hist = np.hstack(hists)     # hist is a 64 bit vector hist是64位向量
    return hist.astype(np.float32)

x_train_hog = np.array([hog(x) for x in x_train]) #HOG 特徵, histogram of oriented gradient, 梯度方向直方圖特徵
x_test_hog = np.array([hog(x) for x in x_test])

In [None]:
"""
SVM model
SVM 是機器學習中一個經典的分類算法，具體細節有興趣可以參考 該知乎上的解釋，我們這裡直接調用 opencv 中實現好的函數
用 histogram 特徵訓練 SVM 模型
訓練過程可能會花點時間，請等他一下
"""

In [11]:
SVM_hist = cv2.ml.SVM_create()
SVM_hist.setKernel(cv2.ml.SVM_LINEAR)
SVM_hist.setGamma(5.383)
SVM_hist.setType(cv2.ml.SVM_C_SVC)
SVM_hist.setC(2.67)

#training
SVM_hist.train(x_train_histogram, cv2.ml.ROW_SAMPLE, y_train)

# prediction
_, y_hist_train = SVM_hist.predict(x_train_histogram)
_, y_hist_test = SVM_hist.predict(x_test_histogram)

In [12]:
"""
用 HOG 特徵訓練 SVM 模型
訓練過程可能會花點時間，請等他一下
"""
SVM_hog = cv2.ml.SVM_create()
SVM_hog.setKernel(cv2.ml.SVM_LINEAR)
SVM_hog.setGamma(5.383)
SVM_hog.setType(cv2.ml.SVM_C_SVC)
SVM_hog.setC(2.67)

#training
SVM_hog.train(x_train_hog, cv2.ml.ROW_SAMPLE, y_train)

# prediction
_, y_hog_train = SVM_hog.predict(x_train_hog)
_, y_hog_test = SVM_hog.predict(x_test_hog)


In [13]:
print('HOG train accuracy: {}'.format(accuracy_score(y_train, y_hog_train)))
print('HOG accuracy: {}'.format(accuracy_score(y_test, y_hog_test)))

HOG train accuracy: 0.19686
HOG accuracy: 0.2006
