<a href="https://colab.research.google.com/github/komazawa-deep-learning/komazawa-deep-learning.github.io/blob/master/notebooks/2021_0528edge_and_face_detection_algorithm_not_cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# DOG 等エッジ検出と顔検出の従来手法

In [None]:
!pip install japanize_matplotlib
!wget https://raw.githubusercontent.com/opencv/opencv/master/data/haarcascades/haarcascade_frontalcatface.xml

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
import japanize_matplotlib
%matplotlib inline

import cv2 as cv

In [None]:
#ファイルをアップロードします
from google.colab import files
#files?
files.upload()  # ご自身の PC からファイルをアップロードして下さい

In [None]:
#アップロードしたファイルの表示
img_cv = cv.imread(image_file)
plt.figure(figsize = (6, 8))
plt.axis('off')
plt.imshow(cv.cvtColor(img_cv, cv.COLOR_BGR2RGB))  # OpenCV は RGB ではなく BGR なので変換

In [None]:
from skimage.color import rgb2gray

img_gray = rgb2gray(img)
print('画像のサイズ:', img_gray.shape, '\n')

# 2D pixel map
print('画像の画素の値')
print(np.round(img_gray, 2), '\n')

# flattened pixel feature vector
print('一次元にしてみます', (np.round(img_gray.flatten(), 2)))

plt.figure(figsize = (6, 8))  # 表示画像のサイズ単位はインチで横と縦を指定
plt.imshow(img_gray, cmap="gray"); plt.show()
c_freq, c_bins, c_patches = plt.hist(img_gray.flatten(), bins=30)

In [None]:
# opencv の顔認識モジュールをLoad the classifier and create a cascade object for face detection
opencv_base = '.'
face_cascade = cv.CascadeClassifier(os.path.join(opencv_base,'haarcascade_frontalcatface.xml'))
#face_cascade = cv.CascadeClassifier(os.path.join(opencv_base,'haarcascade_frontalface_alt2.xml'))
#face_cascade = cv.CascadeClassifier(os.path.join(opencv_base,'haarcascade_fullbody.xml'))

In [None]:
#DoG 関数の定義
def DoG(img, ker1=3, ker2=5):
    blur2 = cv.GaussianBlur(img, (ker2, ker2), 0)
    blur1 = cv.GaussianBlur(img, (ker1, ker1), 0)

    return blur2 - blur1


In [None]:
dog_img = DoG(img)
plt.imshow(dog_img); plt.show()

dog_img = DoG(img, ker1=3, ker2=9)
plt.imshow(dog_img); plt.show()

In [None]:
# Canny アルゴリズムによるエッジ（端点）検出の実演
from skimage.feature import canny

img_edges = canny(img_gray, sigma=3)

plt.figure(figsize = (6, 8))
plt.axis('off')
plt.imshow(img_edges, cmap='binary')


In [None]:
#HOG の実演
from skimage.feature import hog
from skimage import exposure

# 下の orientation の値は 0 から 9 までです。変化させて，結果を観察してください
fd_img, img_hog = hog(img_gray, orientations=8, pixels_per_cell=(8, 8), 
                      cells_per_block=(3, 3), visualize=True)

# rescaling intensity to get better plots
img_hogs = exposure.rescale_intensity(img_hog, in_range=(0, 0.04))

plt.figure(figsize = (6, 8))
plt.axis('off')
plt.imshow(img_hogs, cmap='binary')


In [None]:
files.upload()  # ご自身の PC からファイルをアップロードして下さい

In [None]:
face_image_filename = 'IMG_4056.jpg'  # アップロードした顔画像ファイル名に書き換えてください
original_image = cv.imread(face_image_filename)

# Convert color image to grayscale for Viola-Jones
grayscale_image = cv.cvtColor(original_image, cv.COLOR_BGR2GRAY)
detected_faces = face_cascade.detectMultiScale(grayscale_image)

In [None]:
for (column, row, width, height) in detected_faces:
    cv.rectangle(
        original_image,
        (column, row),
        (column + width, row + height),
        (255, 0, 0),
        2
    )

In [None]:
plt.figure(figsize=(18,14))
plt.axis('off')
plt.imshow(original_image, cmap='gray')

In [None]:
# カーネルを適切に設定してください
W1 = np.array([[0,1,0],
               [0,1,0],
               [0,1,0]])
W2 = np.array([[0,0,0],
               [1,1,1],
               [0,0,0]])
W3 = np.array([[1,0,0],
               [0,1,0],
               [0,0,1]])
W4 = np.array([[0,0,1],
               [0,1,0],
               [1,0,0]])

plt.figure(figsize=(8,4))
plt.subplot(1,4,1); plt.imshow(W1, cmap='gray')
plt.subplot(1,4,2); plt.imshow(W2, cmap='gray')
plt.subplot(1,4,3); plt.imshow(W3, cmap='gray')
plt.subplot(1,4,4); plt.imshow(W4, cmap='gray')
plt.suptitle("カーネル", fontsize=12)
plt.show()

In [None]:
# シンプルな畳み込み層を定義
class Conv:
    # シンプルな例を考えるため、カーネル幅 Wは 3x3で固定
    # strides や padding は考えません
    def __init__(self, W):
        self.W = W
    def f_prop(self, X):
        out = np.zeros((X.shape[0]-2, X.shape[1]-2))
        for i in range(out.shape[0]):
            for j in range(out.shape[1]):
                x = X[i:i+3, j:j+3]
                # 要素ごとの積の合計をとっています
                out[i,j] = np.dot(self.W.flatten(), x.flatten())
        return out


In [None]:
from skimage.color import rgb2gray

image_filename = 'IMG_4056.jpg'  #ファイル名はアップロードしたファイル名に合わせて変更します
image_file = os.path.join('.', image_filename) 
img = plt.imread(image_file)
print(img.shape)  # 画像のサイズを表示します

img = rgb2gray(img) # 濃淡画像(グレースケール)に変換
plt.axis('off')
plt.imshow(img, cmap='gray')

In [None]:
#type(img)
# 畳み込み
X = np.copy(img)
conv1 = Conv(W1); C1 = conv1.f_prop(X)
conv2 = Conv(W2); C2 = conv2.f_prop(X)
conv3 = Conv(W3); C3 = conv3.f_prop(X)
conv4 = Conv(W4); C4 = conv4.f_prop(X)


In [None]:
plt.subplot(1,4,1); plt.imshow(C1,cmap='gray')
plt.subplot(1,4,2); plt.imshow(C2,cmap='gray')
plt.subplot(1,4,3); plt.imshow(C3,cmap='gray')
plt.subplot(1,4,4); plt.imshow(C4,cmap='gray')
plt.suptitle("畳み込み演算の結果", fontsize=12)
plt.show()