<a href="https://colab.research.google.com/github/ShinAsakawa/ShinAsakawa.github.io/blob/master/2022notebooks/2022_1024convolution_exercise.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
%config InlineBackend.figure_format = 'retina'
import torch
import torchvision
import numpy as np
import matplotlib.pyplot as plt
try:
    import japanize_matplotlib
except ImportError:
    !pip install japanize_matplotlib
    import japanize_matplotlib

In [None]:
# カーネルを適切に設定する
ker1 = np.array([[0,1,0],  # 縦線検出カーネル 神経科学の用語では検出細胞
                 [0,1,0],
                 [0,1,0]])
ker2 = np.array([[0,0,0],  # 横線検出カーネル
                 [1,1,1],
                 [0,0,0]])
ker3 = np.array([[1,0,0],  # 左上から右下への斜め線検出カーネル
                 [0,1,0],
                 [0,0,1]])
ker4 = np.array([[0,0,1],  # 左下から右上への斜め線検出カーネル
                 [0,1,0],
                 [1,0,0]])

plt.figure(figsize=(8,2))
plt.subplot(1,4,1); plt.imshow(ker1, cmap='gray')
plt.subplot(1,4,2); plt.imshow(ker2, cmap='gray')
plt.subplot(1,4,3); plt.imshow(ker3, cmap='gray')
plt.subplot(1,4,4); plt.imshow(ker4, cmap='gray')
plt.suptitle("カーネルの視覚化", fontsize=12)
plt.show()

In [None]:
# 簡単な畳み込み層を定義

class Conv:
    """簡単な例を考えるため、カーネルサイズは 3 行 3 列で固定とし，
    strides や padding は考えないこととする"""
    
    def __init__(self, W):
        self.W = W
        
    def process(self, X):
        out = np.zeros((X.shape[0]-2, X.shape[1]-2))
        for i in range(out.shape[0]):
            for j in range(out.shape[1]):
                x = X[i:i+3, j:j+3]
                # 要素ごとの積の合計をとっています
                out[i,j] = np.dot(self.W.flatten(), x.flatten())
        return out


In [None]:
dataset = torchvision.datasets.MNIST(root='.', 
                                     train=True, 
                                     download=True,
                                    )

In [None]:
img, label = dataset.__getitem__(3)

plt.figure(figsize=(2,2))
plt.imshow(img, cmap='gray')
plt.title(f'ラベル名:{label}')
plt.show()

In [None]:
# 畳み込みの実施
X = np.copy(img)

conv1 = Conv(ker1)
C1 = conv1.process(X)

conv2 = Conv(ker2)
C2 = conv2.process(X)

conv3 = Conv(ker3)
C3 = conv3.process(X)

conv4 = Conv(ker4)
C4 = conv4.process(X)


In [None]:
plt.figure(figsize=(6,2))
plt.subplot(1,4,1); plt.imshow(C1, cmap='gray')
plt.subplot(1,4,2); plt.imshow(C2, cmap='gray')
plt.subplot(1,4,3); plt.imshow(C3, cmap='gray')
plt.subplot(1,4,4); plt.imshow(C4, cmap='gray')
plt.suptitle("畳み込み演算の結果", fontsize=12)
plt.show()

In [None]:
#DoG 関数の定義
import cv2 as cv  # opencv 画像処理モジュールの輸入

def DoG(img, ker1=3, ker2=5):
    blur2 = cv.GaussianBlur(img, (ker2, ker2), 0)
    blur1 = cv.GaussianBlur(img, (ker1, ker1), 0)

    return blur2 - blur1


In [None]:
dog_img0 = DoG(X)                #DOGの実施
dog_img1 = DoG(X, ker1=3, ker2=9) #異なる分散でDOGを実施

plt.figure(figsize=(4,2))

# 1 行 2 列 で結果を表示
plt.subplot(1,2,1) 
plt.imshow(dog_img0, cmap='gray')
plt.gca().set_title('dog_img0')

plt.subplot(1,2,2)
plt.imshow(dog_img1, cmap='gray')
plt.gca().set_title('dog_img1')

plt.show()