# Module 1. OpenCV 套件
### 概要 :
> * OpenCV 全名是 Open Source Computer Vision ( Library )
> * 白 / 黑盒子 : 介面, 參數, 傳回值
> * 演算法 : 需了解基本原理, 對運用極有幫助, 非探究數學推倒
> * 應  用 : 需掌握正確使用方法
> * Q&A 社團 iCoding : https://www.facebook.com/groups/216955676502460
> * Email : jungan0914@gmail.com
---

## 1-1: OpenCV 環境安裝
> * 在 (命令提示字元 / Windows PowerShel `系統管理員`) 身分下打 pip install jupyterlab 指令( `灌程式` )
> * 在 (命令提示字元 / Windows PowerShell `一般身分`)下打 jupyter lab ( `執行程式` )(shell> jupyter lab)

## Anaconda : 建立 python 3.9.x 虛擬環境
### download : https://www.anaconda.com/
> * 安裝時選 Just Me, 不要加入 PATH 中
> * 建立 python 3.9.x 虛擬環境
> * 回到 conda Home 在 python 3.9.x環境下, 將 JupyterLab install & Launch<br>
> ## 安裝步驟 :
https://www.yongxi-stat.com/python-anaconda-install/

pthon3.9環境更新網址: <br>
https://medium.com/python4u/用conda建立及管理python虛擬環境-b61fd2a76566

### install following in command line :
> * install python `3.9.X`
> * `pip install jupyterlab ( 上面 conda install -c conda-forge jupyterlab 已經跑過，就不要再跑了 )`
---
> * pip install numpy
> * pip install matplotlib
> * pip install opencv-python
> * pip install opencv-contrib-python
> * pip install scikit-learn
> * pip install scikit-image
> * pip install scipy
> * pip install imutils
> * pip install pytesseract

<div style="page-break-after: always"></div>

> * Windows OS :
>> pip install dlib<br>
>> or(pip install ".\install\dlib-19.22.99-cp39-cp39-win_amd64.whl")

> * IOS :
>> pip install cmake<br>
>> pip install dlib

### Jupyter 快捷鍵
> * shift-enter : 跑程式
> * A : 上面增加一格
> * B : 下面增加一格
> * C : 複製 (crtl + C)
> * V : 貼上 (crtl + V)
> * Z : 復原 (crtl + Z)
> * X : 剪下 (crtl + X)
> * shift-up & shift-down: 多個 block 選取
> * M : markdown 抄筆記
> * shift + tab : param instruction
> * tab : functions instruction

## 先看一段影片

%%HTML
<iframe 
width="560" height="315" 
src="https://www.youtube.com/embed/Fszu0L1JtqM?si=3RupNrVy7Yp1Tyug" 
title="YouTube video player" frameborder="0" 
allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" 
referrerpolicy="strict-origin-when-cross-origin" 
allowfullscreen>
</iframe>


In [None]:
import sys
import cv2
import numpy as np

import matplotlib
from matplotlib import pyplot as plt
import dlib
import skimage
import sklearn
print(f'python ver.\t: {sys.version}\n\n'
      f'cv2 ver.\t: {cv2.__version__}\n\t\t: {cv2.__file__}\n\n'
      f'numpy ver.\t: {np.__version__}\n\t\t: {np.__file__}\n\n'
      f'matplotlib ver.\t: {matplotlib.__version__}\n\t\t: {matplotlib.__file__}\n\n'
      f'dlib ver.\t: {dlib.__version__}\n\t\t: {dlib.__file__}\n\n'
      f'skimage ver.\t: {skimage.__version__}\n\t\t:  {skimage.__file__}\n\n'
      f'sklearn ver.\t: {sklearn.__version__}\n\t\t:  {sklearn.__file__}\n\n')

---

<div style="page-break-after: always"></div>

## 1-2: 彩色、灰階照片讀取 / 寫入

### Read / Open image file : `B:0, G:1, R:2`
><img src="./image/rgb01.png"  style='width:90%'>
><img src="./image/image2vector.png"  style='width:90%'>

> 讀取支援的格式：bmp, pbm, pgm, ppm, jpeg, jpg, tiff, tif, png ....<br>
> https://docs.opencv.org/master/d4/da8/group__imgcodecs.html

### RGB to Gray ?
* 加權平均法 : 根據重要性及其它指標，將三個分量以不同的權值進行加權平均。由於人眼對綠色的敏感最高，對藍色敏感最低，因此，按下式對RGB三分量進行加權平均能得到較合理的灰度影像。
$$F_{(i, j)} = 0.299 R_{(i, j)} + 0.587 G_{(i, j)} + 0.114 B_{(i, j)}$$

<div style="page-break-after: always"></div>

* 分量法 : 將彩色影像中的三分量的亮度作為三個灰度影像的灰度值，可根據應用需要選取一種灰度影像。
$$F1_{(i, j)} = R_{(i, j)}$$
$$F2_{(i, j)} = G_{(i, j)}$$
$$F3_{(i, j)} = B_{(i, j)}$$

* 最大值法 : 將彩色影像中的三分量亮度的最大值作為灰度圖的灰度值。
$$F_{(i, j)} = max(R_{(i, j)}, G_{(i, j)}, B_{(i, j)})$$

* 平均值法 : 將彩色影像中的三分量亮度求平均得到一個灰度值。
$$F_{(i, j)} = \frac{R_{(i, j)} + G_{(i, j)} + B_{(i, j)}}{3}$$

### Gray to RGB : Gray → R, Gray → G, Gray → B<br>
https://docs.opencv.org/3.4/de/d25/imgproc_color_conversions.html

### read image file 
| 數值 |      含意      |           語法         |
|:----:|:-------------:|:--------------------:|
|  -1  | 保持原格式不便 | cv2.IMREAD_UNCHANGED |
|  0   |  單通道灰階    | cv2.IMREAD_GRAYSCALE | 
|  1   | 3通道BGR (`預設`) |   cv2.IMREAD_COLOR   | 

### imshow
* 如果圖像是 8 位無符號，則按原樣顯示。
* 如果圖像是 16 位無符號或 32 位整數，則將像素除以 256。即值範圍 [0, 255*256] 映射到 [0, 255]。
* 如果圖像是 32 位或 64 位浮點，則像素值乘以 255。即值範圍 [0, 1] 映射到 [0, 255]。

In [None]:
import cv2
from matplotlib import pyplot as plt

img0 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_GRAYSCALE)  # same
# img0 = cv2.imread('./image/SpongeBob.jpg', 0)    # 0 灰階

img1 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_COLOR)    # 1 BGR,  1 可省略(原圖)
# img1 = cv2.imread('./image/SpongeBob.jpg', 1)                 # 1 BGR,  1 可省略(原圖)

cv2.imshow('SpongeBob Gray uint8', img0)
# cv2.waitKey(0)
cv2.imshow('SpongBob Color uint8', img1)             # unit8
cv2.imshow('SpongBob Color *256', img1*256)          # unit16
cv2.imshow('SpongBob Color 1/256 float', img1/256)   # floating 0.0 ~ 1.0

cv2.waitKey(0)                                       # 0 wait for anykey任意按鍵, try 3000
cv2.destroyAllWindows()
cv2.waitKey(1)

<div style="page-break-after: always"></div>

### image from numpy point of view

#### Data Types for ndarrays

|名稱          |描述                                              |簡寫|
|--------------|-------------------------------------------------|----|
|np.bool	   |用一個位元組儲存的布爾型別（True或False）           |'b' |
|np.int8	   |一個位元組大小，-128 至 127	                      |'i' |
|np.int16	   |整數，-32768 至 32767	                          |'i2'|
|np.int32	   |整數，$-2^{31}$ 至 $2^{32-1}$	                  |'i4'|
|np.int64	   |整數，$-2^{63}$ 至 $2^{63-1}$	                  |'i8'|
|`np.uint8`	   |`無符號整數，0 至 255`	                            |'u'|
|np.uint16	   |無符號整數，0 至 65535	                            |'u2'|
|np.uint32	   |無符號整數，0 至 $2^{32-1}$                        |'u4'|
|np.uint64	   |無符號整數，0 至 $2^{64-1}$	                    |'u8'|
|np.float16	   |半精度浮點數：16位元，正負號1位，指數5位，精度10位    |'f2'|
|np.float32    |單精度浮點數：32位元，正負號1位，指數8位元，精度23位  |'f4'|
|np.float64    |雙精度浮點數：64位元，正負號1位，指數11位，精度52位   |'f8'|
|np.complex64  |複數，分別用兩個32位元浮點數表示實部和虛部            |'c8'|
|np.complex128 |複數，分別用兩個64位元浮點數表示實部和虛部            |'c16'|
|np.object_	   |python物件	                                     |'O' |
|np.string_	   |字串	                                             |'S' |
|np.unicode_   |unicode型別                                        |'U' |

In [None]:
import cv2
from matplotlib import pyplot as plt

img0 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_GRAYSCALE)  # same
# img0 = cv2.imread('./image/SpongeBob.jpg', 0)    # 0 灰階

img1 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_COLOR)    # 1 BGR,  1 可省略(原圖)

# 0 灰階
print(f'gray\t\nshape\t: {img0.shape}\n'
      f'ndim\t: {img0.ndim}\n'
      f'size\t: {img0.size}\n'
      f'dtype\t: {img0.dtype}\n'
      f'type\t: {type(img0)}\n{"="*40}')

# 1 RGB
print(f'color\t\nshape\t: {img1.shape}\n'
      f'ndim\t: {img1.ndim}\n'
      f'size\t: {img1.size}\n'
      f'dtype\t: {img1.dtype}\n'
      f'type\t: {type(img1)}')

### img one pixel data

In [None]:
print(img1[0,0])  # color

### matplotlib show RGB (matplt) vs. BGR (cv2)

In [None]:
import numpy as np
import cv2
from matplotlib import pyplot as plt

img_bgr = cv2.imread('./image/baby.jpg', 1)      # 使用 OpenCV 讀取圖檔

img_rgb = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)    # 將 BGR 圖片轉為 RGB 圖片
# img_rgb = img_bgr[:,:,::-1]                         # 或是這樣亦可

plt.figure(figsize=(16, 9))                # 使用 Matplotlib 顯示圖片
plt.subplot(1,2,1), plt.imshow(img_rgb), plt.title('plt rgb')

plt.subplot(122), plt.imshow(img_bgr), plt.title('cv2 bgr in matplotlib')
plt.imshow

cv2.imshow('bgr', img_bgr)                     # cv2 show bgr
cv2.waitKey(0)                                 # 0 wait for anykey任意按鍵, try 3000
cv2.destroyAllWindows()
cv2.waitKey(1)

### Write / Save image file : imwrite()

In [None]:
import cv2

img0 = cv2.imread('./image/baby.jpg', 0)    # 0 灰階
cv2.imwrite('./image/baby01.jpg', img0)

<div style="page-break-after: always"></div>

## 1-3: OpenCV 影像基礎操作
><img src="./image/array_3d.jpg"  style='width:90%'>
><img src="./image/MagicBox.jpg"  style='width:70%'>

In [None]:
import cv2
import sys

img = cv2.imread('./image/lenaColor.png')    #調用cv2.imread()讀取影像

if img is None:
	sys.exit('無法讀取影像...')
else :
    print(f'img size : {img.shape}')
    cv2.imshow('Image Show', img)           #調用cv2.imshow() 顯示讀取進來的影像
cv2.waitKey(0)
cv2.destroyAllWindows() 
cv2.waitKey(1)

In [None]:
#指定pix位置 x, y
a=100
px = img[a, a]             # RGB 100, 100 的值
print(px)                  #顯示BGR顏色數值

blue = img[a, a, 0]        # 0:Blue, 1:Green, 2:Red 指定 x, y座標上 0 通道到數值
print(blue)

img[a, a] = [0, 0, 0]      # 指定圖片像素值[B, G, R] 給 0 值
print(img[a, a])

In [None]:
# 基於numpy的資料格式指定物件
img = cv2.imread('./image/lenaColor.png')    #調用cv2.imread()讀取影像

print(f'(10, 10, 2)像素的紅色數值\t: {img[10, 10, 2]}\n')        # 0:Blue, 1:Green, 2:Red

#修改像素值 itemset
img[10, 10, 2] = 120          # set (10, 10, 2) = 120

print(f'after img[10,10,2]\t\t: {img[10, 10, 2]} \n')  # 120

print(f'img.shape\t\t\t: {img.shape}\n'  #行、列、通道;圖像長寬與通道數(channels),可以判斷灰階或彩圖
      f'img.size\t\t\t: {img.size:,}\n'   #像素總量 w*h*c
      f'img.dtype\t\t\t: {img.dtype}')  #像素資料型態 uint8(0~255)

### Corp_image - ROI ( Region of Interest )

In [None]:
#分割圖像區域
logo = img[100:400, 150:415]    # x1, x2, : y1, y2
print(f'logo size : {logo.shape}')

cv2.imshow('Image Show', logo)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

In [None]:
import numpy as np
import cv2

img = cv2.imread('./image/assassin.jpg')
cropped = img[100:400, 200:500] 

cv2.imshow('Original', img)
cv2.imshow('cropped', cropped)
print(f'cropped size : {cropped.shape}')

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### 分割與合併，色彩通道

In [None]:
img = cv2.imread('./image/assassin.jpg')

b, g, r = cv2.split(img)     #分割通道
# b = img[:,:,0];  g = img[:,:,1];  r = img[:,:,2]  #也可以陣列指定通道分割

print(f'{b.shape}\n\n'
      f'r =\n{r}')

cv2.imshow('b', b)
cv2.imshow('g', g)
cv2.imshow('r', r)

cv2.imshow('rgb', cv2.merge([r,g,b]))
cv2.imshow('bgr', cv2.merge([b,g,r]))

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### image 3D data

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import cv2

img1 = cv2.imread('./image/contour.png', 0)  # queryImage
# img1 = cv2.imread('./image/blackhat.bmp', 0)  # queryImage

w, h = img1.shape
X = np.arange(0, h, 1)
Y = np.arange(0, w, 1)
X, Y = np.meshgrid(X, Y)

fig = plt.figure(figsize=(12, 8))
ax = plt.axes(projection='3d')

data=ax.scatter(X, Y, img1, c=img1, cmap='rainbow', marker='.')# 繪製 3D 座標點
ax.view_init(10, 20)
ax.set_xlabel(f'w : {h}');   ax.set_ylabel(f'h : {w}');   ax.set_zlabel('gray value :255');
ax.set_zlim(0,255)
fig.colorbar(data, ax = ax)
plt.show()

cv2.imshow('bgr', cv2.imread('./image/contour.png', 1))
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

---

<div style="page-break-after: always"></div>

# Module 2. OpenCV 繪圖

## 2-1: 基礎繪圖
> OpenCV 在圖片上加上線條等幾何圖案以及文字標示。在影像處理的程式中，若要比較清楚呈現處理的結果，時常會需要在圖片上加上一些標示的幾何圖形或是文字，比方說在物件辨識的問題上，可能會使用方框將辨識出來的物件框起來，並加註一些文字描述等。

### line : cv2.line ( 影像, 開始座標, 結束座標, 顏色, 線條寬度 )

In [None]:
import cv2 
import numpy as np

gc = np.zeros((512, 512, 3), dtype='uint8')

cv2.line(gc, (10, 50), (400, 300), (255, 0, 0), 15)
cv2.line(gc, (100, 50), (400, 500), (0, 0, 255), 3)
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### arrow line : cv2.arrowedLine ( 影像, 開始座標, 結束座標, 顏色, 線條寬度[.....] )

In [None]:
import cv2 
import numpy as np

gc = np.zeros((512, 512, 3), dtype='uint8')

cv2.arrowedLine(gc, (10, 50), (400, 300), (255, 0, 0), 5, tipLength = 0.05)
cv2.arrowedLine(gc, (100, 50), (400, 500), (0, 0, 255), 3, tipLength = 0.2)
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### rectangle : cv2.rectangle(影像, 頂點座標, 對向頂點座標, 顏色, 線條寬度)

In [None]:
gc = np.zeros((512, 512, 3), dtype='uint8')

cv2.rectangle(gc, (30, 50), (200, 280), (0, 0, 255), 5)
cv2.rectangle(gc, (100, 200), (296, 376), (234, 151, 102), -5)   # -1 : 實心框
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### circle : cv2.circle ( 影像, 圓心座標, 半徑, 顏色, 線條寬度 )

In [None]:
gc = np.zeros((512, 512, 3), dtype='uint8')

cv2.circle(gc, (200, 100), 80, (255, 255, 0), 2)
cv2.circle(gc, (280, 180), 60, (147, 147, 147), -3)
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### ellipse : cv2.ellipse ( 影像, 中心座標, (長軸, 短軸), 旋轉角度, 起始角度, 結束角度, 顏色, 線條寬度 )

In [None]:
gc = np.zeros((512, 512, 3), dtype='uint8')

cv2.ellipse(gc, (200, 100), (80, 40), 45, 0, 360, (80, 127, 255), 5)
cv2.ellipse(gc, (250, 300), (90, 50), 0, 0, 270, (44, 141, 108), -1)
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### cv2.polylines ( 影像, 頂點座標, 封閉型, 顏色, 線條寬度 )

In [None]:
gc = np.zeros((512, 512, 3), dtype='uint8')

#設定頂點座標
pts = np.array(((100,50), (100,200), (170,300), (300,50)))

cv2.polylines(gc, [pts], 0, (105, 105, 255), 2)  #True:頭尾相連; False:頭尾不相連
cv2.imshow('draw', gc) 

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

In [None]:
import numpy as np
import cv2

img1 = np.random.randint(0, 256, size=[3,3], dtype=np.uint8)
img2 = np.random.randint(0, 256, size=[3,3], dtype=np.uint8)

print(f'img1 :\n{img1}\n\n'
      f'img2 :\n {img2}\n\n'
      f'np : img1+img2 :\n {img1+img2}\n\n'
      f'cv2.add :\n{cv2.add(img1, img2)}')

### Image Operation ( np+, cv2.add )

In [None]:
import cv2

img1=cv2.imread('./image/cat.jpg')
img2=img1.copy()

cv2.imshow('np :　img1 + img2', img1+img2)
cv2.imshow('cv2.add(img1, img2)', cv2.add(img1,img2))

plt.figure(figsize=(16, 5))

plt.subplot(131), plt.title('original')
plt.imshow(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB))

plt.subplot(132), plt.title('np : img1+img2')
plt.imshow(cv2.cvtColor(img1+img2, cv2.COLOR_BGR2RGB))   # same as img*2

plt.subplot(133), plt.title('cv2.add(img1, img2)')
plt.imshow(cv2.cvtColor(cv2.add(img1, img2), cv2.COLOR_BGR2RGB))  # same as add(img1, img2)
plt.show()

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### Image Operation ( ADD Weighted )
>$cv2.addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]])$

In [None]:
import numpy as np
import cv2

img1 = np.random.randint(0, 256, size=[3,3], dtype=np.uint8)
img2 = np.random.randint(0, 256, size=[3,3], dtype=np.uint8)

result = cv2.addWeighted(img1, 0.2, img2, 0.8, 0)  # img1*0.2 + img2*0.8 + 0
print(f'img1 :\n{img1}\n\n'
      f'img2 :\n {img2}\n\n'
      f'np : img1*0.2 + img2*0.8 + 0 :\n{img1*0.2+img2*.8+0}\n\n'
      f'cv2.addWeight :\n{result}')

In [None]:
import cv2

img1=cv2.imread('./image/cat.jpg', 1)
img2=cv2.imread('./image/lenaColor.png', 1)

img1 = cv2.resize(img1, (450, 450))
img2 = cv2.resize(img2, (450, 450))

result = cv2.addWeighted(img1, 0.2, img2, 0.8, 0)  # img1*0.2 + img2*0.8 + 0

cv2.imshow('weighted image', result)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### bitwise : and, or, xor, not
><img src="./image/truth-table.png"  style='width:100%'>

In [None]:
import numpy as np
import cv2
# import matplotlib.pyplot as plt

rectangle = np.zeros((300, 300), dtype = 'uint8')          # zero 黑色畫布
cv2.rectangle(rectangle, (25, 25), (275, 275), 255, -1)   # Draw filled rectangle
cv2.imshow('Rectangle', rectangle)
cv2.waitKey(0)

circle = np.zeros((300, 300), dtype = 'uint8')
cv2.circle(circle, (150, 150), 150, 255, -1)              # Draw filled circle
cv2.imshow('Circle', circle)
cv2.waitKey(0)

bitwiseAnd = cv2.bitwise_and(rectangle, circle)           # and expression
cv2.imshow('AND', bitwiseAnd)
cv2.waitKey(0)

bitwiseOr = cv2.bitwise_or(rectangle, circle)             # or expression
cv2.imshow('OR', bitwiseOr)
cv2.waitKey(0)

bitwiseXor = cv2.bitwise_xor(rectangle, circle)          # xor expression
cv2.imshow('XOR', bitwiseXor)
cv2.waitKey(0)

bitwiseNot = cv2.bitwise_not(circle)                     # not expression
cv2.imshow('NOT', bitwiseNot)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### font
><img src="./image/font.jpg"  style='width:80%'> 

| 文字格式            |代碼|
|--------------------|----|
|FONT_HERSHEY_SIMPLEX| 0 |
|FONT_HERSHEY_PLAIN  | 1 |
|FONT_HERSHEY_DUPLEX | 2 |
|FONT_HERSHEY_COMPLEX| 3 |
|FONT_HERSHEY_TRIPLEX| 4 |
|FONT_HERSHEY_COMPLEX_SMALL| 5 |
|FONT_HERSHEY_SCRIPT_SIMPLEX| 6 |
|FONT_HERSHEY_SCRIPT_COMPLEX| 7 |

LineType :<br>

| 線條格式 |代碼|
|---------|:--:|
|FILLED   | -1 |
|LINE_4   | 4  |
|LINE_8   | 8  |
|LINE_AA  | 16 |

### cv2.putText(影像, 文字, 座標, 字型, 大小, 顏色, 線條寬度, 線條種類)

In [None]:
import numpy as np
import cv2

#建立 512x512 的白色畫布
gc = np.full((540, 1180, 3), 255, dtype='uint8')  # 用(B, G, R) = (255, 255, 255): 白色填滿畫布
# gc = cv2.imread('./image/baby.jpg')    # 0 灰階

font = [cv2.FONT_HERSHEY_SIMPLEX,
        cv2.FONT_HERSHEY_PLAIN,
        cv2.FONT_HERSHEY_DUPLEX,
        cv2.FONT_HERSHEY_COMPLEX,
        cv2.FONT_HERSHEY_TRIPLEX,
        cv2.FONT_HERSHEY_COMPLEX_SMALL,
        cv2.FONT_HERSHEY_SCRIPT_SIMPLEX,
        cv2.FONT_HERSHEY_SCRIPT_COMPLEX ]

for idx, f in enumerate(font):
    cv2.putText(gc, 'OpenCV_AA', (20, 60*(idx+1)), f, 1.5, (0,0,255), 3, cv2.LINE_AA)  # FILLED
    cv2.putText(gc, 'OpenCV_8', (440, 60*(idx+1)), f, 1.5, (255,0,0), 3, cv2.LINE_8)
    cv2.putText(gc, 'OpenCV_4', (820, 60*(idx+1)), f, 1.5, (0,255,0), 3, cv2.LINE_4, True)  # True

cv2.imshow('draw', gc)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

## 2-2: 滑鼠交互
### onmouse(event, x, y, flags, param)

> 事件代號 (int event), 座標 (int x,int y), 旗標代號 (int flag), 滑鼠事件的代號名稱 (param)
> * event : 代表的是滑鼠回傳的事件號碼，每當滑鼠有動作，event就會回傳訊息到 onMouse()，也順便回傳滑鼠移動的座標
> * flag : 代表的是拖曳事件
> * param : 則是自己定義 onMouse() 事件的ID，就跟 GUI 介面的視窗介面 ID 一樣 (cvGetWindowHandle())，不過這邊是自己給的編號，而視窗介面的 ID 則是系統自動隨機分配的 ID，而滑鼠事件的執行可以細分為：

>>### event :
|      事件 event       | 值 |  動作   |
|:---------------------:|:-:|:-------:|
|CV_EVENT_MOUSEMOVE     | 0 |   滑動   |
|CV_EVENT_LBUTTONDOWN   | 1 | 左鍵點擊 |
|CV_EVENT_RBUTTONDOWN   | 2 | 右鍵點擊 |
|CV_EVENT_MBUTTONDOWN   | 3 | 中鍵點擊 |
|CV_EVENT_LBUTTONUP     | 4 | 左鍵放開 |
|CV_EVENT_RBUTTONUP     | 5 | 右鍵放開 |
|CV_EVENT_MBUTTONUP     | 6 | 中鍵放開 |
|CV_EVENT_LBUTTONDBLCLK | 7 | 左鍵雙擊 |
|CV_EVENT_RBUTTONDBLCLK | 8 | 右鍵雙擊 |
|CV_EVENT_MBUTTONDBLCLK | 9 | 中鍵雙擊 |

<div style="page-break-after: always"></div>

>>### Flag : 
|       旗標 flag       | 值 |  動作                  |
|:---------------------:|:--:|:---------------------:|
|CV_EVENT_FLAG_LBUTTON  | 1  |  左鍵拖曳              |
|CV_EVENT_FLAG_RBUTTON   | 2  |  右鍵拖曳              |
|CV_EVENT_FLAG_MBUTTON   | 4  |  中鍵拖曳              |
|CV_EVENT_FLAG_CTRLKEY   | 8  | (8~15)按Ctrl不放事件   |
|CV_EVENT_FLAG_SHIFTKEY  | 16 | (16~31)按Shift不放事件 |
|CV_EVENT_FLAG_ALTKEY    | 32 | (32~39)按Alt不放事件   |


In [None]:
import cv2

def onmouse(event, x, y, flags, param):   #標準滑鼠互動函式
    if event == 0:                          #當滑鼠移動時
        print(f'BGR : {img[y, x]}, x:{x}, y:{y},', end='     ')  #顯示滑鼠所在畫素的數值，注意畫素表示方法和座標位置的不同
#========= main =====================
img= cv2.imread('./image/mybaby.jpg')       #定義圖片位置

cv2.namedWindow('img')                     #構建視窗
cv2.setMouseCallback('img', onmouse)       #回撥繫結視窗

while True:                                #無限迴圈
    cv2.imshow('img', img)
    if cv2.waitKey() == 27:               #按下‘ESC'鍵，退出
        break                      

cv2.destroyAllWindows()                    #關閉視窗
cv2.waitKey(1)

### 長方形拖曳

In [None]:
import cv2
import numpy as np

drawing = False
ix, iy = 5, 5

def draw_rect(event, x, y, flags, param):
    global ix, iy, drawing, mode

    if flags == 1:
        cv2.rectangle(img, (ix,iy), (x,y), (0,255,0), 1)

img = np.zeros((512, 512, 3), np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image', draw_rect)

while True:
    cv2.imshow('image', img)
    if cv2.waitKey(1) == 27:
        break
        
cv2.destroyAllWindows()
cv2.waitKey(1)

## 2-3: 滾動條

In [None]:
import cv2
import numpy as np

def nothing(x):
    pass

img = np.zeros((512, 512, 3), np.uint8)  # empty image
cv2.namedWindow('Track Bar')

# creat track bars
cv2.createTrackbar('R', 'Track Bar', 0, 255, nothing)   # in 'Track Bar' windows
cv2.createTrackbar('G', 'Track Bar', 0, 255, nothing)
cv2.createTrackbar('B', 'Track Bar', 0, 255, nothing)
cv2.createTrackbar('1:ON\n0:OFF', 'Track Bar', 0, 1, nothing)  # need nothing to call function

while True :
    R = cv2.getTrackbarPos('R', 'Track Bar')
    G = cv2.getTrackbarPos('G', 'Track Bar')
    B = cv2.getTrackbarPos('B', 'Track Bar')
    F = cv2.getTrackbarPos('1:ON\n0:OFF', 'Track Bar')

    if F == 1:
        img[:]=[B, G, R]
    else:
        img[:]=[0,0,0]
        
    cv2.imshow('Track Bar', img)
    if cv2.waitKey(1) == 27:
        break

cv2.destroyAllWindows()
cv2.waitKey(1)

### example HSV

In [None]:
import numpy as np
import cv2

def nothing(x):
    pass

pic = cv2.imread('./image/lenaColor.png')
pic = cv2.cvtColor(pic, cv2.COLOR_BGR2HSV)  # 將 BGR圖像轉化為 HSV 圖像

# cv2.namedWindow('old', cv2.WINDOW_NORMAL) 
cv2.imshow('old', pic)     # 顯示原圖像做對比

# cv2.namedWindow('new', cv2.WINDOW_AUTOSIZE) 
cv2.imshow('new', pic)    # 新圖像窗口

#初始化滾動條
cv2.createTrackbar('H', 'new', 10, 15, nothing)
cv2.createTrackbar('S', 'new', 10, 15, nothing)
cv2.createTrackbar('V', 'new', 10, 15, nothing)

while True:
    if cv2.waitKey(1) == 27:          # ESC按下退出
        print('finish !!!')
        break
	# 讀取滚動條現在的滾動條的 HSV 信息
    h_value = float(cv2.getTrackbarPos('H', 'new')/10)  # 1 ~ 1.5
    s_value = float(cv2.getTrackbarPos('S', 'new')/10)  # 1 ~ 1.5
    v_value = float(cv2.getTrackbarPos('V', 'new')/10)  # 1 ~ 1.5
	# 拆分、讀入新數據後，重新合成調整後的圖片
    H, S, V = cv2.split(pic)
    new_pic = cv2.merge([np.uint8(H*h_value) , np.uint8(S*s_value) , np.uint8(V*v_value)])
    cv2.imshow('new', new_pic)

cv2.destroyAllWindows()
cv2.waitKey(1)

---

<div style="page-break-after: always"></div>

# Module 3. 色彩空間
> 色彩空間是描述使用一組值（通常使用三個、四個值或者顏色成分）表示顏色方法的抽像數學模型，也被稱作「色域」。

> 通常使用`RGB（紅色、綠色、藍色）`色彩空間定義，這是另外一種生成同樣顏色的方法，紅色、綠色、藍色被當作X、Y和Z坐標軸。另外一個生成同樣顏色的方法是使用`色相（X軸）、飽和度（色度）（Y軸）和明度（Z軸）`表示，這種方法稱為HSV色彩空間。另外還有許多其它的色彩空間，許多可以按照這種方法用三維（X、Y、Z）、更多或者更少維表示，但是有些根本不能用這種方法表示。

## 3-1: RGB
> RGB色彩空間是RGB色彩空間之一，以單色（單一波長）原色的特定集合著稱

> 最常用的是 24 位實現方法，也就是紅綠藍每個通道有 8 位元或者 256 色級。基於這樣的 24 位 RGB 模型的色彩空間可以表現 `256 × 256 × 256 ≈ 1677` 萬色。一些實現方法採用每原色 16 位元，能在相同範圍內實現更高更精確的色彩密度。這在寬域色彩空間中尤其重要，因為大部分通常使用的顏色排列的相對更緊密。

> 任何的色彩都可由紅、綠、及藍三原色光混合而成，而 CRT、LCD 顯示及電漿螢幕等，確實都透過套用不同的紅、綠、及藍色次像素（Sub-Pixel）陣列的密度，而產生彩色影像。但事實上，有許多色彩卻是沒辦法以這樣的方法產生。尤其是，沒辦法產生各式各樣的青綠色（Blue-Green)

# RGB vs. CMYK
><img src="./image/rgb-vs-cmyk.jpg"  style='width:90%'>

In [None]:
import cv2

image = cv2.imread('./image/assassin.jpg')
cv2.imshow('Original', image)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)
image[:2]  # 3D BGR

### BGR to RGB

In [None]:
import cv2
import numpy as np
# img=np.random.randint(0,256,size=[2,4,3],dtype=np.uint8)
img = cv2.imread('./image/assassin.jpg')

rgb=cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
bgr=cv2.cvtColor(rgb, cv2.COLOR_RGB2BGR)

cv2.imshow('Original', img)
cv2.imshow('rgb', rgb)
cv2.imshow('bgr', bgr)

print(f'img=\n{img[:2]}\n\n'
      f'rgb=\n{rgb[:2]}\n\n'
      f'bgr=\n{bgr[:2]}')

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

## 3-2: Gray
> 基礎 : 對於彩色轉灰度，有一個很著名的心理學公式：

$$Gray = R * 0.299 + G * 0.587 + B * 0.114$$

> 整數算法

> * 而實際應用時，希望`避免低速的浮點運算`，所以需要整數算法。注意到係數都是 3 位精度，我們可以將它們縮放 1000 倍來實現整數運算算法：

$$ Gray = \frac{(R * 299 + G * 587 + B * 114 + 500)}{1000} $$

> * RGB 一般是 8 位精度，現在縮放 1000 倍，所以上面的運算是 32 位整型的運算。注意後面那個除法是整數除法，所以需要加上 500 來實現四捨五入。就是由於該算法需要 32 位運算，所以該公式的另一個變種很流行：

$$ Gray =\frac{(R * 30 + G * 59 + B * 11 + 50)}{100}$$

### to check BGR to Gray
$$F(i, j) = 0.299 R_{(i, j)} + 0.587 G_{(i, j)} + 0.114 B_{(i, j)}$$

In [None]:
img0 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_GRAYSCALE)  # same
# img0 = cv2.imread('./image/SpongeBob.jpg', 0)    # 0 灰階

img1 = cv2.imread('./image/SpongeBob.jpg', cv2.IMREAD_COLOR)    # 1 BGR,  1 可省略(原圖)

t1=np.array([0.299, 0.587, 0.114])
t2=np.array([299, 587, 114 ])
t3=np.array([30, 59, 11])
print(f'img0[0,0]\t\t\t: {img0[0,0]}\n'
      f'img1[0,0]\t\t\t: {img1[0,0]}\n'
      f'img1[0,0]*t1.sum()\t\t: {(img1[0,0]*t1).sum()}\n'
      f'img1[0,0]*t2+500)/1000).sum()\t: {((img1[0,0]*t2+500)/1000).sum()}\n'
      f'img1[0,0]*t3+50)/100).sum()\t: {((img1[0,0]*t3+50)/100).sum():.3f}')

### BGR to Gray : cv, max, min, mean, b, g, r

In [None]:
# 206 types of cvtColor
# Gray
image = cv2.imread('./image/assassin.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow('CV Gray', gray)

print(f'image :\n{image[:2]}\n\n'
      f'gray :\n{gray[:2]}')   # row 0 ~ 1, 全部 column 

cv2.imshow('max. Gray', np.max(image, axis=2))         # max gray
cv2.imshow('min. Gray', np.min(image, axis=2))         # min gray
cv2.imshow('mean Gray', np.mean(image, axis=2).astype('uint8'))   # mean 1/3 gray
cv2.imshow('b Gray', image[:,:,0])
cv2.imshow('g Gray', image[:,:,1])
cv2.imshow('r Gray', image[:,:,2])

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Gray to BGR

In [None]:
import cv2
import numpy as np
# img = cv2.imread('./image/lady_gray.png')      # error 
img = cv2.imread('./image/lenaGray.bmp', 0)     # 2d

rst=cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)       # BGR color 3d
cv2.imshow('rst', rst)
img[:2], rst[:2]   # row 0 ~ 1, 全部 column
print(rst.shape)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

# <div style="page-break-after: always"></div>

## 3-3: HSV
 * HSV / HSL 即`色相、飽和度、明度 / 亮度`（英語：Hue, Saturation, Value / Lightness），又稱 HSB，其中B即英語：Brightness。另外一個生成同樣顏色的方法是使用 : 色相（X軸）、飽和度（色度）（Y軸）和明度（Z軸）表示，這種方法稱為 HSV 色彩空間

> * 色調(Hue) : 色彩的顏色名稱，如紅色、黃色等<br>
> 在HSL中，色調 (Hue) 決定了的顏色， 用 `360 度`來劃分，就像傳統的色輪。 HSL相對於 RGB 顏色的主要優勢之一是互補色彼此相對, 這使得整個`系統非常直觀`。用角度度量，取值範圍為0°～360°，從紅色開始按逆時針方向計算，`紅色為0°，綠色為120°，藍色為240°`。它們的補色分別是：黃色為60°，青色為180°，洋紅色300°

> * 飽和度 (Saturation) : 色彩的純度，越高色彩越純，低則逐漸變灰，數值為 0-100%<br>
> 與色輪中心的距離稱為 "飽和度" 。 仔細觀察上面的色輪，距離圓心越遠，顏色更明亮，更鮮豔。

> * 明度（Value），亮度 (Lightness) : 數值為 0-100%。

>><img src="./image/hsl-hsv.png"  style='width:90%'>

<div style="page-break-after: always"></div>

><img src="./image/rgb2hsv.png"  style='width:100%'>

### OpenCV <br>
> * ### `Hue : [0, 179]`
> * ### Saturation : [0, 255]
> * ### Value : [0, 255]

In [None]:
import cv2
import numpy as np

#=========test blue in HSV=============
imgBlue=np.zeros([1,1,3],dtype=np.uint8)       # 建一個 pixel array
imgBlue[0,0,0]=255
BlueHSV=cv2.cvtColor(imgBlue,cv2.COLOR_BGR2HSV)
print(f'Blue\t\t= {imgBlue}\n'
      f'BlueHSV\t\t= {BlueHSV}\n')

#=========test green in HSV=============
imgGreen=np.zeros([1,1,3],dtype=np.uint8)
imgGreen[0,0,1]=255
GreenHSV=cv2.cvtColor(imgGreen,cv2.COLOR_BGR2HSV)
print(f'Green\t\t= {imgGreen}\n'
      f'GreenHSV\t= {GreenHSV}\n')

#=========test red in HSV=============
imgRed=np.zeros([1,1,3],dtype=np.uint8)
imgRed[0,0,2]=255
RedHSV=cv2.cvtColor(imgRed,cv2.COLOR_BGR2HSV)
print(f'Red\t\t= {imgRed}\n'
      f'RedHSV\t\t= {RedHSV}')

### XYZ :
><img src="./image/rgb2xyz.jpg"  style='width:90%'>

http://www.brucelindbloom.com/index.html?Eqn_RGB_XYZ_Matrix.html

### Lab
> * L – Lightness ( Intensity ).
> * a – color component ranging from Green to Magenta.
> * b – color component ranging from Blue to Yellow

>Lab 顏色空間與 RGB 顏色空間完全不同。在 RGB 顏色空間中，顏色信息分為三個通道，但是相同的三個通道也對亮度信息進行編碼。另一方面，在 Lab 顏色空間中，L通道與顏色信息無關，並且僅編碼亮度。其他兩個通道對顏色進行編碼。它具有以下屬性。

> * 感知均勻的色彩空間，近似我們對色彩的感知方式。
> * 與設備無關（捕獲或顯示）。
> * 在 Adobe Photoshop 中廣泛使用。
> * 通過複雜的轉換方程與 RGB 顏色空間相關。

In [None]:
# Hue, Saturation, Value
import cv2

# BGR
# img = cv2.imread('./image/lenaColor.png', 1)
img = cv2.imread('./image/fruits.png', 1)
cv2.imshow('original', img)

hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
cv2.imshow('HSV', hsv)

hsv[:,:,1] = hsv[:,:,1] / 2                         # adjust saturation
hsv[:,:,2] = hsv[:,:,2] / 2                        # adjust brightness
hsv = cv2.cvtColor(hsv, cv2.COLOR_HSV2BGR)
cv2.imshow('BGR (after HSV adjestment)', hsv)

# Hue, Lightness/Luminance, Saturation
hls = cv2.cvtColor(img, cv2.COLOR_BGR2HLS)
cv2.imshow('HLS', hls)

# Lightness, A(Green..Red), B(Blue..Yellow)
lab = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)
cv2.imshow('L*a*b*', lab)

XYZ = cv2.cvtColor(img, cv2.COLOR_BGR2XYZ)
cv2.imshow('XYZ', XYZ)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### InRange

In [None]:
import cv2
import numpy as np
img=np.random.randint(0, 256, size=[5, 5], dtype=np.uint8)
lo=100;   hi=200

mask = cv2.inRange(img, lo, hi)   # inRange is True 有一點像 thresh
print(f'img=\n{img}\n\n'
      f'mask=\n{mask}')

### Mask

without Mask first

In [None]:
import cv2
import numpy as np

img = np.full((5,5), 9)
# img=np.ones([5, 5], dtype=np.uint8)*9  # img.fill(9)

mask =np.zeros([5, 5], dtype=np.uint8)
mask[0:3, 0]=1; mask[2:5, 2:4]=1

roi=cv2.bitwise_and(img, img, mask = mask)
print(f'img=\n{img}\n\n'
      f'mask=\n{mask}\n\n'
      f'roi=\n{roi}')

### in HSV range
><img src="./image/HSVinRange.png"  style='width:80%'>

> 結合 cv2.inRange() 可以清晰看到某個顏色區域影像位於影像的什麼地方。<br>
> 用法 cv2.inRange(img, low, high)，函式會將位於兩個區域間的值置為 255，位於區間外的值置為 0。<br>
> 比如想要看到青色的區域處於影像中的什麼位置，青色的區域是 [78, 43, 46], [99, 255, 255]

### range of blue, green, red

In [None]:
import cv2
import numpy as np
opencv=cv2.imread('./image/opencv.jpg')
hsv = cv2.cvtColor(opencv, cv2.COLOR_BGR2HSV)

cv2.imshow('opencv', opencv)
cv2.imshow('hsv', hsv)
cv2.waitKey()
#=============blue range=============
minBlue = np.array([100,43,46])       # 從 HSV 色彩空間 110 ~ 124
maxBlue = np.array([124,255,255])
mask_b = cv2.inRange(hsv, minBlue, maxBlue)

blue = cv2.bitwise_and(opencv, opencv, mask= mask_b)
cv2.imshow(f'blue {minBlue[0]}~{maxBlue[0]}', blue)
cv2.waitKey()

#=============green range=============
minGreen = np.array([35,43,46])          # 從 HSV 色彩空間 35 ~ 77
maxGreen = np.array([77,255,255])
mask_g = cv2.inRange(hsv, minGreen, maxGreen)

green = cv2.bitwise_and(opencv, opencv, mask= mask_g)
cv2.imshow(f'green {minGreen[0]}~{maxGreen[0]}', green)
cv2.waitKey()
#=============red range=============
minRed = np.array([0,43,46])             # 從 HSV 色彩空間 0 ~ 10
maxRed = np.array([10,255,255])
mask_r = cv2.inRange(hsv, minRed, maxRed)

red= cv2.bitwise_and(opencv, opencv, mask= mask_r) 
cv2.imshow(f'red {minRed[0]}~{maxRed[0]}', red)
cv2.waitKey()

minRedR = np.array([156,43,46])             # 從 HSV 色彩空間 156 ~ 180
maxRedR = np.array([180,255,255])
mask_rR = cv2.inRange(hsv, minRedR, maxRedR)

redR= cv2.bitwise_and(opencv, opencv, mask= mask_rR)
cv2.imshow(f'redr {minRedR[0]}~{maxRedR[0]}', redR)
cv2.waitKey()

#=============all in one============
mask = mask_b + mask_g + mask_r + mask_rR
all_inOne = cv2.bitwise_and(opencv, opencv, mask= mask) 
cv2.imshow('all_in_One', all_inOne)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### masking

In [None]:
import numpy as np
import cv2

image = cv2.imread('./image/mybaby.jpg')
cv2.imshow('Original', image)
print(image.shape)
cv2.waitKey(0)

# draw white rectangle on the center of the image
mask = np.zeros(image.shape[:2], dtype = 'uint8')
(cX, cY) = (image.shape[1]//2, image.shape[0]//2)
cv2.rectangle(mask, (cX-100,cY-100), (cX+100,cY+100), 255, -1)
cv2.imshow('Mask : rectangle', mask)
cv2.waitKey(0)

# masking image
masked = cv2.bitwise_and(image, image, mask=mask)
cv2.imshow('Mask rect. to Image', masked)
cv2.waitKey(0)

# draw white circle on the center of the image
mask = np.zeros(image.shape[:2], dtype = 'uint8')
cv2.circle(mask, (cX, cY), 100, 255, -1)
cv2.imshow('Mask : circle', mask)
cv2.waitKey(0)

# masking image
masked = cv2.bitwise_and(image, image, mask=mask)
cv2.imshow('Mask circle to Image', masked)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

# skin color in HSV range

In [None]:
import cv2
img=cv2.imread('./image/lesson2.jpg')
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

minSkin = np.array([0,30,60])          # HSV 色彩空間 min
maxSkin = np.array([25,150,255])          # HSV 色彩空間 max

mask_skin = cv2.inRange(hsv, minSkin, maxSkin)
roi = cv2.bitwise_and(img, img, mask= mask_skin)

cv2.imshow('img', img)
cv2.imshow('ROI', roi)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### BGR → HSV → BGR
> RGB 轉換 HSV 及 HSL <br>
> https://www.ginifab.com.tw/tools/colors/rgb_to_hsv_hsl.html

### OpenCV color space conversion
https://docs.opencv.org/master/d8/d01/group__imgproc__color__conversions.html

---

<div style="page-break-after: always"></div>

# Module 4. 圖片``幾何``轉換

## 4-1 : 線性代數複習
> 矩陣相乘 :<br>
> $[ 2 * 2 ] x [ 2 * 2 ] = [ 2 * 2 ]$<br>
> $[ 2 * 3 ] x [ 3 * 2 ] = [ 2 * 2 ]$

><img src="./image/matrix_product.jpg"  style='width:100%'></img>

### 算術運算 Add, Scale

In [None]:
# Element wise Multiplication 
x = np.array([[1., 2.], [4., 5.]])
y = np.array([[6., 23.], [-1, 7]])
print(f'x =\n{x}\n\n'
      f'y =\n{y}\n\n'
      f'x + y =\n{x+y}\n\n'
      f'x * 2 =\n{x*2}\n\n'
      f'x * y =\n{x*y}') 

# dot 矩陣和矩陣 (向量) 相乘

$( M列, N行 ) * ( N列, L行 ) = ( M列, L行 )$

$a . b=\begin{bmatrix}a_1 & a_2 & a_3 & a_4 & a_5\end{bmatrix}_{(1*5)}
\begin{bmatrix}b_1 \\ b_2 \\ b_3 \\ b_4 \\ b_5\end{bmatrix}_{(5*1)} = 
\begin{bmatrix}a_1 b_1+a_2 b_2+a_3 b_3+a_4 b_4+a_5 b_5\end{bmatrix}_{(1*1)}$

### Element wise
$a x b=\begin{bmatrix}a_1 \\ a_2 \\ a_3 \\ a_4 \\ a_5\end{bmatrix}_{(5*1)}
\begin{bmatrix}b_1 \\ b_2 \\ b_3 \\ b_4 \\ b_5\end{bmatrix}_{(5*1)} = 
\begin{bmatrix}a_1 b_1 \\ a_2 b_2 \\ a_3 b_3 \\ a_4 b_4 \\ a_5 b_5\end{bmatrix}_{(5*1)}$

In [None]:
x = np.array([[1., 2.], [4., 5.]])
y = np.array([[6., 23.], [-1, 7]])
x, y, x.dot(y), x@y, np.dot(x,y)

In [None]:
x = np.array([[1., 2., 3.], [4., 5., 6.]])
y = np.array([[6., 23.], [-1, 7], [8, 9]])
x, y, x.dot(y)

### Transpose
><img src="./image/matrixT.png"  style='width:90%'></img>

In [None]:
x = np.array([[1., 2., 3.], [4., 5., 6.]])
y = np.array([[6., 23.], [-1, 7], [8, 9]])
x, x.T, y, y.T

### Inverse
$AA^{-1} = 1$

In [None]:
y = np.array([[6., 23.], [-1, 7]])
np.linalg.inv(y)

In [None]:
np.dot(np.linalg.inv(y), y)

### 幾何變換不改變影像的畫素值，只是在影像平面上進行畫素的重新安排。
> 座標位置 row, column 轉換 (非 RGB 轉換 ) : 縮放(resize)、翻轉(flip)、平移(translate)、旋轉(Rotate)、仿射(Affine)<br>
><img src="./image/resize.jpg"  style='width:90%'></img>
><img src="./image/resize.png"  style='width:90%'></img>
><img src="./image/homogen.jpg"  style='width:100%'></img>

$$ M = \begin{pmatrix} W&A&X\\B&H&Y\\0&0&1 \end{pmatrix}$$<br>

> 圖片移位的數學原理 $x, y$ 是圖片最終的座標$（x, y），x_0，y_0 $是圖片原始座標

$$\begin{bmatrix} x\\y\\1\end{bmatrix} =\begin{bmatrix} W&A&X\\B&H&Y\\0&0&1\end{bmatrix}\begin{bmatrix} x_0\\y_0\\1\end{bmatrix}$$

> $W, H$ : 長寬的`放大, 縮小, 翻轉`<br>
> $X, Y$ : 位置的`平移`<br>
> $A, B$ : 仿射

<div style="page-break-after: always"></div>

## 4-2: OpenCV 圖片幾何轉換

>  ### 最後一個引數 interpolation 表示插值方式：<br>

> | 插值方式       | 名稱          | 說明                                                           |
> |:-------------:|:-------------:|:--------------------------------------------------------------:|
> |INTER_NEAREST  | 最近鄰插值     | 邊緣不會出現緩慢的漸慢過度區域，這也導致放大的圖像容易出現鋸齒的現像 |
> |INTER_LINEAR   | 線性插值（預設) | 線性插值是以距離為權重的一種插值方式。                            |
> |INTER_AREA     | 區域插值       | 使用圖元區域關係進行重採樣。它可能是圖像抽取的首選方法，因為它會產生無雲紋理的結果。但是當圖像縮放時，它類似於INTER_NEAREST方法 |
> |INTER_CUBIC    | 三次樣條插值    | ``是用某種3次方函數差值``, 可以有效避免出現鋸齒的現像, 4x4圖元鄰域的雙三次插值  |
> |INTER_LANCZOS4 | Lanczos插值    | 是跟``傅立葉轉換``有關的三角函數的方法, 8x8圖元鄰域的Lanczos插值      |

### interpolation 插補

In [None]:
import cv2
import numpy as np
from matplotlib import pyplot as plt

img = np.uint8(np.random.randint(0, 256, size=(5,5,3)))
height, width, _= img.shape

new_dimension = (250, 250)
plt.figure(figsize=(12, 8))

plt.subplot(231)
plt.title('Original Image'), plt.imshow(img)

plt.subplot(232)
resized = cv2.resize(img, new_dimension, interpolation = cv2.INTER_NEAREST)
plt.title('INTER_NEAREST'), plt.imshow(resized)

plt.subplot(233)
resized = cv2.resize(img, new_dimension, interpolation = cv2.INTER_LINEAR)
plt.title('INTER_LINEAR'), plt.imshow(resized)

plt.subplot(234)
resized = cv2.resize(img, new_dimension, interpolation = cv2.INTER_AREA)
plt.title('INTER_AREA'), plt.imshow(resized)

plt.subplot(235)
resized = cv2.resize(img, new_dimension, interpolation = cv2.INTER_CUBIC)
plt.title('INTER_CUBIC'), plt.imshow(resized)

plt.subplot(236)
resized = cv2.resize(img, new_dimension, interpolation = cv2.INTER_LANCZOS4)
plt.title('INTER_LANCZOS4'), plt.imshow(resized)

plt.show()

### Scaling
> Scaling - resize() : 縮放只是調整影像大小<br>
><img src=".\image\resize01.jpg"  style='width:90%'></img>

### 速度比較 :
> INTER_NEAREST（最近鄰插值) > INTER_LINEAR(線性插值) > INTER_CUBIC(三次樣條插值) > INTER_AREA  (區域插值)<br>
> 對圖像進行縮小時，為了避免出現波紋現像，`推薦採用INTER_AREA `區域插值方法。

> OpenCV推薦 : <br>
> 如果要`縮小`圖像，通常推薦使用 `INTER_AREA` 插值效果最好，而要`放大`圖像，通常使用 `INTER_CUBIC` (速度較慢，但效果最好)，或者使用 `INTER_LINEAR` (速度較快，效果還可以)。

>至於最近鄰插值 INTER_NEAREST，一般不推薦使用

### Flip
> src ：原始影像。<br>
> flipCode ：翻轉方向
> * $flipCode = 0$ ，則以 X (水平) 軸為對稱軸翻轉
> * $flipCode > 0$ ，則以 Y (垂直) 軸為對稱軸翻轉
> * $flipCode < 0$ ，則在 X (水平) 軸、 Y (垂直) 軸方向同時翻轉

In [None]:
import cv2
img = cv2.imread('./image/cat.jpg')

flip_x = cv2.flip(img, 0)
flip_y = cv2.flip(img, 2)
flip_xy = cv2.flip(img, -1)

cv2.imshow('original', img)
cv2.imshow('flip x', flip_x)
cv2.imshow('flip y', flip_y)
cv2.imshow('flip xy', flip_xy)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### flip image

In [None]:
import numpy as np
import cv2

image = cv2.imread('./image/mybaby.jpg')
cv2.imshow('Original', image)
cv2.waitKey(0)

flipped = cv2.flip(image, 1)
cv2.imshow('Flipped Horizontally left side right : 1', flipped)
cv2.waitKey(0)

flipped = cv2.flip(image, 0)
cv2.imshow('Flipped vertical upside down : 0', flipped)
cv2.waitKey(0)

flipped = cv2.flip(image, -1)
cv2.imshow('Flipped (left side right) and (upside down) : -1', flipped)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Translation
> $cv2.warpAffine(src, dst, tranformMatrix, size)$

> 在影像平移中我們會用到前三個引數：
> * src 對像，表示此操作的源（輸入圖像）。
> * dst 表示此操作的目標（輸出圖像）的對像。
> * 表示轉換矩陣的 tranformMatrix 對像。
> * size−整數類型的變量，表示輸出圖像的大小。

圖片移位的數學原理 x, y 是圖片`最終的座標（x, y）`，`x0，y0 是圖片原始座標`，$∆x，∆y$ 圖片平移的大小，公式如下:<br>
$$x=x_0+∆x$$
$$y=y_0+∆y$$

$$\begin{bmatrix} x\\y\\1\end{bmatrix} =
\begin{bmatrix} 1 & 0 & ∆x\\0 & 1 & ∆y\\0 & 0 & 1\end{bmatrix}
\begin{bmatrix} x_0\\y_0\\1\end{bmatrix}$$

In [None]:
import cv2
import numpy as np
origin = cv2.imread('./image/cat.jpg')

trans_x = 80;  trans_y = 60
h, w = origin.shape[:2]
print(f'origin size : h:{h} / w:{w}')

M = np.float32([[1, 0, trans_x], 
                [0, 1, trans_y]])
print('M =\n', M)

# cv2.warpAffine()函數的第三個參數是輸出圖片的大小，應該是（width, height）的形式，記住width=列數，height=行數
trans_img = cv2.warpAffine(origin, M, (w+100, h+100))
cv2.imshow('origin', origin)
cv2.imshow('trans_img', trans_img)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

In [None]:
# import numpy as np
import cv2

img = cv2.imread('./image/mybaby.jpg')

h, w, _ = img.shape
M = np.float32([[1,0,100], 
                [0,1,50]])
print('M =\n', M)

dst = cv2.warpAffine(img, M, (w+150, h+100))

cv2.imshow('translation image',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

<div style="page-break-after: always"></div>

### Rotation
><img src="./image/rotation.jpg"  style='width:90%'></img>

> 計算出一個二維旋轉的仿射矩陣
> * center ：旋轉中心座標
> * angle ：旋轉角度，正值意味著逆時針旋轉，座標原點為左上角
> * scale ：縮放比例

In [None]:
import cv2
import numpy as np
origin = cv2.imread('./image/cat.jpg')

h, w = origin.shape[:2]

M1 = cv2.getRotationMatrix2D((w/2, h/2), 45, 0.8) #表示旋轉的中心點,表示旋轉的角度,圖像縮放因子
M2 = cv2.getRotationMatrix2D((w/2, 0), 45, 0.9)
M3 = cv2.getRotationMatrix2D((0, h/2), -45, 0.6)
print(f'M1 =\n{M1}\n\n'
      f'M2 =\n{M2}\n\n'
      f'M3 =\n{M3}')

rotate_img1 = cv2.warpAffine(origin, M1, (w, h))
rotate_img2 = cv2.warpAffine(origin, M2, (w, h))
rotate_img3 = cv2.warpAffine(origin, M3, (w, h))

cv2.imshow('origin', origin)
cv2.imshow('rotate_img1', rotate_img1)
cv2.imshow('rotate_img2', rotate_img2)
cv2.imshow('rotate_img3', rotate_img3)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### rotate image

In [None]:
import numpy as np
import cv2

img = cv2.imread('./image/mybaby.jpg')

rows, cols, _ = img.shape

# cols-1 and rows-1 are the coordinate limits
M = cv2.getRotationMatrix2D(((cols-1)/2.0, (rows-1)/2.0), 90, 1)  # certer 是中心
dst = cv2.warpAffine(img, M, (cols, rows))

cv2.imshow('Rotate image dst', dst)

img90 = cv2.rotate(img, cv2.ROTATE_90_CLOCKWISE)
img180 = cv2.rotate(img, cv2.ROTATE_180)
img270 = cv2.rotate(img, cv2.ROTATE_90_COUNTERCLOCKWISE)

cv2.imshow('Rotate 90', img90)
cv2.imshow('Rotate 180', img180)
cv2.imshow('Rotate 270', img270)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Affine Transformation
> 在仿射變換中，原始影像中的所有平行線在輸出影像中`仍然是平行的(平行四邊形的概念`)。為了找到變換矩陣，我們需要從輸入影像中得到三個點，以及它們在輸出影像中的對應位置。然後 cv2.getAffineTransform 將會建立一個 2x3 矩陣，它將被傳遞給 cv2.warpAffine。

In [None]:
import cv2
import numpy as np

img = cv2.imread('./image/cat.jpg')
rows, cols, ch = img.shape

pts1 = np.float32([[0,0], [200,50], [50,200]])
pts2 = np.float32([[10,100], [200,50], [100,250]])

M = cv2.getAffineTransform(pts1, pts2)
print(f'M =\n{M}')
affine_img = cv2.warpAffine(img, M, (cols+100,rows+100))

cv2.imshow('origin', img)
cv2.imshow('affine_img', affine_img)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### 透視變換
> 要完成透視變換，你需要一個 3x3 的對映矩陣，直線會在對映之後保持筆直。要找到這個對映矩陣，你需要`四個原圖上的點`，以及它們在轉換後圖像上對應的位置。在這四個點中，`其中任意三個不能共線`。

> 然後 cv2.getPerspectiveTransform 函數就能得到轉換矩陣了，再用 cv2.warpPerspective 來接收這個 3x3 的轉換矩陣。

In [None]:
import cv2
import numpy as np

img = cv2.imread('./image/cat.jpg')
h, w, ch = img.shape

pts1 = np.float32([[0, 0], [w, 0], [0, h], [w, h]])
# pts2 = np.float32([[0+10, 0+10], [50, w-10] ,[h/2, 0], [h-50, w-10]])
pts2 = np.float32([[0+100, 0+10], [w-100, 50] ,[50, h-200], [w-20, h-10]])

M = cv2.getPerspectiveTransform(pts1, pts2)
print(f'M =\n{M}')
affine_img = cv2.warpPerspective(img, M, (w+100, h+100))    # 3 * 3 Matrix
# affine_img = cv2.warpAffine(img, M, (w+100, h+100))       # error

cv2.imshow('origin', img)
cv2.imshow('affine_img', affine_img)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

---

<div style="page-break-after: always"></div>

# Module 5. 濾波器
## 5-1: 卷積運算介紹
> 卷積一詞最開始出現在信號與系統中，是指兩個原函數產生一個新的函數的一種算子。卷積運算在運算過程可以概括為翻轉、平移再加權求和三個步驟，其中的加權求和就是乘加操作。另外，卷積運算還有一個重要的特性：空間域卷積=頻域乘積，這一點可以解釋為什麼卷積運算可以自動地提取圖像的特徵。

> 在卷積神經網絡中，對數字圖像做卷積操作其實就是利用卷積核（黃底部分）在圖像（綠底部分）上滑動，將圖像上的像素灰度值與對應卷積核上的數值相乘，然後將所有相乘後的值相加作為此時的輸出值（紅底部分），並最終滑動遍歷完整副圖像的過程。

><img src="./image/converlution01.jpg"  style='width:90%'></img>
><img src="./image/converlution02.jpg"  style='width:90%'></img>
><img src="./image/converlution01.gif"  style='width:90%'></img>

### 步伐 (stride) 和 填充 (padding)

><img src="./image/converlution03.jpg"  style='width:100%'></img>
><img src="./image/converlution04.jpg"  style='width:100%'></img>
https://github.com/vdumoulin/conv_arithmetic<br>
https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1

<div style="page-break-after: always"></div>

## 5-2: 卷積運算物理意義

> 我們計算系統輸出時就必須考慮現在時刻的信號輸入的響應以及之前若干時刻信號輸入的響應之「殘留」影響的一個疊加效果。再拓展點，某時刻的系統響應往往不一定是由當前時刻和前一時刻這兩個響應決定的，也可能是再加上前前時刻，前前前時刻，前前前前時刻，等等

>><img src="./image/filter.jpg"  style='width:90%'></img>

> 影像平滑模糊化是透過使用低通濾波器進行影像卷積來實現的。這對於消除雜訊很有用。實際上使用此濾波器時，它會從影像中去除高頻內容（例如，雜訊，邊緣），也會導致影像邊緣變得模糊（也有其他濾波器不會造成影像邊緣模糊）。OpenCV主要提供四種類型的平滑模糊化技術

## 1d convolution

In [None]:
import numpy as np

x = np.array([ 1, 2, 4, 3, 2, 1, 1 ])
h = np.array([ 1, 2, 3, 1, 1 ])

yf = np.convolve(x, h, 'full')
ys = np.convolve(x, h, 'same')

print(f'x\t\t\t= {x}\n'
      f'h\t\t\t= {h}\n'
      f'Full Convolution\t= {yf}\n'
      f'Same Convolution\t= {ys}')

## 5-3 : 平均濾波器、高斯濾波器、中值濾波器、雙邊濾波器
> Blur & boxFilter - Average & Sum

> boxFilter() 函數方框濾波所用的核為：
><img src="./image/boxFilter.jpg"  style='width:100%'></img>
> 當 $normalize = true$ 時，盒式濾波就變成了均值濾波。也就是說，均值濾波是盒式濾波歸一化（normalized）後的特殊情況。其中，歸一化就是把要處理的量都縮放到一個範圍內，比如(0,1)，以便統一處理和直觀量化。

> 當 $normalize = false$ 時，為非歸一化的盒式濾波，用於計算每個圖元鄰域內的積分特性，比如密集光流演算法（dense optical flow algorithms）中用到的圖像倒數的協方差矩陣（covariance matrices of image derivatives）。

### blur & boxFilter with `border type`

In [None]:
import cv2

img = cv2.imread('./image/lenaNoise.png')
result_blur = cv2.blur(img, (3, 3), borderType=cv2.BORDER_REPLICATE)    # border type
result_box = cv2.boxFilter(img, -1, (5, 5), normalize=1)    # change 3, 3 to 5, 5 which is same as blur

cv2.imshow('original', img)
cv2.imshow('result_blur',result_blur)
cv2.imshow('result_box', result_box)  
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Blur diff. kernel

In [None]:
import cv2
o = cv2.imread('./image/lenaNoise.png')
r5 = cv2.blur(o,(5,5))      
r10 = cv2.blur(o,(10,10))      
r15 = cv2.blur(o,(15,15))   

cv2.imshow('original', o)
cv2.imshow('result5', r5)
cv2.imshow('result10', r10)
cv2.imshow('result15', r15)

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

### Define other Filter 
> 2D Convolution ( Image Filtering )
><img src="./image/filter_2d.jpg"  style='width:100%'></img>

### filter2D() 函數<br>

> $dst = cv.filter2D (src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])$

|參數       |描述                                                                |
|:---------:|:------------------------------------------------------------------|
|src        |原圖像                                                              |
|dst        |目標圖像，與原圖像尺寸和通過數相同                                     |
|ddepth	    |目標圖像的所需深度, 當 ddepth 輸入值為-1時，靶心圖表像和原圖像深度保持一致 |
|kernel	    |卷積核（或相當於相關核），單通道浮點矩陣;如果要將不同的內核應用於不同的通道，請使用拆分將圖像拆分為單獨的顏色平面，然後單獨處理它們。|
|anchor     |內核的錨點，指示內核中過濾點的相對位置;錨應位於內核中;默認值（-1，-1）表示錨位於內核中心。|
|detal      |在將它們存儲在 dst 中之前，將可選值添加到已過濾的像素中。類似於偏置。      |
|borderType |像素外推法，參見 BorderTypes                                           |

> 其中 ddepth 表示目標圖像的所需深度，它包含有關圖像中存儲的數據類型的信息，可以是 unsigned char（CV_8U），signed char（CV_8S），unsigned short（CV_16U）等等...

|Input depth (src.depth())|	Output depth (ddepth)|
|:-----------:|:----------------------|
|CV_8U	      |-1/CV_16S/CV_32F/CV_64F|
|CV_16U/CV_16S|-1/CV_32F/CV_64F       |
|CV_32F	      |-1/CV_32F/CV_64F       |
|CV_64F       |-1/CV_64F              |

>Note ：當 ddepth = -1 時，表示輸出圖像與``原圖像有相同的深度``。

### Boundary Padding  
|參數              |方法    |說明                  |
|-----------------|--------|----------------------|
|BORDER_REPLICATE |複製法   |也就是複製最邊緣像素。   |
|BORDER_REFLECT   |反射法   |對感興趣的圖像中的像素在兩邊進行複製例如：$fedcba | abcdefgh | hgfedcb$|
|BORDER_REFLECT_101|反射法  |也就是以最邊緣像素為軸，對稱，$gfedcb | abcdefgh | gfedcba$|
|BORDER_WRAP      |外包裝法 |$cdefgh|abcdefgh|abcdefg$|
|BORDER_CONSTANT  |常量法   |常數值填充。|
><img src="./image/borderType.png"  style='width:90%'></img>

In [None]:
import numpy as np
import cv2

img = cv2.imread('./image/cat.jpg', 1)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)    # 將 BGR 圖片轉為 RGB 圖片

top = bottom = left = right = 50

replicate = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_CONSTANT, value=(255,255,255))

plt.figure(figsize=(14, 9))
plt.subplot(231), plt.imshow(img), plt.title('original');
plt.subplot(232), plt.imshow(replicate), plt.title('replicate')
plt.subplot(233), plt.imshow(reflect), plt.title('reflect')
plt.subplot(234), plt.imshow(reflect101), plt.title('reflect101')
plt.subplot(235), plt.imshow(wrap), plt.title('wrap')
plt.subplot(236), plt.imshow(constant), plt.title('constant'), plt.show()

cv2.waitKey(0) 
cv2.destroyAllWindows()
cv2.waitKey(1)

In [None]:
import cv2
import numpy as np

o = cv2.imread('./image/lenaNoise.png')

# kernel = np.ones((5, 5), np.float32)/25   # how about /10
kernel = np.full((5,5), 1/25, dtype='float32')
print(kernel)

r = cv2.filter2D(o, -1, kernel)  # -1 是影像深度 -1 表示與原圖相同, anchor:以中心為準, delta:offset
# r = cv2.blur(o,(5,5))  
cv2.imshow('original',o)
cv2.imshow('fliter2D',r) 
cv2.waitKey()
cv2.destroyAllWindows()
cv2.waitKey(1)

### sharpen image

In [None]:
import numpy as np
import cv2

# img = cv2.imread('./image/mybaby.jpg')
img = cv2.imread('./image/LenaColor.png')

# generating the kernels
kernel_sharp1 = np.array([[0,-1,0],
                          [-1,5,-1],
                          [0,-1,0]])

kernel_sharp2 = np.array([[-1,-1,-1],
                          [-1,9,-1],
                          [-1,-1,-1]])

kernel_sharp3 = np.array([[1,1,1],
                          [1,-7,1],
                          [1,1,1]])

kernel_sharp4 = np.array([[-1,-1,-1,-1,-1],
                          [-1,2,2,2,-1],
                          [-1,2,8,2,-1],
                          [-1,2,2,2,-1],
                          [-1,-1,-1,-1,-1]]) / 8.0

# applying different kernels to the input image
out1 = cv2.filter2D(img, cv2.CV_64F, kernel_sharp1)
out2 = cv2.filter2D(img, cv2.CV_64F, kernel_sharp2)
out3 = cv2.filter2D(img, cv2.CV_64F, kernel_sharp3)
out4 = cv2.filter2D(img, cv2.CV_64F, kernel_sharp4)

cv2.imshow('Original', img)
cv2.imshow('1. Sharpening', cv2.convertScaleAbs(out1))
cv2.imshow('2. More Sharpening', cv2.convertScaleAbs(out2))
cv2.imshow('3. Excessive Sharpening', cv2.convertScaleAbs(out3))
cv2.imshow('4. Edge Enhancement', cv2.convertScaleAbs(out4))

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Gaussian Filter
> 它的運作方式與 Averaging Filter 類似，但差別在於中間那個點的計算方式不同，Gaussian Filter 的作法是將給予各點不同的權值，`愈靠近中央點的權值愈高`，最後再以平均方式計算出中央點，因此，Gaussia Filter 的模糊化效果比起 Averaging 會比較明顯，但是效果卻更為自然。

>><img src="./image/filter_Gauss.jpg"  style='width:100%'></img>

> $GaussianBlur(src, ksize, sigmaX, sigmaY=None, borderType=None)$

$$SigmaX = 0.3 * [(ksize.width - 1) * 0.5 -1] + 0.8$$
$$SigmaY = 0.3 * [(ksize.width - 1) * 0.5 -1] + 0.8$$

>> $SigmaY$ : 垂直方向的標準差預設為 0 表示與水平方向相同<br>
>> `高斯分佈(也叫常態分佈)` 的特點為 ,標準差越大, 分佈越分散, 標準差越小, 分佈越集中.

>><img src="./image/Gauss.jpg"  style='width:90%'></img>

> ### example
> Gaussian kernel of size = 3
$$ Gx = \frac{1}{16}\begin{pmatrix}1&2&1\\2&4&2\\1&2&1\end{pmatrix}$$

> Gaussian kernel of size = 5
$$ Gx = \frac{1}{159}\begin{pmatrix}2&4&5&4&2\\4&9&12&9&4\\5&12&15&12&5\\4&9&12&9&4\\2&4&5&4&2\end{pmatrix}$$

## 標準差 standard deviation
$$\sigma = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}$$

### Get Gaussian Kernel

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import cv2

ksize=9;    sigma=[0.75, 1.5, 2.25, 3]   # sigma = -1
X = Y = np.arange(-(ksize//2), ksize//2+1)
X, Y = np.meshgrid(X, Y);#    ax.set_box_aspect((1, 1, 1))

fig= plt.figure(figsize=(9,7))

for idx, s in enumerate(sigma) :
    k1d = cv2.getGaussianKernel(ksize, s)
    k2d = k1d * k1d.T

    ax = fig.add_subplot(2, 2, idx+1, projection='3d')
    ax.set_xlabel('x');  ax.set_ylabel('y');  ax.set_zlabel('z');  ax.set_title(f'$\sigma$={s}')

    p=ax.plot_surface(X, Y, k2d, cmap=plt.get_cmap('rainbow'), linewidth=0, antialiased=False)
    # plt.colorbar(p)
plt.suptitle('$\sigma$   variance')# ; plt.tight_layout()
plt.show()             

### sigma diff.

In [None]:
import cv2
o = cv2.imread('image/lenaNoise.png')
sigma0 = cv2.GaussianBlur(o, (5,5), 0, 0)   #標準差取 0 時 OpenCV 會根據高斯矩陣的尺寸自己計算
sigma22 = cv2.GaussianBlur(o, (5,5), 2, 2) #標準差取 2

cv2.imshow('original', o)
cv2.imshow('sigma0', sigma0)
cv2.imshow('sigma22', sigma22)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### GaussianBlur kernal diff.

In [None]:
import numpy as np
import cv2

image = cv2.imread('./image/mybaby.jpg')
cv2.imshow('Original', image)

# stack output images together
blurred = np.hstack([
    cv2.GaussianBlur(image, (3, 3), 0),   # kernal size 越大, sigma 愈大, 圖像愈模糊 
    cv2.GaussianBlur(image, (5, 5), 0),
    cv2.GaussianBlur(image, (7, 7), 0)])

cv2.imshow('Gaussian 3*3, 5*5, 7*7', cv2.resize(blurred, None, fx=0.75, fy=0.75))
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Median Filter 中位數
> 計算內核窗口下所有像素的中位數，並將中心像素替換為該中位數而`不是平均值`<br>
><img src="./image/filter_median.png"  style='width:90%'></img>

> Average vs. Median<br>
><img src="./image/AvgMedian.png"  style='width:90%'></img>

### blur vs. medianBlur

In [None]:
import cv2
o=cv2.imread('image/lenaNoise.png')

blur = cv2.blur(o, (3,3))
med_blur = cv2.medianBlur(o, 3)

cv2.imshow('original', o)
cv2.imshow('blur', blur)
cv2.imshow('median_blur', med_blur)

cv2.waitKey()
cv2.destroyAllWindows()
cv2.waitKey(1)

### medianBlur : diff kernel

In [None]:
import numpy as np
import cv2
image =cv2.imread('image/lenaNoise.png')
# image = cv2.imread('./image/mybaby.jpg')

cv2.imshow('Original', image)

# stack output images together
blurred = np.hstack([
    cv2.medianBlur(image, 3),
    cv2.medianBlur(image, 5),
    cv2.medianBlur(image, 7)])

cv2.imshow('MedianBlue 3, 5, 7', cv2.resize(blurred, None, fx=0.75, fy=0.75))
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### Bilateral Filter 雙邊濾波器<br>
>雙邊濾波能在保持邊界清晰的情況下有效的去除噪音。但是這種操作與其他濾波器相比會`比較慢`, 我們知道高斯濾波器是求中心點鄰近區域畫素的高斯加權平均值。這種`高斯濾波器只考慮畫素之間的空間關係`，而`不會考慮畫素值之間的關係`（畫素的相似度）。所以這種方法不會考慮一個畫素是否位於邊界。因此邊界也會被模糊掉。

>雙邊濾波在同時使用`空間高斯權重`和`灰度值相似性高斯權重`。空間高斯函式確保只有鄰近區域的畫素對中心點有影響，灰度值相似性高斯函式確保只有`與中心畫素灰度值相近的才會被用來做模糊運算`。所以這種方法會確保邊界不會被模糊掉，因為邊界處的灰度值變化比較大.

>簡單說就是, 在生成周邊畫素的權重矩陣時,如果發現旁邊的畫素值和當前的畫素值差異很大, 就只給差異很大的那個元素分配很小的權重,這樣`大的突變差異就被保留了`.<br>

>><img src="./image/bilater.png"  style='width:90%'></img>

>此種方法的好處是，它不但擁有 Median filter 的除噪效果，又能保留圖片中的不同物件的邊緣 (其它三種方式均會造成邊緣同時被模糊化）, 但缺點是，Bilateral Filter執行的效率較差，運算需要的時間較長。

> cv2.bilateralFilter( src, d, σ_Color, σ_Space[, dst[, borderType]]) 
> * src ：影像矩陣
> * d ：鄰域直徑
> * sigmaColor ：顏色標準差，愈大代表在計算時需要考慮更多的顏色
> * sigmaSpace ：空間標準差, 這個參數與Gaussian filter使用的相同，數值越大，代表越遠的像素有較大的權值。

簡單起見，可以令2個sigma的值相等<br>
> 如果他們很小（小於10），濾波器幾乎沒有什麼效果<br>
> 如果他們很大（大於150），濾波器的效果會很強，使圖像顯得非常卡通化


In [None]:
import cv2
o = cv2.imread('./image/lenaNoise.png')
r1 = cv2.bilateralFilter(o, 5, 100, 100)
r2 = cv2.bilateralFilter(o, 5, 200, 200)

cv2.imshow('original', o)
cv2.imshow('bif : 5_100*100', r1)
cv2.imshow('bif : 5_200*200', r2)

cv2.waitKey()
cv2.destroyAllWindows()
cv2.waitKey(1)

### bilateralFilter 對雜訊處裡效果不好, 對邊界處理較佳
GaussianBlur vs. BilaterFilter

In [None]:
import cv2
o = cv2.imread('./image/bilTest.bmp')

g=r=cv2.GaussianBlur(o, (55, 55), 0, 0)
b=cv2.bilateralFilter(o, 55, 100, 100)

cv2.imshow('original',o)
cv2.imshow('Gaussian',g)
cv2.imshow('bilateral',b)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### bilateralFilter : diff parameters

In [None]:
import numpy as np
import cv2

image = cv2.imread('./image/mybaby.jpg')
cv2.imshow('Original', image)

image=cv2.resize(image,(500, 280))

# stack output images together
blurred = np.hstack([
    cv2.bilateralFilter(image, 5, 20, 20),
    cv2.bilateralFilter(image, 7, 40, 40),
    cv2.bilateralFilter(image, 9, 60, 60)])

cv2.imshow('Bilateral', blurred)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

---
<center><h1>--- The End ---</h1></center>