# [Python 影像處理、影像辨識 - OpenCV 教學](https://dinglifenote.com/python-opencv-tutorial/)  
介紹OpenCV基本功能，建議搭配文章做學習

# 安裝OpenCV

用命令安裝請使用  
pip install opencv-python

In [None]:
%pip install opencv-python

# 導入OpenCV

In [None]:
import cv2

導入OpenCV後，有時候會遇到在編輯程式碼時，找不到原始碼定義，也沒有程式碼提示，這時候我們會需要修改OpenCV的程式碼來解決，以Visual Studio Code作為，上面的cv2按下F12，會跳到OpenCV的__init__.py檔案，最前面的幾行程式碼會像下面一樣。

In [None]:
'''
OpenCV Python binary extension loader
'''
import os
import importlib
import sys

__all__ = []

手動加入下面2行。改完檔案之後，重新開啟Visual Studio Code，就可以正常找到OpenCV程式碼的定義了。

In [None]:
'''
OpenCV Python binary extension loader
'''
import os
import importlib
import sys
#加入下面2行
os.environ["PATH"] += os.pathsep + os.path.dirname(os.path.realpath(__file__))
from .cv2 import *
__all__ = []

# 圖片

## 讀取圖片

image = imread(filename[, flags])

* image：回傳的影像物件
* filename：影像絕對路徑，只有檔案名稱的話，會是現在的資料夾
* flags：可選參數，指定用什麼方式讀取圖片，定義的常數可以參考下面表格，定義參考[ImreadModes](https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#ga61d9b0126a3e57d9277ac48327799c80)

| 常數 | 值 | 說明 |
| :----| :---- | :---- |
| IMREAD_UNCHANGED | -1 | 用原本方式讀取影像 (有alpha通道會保留) |
| IMREAD_GRAYSCALE | 0 | 影像轉為灰階 |
| IMREAD_COLOR | 1 | 影像轉為BGR |
| IMREAD_ANYDEPTH | 2 | 影像有16/32位元，則回傳對應深度影像，沒有的話則轉為8位元 |
| IMREAD_ANYCOLOR | 4 | 用任何可能方式讀取影像 |
| IMREAD_LOAD_GDAL | 8 | 用gdal驅動讀取影像 |
| IMREAD_REDUCED_GRAYSCALE_2 | 16 | 影像轉為灰階，再縮小1/2 |
| IMREAD_REDUCED_COLOR_2 | 17 | 影像轉為BGR，再縮小1/2 |
| IMREAD_REDUCED_GRAYSCALE_4 | 32 | 影像轉為灰階，再縮小1/4 |
| IMREAD_REDUCED_COLOR_4 | 33 | 影像轉為BGR，再縮小1/4 |
| IMREAD_REDUCED_GRAYSCALE_8 | 64 | 影像轉為灰階，再縮小1/8 |
| IMREAD_CIMREAD_REDUCED_COLOR_8OLOR | 65 | 影像轉為BGR，再縮小1/8 |
| IMREAD_IGNORE_ORIENTATION | 128 | 不根據EXIF資訊旋轉影像 |

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")

## 顯示圖片

imshow(winname, mat)
* winname：顯示圖片的視窗名稱
* mat：要顯示的圖片

如果單純使用imshow()，容易造成跳出來的影像視窗沒有回應，需要搭配waitKey()去等待鍵盤事件發生，再利用destroyWindow或destroyAllWindows去關閉視窗。

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 定義視窗名稱
window_title = "image"
# 顯示圖片
cv2.imshow(window_title, image)
# 等待按鍵事件
cv2.waitKey(0)
# 關閉視窗
cv2.destroyWindow(window_title)

## 設定顯示圖片視窗

使用imshow()顯示影像，視窗的預設設定是無法讓使用者調整大小的，我們可以使用namedWindow()對視窗做設定。

namedWindow(winname[, flags])
* winname：顯示影像的視窗名稱
* flags：視窗旗標，比較常用的有下面這幾種，定義參考[WindowFlags](https://docs.opencv.org/4.x/d0/d90/group__highgui__window__flags.html#gabf7d2c5625bc59ac130287f925557ac3)

| 常數 | 說明 |
| :----| :---- |
| WINDOW_NORMAL | 可以調整大小 |
| WINDOW_AUTOSIZE | 預設設定，不能調整大小，視窗會根據影像大小自動調整 |
| WINDOW_OPENGL | 視窗用OpenGL支援開啟 |

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 定義視窗名稱
window_title = "resize"
# 設定顯示圖片視窗
cv2.namedWindow(window_title, cv2.WINDOW_GUI_NORMAL)
# 顯示圖片
cv2.imshow(window_title, image)
# 無限等待按鍵事件
cv2.waitKey(0)
# 關閉視窗
cv2.destroyWindow(window_title)

## 等待鍵盤按鍵的事件

retval = waitKey([, delay])
* retval：回傳被按的按鍵的ASCII碼，如果等待時間內沒有按鍵被按下，則回傳-1
* delay：指定等待多少毫秒。如果傳入0會是特別值，會無限等待

In [None]:
import cv2

# 在1秒內，等待按鍵事件
key = cv2.waitKey(1000)

可以搭配ord()函數，來判斷使用者是不是按下了特定按鍵。

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 定義視窗名稱
window_title = "image"
# 顯示圖片
cv2.imshow(window_title, image)
# 無限等待按鍵事件
key = cv2.waitKey(0)

if key == ord("q"):
    # 按鍵是q鍵，關閉視窗
    print("Destroy window")
    cv2.destroyWindow(window_title)
else:
    # 按鍵不是q鍵，不關閉視窗
    print("Do not destroy window")
# 印出按鍵
print(f"key = {key}")

## 關閉顯示視窗

根據影像視窗名稱，關閉指定影像視窗  
  
destroyWindow(winname)
* winname：要關閉的視窗名稱

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 定義視窗名稱
window_title = "image"
# 顯示圖片
cv2.imshow(window_title, image)
# 等待按鍵事件
cv2.waitKey(0)
# 關閉視窗
cv2.destroyWindow(window_title)

關閉所有顯示視窗

destroyAllWindows()

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 顯示圖片
cv2.imshow("win1", image)
# 顯示圖片
cv2.imshow("win2", image)
# 等待按鍵事件
cv2.waitKey(0)
# 關閉所有顯示視窗
cv2.destroyAllWindows()

## 儲存圖片

retval = imwrite(filename, img[, params])
* retval：回傳True/False，表示儲存成功或失敗
* filename：儲存影像的絕對路徑，只有檔案名稱的話，會是現在的資料夾
* img：要儲存的影像物件

In [None]:
import cv2

# 讀取影像檔案
image = cv2.imread("Lenna.jpg")
# 儲存圖片
retval = cv2.imwrite("test.jpg", image)
# 印出執行是否成功
print(retval)

# 影片

## 開啟攝影機或影片

開啟攝影機

retval = cv2.VideoCapture(index)
* retval：回傳VideoCapture物件
* index：指定開啟第x個攝影機，數字從0開始

In [None]:
import cv2

# 開啟索引為0的攝影機
camera = cv2.VideoCapture(0)

開啟影片檔案

retval = cv2.VideoCapture(filename)
* retval：回傳VideoCapture物件
* filename：影片檔案完整路徑

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")

## 判斷影像初始化成功

retval = VideoCapture.isOpened()
* retval：回傳True/False，判斷影片是否成功初始化

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")
# 印出是否成功開啟
print(video.isOpened())

## 讀取影片影像

retval, image = VideoCapture.read()
* retval：回傳True/False，判斷是否成功抓取到影片的圖像
* image：影片幀

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")

# 讀取影片影像
retval, frame = video.read()
if retval:
    # 顯示圖片
    cv2.imshow("video", frame)
    # 等待按鍵事件
    cv2.waitKey(0)
else:
    # 讀取失敗
    print("No video")
# 關閉所有顯示視窗
cv2.destroyAllWindows()

播放影片直到案下q按鍵

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")
# 判斷影片是否成功開啟
while video.isOpened():
    # 讀取影片影像
    retval, frame = video.read()
    if retval:
        # 顯示圖片
        cv2.imshow("video", frame)
    else:
        # 讀取失敗
        break
    # 等待按鍵事件，等待時間會是影片撥放速度
    key = cv2.waitKey(24)
    if ord("q") == key:
        # 按鍵是q就停止讀取影片
        break

# 關閉攝影機或影片
video.release()
# 關閉所有顯示視窗
cv2.destroyAllWindows()

## 讀取影片資訊

retval = VideoCapture.get(propId)
* retval：回傳特定屬性值
* propId：屬性識別碼，下面是比較常用的屬性，詳細列表可以參考[VideoCaptureProperties](https://docs.opencv.org/4.x/d4/d15/group__videoio__flags__base.html#gaeb8dd9c89c10a5c63c139bf7c4f5704d)

| 常數 | 說明 |
| :----| :---- |
| CAP_PROP_POS_MSEC | 影片位置，以毫秒為單位 |
| CAP_PROP_FRAME_WIDTH | 影像寬度 |
| CAP_PROP_FRAME_HEIGHT | 影像高度 |
| CAP_PROP_FPS | 影格率 |
| CAP_PROP_FRAME_COUNT | 影片的的幀數 |

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")
# 印出影片影像寬度
print(video.get(cv2.CAP_PROP_FRAME_WIDTH))

## 關閉攝影機或影片

VideoCapture.release()

建立好的VideoCapture物件，如果不需要再使用的話，強烈建議記得使用release()做關閉。

In [None]:
import cv2

# 開啟影片檔案
video = cv2.VideoCapture("BigBuckBunny.mp4")
# 關閉攝影機或影片
video.release()

## 儲存影片

retval = VideoWriter(filename, fourcc, fps, frameSize[, isColor])
* retval：回傳VideoWriter物件
* filename：影片檔案完整路徑
* fourcc：傳入VideoWriter_fourcc()物件，FourCC的編解碼格式
* fps：影片幀的速度
* frameSize：影像的大小
* isColor：可選參數，是否為彩色

建立VideoWriter_fourcc物件

VideoWriter_fourcc(c1, c2, c3, c4)
* c1, c2, c3, c4：FourCC的4個字元，可以參考[連結](http://abcavi.kibi.ru/fourcc.php)，看一下FourCC有哪些編解碼格式

In [None]:
fourcc = cv2.VideoWriter_fourcc('M', 'J', 'P', 'G')

除了分別傳入字元，也可以用下面的格式一次全部傳入。

In [None]:
fourcc = cv2.VideoWriter_fourcc(*'MJPG')

建立VideoWriter物件

In [None]:
out = cv2.VideoWriter('output.avi', fourcc, 20.0, (int(video.get(cv2.CAP_PROP_FRAME_WIDTH)),  int(video.get(cv2.CAP_PROP_FRAME_HEIGHT))), isColor = False)

### 寫入影像

VideoWriter.write(image)
* image：要儲存的影像

In [None]:
out.write(frame)

### 關閉寫入影片

VideoWriter.release()

建立好的VideoWriter，在用不到時需要呼叫release()

In [None]:
out.release()

可以參考下面範例學習如何儲存影片，範列會先載入影片檔，把每一幀的影像轉成灰階在儲存，最後結束輸出一個output.mp4檔案。

In [None]:
video = cv2.VideoCapture("BigBuckBunny.mp4")

fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter('output.mp4', fourcc, 20.0, (int(video.get(cv2.CAP_PROP_FRAME_WIDTH)),  int(video.get(cv2.CAP_PROP_FRAME_HEIGHT))), isColor = False)

while video.isOpened():
    retval, frame = video.read()
    if retval:
        frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        out.write(frame)
        cv2.imshow("video", frame)
    else:
        break
    key = cv2.waitKey(1)
    if ord("q") == key:
        break

video.release()
out.release()
cv2.destroyAllWindows()