# OpenCV 공부

OpenCV는 __Open Source Computer Visible Library__의 약어로 컴퓨터 비전 라이브러라를 의미한다.
   
실시간 이미지 프로세싱에 중점을 두었으며, Open Source Licence는 BSD 라이선스를 사용하였다.

OpenCV는 계산 효율성과 실시간 처리에 중점을 두고 설계 되었으며
500가지가 넘는 알고리즘이 최적화돼 있으며 이 알고리즘을 구성하거나 지원하는 함수는 알고리즘 수의 10배가 넘는다고 한다.

물체 인식, 얼굴 인식, 제스처 인식을 비롯해 자율주행 자동차, OCR 판독기, 불량 검사기 등에 할 수 있다고 하는데, 우리는 한번 자율주행 자동차 분야에 적용해볼 생각이다. 

원래는 C가 주 개발언어였으나 2.0 부터는 C++이 주가 되었고, Python이 등장한 이후부터는 Python에서 엄청나게 많이 사용되는 추세이다.

나는 효율적인 마크다운 작성과 코드 작성을 위해 주피터 노트북 작성은 코랩으로 하되, 실제 개발환경은 가상환경을 따로 만들어서 동작한다

이 글의 출처는 다음과 같다: https://076923.github.io/posts/Python-opencv-1/

(EDIT) 나는 ubuntu 20.04 윈도우 환경을 번갈아가면서 사용하기에, ubuntu에선 상대경로가 되던게 윈도우에서는 안되는 경우가 있다. 그래서 OS가 다른 환경에서 사용할 때 경로 같은 OS적인 부분들을 잘 다뤄줘야 할 필요가 있어보인다.

## OpenCv 설치

OpenCV는 다음과 같은 패키지를 보유하고 있다.

```
opencv-python
opencv-contrib-python
opencv-python-headless
opencv-contrib-python-headless
```

`contrib`는 일반 opencv-python에서 확장 모듈을 설치하는 것이다.

`headless`는 GUI 종속 라이브러리가 없는 서버 환경(Docker, Cloud)에서 사용할 수 없는 환경에서 라이브러리를 제외하고 사용하는 것이다.

평범한 상황일 때는 `opencv-python`을 쓰도록 하자

설치는 pip를 통해서 하면 된다

```sh
pip3 install opencv-python
```

In [None]:
!pip3 install opencv-python  # 이미 있넹..? ㅎ

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


## 카메라 출력
OpenCV를 이용하면 카메라 출력을 쉽게 할 수 있다.
카메라 출력은 카메라가 `스트리밍 형태`로 동작할 수 있을 때 사용된다.   

여기서 말하는 스트리밍 형태란 저장된 이미지나 동영상 파일이 아니라 __데이터를 실시간으로 받아오고 분석해야 하는 경우__ 카메라를 이용해 데이터를 처리해주는 경우를 말한다.

카메라를 사용해 데이터를 받아오기 때문에 연결된 카메라의 장치 번호를 통해 받아오며, 사용중인 플랫폼에서 카메라에 대한 접근 권한이 허용되어야 한다.   
-> ex) 권한과의 전쟁 Linux

### 메인 코드

In [None]:
import cv2

capture = cv2.VideoCapture(0)
capture.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
capture.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

while cv2.waitKey(33) < 0 :
  ret, frame = capture.read()
  cv2.imshow("VideoFrame", frame)

capture.release()
cv2.destroyAllWindows()

### 코드 설명

```python
# cv2.VideoCatpture(index)

capture = cv2.VideoCapture(0)
```
`비디오 출력 클래스(cv2.VideoCapture)`를 통해 내장 카메라 또는 외장 카메라에서 정보를 받아올 수 있다.

`cv2.VideoCapture(index)`로 카메라의 __장치 번호(ID)__와 연결한다. `index`는 __카메라의 장치번호__를 의미한다.

노트북의 경우, 일반적으로 내장 카메라가 존재하므로 노트북 카메라의 장치 번호는 `0`이 된다.

허나 카메라를 추가적으로 연결하여 __외장 카메라__를 사용하는 경우, 장치 번호가 `1_n`까지 순차적으로 할당된다. (찾는 방법을 안알려주는거 보니 아마 1부터 시작하거나 녹아다로 찾아내시라는 거 같다...)

```python
# capture.set(propid, value)

capture.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
capture.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)
```

`카메라 속성 설정 메서드(capture.set)`로 카메라의 속성을 설정한다.

`capture.set(propid, value)`로 카메라의 `속성(propid)`과 `값(value)`을 설정할 수 있다.

`propid`는 변경하려는 __카메라 설정__을 의미한다.

`value`는 변경하려는 카메라 설정의 속성값을 의미한다.

```python
while cv2.waitKey(33) < 0 :
  ret, frame = capture.read()
  cv2.imshow("VideoFrame", frame)
```

`반복문(While)`을 활용하여 카메라에서 프레임을 지속적으로 받아와준다.

`키 입력 대기 함수(cv2.waitkey)`는 지정된 시간 동안 키 입력이 있을 때까지 프로그램을 지연시킨다.

`cv2.waitkey(delay)`로 키 입력을 기다린다. `delay`는 __지연 시간__을 의미한다.

이 시간의 단위는 밀리초 단위이며, 이 시간 동안 키 입력을 기다리고 입력이 없을 경우 다음 구문을 실행한다.

키 입력 대기 함수는 입력된 키의 __아스키 코드 값__을 반환한다.

즉, 어떤 키라도 입력되기 전까지 33ms마다 반복문을 실행한다.

- `delay`가 __0__일 경우, 지속적으로 키 입력을 검사하여 __프레임이 넘어가지 않는다.__
- `while cv2.waitKey(33) != ord('q') :`으로 사용할 경우, `q`가 입력될 때 `while`문을 종료한다.  

<br/>

`프레임 읽기 메서드(capture.read)`를 이용하여 `카메라의 상태` 및 `프레임`을 받아온다.

`ret`은 카메라의 상태가 저장되며 정상 작동할 경우 `True`를 반환한다. 작동하지 않을 경우 `False`를 반환한다.

`frame`에 현재 시점의 프레임이 저장된다.

<br/>

`이미지 표시 함수(cv2.imshow)`를 이용하여 특정 __윈도우 창__에 __이미지__를 띄운다.

`cv2.imshow(winname, mat)`으로 `윈도우 창의 제목`과 `이미지`를 할당한다.

`winname`은 문자열로 표시하며, 할당한 문자열이 변수와 비슷한 역할을 한다.

`mat`은 이미지를 의미하며, 윈도우 창에 할당한 이미지를 의미한다.

__VideoFrame__ 이름을 갖는 윈도우 창에 프레임이 표시된다.

<br/>

```python
capture.release()
cv2.destoryAllWindows()
```

`메모리 헤제 메서드(capture.release())`로 카메라 장치에서 받아온 __메모리를 헤제한다__

`모든 윈도우 창 제거 함수(cv2.destoryAllWindows)`를 이용하여 모든 윈도우 창을 닫는다.

만약, 특정 윈도우 창만 닫는다면, `cv2.destoryWindow(winname)`으로 __특정 윈도우 창만 닫을 수 있다__

## 이미지 출력
OpenCV는 __래스터 그래픽스 이미지 파일 포맷(Raster Graphics Image File Format)__을 쉽게 불러올 수 있는 별도의 함수를 제공한다.

여기서 래스터 그래픽스 포맷이란 맵 화상 디스플레이 포맷으로 이미지 데이터를 저장하기 위해 사용된다. 각 화소가 하나 개의 작은 부분에 대응하는 직사각형 픽셀 그리드를 사용하여 이미지를 사용하는 도트 매트릭스 구조를 사용한다. 자세한 내용은 <a href="https://www.solvusoft.com/ko/file-extensions/type/raster-image-files/"> 여기</a>를 참조하면 된다.

이 함수는 이미지를 불러올 때 압축 해제된 이미지 데이터 구조에 필요한 메모리 할당 등의 복잡한 작업을 처리하며, __파일 시그니처(File Signature)__를 읽어 적절한 코덱을 결정한다. -> 여기서 적절한 래스터 그래픽스 포맷으로 변환된다.

OpenCV에서 이미지를 불러올 때는 확장자를 확인하는 방식이 아닌 파일 시그니처를 읽어 파일의 포맷을 분석한다.

파일 시그니처는 `파일 매직 넘버(File Magic Number)`라고도 하며, 각 파일 형식마다 몇 개의 바이트가 지정되어 있다. 

예를 들어, __PNG__ 확장저의 경우 __89 50 4E 47 ...__ 형태로 파일 헤더에 포함되어 있다.

이 이미지 입력함수는 OS의 Codec을 사용해 OS 별로 픽셀값이 다를 수 있다.

### 메인 코드 

```python
import cv2

image = cv2.imread("Image/lunar.jpg", cv2.IMREAD_ANYCOLOR)
cv2.imshow("Moon", image)
cv2.waitKey()
cv2.destoryAllWindows()
```

### 세부 코드 & 코드 분석

```python
image = cv2.imread("Image/lunar.jpg", cv2.IMREAD_ANYCOLOR)
```

이미지 입력 함수 `cv2.imread`를 통해 __로컬 경로__의 이미지 파일을 읽어올 수 있다.

`image = cv2.imread(fileName, flags)`는 파일 경로(`fileName`)의 이미지 파일을 `flags` 설정에 따라 불러온다.

파일 경로(`fileName`)는 __상대 경로__ 또는 __절대 경로__를 사용해 이미지를 불러온다.

`flags`는 이미지를 초기에 불러올 때 적용할 `초기 상태`를 의미한다.

- `flags`
  - `cv2.IMREAD_UNCHANGED`: 원본 사용
  - `cv2.IMREAD_GRAYSCALE`: 1채널, 그레이스케일 적용
  - `cv2.IMREAD_COLOR`: 3채널, BGR 이미지 사용
  - `cv2.IMREAD_ANYDEPTH`: 이미지에 따라 정밀도를 16/32비트 또는 8비트로 사용
  - `cv2.IMREAD_ANYCOLOR`: 가능한 3채널, 색상 이미지로 사용
  - `cv2.IMREAD_REDUCED_GRAYSCALE_2`: 1채널, 1/2 크기, 그레이스케일 적용
  - `cv2.IMREAD_REDUCED_GRAYSCALE_4`: 1채널, 1/4 크기, 그레이스케일 적용
  - `cv2.IMREAD_REDUCED_GRAYSCALE_8`: 1채널, 1/8 크기, 그레이스케일 적용
  - `cv2.IMREAD_REDUCED_COLOR_2`: 3채널, 1/2 크기, BGR 이미지 사용
  - `cv2.IMREAD_REDUCED_COLOR_4`: 3채널, 1/4 크기, BGR 이미지 사용
  - `cv2.IMREAD_REDUCED_COLOR_8`: 3채널, 1/8 크기, BGR 이미지 사용

여기서 그레이스케일이란 사진을 흑백 명암 처리해준다는 것이다.

```python 
cv2.imshow("Moon", image)
cv2.waitKey()
cv2.destoryAllWindows()
```

이미지 표시 함수(`cv2.imshow`)와 키 입력 대기 함수(`cv2.waitkey`)로 윈도우 창에 이미지를 띄울 수 있다.

키 입력 대기 함수를 사용하지 않을 경우, __윈도우 창이 유지되지 않고__ 프로그램이 종료된다.

키 입력 이후, 모든 윈도우 창 제거 함수(`cv2.destoryAllWindows`)를 이용하여 모든 윈도우 창을 닫게 해준다.

### 추가 정보

```python3
height, width, channel = image.shape
print(height, width, channel)
```

__결과: 1920 1280 3__

`height, width, channel = image.shape`를 이용하여 해당 이미지의 높이, 너비, 채널 값을 확인할 수 있다!

이미지의 속성은 __크기, 정밀도, 채널__을 주요한 속성으로 사용한다.

- 크기: 이미지의 __높이__와 __너비__를 의미한다.
- 정밀도: 이미지의 처리 결과의 __정밀성__을 의미한다.
- 채널: 이미지의 __색상 정보__를 의미한다.
- Tip들
  - __유효 비트가 많을수록 더 정밀해진다!__
  - 채널이 3인 경우, __다색 이미지__이다. 반면 채널이 1인 경우, __단색 이미지__이다.

In [None]:
import cv2

image = cv2.imread("Image/lunar.jpg", cv2.IMREAD_ANYCOLOR)
cv2.imshow("Moon", image)
cv2.waitKey()
cv2.destoryAllWindows()

## 비디오 출력

동영상 파일에서 순차적으로 __프레임__을 읽어 이미지의 형태로 출력한다.

동영상 파일을 읽으려면 컴퓨터에 __동영상 코덱을 읽을 수 있는 라이브러리__가 설치돼있어야 한다. 근데 요즘 OS는 기본적으로 다 내장되어 있는지라 바로 사용이 가능하다. -> 그런줄 알았는데 아니었다;; ubuntu에 MPEG-4 코덱이 없다;;;

OpenCV는 `FFmpeg`를 지원하므로 __*.avi__나  __*mp4__ 등 다양한 형식의 동영상 파일을 손쉽게 읽을 수 있다.

이미지 파일 중, `GIF`확장자는 프레임이 존재하므로, 동영상 파일을 읽는 방법과 동일하게 처리한다.

### 메인 코드

```python
import cv2

capture = cv2.VideoCapture("Image/Star.mp4")

while cv2.waitKey(33) < 0:
  if capture.get(cv2.CAP_PROP_POS_FRAMES) == capture.get(cv2.CAP_PROP_FRAME_COUNT):
    capture.set(cv2.CAP_PROP_POS_FRAMES, 0)

  ret, frame = capture.read()
  cv2.imshow("VideoFrame", frame)

capture.release()
cv2.destoryAllWindows()
```

### 세부 코드 & 코드 분석

```python
capture = cv2.VideoCapture("Image/Star.mp4")
```

비디오 출력 클래스(`cv2.VideoCapture`)를 통해 __동영상 파일__에서 정보를 받아올 수 있다.

`capture = cv2.VideoCapture(fileName)`는 파일 경로(`fileName`)의 동영상 파일을 불러온다.

앞서 카메라 출력에 사용되었던 클래스와 똑같은 클래스를 사용하되, 그당시에는 카메라 장치 번호를 사용했지만 지금은 __동영상 경로를 지정한다.__

```python
if(capture.get(cv2.CAP_PROP_POS_FRAMES) == capture.get(cv2.CAP_PROP_FRAME_COUNT)):
  capture.set(cv2.CAP_PROP_POS_FRAMES, 0)
```

비디오 속성 반환 메서드(`capture.get`)로 비디오의 속성을 반환한다.

비디오의 정보 중, 동영상의 현재 프레임 수(`cv2.CAP_PROP_POS_FRAMES`)와 동영상의 총 프레임 수(`cv2.CAP_PROP_FRAME_COUNT`)를 받아온다.

분기문(if)를 사용하여 동영상의 현재 프레임 수와 동영상의 총 프레임수를 비교한다.

현재 프레임의 수가 총 프레임 수가 같다면, 현재 재생되고 있는 프레임이 마지막이 된다는 거와 같은데, 이는 동영상이 종료되는 시점이 되므로 비디오 속성 설정 메서드(`capture.get`)로 __동영상의 현재 프레임을 초기화한다__

- Tip: 또는, 동영상 파일 읽기 메서드(`capture.open`)를 이용하여 다시 동영상 파일을 불러올 수도 있다.

### 추가 정보
__VideoCapture 메서드__
- `capture.isOpened()`: 동영상 파일 열기 성공 여부 확인
- `capture.open(filename)`: 동영상 파일 열기
- `capture.set(propid, value)`: 동영상 속성 설정
- `capture.get(propid)`: 동영상 속성 반환
- `capture.release()`: 동영상 파일을 닫고 메모리 해제

__VideoCapture 속성__
- `cv2.CAP_PROP_FRAME_WIDTH`: 프레임의 너비
- `cv2.CAP_PROP_FRAME_HEIGHT`: 프레임의 높이
- `cv2.CAP_PROP_FRAME_COUNT`: 총 프레임의 수
- `cv2.CAP_PROP_FPS`: 프레임 속도
- `cv2.CAP_PROP_FOURCC`: 코덱 코드
- `cv2.CAP_PROP_BRIGHTNESS`: 이미지 밝기, __카메라만 해당__
- `cv2.CAP_PROP_CONTRAST`: 이미지 대비, __카메라만 해당__
- `cv2.CAP_PROP_SATURATION`: 이미지 채도, __카메라만 해당__
- `cv2.CAP_PROP_HUE`: 이미지 색상, __카메라만 해당__
- `cv2.CAP_PROP_GAIN`: 이미지 게인, __카메라만 해당__
- `cv2.CAP_PROP_EXPOSURE`: 이미지 노출, __카메라만 해당__
- `cv2.CAP_PROP_POS_MSEC`: 프레임 재생 시간, __ms 반환__
- `cv2.CAP_PROP_POS_FRAMES`: 현재 프레임, __프레임의 총 개수 미만__
- `CAP_PROP_POS_AVI_RATIO`: 비디오 파일 상대 위치, __0 = 시작, 1 = 끝__


In [None]:
import cv2

capture = cv2.VideoCapture("Image/Star.mp4")

while cv2.waitKey(33) < 0:
  if capture.get(cv2.CAP_PROP_POS_FRAMES) == capture.get(cv2.CAP_PROP_FRAME_COUNT):
    capture.set(cv2.CAP_PROP_POS_FRAMES, 0)

  ret, frame = capture.read()
  cv2.imshow("VideoFrame", frame)

capture.release()
cv2.destoryAllWindows()

## 대칭 (Flip, Symmetry)

대칭(`Flip`)은 기하학적인 측면에서 __반사(relection)__의 의미를 갖는다.

2차원 유클리드 공간에서의 기하학적인 변환의 하나로 $R^2$(2차원 유클리드 공간) 위의 선형 변환을 진행한다.

여기서 __선형 변환__의 정의는 다음과 같다
> 선형변환은 선형 결합을 보존하는, 두 벡터 공간 사이의 함수이다.

간단하게 설명을 하자면, 독립 변수를 함수에 집어 넣으면 종속변수의 값을 내놓는것 처럼, 하나의 벡터를 집어넣으면 다른 하나의 벡터로 출력해주는 형태를 말한다. 다만 선형대수학에서는 입력-출력 관계를 기하학적으로 시각화하는 특정한 방법을 암시해주기에 __변환__이라는 용어를 사용한다.

대칭은 변환할 행렬(이미지)에 대해 __2X2 행렬에서 왼쪽 곱셈을 진행한다.__ 즉, 'p' 형태의 물체에 Y축 대칭을 적용한다면 'q' 형태를 갖게 된다.

그러므로, 원본 행렬(이미지)에 각 축에 대한 대칭을 적용했을 때, 단순히 원본 행렬에서 __축에 따라 재매핑__을 적용하면 대칭된 행렬을 얻을 수 있다.

이미지란 결국엔 비트의 행렬이기 때문에, 행렬 자체를 대칭시켜 이미지 또한 대칭이 가능하고, `numpy`가 기본적으로 내장되어 있기에 앞으로 행렬에 관해 이것저것 많이 다룰 것으로 보인다.

### 메인 코드

```python
import cv2

src = cv2.imread("glass.jpg", cv2.IMREAD_COLOR)
dst = cv2.flip(src, 0)

cv2.imshow("src", src)
cv2.imshow("dst", dst)
cv2.waitKey()
cv2.destroyAllWindows()
```

### 세부 코드 & 코드 분석

```python
src = cv2.imread("glass.jpg", cv2.IMREAD_COLOR)
```
이미지 입력 함수(`cv2.imread`)을 통해 원본 이미지로 사용할 `src`를 선언하고 __로컬 경로__에서 이미지 파일을 읽어온다.

```python
dst = cv2.flip(src, 0)
```
대칭 함수(`cv2.flip`)로 이미지를 대칭할 수 있다.

`dst = cv2.flip(src, flipCode)`는 원본 이미지(`src`)에 대칭 축(`flipCode`)을 기준으로 대칭한 출력 이미지(`dst`)를 반환한다.

__대칭 축__은 __상수__를 입력해 대칭할 축을 정할 수 있다.

- `flipCode < 0`은 __XV축 대칭(상하좌우 대칭)__을 적용한다.
- `flipCode = 0`은 __X축 대칭(상하 대칭)__을 적용한다.
- `flipCode > 0`은 __Y축 대칭(좌우 대칭)__을 적용한다.

```python
cv2.imshow("src", src)
cv2.imshow("dst", dst)
cv2.waitKey()
cv2.destroyAllWindows()
```
이미지 표시 함수는 여러 개의 윈도우 창을 띄울 수 있으며, 동일한 이미지도 여러 개의 윈도우 창으로 띄울 수 있다.

단, __윈도우 창의 제목은 중복되지 않게 작성한다.__

### 추가로 궁금했던 점

__Q. 무조건 상하좌우 대칭밖에 안되나?__   
A. ㅇㅇ 아쉽게도 안된다. `flipCode`에 90과 45를 번갈아가며 넣어봤는데 역시 좌우대칭밖에 되질 않았다.


In [None]:
import cv2

src = cv2.imread("glass.jpg", cv2.IMREAD_COLOR)
dst = cv2.flip(src, 0)

cv2.imshow("src", src)
cv2.imshow("dst", dst)
cv2.waitKey()
cv2.destroyAllWindows()