# OpenCV

```python
pip install opencv-python
```

In [None]:
import cv2
cv2.__version__

## 1. 이미지 출력

[사용한 이미지: dog_image](https://pixabay.com/photos/maltese-dog-puppy-small-dog-1123016/)

```python
.imread(url) # url에 해당하는 파일 읽어오기
.imshow(title_name, img) # title_name이라는 창에 img를 표시
.waitKey(ms) # ms 동안 사용자 키 입력 대기
.destroyAllWindows() # 모든 창 닫기
```

In [2]:
img = cv2.imread('dog.jpeg')
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 읽기 옵션
1. `cv2.IMREAD_COLOR`: 컬러 이미지로 불러오기, 투명 영역은 무시 (default)
2. `cv2.IMREAD_GRAYSCALE`: 흑백 이미지로 불러오기
3. `cv2.IMREAD_UNCHANGED`: 투명 영역까지 포함해서 이미지를 불러옴

In [4]:
import cv2
img_color = cv2.imread('dog.jpeg', cv2.IMREAD_COLOR)
img_gray = cv2.imread('dog.jpeg', cv2.IMREAD_GRAYSCALE)
img_unchanged = cv2.imread('dog.jpeg', cv2.IMREAD_UNCHANGED)

cv2.imshow('img_color', img_color)
cv2.imshow('img_gray', img_gray)
cv2.imshow('img_unchanged', img_unchanged)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### Shape
이미지의 height, width, channel 정보

In [5]:
import cv2
img = cv2.imread('dog.jpeg')
img.shape # (H, W, C)

(425, 640, 3)

## 2. 동영상 출력

[사용한 동영상: cat_video](https://www.pexels.com/video/person-feeding-a-cat-7515833/)

```python
cap = cv2.VideoCapture('cat.mp4')
cap.isOpened() # 동영상 파일이 올바로 열렸는지
ret, frame = cap.read() # ret: 성공 여부, frame: 받아온 이미지/프레임
cap.release() # 자원 해제
.destroyAllWindows() # 모든 창 닫기

.waitKey(ms) # ms 값에 따라 영상 재생 속도를 조절할 수 있다.
```

In [7]:
import cv2
cap = cv2.VideoCapture('cat.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        print("No more frame to take.")
        break

    cv2.imshow('video', frame)

    if cv2.waitKey(25) == ord('q'):
        print("Terminate")
        break

cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

No more frame to take.


-1

## 3. 카메라 출력

In [2]:
import cv2
cap = cv2.VideoCapture(0) # O번째 카메라 장치 (device_id)

if not cap.isOpened(): # 카메라가 잘 열리지 않는 경우
    exit()

while True:
    ret, frame = cap.read()
    if not ret: break

    cv2.imshow("camera", frame)
    if cv2.waitKey(1) == ord('q'): break

cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

OpenCV: AVFoundation didn't find any attached Video Input Devices!
OpenCV: camera failed to properly initialize!


-1

## 도형 그리기

### 빈 스케치북 만들기

In [4]:
import cv2
import numpy as np

# (H=480, W=640, C=3)
img = np.zeros((480, 640, 3), dtype=np.uint8)
img[:] = (255, 255, 255)

cv2.imshow("img", img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 일부 영역 색칠

In [5]:
import cv2
import numpy as np


img = np.zeros((480, 640, 3), dtype=np.uint8)
img[100:200, 200:300] = (255, 255, 255)

cv2.imshow("img", img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 직선
직선의 종류
1. `cv2.LINE_4` : 상하좌우 네 방향으로 연결된 선
2. `cv2.LINE_8` : 대각선을 포함한 여덟 방향으로 연결된 선 (default)
3. `cv2.LINE_AA` : 부드러운 선 (anti-aliasing)

In [3]:
import cv2
import numpy as np

img = np.zeros((480, 640, 3), dtype=np.uint8)

COLOR = (0, 255, 255) # BGR (Yellow)
THICKNESS = 3


cv2.line(img, (50, 100), (400, 50), COLOR, THICKNESS, cv2.LINE_8)
"""
    where_to_draw, start_point, end_point, color, thickness, line_type
"""

cv2.line(img, (50, 200), (400, 150), COLOR, THICKNESS, cv2.LINE_4)
cv2.line(img, (50, 300), (400, 250), COLOR, THICKNESS, cv2.LINE_AA)

cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 원

In [5]:
import cv2
import numpy as np

img = np.zeros((480, 640, 3), dtype=np.uint8)

COLOR = (255, 255, 0) # BGR (Cyan)
RADIUS = 50
THICKNESS = 10


cv2.circle(img, (200, 100), RADIUS, COLOR, THICKNESS, cv2.LINE_AA) # 속이 빈 원
"""
    where_to_draw, center, radius, color, thickness, line_type
"""
cv2.circle(img, (400, 100), RADIUS, COLOR, cv2.FILLED, cv2.LINE_AA) # 속이 찬 원

cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 사각형

In [23]:
import cv2
import numpy as np

img = np.zeros((480, 640, 3), dtype=np.uint8)

COLOR = (0, 0, 255) # BGR (RED)
THICKNESS = 3

cv2.rectangle(img, (100, 200), (300, 400), COLOR, THICKNESS, cv2.LINE_AA)
"""
    where_to_draw, point_list, is_closed, color, thickness, line_type
"""
cv2.rectangle(img, (350, 200), (550, 400), COLOR, cv2.FILLED, cv2.LINE_AA)

cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 다각형

In [None]:
import cv2
import numpy as np

img = np.zeros((480, 640, 3), dtype=np.uint8)

COLOR = (0, 0, 255) # BGR (RED)
THICKNESS = 3

pts1 = np.array([[100, 100], [200, 100], [100, 200]])
pts2 = np.array([[200, 100], [300, 100], [300, 200]])

# cv2.polylines(img, [pts1], True, COLOR, THICKNESS, cv2.LINE_AA)
"""
    where_to_draw, point_list, is_closed, color, thickness, line_type
"""
# cv2.polylines(img, [pts2], True, COLOR, THICKNESS, cv2.LINE_AA)

cv2.polylines(img, [pts1, pts2], True, COLOR, THICKNESS, cv2.LINE_AA) # 속이 빈 다각형

pts3 = np.array([[[100, 300], [200, 300], [100, 400]],[[200, 300], [300, 300], [300, 400]]])
cv2.fillPoly(img, pts3, COLOR, cv2.LINE_AA) # 속이 빈 다각형
"""
    where_to_draw, point_list, color, line_type
"""

cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

## 텍스트

### OpenCV에서 사용하는 글꼴 종류
1. `cv2.FONT_HERSHEY_SIMPLEX`: 보통 크기의 sans-serif
2. `cv2.FONT_HERSHEY_PLAIN`: 작은 크기의 sans-serif
3. `cv2.FONT_HERSHEY_SCRIPT_SIMPLEX`: 필기체 스타일 글꼴
4. `cv2.FONT_HERSHEY_TRIPLEX`: 보통 크기의 serif
5. `cv2.FONT_ITALIC`: 기울임

In [28]:
import cv2
import numpy as np

img = np.zeros((480, 640, 3), dtype=np.uint8)

SCALE = 1
COLOR = (255, 255, 255)
THICKNESS = 1


cv2.putText(img, "Simplex", (20, 50), cv2.FONT_HERSHEY_SIMPLEX, SCALE, COLOR, THICKNESS)
"""
    where_to_put, input_text, start_point, font_type, scale, color, thickness
"""
cv2.putText(img, "Plain", (20, 150), cv2.FONT_HERSHEY_PLAIN, SCALE, COLOR, THICKNESS)
cv2.putText(img, "Script Simplex", (20, 250), cv2.FONT_HERSHEY_SCRIPT_SIMPLEX, SCALE, COLOR, THICKNESS)
cv2.putText(img, "Triplex", (20, 350), cv2.FONT_HERSHEY_TRIPLEX, SCALE, COLOR, THICKNESS)
cv2.putText(img, "Italic", (20, 450), cv2.FONT_HERSHEY_TRIPLEX | cv2.FONT_ITALIC, SCALE, COLOR, THICKNESS)



cv2.imshow("img", img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 한글 우회 방법
OpenCV에서는 한글을 지원하지 않는다. 대신 PIL 라이브러리로 우회할 수 있다.

In [35]:
!pip install pillow

Collecting pillow
  Downloading Pillow-10.0.1-cp39-cp39-macosx_11_0_arm64.whl (3.3 MB)
[K     |████████████████████████████████| 3.3 MB 10.8 MB/s eta 0:00:01
[?25hInstalling collected packages: pillow
Successfully installed pillow-10.0.1
You should consider upgrading via the '/Users/kisookim/Repositories/opencv-inflearn/opencv/bin/python3 -m pip install --upgrade pip' command.[0m


In [None]:
!curl https://www.wfonts.com/download/data/2016/06/13/malgun-gothic/malgun-gothic.zip --output malgun-gothic.zip

In [None]:
import cv2
import numpy as np
# PIL (python image library)
from PIL import ImageFont, ImageDraw, Image

def myPutText(src, text, pos, font_size, font_color):
    img_pil = Image.fromarray(src)
    draw = ImageDraw.Draw(img_pil)
    font = ImageFont.truetype('/Users/kisookim/Repositories/opencv-inflearn/malgun-gothic/malgun.ttf', font_size)
    draw.text(pos, text, font=font, fill=font_color)
    return np.array(img_pil)

img = np.zeros((480, 640, 3), dtype=np.uint8)

FONT_SIZE = 30
COLOR = (255, 255, 255)

img = myPutText(img, "테스트다", (20, 50), FONT_SIZE, COLOR)

cv2.imshow("img", img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

## 파일 저장

### 이미지 저장

In [3]:
import cv2
img = cv2.imread('dog.jpeg', cv2.IMREAD_GRAYSCALE)
cv2.imwrite('dog_save.png', img)

True

### 동영상 저장

In [6]:
codec = 'DIVX'
print(codec)
print(*codec)
print([codec])
print([*codec])

DIVX
D I V X
['DIVX']
['D', 'I', 'V', 'X']


In [7]:
import cv2
cap = cv2.VideoCapture('cat.mp4')

# Codec 정의
# fourcc = cv2.VideoWriter_fourcc('D', 'I', 'V', 'X')
fourcc = cv2.VideoWriter_fourcc(*'DIVX') # SAME

# width, height, fps
N = 1
width = round(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS) * N # 영상 재생 속도가 N배

out = cv2.VideoWriter('output.avi', fourcc, fps, (width, height))

"""
    output_name, codec, fps, size (width, height)
"""

while cap.isOpened():
    ret, frame = cap.read()

    if not ret: break

    out.write(frame) # 영상 데이터만 저장되며, 소리는 없음
    cv2.imshow('video', frame)
    if cv2.waitKey(1) == ord('q'): break

out.release()
cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 크기 조정

### 이미지

In [8]:
# 고정 크기로 설정
import cv2
img = cv2.imread('dog.jpeg')
dst = cv2.resize(img, (400, 500))

cv2.imshow('img', img)
cv2.imshow('resize', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [9]:
# 비율로 설정
import cv2
img = cv2.imread('dog.jpeg')
dst = cv2.resize(img, None, fx=.5, fy=.5) # x, y 비율을 정의 (.5배로 축소)

cv2.imshow('img', img)
cv2.imshow('resize', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 보간법
1. `cv2.INTER_AREA`: 크기 줄일 때
2. `cv2.INTER_CUBIC`: 크기 늘릴 때 (저속, 고퀄)
3. `cv2.INTER_LINEAR`: 크기 늘릴 때 (default)

In [None]:
# 보간법 적용하여 축소
import cv2
img = cv2.imread('dog.jpeg')
dst = cv2.resize(img, None, fx=.5, fy=.5, interpolation=cv2.INTER_AREA)

cv2.imshow('img', img)
cv2.imshow('resize', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

In [None]:
# 보간법 적용하여 확대
import cv2
img = cv2.imread('dog.jpeg')
dst = cv2.resize(img, None, fx=1.5, fy=1.5, interpolation=cv2.INTER_CUBIC)

cv2.imshow('img', img)
cv2.imshow('resize', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### 동영상

In [4]:
# 고정 크기로 설정
import cv2

cap = cv2.VideoCapture('cat.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if not ret: break

    frame_resized = cv2.resize(frame, (400, 500))

    cv2.imshow('video', frame_resized)
    if cv2.waitKey(1) == ord('q'): break

cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [5]:
# 비율로 설정
import cv2

cap = cv2.VideoCapture('cat.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if not ret: break

    frame_resized = cv2.resize(frame, None, fx=1.5, fy=1.5, interpolation=cv2.INTER_CUBIC)

    cv2.imshow('video', frame_resized)
    if cv2.waitKey(1) == ord('q'): break

cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 이미지 자르기

In [7]:
# 영역을 잘라서 새로운 윈도우에 표시
import cv2
img = cv2.imread('dog.jpeg')
crop = img[100:200, 200:400]

cv2.imshow('img', img)
cv2.imshow('crop', crop)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [8]:
# 영역을 잘라서 기존 윈도우에 표시
import cv2
img = cv2.imread('dog.jpeg')
crop = img[100:200, 200:400]

img[100:200, 400:600] = crop

cv2.imshow('img', img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 좌우 대칭

In [10]:
import cv2
img = cv2.imread('dog.jpeg')
flip_horizontal = cv2.flip(img, 1) # flipCode > 0: horizontal

cv2.imshow('img', img)
cv2.imshow('flip_horizontal', flip_horizontal)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 상하 대칭

In [11]:
import cv2
img = cv2.imread('dog.jpeg')
flip_vertical = cv2.flip(img, 0) # flipCode == 0: vertical

cv2.imshow('img', img)
cv2.imshow('flip_vertical', flip_vertical)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 상하좌우 대칭

In [12]:
import cv2
img = cv2.imread('dog.jpeg')
flip_both = cv2.flip(img, -1) # flipCode < 0: 상하좌우 대칭

cv2.imshow('img', img)
cv2.imshow('flip_both', flip_both)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 회전

In [14]:
# 시계 방향 90 deg 회전
import cv2
img = cv2.imread('dog.jpeg')

rotate_90 = cv2.rotate(img, cv2.ROTATE_90_CLOCKWISE)

cv2.imshow('img', img)
cv2.imshow('rotate_90', rotate_90)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [15]:
# 시계 방향 180 deg 회전
import cv2
img = cv2.imread('dog.jpeg')

rotate_180 = cv2.rotate(img, cv2.ROTATE_180)

cv2.imshow('img', img)
cv2.imshow('rotate_180', rotate_180)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [16]:
# 시계 반대 방향 90 deg 회전
import cv2
img = cv2.imread('dog.jpeg')

rotate_270 = cv2.rotate(img, cv2.ROTATE_90_COUNTERCLOCKWISE)

cv2.imshow('img', img)
cv2.imshow('rotate_270', rotate_270)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 변형

### 흑백

In [None]:
# 이미지를 흑백으로 읽음
import cv2
img = cv2.imread('dog.jpeg', cv2.IMREAD_GRAYSCALE)
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

In [17]:
# 불러온 이미지를 흑백으로 변경
import cv2
img = cv2.imread('dog.jpeg')

dst = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

cv2.imshow('img', img)
cv2.imshow('gray', dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 흐림

Gaussian Blur

In [18]:
# 커널 사이즈 변화에 따른 흐림
import cv2
img = cv2.imread('dog.jpeg')

# (3, 3), (5, 5), (7, 7)
kernel_3 = cv2.GaussianBlur(img, (3, 3), 0) # sigma_x = 0 (automatic)
kernel_5 = cv2.GaussianBlur(img, (5, 5), 0) 
kernel_7 = cv2.GaussianBlur(img, (7, 7), 0) 

cv2.imshow('img', img)
cv2.imshow('kernel3', kernel_3)
cv2.imshow('kernel5', kernel_5)
cv2.imshow('kernel7', kernel_7)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [19]:
# 표준 편차 변화에 따른 흐림
import cv2
img = cv2.imread('dog.jpeg')

sigma_1 = cv2.GaussianBlur(img, (0, 0), 1) # sigma_x = 가우시안 커널의 x 방향의 표준 편차
sigma_2 = cv2.GaussianBlur(img, (0, 0), 2) 
sigma_3 = cv2.GaussianBlur(img, (0, 0), 3) 

cv2.imshow('img', img)
cv2.imshow('sigma1', sigma_1)
cv2.imshow('sigma2', sigma_2)
cv2.imshow('sigma3', sigma_3)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 원근
[신문 이미지](https://pixabay.com/photos/old-newspaper-newspaper-retro-sepia-350376/)

[포커 카드 이미지](https://pixabay.com/photos/poker-cards-casino-gambling-game-682332/)

In [25]:
# 사다리꼴 이미지 펼치기
import cv2
import numpy as np

img = cv2.imread('newspapers.jpeg')

width, height = 640, 240


src = np.array([[511, 352], [1008, 345], [1122, 584], [455, 594]], dtype=np.float32) # input 4개 지점
dst = np.array([[0, 0], [width, 0], [width, height], [0, height]], dtype=np.float32) # output 4개 지점
# 좌상, 우상, 우하, 좌하 (시계 방향으로 네 지점을 정의)

matrix = cv2.getPerspectiveTransform(src, dst) # transform-matrix를 얻어옴
result = cv2.warpPerspective(img, matrix, (width, height)) # matrix 대로 변환을 함


cv2.imshow('img', img)
cv2.imshow('result', result)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [27]:
# 회전된 이미지 올바로 세우기
import cv2
import numpy as np

img = cv2.imread('poker.jpeg')

width, height = 530, 710

src = np.array([[702, 143], [1133, 414], [726, 1007], [276, 700]], dtype=np.float32) # input 4개 지점
dst = np.array([[0, 0], [width, 0], [width, height], [0, height]], dtype=np.float32) # output 4개 지점
# 좌상, 우상, 우하, 좌하 (시계 방향으로 네 지점을 정의)

matrix = cv2.getPerspectiveTransform(src, dst) # transform-matrix를 얻어옴
result = cv2.warpPerspective(img, matrix, (width, height)) # matrix 대로 변환을 함

cv2.imshow('img', img)
cv2.imshow('result', result)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 미니 프로젝트 - 반자동 문서 스캐너

### 마우스 이벤트 등록

In [None]:
import cv2

def mouse_handler(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDOWN:
        print("Attach mouse left button.")
        print(x, y)
    elif event == cv2.EVENT_LBUTTONUP:
        print("Detach mouse left button.")
        print(x, y)
    elif event == cv2.EVENT_LBUTTONDBLCLK:
        print("Double-click mouse left button.")
        print(x, y)
    elif event == cv2.EVENT_MOUSEMOVE:
        print("Move mouse cursor.")
        print(x, y)
    elif event == cv2.EVENT_RBUTTONDOWN:
        print("Attach mouse right button.")
        print(x, y)
        

img = cv2.imread('poker.jpeg')
cv2.namedWindow('img')
cv2.setMouseCallback('img', mouse_handler)
cv2.imshow('img', img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

### 프로젝트

In [13]:
import cv2
import numpy as np

src_img = cv2.imread('poker.jpeg')
point_list = []

COLOR = (255, 0, 255) # BGR (PINK)
THICKNESS = 3
drawing = False # 선을 그릴지 여부

def mouse_handler(event, x, y, flags, param):
    global drawing

    dst_img = src_img.copy()
    
    if event == cv2.EVENT_LBUTTONDOWN:
        drawing = True # start to draw
        point_list.append((x, y))

    if drawing:
        prev_point = None
        for point in point_list:
            cv2.circle(dst_img, point, 15, COLOR, cv2.FILLED) # draw circle
            if prev_point != None:
                cv2.line(dst_img, prev_point, point, COLOR, THICKNESS, cv2.LINE_AA)
            prev_point = point
            
        next_point = (x, y)
        if len(point_list) == 4:
            show_result() # output result
            next_point = point_list[0]

        cv2.line(dst_img, prev_point, next_point, COLOR, THICKNESS, cv2.LINE_AA)

    

    cv2.imshow('img', dst_img)

def show_result():
    width, height = 530, 710
    src = np.float32(point_list)
    dst = np.array([[0, 0], [width, 0], [width, height], [0, height]], dtype=np.float32) # output 4개 지점
    # 좌상, 우상, 우하, 좌하 (시계 방향으로 네 지점을 정의)
    
    matrix = cv2.getPerspectiveTransform(src, dst) # transform-matrix를 얻어옴
    result = cv2.warpPerspective(src_img, matrix, (width, height)) # matrix 대로 변환을 함

    cv2.imshow('result', result)

cv2.namedWindow('img')
cv2.setMouseCallback('img', mouse_handler)
cv2.imshow('img', src_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 변형 - 이진화
특정 값을 기준으로 흰색과 검은색으로 나누는 것

[책 이미지](https://www.pexels.com/photo/photo-of-person-reading-book-on-beach-1730560/)

In [14]:
import cv2

img = cv2.imread('book.jpeg', cv2.IMREAD_GRAYSCALE)

ret, binary = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

cv2.imshow('img', binary)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### Trackbar
값 변화에 따른 변형 확인

In [None]:
import cv2
img = cv2.imread('book.jpeg', cv2.IMREAD_GRAYSCALE)

def empty(pos):
    # print(pos)
    pass

name = 'Trackbar'
cv2.namedWindow(name)

cv2.createTrackbar('threshold', name, 127, 255, empty)
"""
    bar_name, window_name, initial_value, max_value, event_handler
"""

while True:
    thresh = cv2.getTrackbarPos('threshold', name)
    """
        bar_name, window_name
    """
    ret, binary = cv2.threshold(img, thresh, 255, cv2.THRESH_BINARY)

    if not ret: break

    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord('q'): break

cv2.destroyAllWindows()
cv2.waitKey(1)

### 그림판에서 제작한 이미지
영상 이미지 캡처함

In [18]:
import cv2
img = cv2.imread('threshold.png', cv2.IMREAD_GRAYSCALE)

def empty(pos):
    # print(pos)
    pass

name = 'Trackbar'
cv2.namedWindow(name)

cv2.createTrackbar('threshold', name, 127, 255, empty)
"""
    bar_name, window_name, initial_value, max_value, event_handler
"""

while True:
    thresh = cv2.getTrackbarPos('threshold', name)
    """
        bar_name, window_name
    """
    ret, binary = cv2.threshold(img, thresh, 255, cv2.THRESH_BINARY)

    if not ret: break

    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord('q'): break

cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [21]:
import cv2

img = cv2.imread('threshold.png', cv2.IMREAD_GRAYSCALE)

error = 5

ret, binary1 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY)
ret, binary2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, binary3 = cv2.threshold(img, 195+error, 255, cv2.THRESH_BINARY)

cv2.imshow('img', img)
cv2.imshow('binary1', binary1)
cv2.imshow('binary2', binary2)
cv2.imshow('binary3', binary3)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## Adaptive Threshold
이미지를 작은 영역으로 나누어 임계치 적용

In [22]:
import cv2

def empty(pos):
    # print(pos)
    pass

img = cv2.imread('book.jpeg', cv2.IMREAD_GRAYSCALE)

name = 'Trackbar'
cv2.namedWindow(name)

cv2.createTrackbar('block_size', name, 25, 100, empty) # block_size는 홀수만 가능하며 1보다 큰 값
cv2.createTrackbar('c', name, 3, 10, empty) # 일반적으로 양수값을 사용
"""
    bar_name, window_name, initial_value, max_value, event_handler
"""

while True:
    block_size = cv2.getTrackbarPos('block_size', name)
    c = cv2.getTrackbarPos('c', name)

    if block_size <= 1: block_size = 3
    if block_size % 2 == 0: block_size += 1
    """
        bar_name, window_name
    """
    binary = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, block_size, c)

    """
        where_to_apply, max_value, 
    """

    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord('q'): break

cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 오츠 알고리즘
Bimodal Image에 사용하기 적합하며, 최적의 임계치를 자동으로 발견함

In [23]:
import cv2
img = cv2.imread('book.jpeg', cv2.IMREAD_GRAYSCALE)

ret, binary = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, otsu = cv2.threshold(img, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

print(f"Otsu threshold: {ret}")

cv2.imshow('img', img)
cv2.imshow('binary', binary)
cv2.imshow('otsu', otsu)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

Otsu threshold: 122.0


-1

## 이미지 변환 - 팽창
이미지를 확장하여 작은 구멍을 채움. 흰색 영역의 외곽 픽셀 주변에 흰색 추가

사용 이미지는 화면 캡처함

In [25]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread('dilate.png', cv2.IMREAD_GRAYSCALE)

dilate1 = cv2.dilate(img, kernel, iterations=1) # 팽창 1번
dilate2 = cv2.dilate(img, kernel, iterations=2) # 팽창 1번
dilate3 = cv2.dilate(img, kernel, iterations=3) # 팽창 1번

cv2.imshow('gray', img)
cv2.imshow('dilate1', dilate1)
cv2.imshow('dilate2', dilate2)
cv2.imshow('dilate3', dilate3)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 변환 - 침식
이미지를 깎아서 노이즈를 제거. 흰색 영역의 외각 픽셀을 검은색으로 변경

In [27]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread('erode.png', cv2.IMREAD_GRAYSCALE)

erode1 = cv2.erode(img, kernel, iterations=1) # 팽창 1번
erode3 = cv2.erode(img, kernel, iterations=3) # 팽창 1번
erode5 = cv2.erode(img, kernel, iterations=5) # 팽창 1번

cv2.imshow('gray', img)
cv2.imshow('erode1', erode1)
cv2.imshow('erode3', erode3)
cv2.imshow('erode5', erode5)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 변환 - 열림과 닫힘

### 열림 Opening
침식 후 팽창. 깎아서 노이즈를 제거한 뒤 살을 찌움

> dilate(erode(image))

In [30]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread('erode.png', cv2.IMREAD_GRAYSCALE)

erode = cv2.erode(img, kernel, iterations=5)
dilate = cv2.dilate(erode, kernel, iterations=5)

cv2.imshow('img', img)
cv2.imshow('erode', erode)
cv2.imshow('dilate', dilate)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 닫힘 Closing
팽창 후 침식. 구멍을 메운 다음 깎아나감.

> erode(dilate(image))

In [31]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread('dilate.png', cv2.IMREAD_GRAYSCALE)

dilate = cv2.dilate(img, kernel, iterations=5)
erode = cv2.erode(dilate, kernel, iterations=5)


cv2.imshow('img', img)
cv2.imshow('dilate', dilate)
cv2.imshow('erode', erode)


cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 검출 - 경계선

사용 이미지는 캡처함

In [33]:
import cv2
img = cv2.imread('snowman.png')

canny = cv2.Canny(img, 150, 200)
"""
    target_image, min_value (min_threshold), max_value (max_threshold)
"""

cv2.imshow('img', img)
cv2.imshow('canny', canny)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

In [36]:
import cv2
img = cv2.imread('snowman.png')

def empty(pos):
    pass

name = 'Trackbar'
cv2.namedWindow(name)
cv2.createTrackbar('threshold1', name, 0, 255, empty) # minVal
cv2.createTrackbar('threshold2', name, 0, 255, empty) # maxVal

while True:
    threshold1 = cv2.getTrackbarPos('threshold1', name)
    threshold2 = cv2.getTrackbarPos('threshold2', name)

    canny = cv2.Canny(img, threshold1, threshold2)
    """
        target_image, min_value (min_threshold), max_value (max_threshold)
    """

    cv2.imshow('img', img)
    cv2.imshow(name, canny)

    if cv2.waitKey(1) == ord('q'): break
    
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 이미지 검출 - 윤곽선 (Contour)
경계선을 연결한 선

[카드 이미지](https://pixabay.com/vectors/cards-game-aces-four-diamonds-161404/)

In [40]:
import cv2
img = cv2.imread('card.png')

COLOR = (0, 200, 0)
THICKNESS = 2

target_img = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, otsu = cv2.threshold(gray, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

contours, hierarchy = cv2.findContours(otsu, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)

"""
    Detect contours

    contours: info
    heirarchy: hierarchical structure

    input_img, find_mode, approx_method
"""

cv2.drawContours(target_img, contours, -1, COLOR, THICKNESS)

"""
    draw contours
    where_to_draw, contour_info, index, color, thickness
"""

cv2.imshow('img', img)
cv2.imshow('gray', gray)
cv2.imshow('otsu', otsu)
cv2.imshow('contour', target_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 윤곽선 찾기 모드
1. `cv2.RETR_EXTERNAL`: 가장 외곽의 윤곽선만 찾음
2. `cv2.LIST`: 모든 윤곽선 찾음 (계층 정보 없음)
3. `cv2.RETR_TREE`: 모든 윤곽선 찾음 (계층 정보를 트리 구조로 전달)


- `cv2.CHAIN_APPROX_NONE`: 윤곽선의 모든 좌표 반환
- `cv2.CHAIN_APPROX_SIMPLE`: 윤곽선의 꼭지점 좌표 반환. Memory Saving

In [43]:
import cv2
img = cv2.imread('card.png')

COLOR = (0, 200, 0)
THICKNESS = 2

target_img = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, otsu = cv2.threshold(gray, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

# contours, hierarchy = cv2.findContours(otsu, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
# contours, hierarchy = cv2.findContours(otsu, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)
contours, hierarchy = cv2.findContours(otsu, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)

print(f"Total number of contours: {len(contours)}")

cv2.drawContours(target_img, contours, -1, COLOR, THICKNESS)

cv2.imshow('img', img)
cv2.imshow('gray', gray)
cv2.imshow('otsu', otsu)
cv2.imshow('contour', target_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

Total number of contours: 36


-1

### 경계 사각형

윤곽선의 경계면을 둘러싸는 사각형

> boundingRect()

In [45]:
import cv2
img = cv2.imread('card.png')

COLOR = (0, 200, 0)
THICKNESS = 2
target_img = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, otsu = cv2.threshold(gray, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)
contours, hierarchy = cv2.findContours(otsu, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)

for cnt in contours:
    x, y, w, h = cv2.boundingRect(cnt)
    cv2.rectangle(target_img, (x, y), (x+w, y+h), COLOR, THICKNESS)

cv2.imshow('img', img)
cv2.imshow('gray', gray)
cv2.imshow('otsu', otsu)
cv2.imshow('contour', target_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

### 윤곽선 면적 구하기

> contourArea()

In [46]:
import cv2
img = cv2.imread('card.png')

COLOR = (0, 200, 0)
THICKNESS = 2
target_img = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, otsu = cv2.threshold(gray, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)
contours, hierarchy = cv2.findContours(otsu, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)

for cnt in contours:
    if cv2.contourArea(cnt) > 25000:
        x, y, w, h = cv2.boundingRect(cnt)
        cv2.rectangle(target_img, (x, y), (x+w, y+h), COLOR, THICKNESS)

cv2.imshow('img', img)
cv2.imshow('gray', gray)
cv2.imshow('otsu', otsu)
cv2.imshow('contour', target_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 미니 프로젝트 - 개별 카드 추출해서 파일 저장

In [49]:
import cv2
img = cv2.imread('card.png')

COLOR = (0, 200, 0)
THICKNESS = 2
target_img = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, otsu = cv2.threshold(gray, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)
contours, hierarchy = cv2.findContours(otsu, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)

idx = 1
for cnt in contours:
    if cv2.contourArea(cnt) > 25000:
        x, y, w, h = cv2.boundingRect(cnt)
        cv2.rectangle(target_img, (x, y), (x+w, y+h), COLOR, THICKNESS)

        crop = img[y:y+h, x:x+w]
        cv2.imshow(f"card_crop_{idx}", crop)
        cv2.imwrite(f"card_crop_{idx}.png", crop)
        idx += 1

cv2.imshow('img', img)
cv2.imshow('contour', target_img)

cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.waitKey(1)

-1

## 퀴즈
OpenCV를 이용하여, 가로로 촬영된 영상을 세로로 회전하는 프로그램을 작성하기
1. 회전: 시계 반대방향 90도
2. 재생속도: 원본 * 4배
3. 출력 파일명: city_output.avi (codec: DIVX)
4. 원본 파일명: [city.mp4](https://www.pexels.com/video/traffic-on-an-intersection-road-in-a-city-3121459/)

In [51]:
import cv2
cap = cv2.VideoCapture('city.mp4')
fourcc = cv2.VideoWriter_fourcc(*"DIVX")

width = round(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

out = cv2.VideoWriter('city_output.avi', fourcc, fps*4, (height, width))

while cap.isOpened():
    ret, frame = cap.read()

    if not ret: break

    rotate_frame = cv2.rotate(frame, cv2.ROTATE_90_COUNTERCLOCKWISE)
    out.write(rotate_frame)

    cv2.imshow('video', frame)
    if cv2.waitKey(1) == ord('q'): break

out.release()
cap.release()
cv2.destroyAllWindows()
cv2.waitKey(1)

-1