# 10. 이미지 변형

## 흑백

이미지를 흑백으로 읽음

In [1]:
import cv2

img = cv2.imread("../images/img.jpg", cv2.IMREAD_GRAYSCALE)

cv2.imshow("img", img)

cv2.waitKey(0)
cv2.destroyAllWindows()

불러온 이미지를 흑백으로 변경

In [2]:
import cv2

img = cv2.imread("../images/img.jpg")
dst = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

cv2.imshow("img", img)
cv2.imshow("gray", dst)

cv2.waitKey(0)
cv2.destroyAllWindows()

## 흐림

### 가우시안 블러

커널 사이즈 변화에 따른 흐림

In [1]:
import cv2

img = cv2.imread("../images/img.jpg")

# (3, 3), (5, 5), (7, 7)
kernel_3 = cv2.GaussianBlur(img, (3, 3), 0)
kernel_5 = cv2.GaussianBlur(img, (5, 5), 0)
kernel_7 = cv2.GaussianBlur(img, (7, 7), 0)


cv2.imshow("img", img)
cv2.imshow("kernel_3", kernel_3)
cv2.imshow("kernel_5", kernel_5)
cv2.imshow("kernel_7", kernel_7)

cv2.waitKey(0)
cv2.destroyAllWindows()

표준편차 변화에 따른 흐림

In [3]:
import cv2

img = cv2.imread("../images/img.jpg")

sigma_1 = cv2.GaussianBlur(img, (0, 0), 1)  # sigmaX: 가우시안 커널의 x 방향의 표준편차
sigma_2 = cv2.GaussianBlur(img, (0, 0), 2)
sigma_3 = cv2.GaussianBlur(img, (0, 0), 3)

cv2.imshow("img", img)
cv2.imshow("sigma_1", sigma_1)
cv2.imshow("sigma_2", sigma_2)
cv2.imshow("sigma_3", sigma_3)

cv2.waitKey(0)
cv2.destroyAllWindows()

## 원근

사다리꼴 이미지 펼치기

In [9]:
import cv2
import numpy as np

img = cv2.imread("../images/newspaper.jpg")

width, height = 640, 350  # 가로 크기 640, 세로 크기 350 으로 결과물 출력
# 좌상, 우상, 우하, 좌하 (시계 방향으로 4 지점 정의)
src = np.array(
    [
        [511, 352],
        [1008, 345],
        [1122, 594],
        [455, 604],
    ],
    dtype=np.float32,
)  # input 4개 지점
dst = np.array(
    [
        [0, 0],
        [width, 0],
        [width, height],
        [0, height],
    ],
    dtype=np.float32,
)  # output 4개 지점

matrix = cv2.getPerspectiveTransform(src, dst)  # Matrix 얻어옴
result = cv2.warpPerspective(img, matrix, (width, height))  # matrix 대로 변환을 함

cv2.imshow("img", img)
cv2.imshow("result", result)

cv2.waitKey(0)
cv2.destroyAllWindows()

회전된 이미지 올바로 세우기

In [17]:
import cv2
import numpy as np

img = cv2.imread("../images/poker.jpg")

width, height = 530, 710
# 좌상, 우상, 우하, 좌하 (시계 방향으로 4 지점 정의)
src = np.array(
    [
        [705, 137],
        [1133, 414],
        [726, 1007],
        [276, 700],
    ],
    dtype=np.float32,
)  # input 4개 지점
dst = np.array(
    [
        [0, 0],
        [width, 0],
        [width, height],
        [0, height],
    ],
    dtype=np.float32,
)  # output 4개 지점

matrix = cv2.getPerspectiveTransform(src, dst)  # Matrix 얻어옴
result = cv2.warpPerspective(img, matrix, (width, height))  # matrix 대로 변환을 함

cv2.imshow("img", img)
cv2.imshow("result", result)

cv2.waitKey(0)
cv2.destroyAllWindows()

## 이진화

### Threshold

In [4]:
import cv2

img = cv2.imread("../images/book.jpg", cv2.IMREAD_GRAYSCALE)

ret, binary = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

cv2.imshow("img", img)
cv2.imshow("binary", binary)

cv2.waitKey(0)
cv2.destroyAllWindows()

### Trackbar (값 변화에 따른 변형 확인)

In [9]:
import cv2


def empty(pos):
    # print(pos)
    pass


img = cv2.imread("../images/book.jpg", cv2.IMREAD_GRAYSCALE)

name = "Trackbar"
cv2.namedWindow(name)

cv2.createTrackbar("threshold", name, 127, 255, empty)  # bar 이름, 창 이름, 초기값, 최대값, 이벤트 처리

while True:
    thresh = cv2.getTrackbarPos("threshold", name)  # bar 이름, 창 이름
    # ret: threshold 값, binary: 이진화된 이미지
    ret, binary = cv2.threshold(img, thresh, 255, cv2.THRESH_BINARY)

    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord("q"):
        break

cv2.destroyAllWindows()

In [6]:
import cv2


def empty(pos):
    # print(pos)
    pass


img = cv2.imread("../images/threshold.png", cv2.IMREAD_GRAYSCALE)

name = "Trackbar"
cv2.namedWindow(name)

cv2.createTrackbar("threshold", name, 127, 255, empty)

while True:
    thresh = cv2.getTrackbarPos("threshold", name)
    ret, binary = cv2.threshold(img, thresh, 255, cv2.THRESH_BINARY)

    cv2.imshow("img", img)
    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord("q"):
        break

cv2.destroyAllWindows()

In [8]:
import cv2

img = cv2.imread("../images/threshold.png", cv2.IMREAD_GRAYSCALE)

ret, binary1 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY)  # 진한 회색, 밝은 회색, 흰색
ret, binary2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)  # 밝은 회색, 흰색
ret, binary3 = cv2.threshold(img, 195, 255, cv2.THRESH_BINARY)  # 흰색

cv2.imshow("binary1", binary1)
cv2.imshow("binary2", binary2)
cv2.imshow("binary3", binary3)

cv2.waitKey(0)
cv2.destroyAllWindows()

### Adaptive Threshold

이미지를 작은 영역으로 나누어서 임계치 적용

In [1]:
import cv2


def empty(pos):
    # print(pos)
    pass


img = cv2.imread("../images/book.jpg", cv2.IMREAD_GRAYSCALE)

name = "Trackbar"
cv2.namedWindow(name)

cv2.createTrackbar("block_size", name, 25, 100, empty)  # 홀수만 가능, 1보다 큰 값
cv2.createTrackbar("c", name, 3, 10, empty)  # 일반적으로 양수 값을 사용

while True:
    block_size = cv2.getTrackbarPos("block_size", name)
    c = cv2.getTrackbarPos("c", name)

    if block_size <= 1:  # 1 이하면 3으로
        block_size = 3

    if block_size % 2 == 0:  # 짝수이면 홀수로
        block_size += 1

    binary = cv2.adaptiveThreshold(
        img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, block_size, c
    )

    cv2.imshow(name, binary)
    if cv2.waitKey(1) == ord("q"):
        break

cv2.destroyAllWindows()

### 오츠 알고리즘

Bimodal Image 에 사용하기 적합 (최적의 임계치를 자동으로 발견)

In [5]:
import cv2

img = cv2.imread("../images/book.jpg", cv2.IMREAD_GRAYSCALE)

ret, binary = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, otsu = cv2.threshold(img, -1, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)
print("otsu threshold", ret)

cv2.imshow("img", img)
cv2.imshow("otsu", otsu)

cv2.waitKey(0)
cv2.destroyAllWindows()

otsu threshold 138.0


## 팽창

이미지를 확장하여 작은 구멍을 채움  
(흰색 영역의 외곽 픽셀 주변에 흰색을 추가)

In [15]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread("../images/dilate.png", cv2.IMREAD_GRAYSCALE)

img[52, 52] = 255

dilate1 = cv2.dilate(img, kernel, iterations=1)  # 반복 횟수
dilate2 = cv2.dilate(img, kernel, iterations=2)
dilate3 = cv2.dilate(img, kernel, iterations=3)

cv2.imshow("gray", img)
cv2.imshow("dilate1", dilate1)
cv2.imshow("dilate2", dilate2)
cv2.imshow("dilate3", dilate3)

cv2.waitKey(0)
cv2.destroyAllWindows()

## 침식

이미지를 깎아서 노이즈 제거  
(흰색 영역의 외곽 픽셀을 검은색으로 변경)

In [29]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread("../images/erode.png", cv2.IMREAD_GRAYSCALE)

img[120, 125] = 0

erode1 = cv2.erode(img, kernel, iterations=1)  # 반복 횟수
erode2 = cv2.erode(img, kernel, iterations=2)
erode3 = cv2.erode(img, kernel, iterations=3)

cv2.imshow("gray", img)
cv2.imshow("erode1", erode1)
cv2.imshow("erode2", erode2)
cv2.imshow("erode3", erode3)

cv2.waitKey(0)
cv2.destroyAllWindows()

## 열림 & 닫힘

### 열림(Opening): 침식 후 팽창. 깎아서 노이즈 제거 후 살 찌움

> dilate(erode(image))

In [35]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread("../images/erode.png", cv2.IMREAD_GRAYSCALE)

erode = cv2.erode(img, kernel, iterations=3)
dilate = cv2.dilate(erode, kernel, iterations=3)

cv2.imshow("img", img)
cv2.imshow("erode", erode)
cv2.imshow("dilate", dilate)

cv2.waitKey(0)
cv2.destroyAllWindows()

### 닫힘(Closing): 팽창 후 침식. 구멍을 메운 후 다시 깎음

> erode(dilate(image))

In [41]:
import cv2
import numpy as np

kernel = np.ones((3, 3), dtype=np.uint8)

img = cv2.imread("../images/dilate.png", cv2.IMREAD_GRAYSCALE)

dilate = cv2.dilate(img, kernel, iterations=3)
erode = cv2.erode(dilate, kernel, iterations=3)

cv2.imshow("img", img)
cv2.imshow("dilate", dilate)
cv2.imshow("erode", erode)

cv2.waitKey(0)
cv2.destroyAllWindows()