## 목차
- 이미지 불러와서 출력하기
- 이미지변형(흑백): cvtColor
- 이미지변형(이진화): threshold, createTrackbar, getTrackbarPos
- 이미지변형(흐림): GaussianBlur
- 이미지변형(원근): getPerspectiveTransform, warpPerspective
- 키보드이벤트
- 마우스이벤트
- 반자동 문서 스캐너
- 엣지 검출
- 직선 검출



## 이미지 불러와서 출력하기

In [58]:
import cv2
img=cv2.imread('Desktop/lenna.png')
cv2.imshow('title',img)
cv2.waitKey(0)
cv2.destroyAllWindows #윈도우창 닫음

<function destroyAllWindows>

In [6]:
img.shape

(512, 512, 3)

크기가 512x512고 3개의 색상정보를 갖는 이미지임, 채널이 1이면 단색, 3이면 다색 이미지임

In [113]:
import cv2

img=cv2.imread('Desktop/seoulriver.jpg', cv2.IMREAD_GRAYSCALE)

cv2.namedWindow('origin') #origin이라는 이름의 창을 생성
cv2.imshow('origin', img) #origin이라는 창에 img를 표시
cv2.resizeWindow('origin', 1000, 500) #origin이라는 창의 사이즈를 변경
cv2.moveWindow('origin', 0, 0) #origin이라는 창의 위치를 변경

cv2.waitKey(0) #키보드 입력이 있을 때까지 대기하다가, 아무키를 누르면
cv2.destroyAllWindows() #모든 윈도우창 닫음

## 이미지변형(흑백): cvtColor

In [59]:
import cv2
img=cv2.imread('Desktop/lenna.png')
gray=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #bgr에서 gray로 색변환함

cv2.imshow('color',img)
cv2.imshow('gray',gray)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [61]:
import cv2
img=cv2.imread('Desktop/lenna.png', cv2.IMREAD_GRAYSCALE)

cv2.imshow('lenna',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

- cv2.IMREAD_COLOR: 이미지를 읽을 때 컬러로 읽음, 디폴트, 투명영역은 무시
- cv2.IMREAD_GRAYSCALE: 흑백
- cv2.IMREAD_UNCHANGED: 투명영역 포함

## 이미지변형(이진화): threshold, createTrackbar, getTrackbarPos

step1. threshold 함수 적용

In [73]:
import cv2
src=cv2.imread('Desktop/lenna.png')
gray=cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)
ret,dst100=cv2.threshold(gray, 100, 255, cv2.THRESH_BINARY) #소스이미지, 임계값, 최대값, 타입
ret,dst50=cv2.threshold(gray, 50, 255, cv2.THRESH_BINARY)
cv2.imshow('gray',gray)
cv2.imshow('dst100',dst100)
cv2.imshow('dst50',dst50) #임계값을 낮출수록 사진이 많이 날아감(=많이 어두운 부분도 하얗게 처리됨)
cv2.waitKey()
cv2.destroyAllWindows

<function destroyAllWindows>

threshold()의 return값은 2개임, 임계값(return value)과 결과이미지(destination)

threshold_binary 타입은 픽셀이 임계값보다 크면 최대값(maxval)으로 바꾸고, 이하면 0으로 변경함(=까맣게 처리)

In [63]:
ret

50.0

step2. 임계값 변화에 따른 이미지의 변형을 확인

In [92]:
import cv2
img=cv2.imread('Desktop/lenna.png', cv2.IMREAD_GRAYSCALE)

def empty(pos): #트랙바의 slide값이 바뀔 때 호출되는 콜백함수, 트랙바 위치를 반환함
    #print(pos)
    pass

#새로운 윈도우창을 만들고, 트랙바를 생성함
name='track'
cv2.namedWindow(name)
cv2.createTrackbar('threshold', name, 100, 255, empty)

#트랙바의 값을 받아와서, 임계값에 따라 흑백이미지를 이진화하고, 출력하는 것을 무한반복
while True:
    thresh=cv2.getTrackbarPos('threshold', name)
    ret,dst=cv2.threshold(gray, thresh, 255, cv2.THRESH_BINARY)
    cv2.imshow(name, dst)
    if cv2.waitKey(1)==ord('q'): break #사용자가 q를 누르면 반복문 종료

cv2.destroyAllWindows()

createTrackbar(트랙바 이름, 윈도우창 이름, 초기값, 최대값(최솟값은 항상 0), 콜백함수)

getTrackbarPos(트랙바 이름, 윈도우창 이름)

## 이미지변형(흐림): GaussianBlur

In [83]:
img=cv2.imread('Desktop/lenna.png')
kernel3=cv2.GaussianBlur(img, (3,3), 0)
kernel5=cv2.GaussianBlur(img, (5,5), 0)
kernel7=cv2.GaussianBlur(img, (7,7), 0)

cv2.imshow('img',img)
cv2.imshow('kernel3',kernel3)
cv2.imshow('kernel5',kernel5)
cv2.imshow('kernel7',kernel7) #커널사이즈가 커질 수록 블러효과가 강해짐
cv2.waitKey(0)
cv2.destroyAllWindows()

## 이미지변형(원근)

사다리꼴 이미지(뉴스) 펼치기

In [15]:
import cv2
import numpy as np

img=cv2.imread('Desktop/newspaper.jpg')

width, height= 600, 200

#시계방향으로 4개 지점 (좌상,우상,우하,좌하)
src=np.array([[440,326], [1038,489], [1005,683], [308,422]], dtype=np.float32)
dst=np.array([[0,0],[width,0], [width,height], [0,height]], dtype=np.float32)

matrix=cv2.getPerspectiveTransform(src, dst) #소스영역을 목적지영역으로 변환
result=cv2.warpPerspective(img, matrix, (width,height))

cv2.imshow('orininal',img)
cv2.imshow('img',result)
cv2.waitKey(0)
cv2.destroyAllWindows()

회전된 이미지(카드) 세우기

In [None]:
import cv2
import numpy as np

img=cv2.imread('Desktop/poker.jpg')

width, height= 240,380
src=np.array([[795,103], [1197,307], [893,969], [461,751]], dtype=np.float32)
dst=np.array([[0,0],[width,0], [width,height], [0,height]], dtype=np.float32)

matrix=cv2.getPerspectiveTransform(src, dst) #소스영역을 목적지영역으로 변환
result=cv2.warpPerspective(img, matrix, (width,height))

cv2.imshow('orininal',img)
cv2.imshow('img',result)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 키보드이벤트

In [1]:
import cv2

img=cv2.imread('Desktop/seoulriver.jpg')
x,y=100,100

while True:
    cv2.imshow('img', img)
    cv2.moveWindow('img', x,y)
    key=cv2.waitKey(0) & 0xFF #키보드 입력값을 저장하는 변수
    print(chr(key))

    if key==ord('h'): x-=10   #h키를 누르면 x방향으로 -10만큼 이동
    elif key==ord('j'): y+=10
    elif key==ord('k'): y-=10
    elif key==ord('l'): x+=10
    elif key==ord('q'): break; cv2.destroyAllWindows()
    
    cv2.moveWindow('img', x,y)

h
j
k
l
q


## 마우스이벤트

In [1]:
import cv2

def mouse_handler(event, x,y, flags, param): #이벤트처리를 위한 콜백함수
    if event==cv2.EVENT_LBUTTONDOWN:
        print('왼버튼 down')
        print(x,y) #마우스좌표(파라미터)를 출력함
    elif event==cv2.EVENT_LBUTTONUP:
        print('왼버튼 up')
        print(x,y)
    elif event==cv2.EVENT_LBUTTONDBLCLK: #더블클릭은 down, up, dblclk, up이 한세트
        print('왼버튼 double click')
    elif event==cv2.EVENT_RBUTTONDOWN:
        print('오른버튼 down')
        print(x,y)
    elif event==cv2.EVENT_RBUTTONUP:
        print('오른버튼 up')
        print(x,y) 
    pass

img=cv2.imread('Desktop/poker.jpg')
cv2.namedWindow('img')
cv2.setMouseCallback('img', mouse_handler) #마우스 콜백함수를 설정함
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

왼버튼 down
794 251
왼버튼 up
1051 314
왼버튼 down
954 144
왼버튼 up
954 144
왼버튼 double click
왼버튼 up
954 144


event에는 cv2.EVENT_로 시작하는 12가지 이벤트가 있음

flags는 cv2.EVENT_FLAG_로 시작하고 ctrl, shift, alt키를 누른 것처럼 이벤트 처리함, flags와 param을 사용하지 않더라도 선언해야 함

## 반자동 문서 스캐너

step1. 점 찍기

In [17]:
import cv2
import numpy as np

src_img=cv2.imread('Desktop/poker.jpg') #이미지 불러오기
src_img=cv2.resize(src_img, (486,600)) #이미지 사이즈 바꾸기

points=[] #마우스가 클릭한 점의 좌표를 저장할 리스트
bgr=(100,200,300)

def mouse_handler(event, x,y, flags, param):
    if event==cv2.EVENT_LBUTTONDOWN: points.append((x,y)) #왼버튼 눌리면 좌표추가
    for i in points:
        cv2.circle(src_img, i, 5, bgr, cv2.FILLED) #이미지, 중심점, 반지름, 색깔, 채움
    cv2.imshow('img', src_img)
    if len(points)==4: show_result() #점이 4개 찍히면 결과출력

def show_result():
    width, height= 240,380
    src=np.float32(points)
    dst=np.array([[0,0],[width,0], [width,height], [0,height]], dtype=np.float32)
    matrix=cv2.getPerspectiveTransform(src,dst) #sorce를 destination으로
    result=cv2.warpPerspective(src_img, matrix, (width,height))
    cv2.imshow('result', result)

cv2.namedWindow('img')
cv2.setMouseCallback('img', mouse_handler)
cv2.imshow('img', src_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

step2. 선 긋기

In [40]:
import cv2
import numpy as np

src_img=cv2.imread('Desktop/poker.jpg')
src_img=cv2.resize(src_img, (486,600))

points=[]
COLOR=(255,0,255) #BGR 기준으로 b=255, r=255, 핑크색
THICKNESS=3
drawing=False #선을 그릴지 여부 판단

def mouse_handler(event, x,y, flags, param):
    global drawing
    if event==cv2.EVENT_LBUTTONDOWN:
        drawing=True #선을 그리기 시작
        points.append((x,y))

    if drawing:
        prev_point=None
        for i in points:
            cv2.circle(src_img, i, 5, COLOR, cv2.FILLED)
            if prev_point:
                cv2.line(src_img, prev_point, i, COLOR, THICKNESS, cv2.LINE_AA) #이미지, 시작점, 끝점, 색깔, 두께, 선을 부드럽게
            prev_point=i

        if len(points)==4:
            show_result()
            
    cv2.imshow('img', src_img)
        
def show_result():
    width, height= 240,380
    src=np.float32(points)
    dst=np.array([[0,0],[width,0], [width,height], [0,height]], dtype=np.float32)
    matrix=cv2.getPerspectiveTransform(src, dst)
    result=cv2.warpPerspective(src_img, matrix, (width,height))
    cv2.imshow('result',result)
    
cv2.namedWindow('img')
cv2.setMouseCallback('img',mouse_handler)
cv2.imshow('img', src)
cv2.waitKey(0)
cv2.destroyAllWindows()

step3. 실시간으로 선 긋기

In [48]:
import cv2
import numpy as np

src_img=cv2.imread('Desktop/poker.jpg')
src_img=cv2.resize(src_img, (486,600))

points=[]
COLOR=(255,0,255)
THICKNESS=3
drawing=False

def mouse_handler(event, x,y, flags, param):
    global drawing
    dst_img=src_img.copy()
    
    #왼버튼이 눌리면 drawing을 시작하고 해당 좌표를 points에 저장함
    if event==cv2.EVENT_LBUTTONDOWN:
        drawing=True
        points.append((x,y))

    if drawing:
        prev_point=None
        
        #points에 저장된 모든 좌표에 대해, 점을 찍고 점들끼리 이어주는 부분
        for i in points:
            cv2.circle(dst_img, i, 5, COLOR, cv2.FILLED)
            if prev_point:
                cv2.line(dst_img, prev_point, i, COLOR, THICKNESS, cv2.LINE_AA)
            prev_point=i
        
        #마지막 점에서 다음점(=현재 마우스의 위치)까지 선을 이어주는 부분
        next_point=(x,y)
        if len(points)==4: #점이 4개 다 찍혔다면 다음점은 첫번째 점
            show_result()
            next_point=points[0]
        cv2.line(dst_img, prev_point, next_point, COLOR, THICKNESS, cv2.LINE_AA)
        
    cv2.imshow('img', dst_img)
        
def show_result():
    width, height= 240, 380
    src=np.float32(points)
    dst=np.array([[0,0],[width,0], [width,height], [0,height]], dtype=np.float32)
    matrix=cv2.getPerspectiveTransform(src, dst)
    result=cv2.warpPerspective(src_img, matrix, (width,height))
    cv2.imshow('result',result)
    
cv2.namedWindow('img')
cv2.setMouseCallback('img',mouse_handler)
cv2.imshow('img', src)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 엣지 검출

In [18]:
import cv2
src=cv2.imread('Desktop/poker.jpg')
src=cv2.resize(src, (450,400))
gray=cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)


sobel=cv2.Sobel(gray, cv2.CV_8U, 1,0,3) #입력이미지, dx, dy, 커널크기(최대 31의 홀수)
laplacian=cv2.Laplacian(gray, cv2.CV_8U, ksize=3)
canny=cv2.Canny(src, 100, 255)

cv2.imshow('src',src)
cv2.imshow('soble',sobel)
cv2.imshow('laplician',laplacian)
cv2.imshow('canny',canny)
cv2.waitKey(0)
cv2.destroyAllWindows()

- 소벨: 인접한 픽셀의 gradient를 계산하기 위해 convolution 연산을 수행함

- 라플라시안: 엣지가 밝은 부분과 어더운 부분 중 어디에서 발생했는지 알 수 있음

- 캐니: 하위임계값과 상위임계값을 설정해, 픽셀이 상위임계값보다 큰 기울기를 가지면 가장자리로 간주함, L1과 L2-norm 중 무엇으로 gradient를 계산할지 선택할 수 있음(L1은 속도는 빠르지만 정확도가 떨어짐)

## 직선 검출: HoughLines

In [15]:
import cv2
import numpy as np

src=cv2.imread('Desktop/road.jpg')
dst=src.copy()
gray=cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)

In [16]:
canny=cv2.Canny(src, 5000,1500, apertureSize=5, L2gradient=True)
lines=cv2.HoughLines(canny, 0.8, np.pi/180, 150, srn=100, stn=200, min_theta=0, max_theta=np.pi)

- 임계값을 5000, 1500로 설정해 주요한 가장자리만 남김, 커널크기는 5, L2 norm을 
- 검출할 이미지, 거리(0.0\~1.0), 각도(0~180), 임계값, <U>거리약수, 각도약수</U>(0이면 표준허프변환), <U>최소각도, 최대각도</U>(검출각도의 범위를 설정)


In [14]:
lines

array([[[317.2      ,   1.5707964]],

       [[487.6      ,   1.1693705]],

       [[482.80002  ,   1.1868238]],

       [[ 92.4      ,   1.9722221]],

       [[ 95.6      ,   1.9722221]],

       [[ 80.4      ,   1.9896753]],

       [[318.80002  ,   1.5707964]]], dtype=float32)

직선일 가능성이 높은 거리와 각도가 저장돼있음

In [17]:
for i in lines:
    rho, theta=i[0][0], i[0][1]
    a,b=np.cos(theta), np.sin(theta)
    x0,y0=a*rho,b*rho
    scale=src.shape[0]+src.shape[1]
    
    x1 = int(x0 + scale*-b) #(x0,y0)을 평행이동시켜서 이미지 밖의 (x1,y1), (x2,y2)를 할당함->직선을 그림
    y1 = int(y0 + scale*a)
    x2 = int(x0 - scale*-b)
    y2 = int(y0 - scale*a)
    
    cv2.line(dst, (x1,y1), (x2,y2), (0,0,255), 2) #dst 위에 두 좌표를 연결하는 선을 빨간색으로 그림
    #cv2.circle(dst, (x0,y0), 3, (255,0,0), cv2.FILLED)
    
cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()