# OpenCV-Python 기초사용법

## 영상속성

In [2]:
import sys
import cv2
import numpy as np

In [4]:
# cv2.imread(filename[, flags]) -> retval

# retval
    # numpy.nbarray: retval.ndim/shape/size/dtype
    # dtype: uint8
    # shape: gray영상의 경우 (h,w) 또는 color (h,w, 3) 
    # gray영상 : cv2.CV_8UC1 -> numpy.uint8
    # color영상 : cv2.CV_8UC3 -> numpy.uint8

In [5]:
# 영상 불러오기
img1 = cv2.imread('cat.bmp', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('cat.bmp', cv2.IMREAD_COLOR)

if img1 is None or img2 is None:
    print('Image load failed!')
    sys.exit()


# 영상의 속성 참조
print('type(img1):', type(img1))
print('img1.shape:', img1.shape)
print('img2.shape:', img2.shape)
print('img1.dtype:', img1.dtype)
print('img1.dtype:', img2.dtype)

print('img1.shape length:', len(img1.shape))
print('img2.shape length:', len(img2.shape))


type(img1): <class 'numpy.ndarray'>
img1.shape: (480, 640)
img2.shape: (480, 640, 3)
img1.dtype: uint8
img1.dtype: uint8
img1.shape length: 2
img2.shape length: 3


## 영상의 크기 참조

In [6]:

h, w = img1.shape
print('img1 size: {} x {}'.format(w, h))

h, w = img2.shape[:2]
print('img2 size: {} x {}'.format(w, h))

img1 size: 640 x 480
img2 size: 640 x 480


## 영상의 픽셀값 참조

In [7]:

x = 20
y = 30

p1 =img1[y,x]
print(p1)

p2 = img2[y, x]
print(p2)

'''
img1[10:20, 10:20] = 0
img2[10:20, 10:20] = (0, 0, 255)
'''
# cv2.imshow('image', img1)
# cv2.imshow('image2',img2)

cv2.waitKey()
cv2.destroyAllWindows()

252
[255 254 246]


## 영상생성

In [8]:
'''
numpy.empty(shape, dtype)
numpy.zeros(shape, dtype)
numpy.ones(shape, dtype)
numpy.full(shape, fill_value, dtype)
'''

'\nnumpy.empty(shape, dtype)\nnumpy.zeros(shape, dtype)\nnumpy.ones(shape, dtype)\nnumpy.full(shape, fill_value, dtype)\n'

In [1]:
import numpy as np
import cv2

# 새 영상 생성하기
img1 = np.empty((240, 320), dtype=np.uint8)       # grayscale image
img2 = np.zeros((240, 320, 3), dtype=np.uint8)    # color image
img3 = np.ones((240, 320), dtype=np.uint8) * 255  # dark gray
img4 = np.full((240, 320, 3), (0, 255, 255), dtype=np.uint8)  # yellow

cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.imshow('img3', img3)
cv2.imshow('img4', img4)
cv2.waitKey()
cv2.destroyAllWindows()


## 새영상 생성

In [6]:
# 영상 복사
# img1 = cv2.imread('cat.bmp', cv2.IMREAD_COLOR)
img1 = cv2.imread('HappyFish.jpg')

if img1 is None:
    print("image load failed")
    sys.exit()

img2 = img1
img3 = img1.copy()

img1[:,:] = (0, 255, 255)


print(img1.shape)
print(img1.dtype)

cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.imshow('img3', img3)

cv2.waitKey()
cv2.destroyAllWindows()


(194, 259, 3)
uint8


## 부분 영상 추출

In [9]:
img1 = cv2.imread('HappyFish.jpg')

img2 = img1[40:120, 30:150]  # numpy.ndarray의 슬라이싱
img3 = img1[40:120, 30:150].copy()

# img2.fill(0)

cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.imshow('img3', img3)


cv2.waitKey()
cv2.destroyAllWindows()

## 마스크 연산과 ROI

In [12]:
# 마스크 영상을 이용한 영상 합성
src = cv2.imread('airplane.bmp', cv2.IMREAD_COLOR)
mask = cv2.imread('mask_plane.bmp', cv2.IMREAD_GRAYSCALE)
dst = cv2.imread('field.bmp', cv2.IMREAD_COLOR)

if src is None or mask is None or dst is None:
    print('Image load failed!')
    sys.exit()
    

# 영상의 포맷과 형식이 같아야 함
# cv2.copyTo(src, mask, dst)
# dst = cv2.copyTo(src, mask)

# Using numpy
# dst[mask > 0] = src[mask > 0]

cv2.imshow('src', src)
cv2.imshow('dst', dst)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

## 알파 채널을 마스크 영상으로 이용

In [5]:
src = cv2.imread('cat.bmp', cv2.IMREAD_COLOR)
logo = cv2.imread('opencv-logo-white.png', cv2.IMREAD_UNCHANGED)

print(logo.shape)

if src is None or logo is None:
    print('Image load failed!')
    sys.exit()

mask = logo[:, :, 3]    # mask는 알파 채널로 만든 마스크 영상
logo = logo[:, :, :-1]  # logo는 b, g, r 3채널로 구성된 컬러 영상
h, w = mask.shape[:2]
crop = src[10:10+h, 10:10+w]  # logo, mask와 같은 크기의 부분 영상 추출

cv2.copyTo(logo, mask, crop)
#crop[mask > 0] = logo[mask > 0]

cv2.imshow('src', src)
cv2.imshow('logo', logo)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

(222, 180, 4)


## OpenCV 그리기 함수

In [None]:
# cv2.line(img, pt1, pt2, color, thickness = None, lineType = None) -> img
# flags
    # img:그림을 그릴 영상
    # pt1, pt2: 직선의 시작점, 끝점
    # color: 직선의 칼라 (B,G,R)의 튜플
    # thinkness: 선두께
    # lineType: cv2.LINE_4, cv2.LINE_8, cv2.LINE_AA
    
# cv2.rectangle(img, pt1, pt2, color, thickness = None, lineType = None) -> img
# cv2.rectangle(img, rect, color, thickness = None, lineType = None) -> img
    # rect: 사각형의 위치 정보 (x, y, w, h)
    
    
# cv2.circle(img, center, radius, color, thickness = None, lineType = None) -> img
    # center: 원의 중심좌표 (x, y)
    # radius : 원의 반지름
    
# cv2.polylines(img, pts, isClosed, color, thickness = None, lineType = None) -> img
    # center: 다각형 점들의 array
    # isClosed : True for 폐곡선

In [12]:
import numpy as np
import cv2

img = np.full((400, 400, 3), 255, np.uint8)

# x, y 좌표순서
cv2.line(img, (50, 50), (200, 50), (0, 0, 255), 5)
cv2.line(img, (50, 60), (150, 160), (0, 0, 128))

cv2.rectangle(img, (50, 200, 150, 100), (0, 255, 0), 2)
cv2.rectangle(img, (70, 220), (180, 280), (0, 128, 0), -1)

cv2.circle(img, (300, 100), 30, (255, 255, 0), -1, cv2.LINE_AA)
cv2.circle(img, (300, 100), 60, (255, 0, 0), 3, cv2.LINE_AA)


pts = np.array([[250, 200], [300, 200], [350, 300], [250, 300]])
cv2.polylines(img, [pts], True, (255, 0, 255), 2)

text = 'Hello? OpenCV ' + cv2.__version__
cv2.putText(img, text, (50, 350), cv2.FONT_HERSHEY_SIMPLEX, 0.8, 
            (0, 0, 255), 1, cv2.LINE_AA)

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

## 카메라와 동영상 처리하기 

In [None]:
# cv2.VideoCapture(index/filename, apiPreference=None) -> retval
# index: camera_id or filename
# apiPreference=None


# cv2.VideoCapture.open(index/filename, apiPreference=None) -> retval
# retval: True or False

# cv2.VideoCapture.read(image=None) -> retval, image
# retval : True or False

# cv2.VideoCapture.get() -> retval

# cv2.Canny(image, threshold1, threshold2)
# image:입력영상
# threshold1 = low value, threshold2 =  high value

In [20]:
# 카메라 열기
cap = cv2.VideoCapture(0)

if not cap.isOpened(): #True or Falose
    print("Camera open failed!")
    sys.exit()


# 카메라 프레임 크기 출력
print('Frame width:', int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)))
print('Frame height:', int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT)))


# cap.set(cv2.CAP_PROP_FRAME_WIDTH, 320)
# cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 240)

# 카메라 프레임 처리
while True:
    ret, frame = cap.read()

    if not ret:
        break

    edge = cv2.Canny(frame, 50, 150)       
#     inversed = ~frame  # 반전
    
    cv2.imshow('frame', frame)
    cv2.imshow('frame1', edge)
#     cv2.imshow('inversed', inversed)

    if cv2.waitKey(10) == 27:
        break

cap.release()
cv2.destroyAllWindows()

Frame width: 640
Frame height: 480


## 카메라 동영상 저장하기

In [1]:
# cv2.VideoWriter(filename, fourcc, fps, framesize, isColor=None) -> retval
# filename: 저장할 이름
# fourcc: cv2.VideoWriter_fourcc(*'DIVX') 를 사용
# fps: 초당 프레임 수 e.g. 30
# frameSize: 프레임 크기 e.g., [640, 480])
# isColor: Color 영상
#

In [18]:
# import sys
# import cv2


cap = cv2.VideoCapture(0)

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()

# cap.get(cv2.CAP_PROP_FRAME_WIDTH) -> float type 반환
w = round(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
h = round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

fps = cap.get(cv2.CAP_PROP_FPS) #

# fourcc = cv2.VideoWriter_fourcc(*'MJPG')
fourcc = cv2.VideoWriter_fourcc(*'DIVX') # *'DIVX' == 'D', 'I', 'V', 'X'
delay = round(1000 / fps)

out = cv2.VideoWriter('output.avi', fourcc, fps, (w, h))

if not out.isOpened():
    print('File open failed!')
    cap.release()
    sys.exit()

while True:
    ret, frame = cap.read()

    if not ret:
        break

#     inversed = ~frame
#     edge = cv2.Canny(frame, 50, 150)
#     edge_color = cv2.cvtColor(edge, cv2.COLOR_GRAY2BGR)

    out.write(frame) #소리는 capture가 안됨
#     out.write(inversed)
#     out.write(edge_color)

    cv2.imshow('frame', frame)
#     cv2.imshow('inversed', inversed)
#     cv2.imshow('edge', edge)

    if cv2.waitKey(delay) == 27:
        break

cap.release()
out.release()

cv2.destroyAllWindows()

## 키보드 이벤트 처리하기

In [21]:
# import sys
# import numpy as np
# import cv2


img = cv2.imread('cat.bmp', cv2.IMREAD_GRAYSCALE)

if img is None:
    print('Image load failed!')
    sys.exit()

cv2.namedWindow('image')
cv2.imshow('image', img)

# cv2.waitKeyEx()

while True:
    keycode = cv2.waitKey()
    if keycode == ord('i'):
        img = ~img
        cv2.imshow('image', img)
    elif keycode == 27:
        break

cv2.destroyAllWindows()


## 마우스 이벤트 처리하기

In [None]:
# cv2.setMouseCallback(windowName, onMouse, param = None) -> None
    # windowName: 마우스이벤트를 수행할 창 이름
    # onMouse: 마우스 이벤트 콜벡함수
    # param: 콜백함수에 전달할 데이터

# onMouse(event, x, y, flags, param) -> None
# event: 마우스 이벤트 종류 e.g., cv2.EVENT_LBUTTONDOWN
# x, y : 창을 기준으로 이벤트 발생좌표
# flags: 이벤트시 발생 상태 e.g., "ctrl"
# param: cv2.setMouseCallback()함수에서 설정한 데이터

In [34]:
# import sys
# import numpy as np
# import cv2


oldx = oldy = -1

def on_mouse(event, x, y, flags, param):
    global oldx, oldy

    if event == cv2.EVENT_LBUTTONDOWN:
        oldx, oldy = x, y
        print('EVENT_LBUTTONDOWN: %d, %d' % (x, y))

    elif event == cv2.EVENT_LBUTTONUP:
        print('EVENT_LBUTTONUP: %d, %d' % (x, y))

#     elif event == cv2.EVENT_MOUSEMOVE:
#         if flags & cv2.EVENT_FLAG_LBUTTON:
#             cv2.line(img, (oldx, oldy), (x, y), (0, 0, 255), 4, cv2.LINE_AA)
#             cv2.imshow('image', img)
#             oldx, oldy = x, y


img = np.ones((480, 640, 3), dtype=np.uint8) * 255

cv2.namedWindow('image')
cv2.setMouseCallback('image', on_mouse, img) #항상 창을 띄우고 호출

cv2.imshow('image', img)
cv2.waitKey()

cv2.destroyAllWindows()


EVENT_LBUTTONDOWN: 88, 207
EVENT_LBUTTONUP: 88, 207
EVENT_LBUTTONDOWN: 319, 217
EVENT_LBUTTONUP: 320, 217
EVENT_LBUTTONDOWN: 79, 230
EVENT_LBUTTONUP: 311, 148
EVENT_LBUTTONDOWN: 253, 344
EVENT_LBUTTONUP: 492, 245
EVENT_LBUTTONDOWN: 133, 103
EVENT_LBUTTONUP: 443, 86
EVENT_LBUTTONDOWN: 551, 81
EVENT_LBUTTONUP: 543, 85
EVENT_LBUTTONDOWN: 62, 333
EVENT_LBUTTONUP: 626, 64


## 트랙바 사용하기

In [None]:
# createTrackbar(trackbarName, windowName, value, count, onChange) -> None
# trackbarName: 트랙바 이름
# windowName : 트랙바를 생성할 창 이름
# value : 트랙바 위치 초기값
# count : 트랙바 최댓값, 최솟값은 0
# onChange :callback 함수 e.g., onChange(pos) 위치를 정수형태로 전달

In [38]:
# import numpy as np
# import cv2


def on_level_change(pos):
    print(pos)
    value = pos * 16
#     if value >= 255:
#         value = 255
#     value = np.clip(value,0,255)

    img[:] = value
    cv2.imshow('image', img)


img = np.zeros((480, 640), np.uint8)
cv2.namedWindow('image')
cv2.createTrackbar('level', 'image', 0, 16, on_level_change) # 창이 생성된 후 호출

cv2.imshow('image', img)
cv2.waitKey()
cv2.destroyAllWindows()