In [2]:
import sys
import cv2

path = 'C:/Users/ky_moon/Desktop/vision/ch02/'
# 영상 불러오기
img1 = cv2.imread(path + 'cat.bmp', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread(path + 'cat.bmp', cv2.IMREAD_COLOR)

if img1 is None or img2 is None:
    print('Image load failed!')
    sys.exit()

# 영상의 속성 참조
print('type(img1):', type(img1))
print('img1.shape:', img1.shape)
print('img2.shape:', img2.shape)
print('img1.dtype:', img1.dtype)

# 영상의 크기 참조
h, w = img2.shape[:2] # x축 : w(열) / y축 : h(행)
print('img2 size: {} x {}'.format(w, h))

if len(img1.shape) == 2:
    print('img1 is a grayscale image')
elif len(img1.shape) == 3:
    print('img1 is a truecolor image')

img1[:, :] = 0
img2[:, :] = (0, 255, 255)
        
cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.waitKey()
cv2.destroyAllWindows()

type(img1): <class 'numpy.ndarray'>
img1.shape: (480, 640)
img2.shape: (480, 640, 3)
img1.dtype: uint8
img2 size: 640 x 480
img1 is a grayscale image


In [4]:
import numpy as np

img1 = np.empty((240, 320), dtype=np.uint8)       # grayscale image
img2 = np.zeros((240, 320, 3), dtype=np.uint8)    # color image
img3 = np.ones((240, 320, 3), dtype=np.uint8) * 255  # dark gray
img4 = np.full((240, 320, 3), (0, 255, 255), dtype=np.uint8)  # yellow

print('img1.shape:', img1.shape)
print('img2.shape:', img2.shape)
print('img3.shape:', img3.shape)
print('img4.shape:', img4.shape)

cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.imshow('img3', img3)
cv2.imshow('img4', img4)
cv2.waitKey()
cv2.destroyAllWindows()

img1.shape: (240, 320)
img2.shape: (240, 320, 3)
img3.shape: (240, 320, 3)
img4.shape: (240, 320, 3)


In [5]:
img1 = cv2.imread(path + 'HappyFish.jpg')

img2 = img1 # img2는 img1과 같은 영상 공유
img3 = img1.copy() # 완전한 복사본, 메모리를 새롭게 할당

img1.fill(255)

cv2.imshow('img1', img1)
cv2.imshow('img2', img2) # img2는 img1과 마찬가지로 노란색으로 채워짐
cv2.imshow('img3', img3) # img3는 영향 x
cv2.waitKey()
cv2.destroyAllWindows()

In [6]:
img1 = cv2.imread(path + 'HappyFish.jpg')

img2 = img1[40:120, 30:150]  # numpy.ndarray의 슬라이싱
img3 = img1[40:120, 30:150].copy()

cv2.circle(img2, (50, 50), 20, (0, 0, 250), 2) # img1에도 원을 그림

cv2.imshow('img1', img1)
cv2.imshow('img2', img2)
cv2.imshow('img3', img3)
cv2.waitKey()
cv2.destroyAllWindows()

In [7]:
src = cv2.imread(path + 'airplane.bmp', cv2.IMREAD_COLOR)
mask = cv2.imread(path + 'mask_plane.bmp', cv2.IMREAD_GRAYSCALE) # mask는 gray scale
dst = cv2.imread(path + 'field.bmp', cv2.IMREAD_COLOR) # dst, src는 같은 shape여야 함

if src is None or mask is None or dst is None:
    print('Image load failed!')
    sys.exit()

cv2.copyTo(src, mask, dst) # dst : 입력이자 출력

# dst[mask > 0] = src[mask > 0] : boolean indexing, src에서 True인 부분만 가져옴 -> dst 영상의 픽셀값 자체가 변경됨

cv2.imshow('src', src)
cv2.imshow('dst', dst)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

In [10]:
src = cv2.imread(path + 'airplane.bmp', cv2.IMREAD_COLOR)
mask = cv2.imread(path + 'mask_plane.bmp', cv2.IMREAD_GRAYSCALE)  # mask는 gray scale
dst = cv2.imread(path + 'field.bmp', cv2.IMREAD_COLOR)  # dst, src는 같은 shape여야 함

if src is None or mask is None or dst is None:
    print('Image load failed!')
    sys.exit()

dst[mask > 0] = src[mask > 0]  # src에서 비행기 위치에 해당하는 픽셀값을, dst의 해당 위치에 할당

cv2.imshow('src', src)
cv2.imshow('dst', dst)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
src = cv2.imread(path + 'opencv-logo-white.png', cv2.IMREAD_UNCHANGED)
mask = src[:, :, -1]  # alpha 채널
src = src[:, :, 0:3]  # BGR채널
dst = cv2.imread(path + 'field.bmp', cv2.IMREAD_COLOR)

h, w = src.shape[:2]  # src[0] : 행 h(y) / src[1] : 열 w(x)
crop = dst[0:h, 0:w] 
# src와 dst의 사이즈가 다르기 때문에 crop 필요
# crop영상의 픽셀값이 변경됨에 따라 crop부분에 해당하는 dst영상의 픽셀값도 변경됨

if src is None or mask is None or dst is None:
    print('Image load failed!')
    sys.exit()

cv2.copyTo(src, mask, crop) # crop : 입력이자 출력, dst에서 좌측 상단의 픽셀값만 변경됨

# dst[mask > 0] = src[mask > 0] : boolean indexing, src에서 True인 부분만 가져옴 -> dst 영상의 픽셀값 자체가 변경됨

cv2.imshow('src', src)
cv2.imshow('dst', dst)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

In [11]:
# 알파 채널을 마스크 영상으로 이용
src = cv2.imread(path + 'cat.bmp', cv2.IMREAD_COLOR)
logo = cv2.imread(path + 'opencv-logo-white.png', cv2.IMREAD_UNCHANGED)

if src is None or logo is None:
    print('Image load failed!')
    sys.exit()

mask = logo[:, :, 3]    # mask는 알파 채널로 만든 마스크 영상
logo = logo[:, :, :-1]  # logo는 b, g, r 3채널로 구성된 컬러 영상
h, w = mask.shape[:2]

crop = src[10:10+h, 10:10+w]  # logo, mask와 같은 크기의 부분 영상 추출

cv2.copyTo(logo, mask, crop)
#crop[mask > 0] = logo[mask > 0]

cv2.imshow('src', src)
cv2.imshow('logo', logo)
cv2.imshow('mask', mask)
cv2.waitKey()
cv2.destroyAllWindows()

#### 그리기 함수

* 영상의 픽셀값 자체를 변경
* 그레이 스케일 영상에는 컬러로 그리기 불가능

In [1]:
import numpy as np
import cv2

img = np.full((400, 400, 3), 255, np.uint8)

# 직선 그리기
cv2.line(img, (50, 50), (200, 50), (0, 0, 255), 5)  # 직선의 시작점, 끝점, 색상, 선 두께
cv2.line(img, (50, 60), (150, 160), (0, 0, 128))

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

C:\Users\ky_moon\Anaconda3\envs\tensorflow\lib\site-packages\numpy\.libs\libopenblas.PYQHXLVVQ7VESDPUVUADXEVJOBGHJPAY.gfortran-win_amd64.dll
C:\Users\ky_moon\Anaconda3\envs\tensorflow\lib\site-packages\numpy\.libs\libopenblas.TXA6YQSD3GCQQC22GEQ54J2UDCXDXHWN.gfortran-win_amd64.dll
C:\Users\ky_moon\Anaconda3\envs\tensorflow\lib\site-packages\numpy\.libs\libopenblas.WCDJNK7YVMPZQ2ME2ZZHJJRJ3JIKNDB7.gfortran-win_amd64.dll
  stacklevel=1)


In [2]:
img = np.full((400, 400, 3), 255, np.uint8)

cv2.rectangle(img, (50, 200, 150, 100), (0, 255, 0), 2) # rec : 사각형 위치 정보(x,y,w,h) / (50, 200)좌표에서 가로로 150 세로로 100
cv2.rectangle(img, (70, 220), (180, 280), (0, 128, 0), -1) # (70, 220)에서 (180, 280) / thickness=-1 => 내부를 채움

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
img = np.full((400, 400, 3), 255, np.uint8)

cv2.circle(img, (300, 100), 30, (255, 255, 0), -1, cv2.LINE_AA) # (300, 100)중심점, 반지름 30인 원 / thickness=-1 => 내부를 채움
cv2.circle(img, (300, 100), 60, (255, 0, 0), 3, cv2.LINE_AA)

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

In [3]:
import numpy as np
import cv2

img = np.full((400, 400, 3), 255, np.uint8)

cv2.line(img, (50, 50), (200, 50), (0, 0, 255), 5)
cv2.line(img, (50, 60), (150, 160), (0, 0, 128))

cv2.rectangle(img, (50, 200, 150, 100), (0, 255, 0), 2)
cv2.rectangle(img, (70, 220), (180, 280), (0, 128, 0), -1)

cv2.circle(img, (300, 100), 30, (255, 255, 0), -1, cv2.LINE_AA)
cv2.circle(img, (300, 100), 60, (255, 0, 0), 3, cv2.LINE_AA)

pts = np.array([[250, 200], [300, 200], [350, 300], [250, 300]])
cv2.polylines(img, [pts], True, (255, 0, 255), 2)

text = 'Hello? OpenCV ' + cv2.__version__
cv2.putText(img, text, (50, 350), cv2.FONT_HERSHEY_SIMPLEX, 0.8, 
            (0, 0, 255), 1, cv2.LINE_AA)

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

#### 동영상 처리

In [None]:
import sys
import cv2


# 카메라 열기
cap = cv2.VideoCapture(0)

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()

# 카메라 프레임 크기 출력
print('Frame width:', int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)))
print('Frame height:', int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT)))

# cap.set(cv2.CAP_PROP_FRAME_WIDTH, 320)
# cap.set(cv2.CAP_PROP_FRAME_HEIGHT 240)  320x240 사이즈로 영상 출력

# 카메라 프레임 처리
while True:
    ret, frame = cap.read()

    if not ret:
        break
    
    inversed = ~frame  # 반전

    cv2.imshow('frame', frame)
    cv2.imshow('inversed', inversed)

    if cv2.waitKey(10) == 27:
        break

cap.release()
cv2.destroyAllWindows()

In [4]:
import sys
import cv2


cap = cv2.VideoCapture(0)

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()

w = round(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
h = round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

fourcc = cv2.VideoWriter_fourcc(*'DIVX') # *'DIVX' == 'D', 'I', 'V', 'X'
delay = round(1000 / fps)

out = cv2.VideoWriter('output.avi', fourcc, fps, (w, h))

if not out.isOpened():
    print('File open failed!')
    cap.release()
    sys.exit()

while True:
    ret, frame = cap.read()

    if not ret:
        break

    inversed = ~frame

    out.write(inversed)

    cv2.imshow('frame', frame)
    cv2.imshow('inversed', inversed)

    if cv2.waitKey(delay) == 27:
        break

cap.release()
out.release()
cv2.destroyAllWindows()

In [2]:
import sys
import numpy as np
import cv2


oldx = oldy = -1

def on_mouse(event, x, y, flags, param):
    global oldx, oldy

    if event == cv2.EVENT_LBUTTONDOWN:
        oldx, oldy = x, y
        print('EVENT_LBUTTONDOWN: %d, %d' % (x, y))

    elif event == cv2.EVENT_LBUTTONUP:
        print('EVENT_LBUTTONUP: %d, %d' % (x, y))

    elif event == cv2.EVENT_MOUSEMOVE:
        if flags & cv2.EVENT_FLAG_LBUTTON:  # lbutton을 누르면 EVENT_FLAG_LBUTTON=1
            cv2.line(img, (oldx, oldy), (x, y), (0, 0, 255), 4, cv2.LINE_AA)
            cv2.imshow('image', img)
            oldx, oldy = x, y


img = np.ones((480, 640, 3), dtype=np.uint8) * 255

cv2.namedWindow('image')
cv2.setMouseCallback('image', on_mouse, img) # 발생하는 마우스 이벤트를 반영

cv2.imshow('image', img)
cv2.waitKey()

cv2.destroyAllWindows()


EVENT_LBUTTONDOWN: 143, 118
EVENT_LBUTTONUP: 144, 118
EVENT_LBUTTONDOWN: 374, 169
EVENT_LBUTTONUP: 997, 51
