# 동영상 파일 다루기

In [1]:
import cv2
import sys

### 파일로된 영상

In [5]:
cap = cv2.VideoCapture('./data/stopwatch.avi')

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
w, h = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = int(cap.get(cv2.CAP_PROP_FPS))

print("frame width, height", w, h)
print("fps", fps)

while True:
    ret, frame = cap.read()
    
    if not ret:
        print("frame read error")
        break
    
    inversed = ~frame
    cv2.imshow("frame", frame)
    cv2.imshow("inversed", inversed)
    #cv2.imshow("inversed", 1 - frame[:, :, :])
    
    if cv2.waitKey(fps) == 27: #27 (Esc Key), 10 : 10ms delay
        break
        
if cap.isOpened():
    cap.release()
cv2.destroyAllWindows()    

frame width, height 640 480
fps 30


### 동영상 저장

In [9]:
cap = cv2.VideoCapture(0) # 카메라 입력

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
# outputVideo = cv2.VideoWriter(파일명, 코덱, fps, (width, height))

fourcc = cv2.VideoWriter_fourcc("D", "I", "V", "X")
#fourcc = cv2.VideoWriter_fourcc(*"DIVX")
w, h = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = int(cap.get(cv2.CAP_PROP_FPS))

outputVideo = cv2.VideoWriter('./out/output.avi', fourcc, fps, (w, h))

print("frame width, height", w, h)
print("fps", fps)

while True:
    ret, frame = cap.read()
    
    if not ret:
        print("frame read error")
        break
   
    outputVideo.write(frame)
    cv2.imshow("frame", frame)
    
    if cv2.waitKey(fps) == 27: #27 (Esc Key), 10 : 10ms delay
        break
        
if cap.isOpened():
    cap.release()
outputVideo.release()    
cv2.destroyAllWindows()    

frame width, height 640 480
fps 30


### 드로이드캠 영상

안드로이드 스마트폰 앱 중 DroidCam을 이용하면 스마트폰 카메라에서 촬영한 영상을 소켓 통신을 통해 보내고 받을 수 있다.
- 사용 순서
1. 플레이스토어에서 DroidCam 설치
2. 스마트폰에서 DroidCam 앱을 실행하고 와이파이 IP, 포트 번호, 'mpegfeed'를 사용해 VideoCapture 객체 cap을 생성(http://IP:port/mjpegfeed')
3. 와이파이 IP, 포트 번호는 스마트폰 및 와이파이 환경에 따라 다르고, 'mjpegfeed' 문자열은 앱에 따라 다를 수 있음.
아이폰의 경우 (http://IP:port/video')

In [10]:
cap = cv2.VideoCapture("http://192.168.22.70:4747/mjpegfeed") # 드로이드캠에서 wifi에 접속해서 할당받은 ip
#cap = cv2.VideoCapture("http://192.168.22.70:4747/video") # 아이폰의 경우
if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
# outputVideo = cv2.VideoWriter(파일명, 코덱, fps, (width, height))

fourcc = cv2.VideoWriter_fourcc("D", "I", "V", "X")
#fourcc = cv2.VideoWriter_fourcc(*"DIVX")
w, h = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = int(cap.get(cv2.CAP_PROP_FPS))

outputVideo = cv2.VideoWriter('./out/droidcam.avi', fourcc, fps, (w, h))

print("frame width, height", w, h)
print("fps", fps)

while True:
    ret, frame = cap.read()
    
    if not ret:
        print("frame read error")
        break
   
    outputVideo.write(frame)
    cv2.imshow("frame", frame)
    
    if cv2.waitKey(fps) == 27: #27 (Esc Key), 10 : 10ms delay
        break
        
if cap.isOpened():
    cap.release()
outputVideo.release()    
cv2.destroyAllWindows()    

frame width, height 640 480
fps 25


### 유튜브 영상

- pafy : 비디오에서 메타데이터 획득, 비디오/오디오를 다운로드 하는 패키지
- youtube_dl : patfy의 backend에서 유튜브 동영상을 다운로드

**설치방법**
- pip install pafy
- pip install youtube_dl

In [17]:
import pafy
import youtube_dl

url = "https://www.youtube.com/watch?v=9SmQOZWNyWE&list=RD9SmQOZWNyWE&index=2" # 스트리밍 주소

video = pafy.new(url)
print("title", video.title)
print("rating", video.rating)
print("duration", video.duration)

best = video.getbest()
# best.url : download 가능한 url
# best.resolution : video의 해상도
print(best.url)

title BTS - "Permission to Dance" performed at the United Nations General Assembly | SDGs | Official Video
rating None
duration 00:03:43
https://rr2---sn-nxwvob-pjos.googlevideo.com/videoplayback?expire=1651131687&ei=x_BpYtjkFobz2roPi4K5iA4&ip=210.126.217.236&id=o-AMGuWOB5TIcPITmwlsIUna51BkSirmhRc7Fz8YEx5Okp&itag=18&source=youtube&requiressl=yes&mh=e9&mm=31%2C29&mn=sn-nxwvob-pjos%2Csn-oguesn6d&ms=au%2Crdu&mv=m&mvi=2&pcm2cms=yes&pl=20&initcwndbps=1571250&spc=4ocVC1Kqxc3gc3rqdqk6bMbdNSKW&vprv=1&mime=video%2Fmp4&ns=B5sNxpe1bjUpixa-pJBvCMUG&gir=yes&clen=19255716&ratebypass=yes&dur=223.445&lmt=1632650578912066&mt=1651109583&fvip=2&fexp=24001373%2C24007246&c=WEB&txp=5538434&n=covCvbVEe1Dqz9knR&sparams=expire%2Cei%2Cip%2Cid%2Citag%2Csource%2Crequiressl%2Cspc%2Cvprv%2Cmime%2Cns%2Cgir%2Cclen%2Cratebypass%2Cdur%2Clmt&sig=AOq0QJ8wRQIgKp3rrWHSLrvqVZ3Xu1DnvowAoSGrrPQ6Mkok-Aev3_QCIQC4gUXUmFpA6yPKbvW5Mb4FFrA3_WCL74xZ2PZCn1KkIA%3D%3D&lsparams=mh%2Cmm%2Cmn%2Cms%2Cmv%2Cmvi%2Cpcm2cms%2Cpl%2Cinitcwndbps&l

In [18]:
cap = cv2.VideoCapture(best.url) # 다운로드 가능한 주소

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
# outputVideo = cv2.VideoWriter(파일명, 코덱, fps, (width, height))

fourcc = cv2.VideoWriter_fourcc("D", "I", "V", "X")
#fourcc = cv2.VideoWriter_fourcc(*"DIVX")
w, h = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = int(cap.get(cv2.CAP_PROP_FPS))

outputVideo = cv2.VideoWriter('./out/youtube.avi', fourcc, fps, (w, h))

print("frame width, height", w, h)
print("fps", fps)

while True:
    ret, frame = cap.read()
    
    if not ret:
        print("frame read error")
        break
   
    outputVideo.write(frame)
    cv2.imshow("frame", frame)
    
    if cv2.waitKey(fps) == 27: #27 (Esc Key), 10 : 10ms delay
        break
        
if cap.isOpened():
    cap.release()
outputVideo.release()    
cv2.destroyAllWindows()    

frame width, height 640 360
fps 29


# 다양한 그리기 함수

In [19]:
import numpy as np

### 직선 그리기

In [29]:
img = np.full((400, 400, 3), 255, np.uint8)

# (Note) 행렬에서 위치를 찾아가는 방법과 반대 
# 색인과 슬라이싱을 할 때, 행(수직방향) 다음에 열(수평방향)

# cv2.line(도화지, 시작하는점, 끝나는점, 색깔, 굵기...)

# 수평선
pt1 = ( 50, 100) # 시작점의 x좌표, y좌표 (수평방향, 수직방향에서의 위치)
pt2 = (150, 100) # 끝나는점의 x좌표, y좌표
cv2.line(img, pt1, pt2, (0, 0, 255)) # pt: (x, y), color : (b, g, r)


# 대각선
pt3 = (200, 100) # 시작점의 x좌표, y좌표 (수평방향, 수직방향에서의 위치)
pt4 = (300, 250) # 끝나는점의 x좌표, y좌표

pt5 = (200, 150) # 시작점의 x좌표, y좌표 (수평방향, 수직방향에서의 위치)
pt6 = (300, 300) # 끝나는점의 x좌표, y좌표

pt7 = (200, 200) # 시작점의 x좌표, y좌표 (수평방향, 수직방향에서의 위치)
pt8 = (300, 350) # 끝나는점의 x좌표, y좌표

cv2.line(img, pt3, pt4, (0, 0, 255), 3, cv2.LINE_4) # pt: (x, y), color : (b, g, r)
cv2.line(img, pt5, pt6, (0, 0, 255), 3, cv2.LINE_8) # pt: (x, y), color : (b, g, r)
cv2.line(img, pt7, pt8, (0, 0, 255), 3, cv2.LINE_AA) # pt: (x, y), color : (b, g, r)


cv2.imshow("img",img)
cv2.waitKey()
cv2.destroyAllWindows()

### 도형 그리기

In [66]:
img = np.full((400, 400, 3), 255, np.uint8)

# rectangle
# cv2.rectangle(도화지, 시작하는점, 끝나는점, 색깔, 굵기...) # 시작점과 끝점은 대각 방향으로 바라보는 점
cv2.rectangle(img, (50, 50), (150, 100), (0, 0, 255), 3)
cv2.rectangle(img, (50, 150), (150, 200), (255, 0, 0), -1) # 굵기에 -1을 지정하면 내부가 채워짐

# circle
# cv2.circle(도화지, 중심점, 반지름, 색깔, 굵기...)
cv2.circle(img, (300, 120), 30, (255, 255, 0), 2)
cv2.circle(img, (300, 200), 30, (0, 255, 0), -1)

# ellipse
# cv2.ellipse(도화지, 중심점, 반지름쌍, 기울기, 시작각도, 끝각도, 색깔, 굵기...)
cv2.ellipse(img, (100, 300), (60, 30), 0, 0, 360, (255, 0, 0), 3)

# polylines
# cv2.polylines(도화지, [다각형을 이룰 점들], 다각형을 닫을지, 색깔,굵기 )
pts = np.array([[250, 250], [300, 250], [300, 300], [350, 300], [350, 350], [250, 350]])
cv2.polylines(img, [pts], True, (255, 0, 255), 2)

cv2.imshow("img",img)
cv2.waitKey()
cv2.destroyAllWindows()

### 문자열 출력하기

In [69]:
img = np.full((400, 400, 3), 255, np.uint8)

# cv2.putText(도화지, 텍스트, 텍스트의 좌하단좌표, 폰트, 스케일, 색깔...)
cv2.putText(img, "Hello", (20,50), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0), 3)

cv2.imshow("img",img)
cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
# Hello, OpenCV를 출력하되, 텍스트의 좌하단에 동그라미를 그리기

In [81]:
img = np.full((200, 640, 3), 255, np.uint8)

text = "Hello, OpenCV"
fontFace = cv2.FONT_HERSHEY_TRIPLEX
fontScale = 2.0
thickness = 1

sizeText, _ = cv2.getTextSize(text, fontFace, fontScale, thinkness)
# sizeText : 문자열을 감싸고 있는 사각형의 사이즈

# img.shape[1] : 도화지의 width, 
# img.shape[0] : 도화지의 height

org = (img.shape[1] - sizeText[0])//2, (img.shape[0] + sizeText[1])//2

cv2.putText(img, text, org, fontFace, fontScale, (255, 0, 0), thickness) # org : 좌하단


cv2.rectangle(img, org, (org[0] + sizeText[0], org[1]-sizeText[1]), (0, 255, 0), 1)

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows() 

### Workshop : 카운트 다운 영상 만들기

- 강사님 코드

In [86]:
img = np.full((512, 512, 3), 255, np.uint8)
cx, cy = img.shape[0]//2, img.shape[1]//2
fontFace = cv2.FONT_HERSHEY_TRIPLEX
fontScale = 5
thickness = 2

frame_size = img.shape[0], img.shape[1]
fps = 1
coutdown_writer = cv2.VideoWriter("./out/countdown0.mp4", fourcc, fps, frame_size)

for count in range(5, 0, -1):
    text = str(count)
    sizeText, _ = cv2.getTextSize(text, fontFace, fontScale, thickness)
    org = (img.shape[1] - sizeText[0])//2, (img.shape[0] + sizeText[1])//2
    cv2.putText(img, text, org, fontFace, fontScale, (255, 0, 0), 3)
    
    cv2.circle(img, (cx, cy), int(np.max(sizeText) * count * 0.5), (255, 255, 0), 4)
    coutdown_writer.write(img)
    
    cv2.imshow("img", img)
    cv2.waitKey(1000)
    img = np.full((512, 512, 3), 255, np.uint8)

coutdown_writer.release()
cv2.destroyAllWindows()

- 지훈씨 코드

In [87]:
texts = [7,6,5,4,3,2,1]
fontFace = cv2.FONT_HERSHEY_TRIPLEX
fontScale = 2.0
thinkness = 1
colors = {7:(0,0,255),6:(0,94,255),5:(0,228,255),4:(0,147,0),
          3:(255,0,1),2:(111,0,0),1:(225,18,113)}

sizeText, _ = cv2.getTextSize(str(texts[0]), fontFace, fontScale, thinkness)
org = (img.shape[1] - sizeText[0])//2, (img.shape[0] + sizeText[1])//2

# 비디오 설정
fourcc = cv2.VideoWriter_fourcc(*'DIVX')
w, h = (650, 650)
fps = 0.8
outputVideo = cv2.VideoWriter('./out/count.avi', fourcc, fps, (w, h))

for text in texts:
    img = np.full((w, h, 3), -1, np.uint8)
    sizeText, _ = cv2.getTextSize(str(text), fontFace, fontScale, thinkness)
    org = (img.shape[1])//2, (img.shape[0])//2
    cv2.putText(img, str(text), (org[0]-(10*text),org[1]+(10*text)),
                fontFace, text, colors[text], thinkness, cv2.LINE_AA)
    cv2.circle(img, org, sizeText[0]*text, colors[text], 5, cv2.LINE_AA)
    outputVideo.write(img)
    cv2.imshow('img', img)
    if cv2.waitKey(500) == 27 :
        print('강제 종료')
        cv2.destroyAllWindows() # esc 사용시 강제 종료
        break

if text == 1 :
    outputVideo.release()
    cv2.destroyAllWindows() # 자동종료

- 승범씨 코드

In [88]:
for i in range(10, -1, -1):
    img = np.full((500, 500, 3), 255, np.uint8)
    
    text = str(i)
    fontFace = cv2.FONT_HERSHEY_SIMPLEX
    fontScale = 5
    thickness = 3
    sizeText, _ = cv2.getTextSize(text, fontFace, fontScale, thickness)
    
    org = (img.shape[1] - sizeText[0])//2, (img.shape[0] + sizeText[1])//2
    
    cv2.ellipse(img, (250, 250), (150, 150), 0, 0, 360-(36*(10-i)), (255, 0, 0), 100, lineType=cv2.LINE_AA)
    cv2.putText(img, text, org, fontFace, fontScale, (0, 0, 0), thickness)
    
    cv2.imshow('img', img)
    cv2.waitKey(1000)
cv2.destroyAllWindows()

# 이벤트 처리

### Keyboard Event

In [89]:
img = cv2.imread('./data/lenna.bmp')

if img is None:
    print('Image load failed!')
    sys.exit()

cv2.imshow('img', img)

while True: # 무한반복에서는 break가 반드시 있어야 함
    keycode = cv2.waitKey()
    
    if keycode == ord('i') or keycode == ord("I"):
        img = ~img
        cv2.imshow("img", img)
        
    elif keycode == ord('q') or keycode == ord("Q"):
        break

cv2.destroyAllWindows()

### Workshop : 키보드 이벤트 처리

In [93]:
img = np.full((512, 512, 3), 255, np.uint8)

x, y = img.shape[0]//2, img.shape[1]//2
width , height = img.shape[1], img.shape[0]

R = 50
direction = 0

while True:
    keycode = cv2.waitKeyEx(50)
    if keycode == 27:
        break;
        
    elif keycode == 0x270000: # right key
        direction = 0
    elif keycode == 0x280000: # down key
        direction = 1    
    elif keycode == 0x250000: # left key
        direction = 2
    elif keycode == 0x260000: # up key
        direction = 3

    if direction == 0:
        x += 10
    elif direction == 1:
        y += 10
    elif direction == 2:
        x -= 10
    elif direction == 3:
        y -=10
        
        
    # 경계처리
    if x < R:
        x = R
        direction = 0
    if x > width - R:
        x = width -R
        direction = 2
    
    if y < R:
        y = R
        direction = 1
    if y > height - R:
        y = height - R
        direction = 3
    
    
    cv2.circle(img, (x, y), R, (0, 0, 255), -1)    
    cv2.imshow('img', img)
    
    img = np.full((512, 512, 3), 255, np.uint8)
    
cv2.destroyAllWindows()

### Mouse Event

In [98]:
def on_mouse(event, x, y, flags, param):
    # mouse event 의 종류를 조사
    # case 마다 해당 액션
    global old_x, old_y
    if event == cv2.EVENT_LBUTTONDOWN:
        old_x, old_y = x, y
    elif event == cv2.EVENT_LBUTTONUP:
        pass
    elif event == cv2.EVENT_MOUSEMOVE:
        if flags & cv2.EVENT_FLAG_LBUTTON:
            cv2.line(img, (old_x, old_y), (x, y), (0, 255, 255), 2)
            cv2.imshow("img", img)
            old_x, old_y = x, y
        
img = cv2.imread("./data/lenna.bmp")

if img is None:
    print("Image load failed!")
    sys.exit()

cv2.imshow("img", img)
cv2.setMouseCallback("img", on_mouse) # 마우스 이벤트가 발생했을때 처리될 함수를 등록(만)!
    
cv2.imshow("img", img)    
cv2.waitKey()
cv2.destroyAllWindows()

### Trackbar

In [102]:
[pos * 16 for pos in range(17)]

[0, 16, 32, 48, 64, 80, 96, 112, 128, 144, 160, 176, 192, 208, 224, 240, 256]

In [112]:
def saturated(value):
    if value > 255:
        value = 255
    elif value < 0:
        value = 0
    return value
    

def on_level_change(pos):
    # 이벤트가 발생했을때마다 화면의 밝기가 바뀌도록 구현
    img[:] = saturated(pos * 16)
    cv2.imshow("img", img)

img = np.full((512, 512, 3), 0, np.uint8)

cv2.imshow("img", img)    
cv2.createTrackbar("level", "img", 0, 16, on_level_change)
cv2.setTrackbarPos("level", "img", 0)


cv2.waitKey()
cv2.destroyAllWindows()

### Workshop : 트랙바 이벤트 처리

In [118]:
def on_level_change(pos):
    # 이벤트가 발생했을때마다 R, G, B 각 밝기가 바뀌도록 구현
    # 트랙바의 위치 값 = cv2.getTrackbarPos(트랙바 이름, 윈도우이름)
    r = cv2.getTrackbarPos("R", "img")
    g = cv2.getTrackbarPos("G", "img")
    b = cv2.getTrackbarPos("B", "img")
    
    img[:] = (b, g, r)
    
    cv2.imshow("img", img)

img = np.full((512, 512, 3), 0, np.uint8)

cv2.imshow("img", img)    
cv2.createTrackbar("R", "img", 0, 255, on_level_change)
cv2.createTrackbar("G", "img", 0, 255, on_level_change)
cv2.createTrackbar("B", "img", 0, 255, on_level_change)

cv2.setTrackbarPos("B", "img", 255)

cv2.waitKey()
cv2.destroyAllWindows()

# 유용한 기능들

## 마스크 연산

In [128]:
src = cv2.imread('./data/lenna.bmp', cv2.IMREAD_COLOR)
mask = cv2.imread('./data/mask_smile.bmp', cv2.IMREAD_GRAYSCALE) 

src[mask > 0] = (0, 255, 255)

cv2.imshow("src", src) 
cv2.imshow("mask", mask) 
cv2.waitKey()
cv2.destroyAllWindows()

In [123]:
# (mask>0).sum()
# (mask==0).sum()
# mask.shape
# 512*512 == 65584 + 196560

65584

In [133]:
src = cv2.imread('./data/airplane.bmp', cv2.IMREAD_COLOR)
mask = cv2.imread('./data/mask_plane.bmp', cv2.IMREAD_GRAYSCALE)
dst = cv2.imread('./data/field.bmp', cv2.IMREAD_COLOR)

# todo
dst[mask>0] = src[mask>0]

cv2.imshow("src", src) 
cv2.imshow("mask", mask) 
cv2.imshow("dst", dst) 
cv2.waitKey()
cv2.destroyAllWindows()

## 연산 시간 측정

In [137]:
src = cv2.imread("./data/lenna.bmp", cv2.IMREAD_GRAYSCALE)
dst = np.empty(src.shape, src.dtype)

tm = cv2.TickMeter()
tm.start()
# option 1 : python을 이용해서 반전
for y in range(src.shape[0]):
    for x in range(src.shape[1]):
        dst[y, x] = 255 - src[y, x]

tm.stop()
print("%4.3f ms"% tm.getTimeMilli())

cv2.imshow("src", src) 
cv2.waitKey()
cv2.destroyAllWindows()

847.290 ms


In [138]:
src = cv2.imread("./data/lenna.bmp", cv2.IMREAD_GRAYSCALE)
dst = np.empty(src.shape, src.dtype)

tm = cv2.TickMeter()
tm.start()
# option 2 : numpy를 이용해서 반전

dst = 255 - src # 벡터 연산, broadcasting

tm.stop()
print("%4.3f ms"% tm.getTimeMilli())

cv2.imshow("src", src) 
cv2.waitKey()
cv2.destroyAllWindows()

0.403 ms


In [139]:
847/0.403

2101.7369727047144

## 유용한 함수들

- np.sum(), np.mean()

In [141]:
src = cv2.imread("./data/lenna.bmp", cv2.IMREAD_GRAYSCALE)
np.sum(src), np.mean(src)

(32518590, 124.04857635498047)

- cv2.minMaxLoc()

In [142]:
minVal, maxVal, minPos, maxPos = cv2.minMaxLoc(src)
minVal, maxVal, minPos, maxPos  # minPos, maxPos : (x, y)

(25.0, 245.0, (508, 71), (116, 273))

In [143]:
print(src[71, 508])  # 25  : 행렬은 y행, x열
print(src[273, 116])  # 245 : 행렬은 y행, x열

25
245


- cv2.normalize()

In [144]:
data = np.array([[-1, -0.5, 0, 0.5, 1]], dtype=np.float32)
normed_data = cv2.normalize(data, None, 0, 255, cv2.NORM_MINMAX, cv2.CV_8U)
normed_data

array([[  0,  64, 128, 191, 255]], dtype=uint8)