# 기초 사용법

opencv tutorial : https://docs.opencv.org/4.6.0/d6/d00/tutorial_py_root.html

In [1]:
import cv2

In [None]:
cv2.__version__

## Hello World

In [None]:
img = cv2.imread('./data/lenna.bmp')

print(type(img), img.shape)

cv2.namedWindow('image') # 생략가능
cv2.imshow('image', img)

cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
img.min(), img.max()

In [None]:
img[0][0]

## 영상 파일 읽고 화면에 표시하기

In [None]:
# Color Mode로 이미지 읽기
imgColor = cv2.imread('./data/lenna.bmp', cv2.IMREAD_COLOR) 

# GrayScale Mode로 이미지 읽기
imgGray = cv2.imread('./data/lenna.bmp', cv2.IMREAD_GRAYSCALE) 

# type, shape 출력
print(type(imgColor), imgColor.shape)
print(type(imgGray), imgGray.shape)

# 윈도우에 보여주기
cv2.imshow('img color', imgColor)
cv2.imshow('img gray', imgGray)

# 창닫기
cv2.waitKey()
cv2.destroyAllWindows()

## 영상 파일 읽고 저장하기

In [None]:
# Color Mode로 이미지 읽기

imgColor = cv2.imread('./data/lena.jpg', cv2.IMREAD_COLOR)
print(type(imgColor), imgColor.shape)

cv2.imwrite('./out/lena.bmp', imgColor)
cv2.imwrite('./out/lena.png', imgColor)

cv2.imwrite('./out/lena2.png', imgColor, [cv2.IMWRITE_PNG_COMPRESSION, 9]) # 0~9
cv2.imwrite('./out/lena2.jpg', imgColor, [cv2.IMWRITE_JPEG_QUALITY, 90]) # 0~100

cv2.imshow('img color', imgColor)
cv2.waitKey()
cv2.destroyAllWindows()

## matplotlib으로 컬러 영상 표시

In [None]:
import matplotlib.pyplot as plt

In [None]:
# matplotlib으로 이미지 읽고 보여주기
img_m = plt.imread('./data/lena.jpg')
plt.imshow(img_m)

In [None]:
img_c = cv2.imread('./data/lena.jpg')
plt.imshow(img_c)

In [None]:
img_m[0][0], img_c[0][0] # cv2가 이미지를 읽는 순서는 B->G->R, matplotlib은 R->G->B

In [None]:
# cv2로 읽은것을 cv2로 보여주는데는 문제가 없음
img_c = cv2.imread('./data/lena.jpg')
cv2.imshow('img color', img_c)
cv2.waitKey()
cv2.destroyAllWindows()

* (1) cvtColor 함수를 컬러 채널을 변경후 표시

In [None]:
img_bgr = cv2.imread('./data/lena.jpg') # img_bgr에는 BGR의 순서로 데이터가 준비가 되어 있음

# 현재 채널공간(channel space)이 BGR인데 RGB로 바꿈
img_rgb = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)

* (2) numpy ndarray의 색인 문법으로 컬러 채널 순서를 변경

In [None]:
img_bgr = cv2.imread('./data/lena.jpg') # img_bgr에는 BGR의 순서로 데이터가 준비가 되어 있음

# 현재 채널공간(channel space)이 BGR인데 RGB로 바꿈
# option 1
img_rgb = img_bgr.copy()
img_rgb[:, :, [0, 2]] = img_bgr[:, :, [2, 0]]

plt.imshow(img_rgb)

In [None]:
img_bgr = cv2.imread('./data/lena.jpg') # img_bgr에는 BGR의 순서로 데이터가 준비가 되어 있음

# 현재 채널공간(channel space)이 BGR인데 RGB로 바꿈
# option 2
img_rgb = img_bgr.copy()
img_rgb[:, :, 0] = img_bgr[:, :, 2]
img_rgb[:, :, 2] = img_bgr[:, :, 0]

plt.imshow(img_rgb)

In [None]:
img_bgr = cv2.imread('./data/lena.jpg') # img_bgr에는 BGR의 순서로 데이터가 준비가 되어 있음

# 현재 채널공간(channel space)이 BGR인데 RGB로 바꿈
# option 3
img_rgb = img_bgr.copy()
img_rgb = img_bgr[:, :, -1::-1]

plt.imshow(img_rgb)

# 동영상 파일 다루기

```
객체 = 비디오객체 생성

while True:
    배열 = 객체.read() #배열 한장이 이미지 한장 (shape: w, h, c)
    배열 보여주기 (재생)
    배열 저장하기 (녹화)
    
    키를 기다리다가 조건에 맞으면
        break;
창닫기        
```

In [None]:
# cap = cv2.VideoCapture(device) # 카메라 디바이스
# cap = cv2.VideoCapture(filepath) # 동영상 파일
# cap = cv2.VideoCapture(url) # 스트리밍 주소

## 카메라 입력

In [3]:
import sys

In [22]:
cap = cv2.VideoCapture(0) # 0 : 메인 카메라

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()

w = cap.get(cv2.CAP_PROP_FRAME_WIDTH)    
h = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)  
print(w, h)
while True:
    ret, frame = cap.read() # frame은 이미지 한장
    
    if not ret:
        print("frame read error")
        break
        
    cv2.imshow('camera', frame)
  
    key = cv2.waitKey(10) # ESC Key (27), 10ms 기다리기 (sleep 효과)
    if key == 27 :
        break;
        
if cap.isOpened():
    print('cap release!')
    cap.release()
        
cv2.destroyAllWindows()   
# cv2.waitKey(1)  # MAC에서 window 안닫힐 때
# https://stackoverflow.com/questions/6116564/destroywindow-does-not-close-window-on-mac-using-python-and-opencv

640.0 480.0
cap release!


## 동영상 파일

In [20]:
cap = cv2.VideoCapture('./data/stopwatch.avi') # 동영상 파일

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
w = cap.get(cv2.CAP_PROP_FRAME_WIDTH)    
h = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)    
fps = cap.get(cv2.CAP_PROP_FPS)   # frame per second
delay = round(1000/fps) # 1000/30 
print(delay)
    
while True:
    ret, frame = cap.read() # frame은 이미지 한장
    
    if not ret:
        print("frame read error")
        break
        
    cv2.imshow('camera', frame)
  
    key = cv2.waitKey(delay) # ESC Key (27), 10ms 기다리기 (sleep 효과)
    if key == 27 :
        break;
        
if cap.isOpened():
    print('cap release!')
    cap.release()
        
cv2.destroyAllWindows()   

33
frame read error
cap release!


## 동영상 저장

In [24]:
cap = cv2.VideoCapture('./data/stopwatch.avi') # 동영상 파일

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
w = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
h = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)   # frame per second
delay = round(1000/fps) # 1000/30 

fourcc = cv2.VideoWriter_fourcc('D', 'I', 'V', 'X') #DivX Mpeg-4 코덱
#fourcc = cv2.VideoWriter_fourcc(*'DIVX')

# 저장을 위한 객체 = cv2.VideoWriter(파일명, 코덱, FPS, 해상도)
outputVideo = cv2.VideoWriter('./out/output.avi', fourcc, fps, (w, h))

while True:
    ret, frame = cap.read() # frame은 이미지 한장
    
    if not ret:
        print("frame read error")
        break
        
    cv2.imshow('camera', frame) # 재생
    outputVideo.write(frame)    # 녹화
  
    key = cv2.waitKey(delay) # ESC Key (27), 10ms 기다리기 (sleep 효과)
    if key == 27 :
        break;
        
if cap.isOpened():
    print('cap release!')
    cap.release()
        
cv2.destroyAllWindows()   

frame read error
cap release!


## 드로이드캠 영상

안드로이드 스마트폰 앱 중 DroidCam을 이용하면 스마트폰 카메라에서 촬영한 영상을 소켓 통신을 통해 보내고 받을 수 있다.
- 사용 순서
1. 플레이스토어에서 DroidCam 설치
2. 스마트폰에서 DroidCam 앱을 실행하고 와이파이 IP, 포트 번호, 'mjpegfeed'를 사용해 VideoCapture 객체 cap을 생성(http://IP:port/mjpegfeed')
3. 와이파이 IP, 포트 번호는 스마트폰 및 와이파이 환경에 따라 다르고, 'mjpegfeed' 문자열은 앱에 따라 다를 수 있음.

In [25]:
cap = cv2.VideoCapture('http://192.168.80.234:4747/mjpegfeed') #  드로이드캠 연결 IP
#cap = cv2.VideoCapture('http://192.168.80.234:4747/video') # (아이폰의 경우)

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
w = cap.get(cv2.CAP_PROP_FRAME_WIDTH)    
h = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)    
fps = cap.get(cv2.CAP_PROP_FPS)   # frame per second
delay = round(1000/fps) # 1000/30 
print(delay)
    
while True:
    ret, frame = cap.read() # frame은 이미지 한장
    
    if not ret:
        print("frame read error")
        break
        
    cv2.imshow('camera', frame)
  
    key = cv2.waitKey(delay) # ESC Key (27), 10ms 기다리기 (sleep 효과)
    if key == 27 :
        break;
        
if cap.isOpened():
    print('cap release!')
    cap.release()
        
cv2.destroyAllWindows()   

40
cap release!


## 유튜브 영상

- pafy : 비디오에서 메타데이터 획득, 비디오/오디오를 다운로드 하는 패키지
- youtube_dl : patfy의 backend에서 유튜브 동영상을 다운로드

**설치방법**
- pip install pafy
- pip install youtube_dl

In [2]:
import pafy
import youtube_dl

In [3]:
url = 'https://www.youtube.com/watch?v=9SmQOZWNyWE&list=RD9SmQOZWNyWE&index=2'
video = pafy.new(url)

print('title : ' video.title)
print('rating : ', video.rating)
print('duration : ', video.duration)

best = video.getbest()
print('download url : ', best.url)
print('resolution : ', best.resolution)

In [11]:
cap = cv2.VideoCapture(best.url) #  유튜브 다운로드 URL

if not cap.isOpened():
    print("Camera open failed!")
    sys.exit()
    
w = cap.get(cv2.CAP_PROP_FRAME_WIDTH)    
h = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)    
fps = cap.get(cv2.CAP_PROP_FPS)   # frame per second
delay = round(1000/fps) # 1000/30 
print(delay)
    
while True:
    ret, frame = cap.read() # frame은 이미지 한장
    
    if not ret:
        print("frame read error")
        break
        
    cv2.imshow('origial', frame)
    cv2.imshow('inverse', 255 - frame)
    
    edge = cv2.Canny(frame, 100, 200)
    cv2.imshow('edge', edge)
    
  
    key = cv2.waitKey(delay) # ESC Key (27), 10ms 기다리기 (sleep 효과)
    if key == 27 :
        break;
        
if cap.isOpened():
    print('cap release!')
    cap.release()
        
cv2.destroyAllWindows()   

33
cap release!


# 다양한 그리기 함수

In [2]:
import numpy as np

```
# numpy ndarray로 색인할 때는 행(수직방향)을 색인->열(수평방향)을 색인
img[100, 50]     
# openCV 함수에서 좌표를 찾아갈 때는 x좌표(수평방향) -> y좌표(수직방향)
pt1 = (50, 100)  # x좌표 50, y좌표 100
```

## 직선 그리기

In [21]:
#np.full(사이즈, 초기값, 데이터타입)
img = np.full((400, 400, 3), 255, np.uint8)

# 수평선
pt1 = (50, 100) # x좌표, y좌표
pt2 = (150, 100) # x좌표, y좌표

# cv2.line(도화지, 시작점, 끝점, 색깔, 굵기....)
cv2.line(img, pt1, pt2, (0, 0, 255), 2)

# 대각선
pt3 = (200, 100)
pt4 = (300, 250)
cv2.line(img, pt3, pt4, (0, 0, 255), 2, cv2.LINE_AA)

cv2.imshow('img', img)
cv2.waitKey()
cv2.destroyAllWindows()

## 도형 그리기

In [25]:
cv2.FILLED

-1

In [44]:
img = np.full((400, 400, 3), 255, np.uint8)

# rectangle
# cv2.rectangle(도화지, 시작점, 끝점, 색깔, 굵기...) # 시작점 끝점은 대각방향으로 마주보는 점
cv2.rectangle(img, (50, 50), (150, 100), (0, 0, 255), 3)
cv2.rectangle(img, (50, 150), (150, 200), (0, 0, 255), cv2.FILLED) # 굵기 자리에 -1을 지정하면 내부 채워짐

# circle
# cv2.circle(도화지, 중심점, 반지름, 색깔, 굵기...)
cv2.circle(img, (300, 120), 30, (255, 255, 0), 2)
cv2.circle(img, (300, 200), 30, (255, 255, 0), cv2.FILLED)

# ellipse
# cv2.ellipse(도화지, 중심점, 반지름쌍, 기울기, 시작각도, 끝각도, 색깔, 굵기..)
cv2.ellipse(img, (100, 300), (60, 30), 0, 0, 360, (255, 0, 0), 3)

# polylines
# cv2.polylines(도화지, [다각형을 이룰 점들], 다각형을 닫을지 여부, 색깔, 굵기...)
pts = np.array([[250, 250], [300, 250], [300, 300], [350, 300], [350, 350], [250, 350]])
cv2.polylines(img, [pts], True, (255, 0, 255), 2)

cv2.imshow('img', img)
cv2.waitKey()
cv2.destroyAllWindows()


## 문자열 출력하기

In [45]:
img = np.full((400, 400, 3), 255, np.uint8)

# text
# cv2.putText(도화지, 텍스트, 텍스트의 좌하단 좌표, 폰트, 스케일, 색깔, 굵기...)
cv2.putText(img, 'Hello', (20, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 0), 3)

cv2.imshow('text', img)
cv2.waitKey()
cv2.destroyAllWindows()

In [None]:
# Hello, OpenCV 를 출력하되, 감싸는 사각형을 그리고, 좌하단에 동그라미 그리기

In [19]:
img = np.full((200, 640, 3), 255, np.uint8)

text = 'Hello, OpenCV'

fontFace = cv2.FONT_HERSHEY_DUPLEX
fontScale = 2
thickness = 1

size_Text, retVal = cv2.getTextSize(text, fontFace, fontScale, thickness)

print(size_Text)
print(img.shape)

org_x = (img.shape[1] - size_Text[0]) // 2
org_y = (img.shape[0] + size_Text[1]) // 2
org_x, org_y

cv2.putText(img, text, (org_x, org_y), fontFace, fontScale, (255, 0, 0), thickness)
cv2.rectangle(img, (org_x, org_y), (org_x+size_Text[0], org_y-size_Text[1]), (0, 255, 0), 2)
cv2.circle(img, (org_x, org_y), 5, (0, 0, 255))

cv2.imshow('hello opencv', img)
cv2.waitKey()
cv2.destroyAllWindows()

(451, 43)
(200, 640, 3)


## 실습 : 카운트 다운 영상 만들기

In [12]:
## 재영F ##
img = np.full((400, 400, 3), 255, np.uint8)
for i in range(5, 0, -1):
    cv2.putText(img, str(i), (170, 210), cv2.FONT_HERSHEY_SCRIPT_COMPLEX, 3, (200, 100, 50), 3)
    cv2.circle(img, (200, 180), i*30, (150, 40, 100), 2)
    cv2.imshow('countdown', img)
    cv2.waitKey(1000)
    img = np.full((400, 400, 3), 255, np.uint8)
cv2.destroyAllWindows()

In [10]:
## 강사님 ##
img = np.full((512, 512, 3), 255, np.uint8)
cx, cy = img.shape[0]//2, img.shape[1]//2
fontFace = cv2.FONT_HERSHEY_TRIPLEX
fontScale = 5
thickness = 2

fourcc = cv2.VideoWriter_fourcc("D", "I", "V", "X")
frame_size = img.shape[0], img.shape[1]
fps = 1
coutdown_writer = cv2.VideoWriter("./out/countdown0.mp4", fourcc, fps, frame_size)

for count in range(5, 0, -1):
    text = str(count)
    sizeText, _ = cv2.getTextSize(text, fontFace, fontScale, thickness)
    org = (img.shape[1] - sizeText[0])//2, (img.shape[0] + sizeText[1])//2
    cv2.putText(img, text, org, fontFace, fontScale, (255, 0, 0), 3)
    cv2.circle(img, (cx, cy), int(np.max(sizeText) * count * 0.5), (255, 255, 0), 4)
    coutdown_writer.write(img)
    
    cv2.imshow("img", img)
    cv2.waitKey(1000)
    img = np.full((512, 512, 3), 255, np.uint8)

coutdown_writer.release()
cv2.destroyAllWindows()