# 카메라 스티커앱을 개선하자

## (1) moviepy로 비디오 처리하기

* 파이썬 기반의 동영상 처리 라이브러리  
동영상을 다룰 때의 실행시간, 즉 처리 속도가 중요. 그래서 moviepy를 쓰는 것이 성능면에서 적합한지

1. moviepy를 이용해서 주피터 노트북 상에서 비디오를 읽고 쓰는 프로그램을 작성

In [1]:
pwd

'/home/ssac26/aiffel/video_sticker_app'

In [2]:
from moviepy.editor import VideoClip, VideoFileClip
from moviepy.editor import ipython_display
import cv2
import numpy as np
import os

In [3]:
# 읽기
video_path = os.getenv('HOME')+'/aiffel/video_sticker_app/images/video2.mp4'
clip = VideoFileClip(video_path)
clip = clip.resize(width=640)
clip.ipython_display(fps=30, loop=True, autoplay=True, rd_kwargs=dict(logger=None))

# 쓰기
result_video_path = os.getenv('HOME')+'/aiffel/video_sticker_app/images/mvpyresult.mp4'
clip.write_videofile(result_video_path)

                                                                    

Moviepy - Building video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4.
MoviePy - Writing audio in mvpyresultTEMP_MPY_wvf_snd.mp3


t:   5%|▌         | 22/404 [00:00<00:01, 219.77it/s, now=None]

MoviePy - Done.
Moviepy - Writing video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4



                                                               

Moviepy - Done !
Moviepy - video ready /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4


2. moviepy 로 읽은 동영상을 numpy 형태로 변환하고 영상 밝기를 50% 어둡게 만든 후에 저장

In [4]:
# 읽기
video_path = os.getenv('HOME')+'/aiffel/video_sticker_app/images/video2.mp4'
clip = VideoFileClip(video_path)
clip = clip.resize(width=640)
clip.ipython_display(fps=30, loop=True, autoplay=True, rd_kwargs=dict(logger=None))

# clip 에서 numpy 로 데이터 추출
vlen = int(clip.duration*clip.fps)
video_container = np.zeros((vlen, clip.size[1], clip.size[0], 3), dtype=np.uint8)
for i in range(vlen):
    img = clip.get_frame(i/clip.fps)
    video_container[i] = (img * 0.5).astype(np.uint8)

# 새 clip 만들기
dur = vlen / clip.fps
outclip = VideoClip(lambda t: video_container[int(round(t*clip.fps))], duration=dur)

# 쓰기
result_video_path2 = os.getenv('HOME')+'/aiffel/video_sticker_app/images/mvpyresult2.mp4'
outclip.write_videofile(result_video_path2, fps=30)

t:  12%|█▏        | 49/403 [00:00<00:00, 485.04it/s, now=None]

Moviepy - Building video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult2.mp4.
Moviepy - Writing video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult2.mp4



                                                               

Moviepy - Done !
Moviepy - video ready /home/ssac26/aiffel/video_sticker_app/images/mvpyresult2.mp4


3. 영상을 읽고 쓰는 시간을 측정해 주세요. OpenCV를 사용할 때와 차이를 측정

In [5]:
# CASE 1 : moviepy 사용
start = cv2.getTickCount()
clip = VideoFileClip(video_path)
clip = clip.resize(width=640)

vlen = int(clip.duration*clip.fps)
video_container = np.zeros((vlen, clip.size[1], clip.size[0], 3), dtype=np.uint8)

for i in range(vlen):
    img = clip.get_frame(i/clip.fps)
    video_container[i] = (img * 0.5).astype(np.uint8)

dur = vlen / clip.fps
outclip = VideoClip(lambda t: video_container[int(round(t*clip.fps))], duration=dur)

mvpy_video_path = os.getenv('HOME')+'/aiffel/video_sticker_app/images/mvpyresult.mp4'
outclip.write_videofile(mvpy_video_path, fps=30)

time = (cv2.getTickCount() - start) / cv2.getTickFrequency()
print (f'[INFO] moviepy time : {time:.2f}ms')

t:  12%|█▏        | 48/403 [00:00<00:00, 411.33it/s, now=None]

Moviepy - Building video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4.
Moviepy - Writing video /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4



                                                               

Moviepy - Done !
Moviepy - video ready /home/ssac26/aiffel/video_sticker_app/images/mvpyresult.mp4
[INFO] moviepy time : 2.58ms


In [6]:
# CASE 2 : OpenCV 사용
start = cv2.getTickCount()
vc = cv2.VideoCapture(video_path)

cv_video_path = os.getenv('HOME')+'/aiffel/video_sticker_app/images/cvresult.mp4'
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
vw = cv2.VideoWriter(cv_video_path, fourcc, 30, (640,360))

vlen = int(vc.get(cv2.CAP_PROP_FRAME_COUNT))

for i in range(vlen):
    ret, img = vc.read()
    if ret == False: break
    
    img_result = cv2.resize(img, (640, 360)) * 0.5
    vw.write(img_result.astype(np.uint8))
    
time = (cv2.getTickCount() - start) / cv2.getTickFrequency()
print (f'[INFO] cv time : {time:.2f}ms')

[INFO] cv time : 1.79ms


moviepy 를 이용할 때의 장단점을 분석  


장점 : 여러이미지를 이용해 gif만들때 편리  
단점 : 스트리밍(실시간영상)에는 사용불가  
moviepy와 opencv의 차이는 잘 모르겠음, opencv가 화면의 크기가 커서 더 자연스러운 동작을 하는것처럼도 보이지만
moviepy의 경우엔 화면크기와 밝기를 조절해서 그렇게 보이는 걸수도 있음

## (2) 어디까지 만들고 싶은지 정의하기

1. 실시간 카메라 스티커앱을 만들기

In [7]:
cv2.__version__

'4.5.2'

In [8]:
%%writefile webcam_sticker.py
import numpy as np
import cv2
import dlib

from newaddsticker import img2sticker

detector_hog = dlib.get_frontal_face_detector()
landmark_predictor = dlib.shape_predictor('./models/shape_predictor_68_face_landmarks.dat')

def main():
    cv2.namedWindow('show', 0)
    cv2.resizeWindow('show', 640, 360)

    vc = cv2.VideoCapture(0)   # 연결된 영상 장치의 인덱스, 하나만 있는 경우 0을 사용
    img_sticker = cv2.imread('./images/king.png')

    vlen = int(vc.get(cv2.CAP_PROP_FRAME_COUNT))
    print (vlen) # 웹캠은 video length 가 0 입니다.

    # 정해진 길이가 없기 때문에 while 을 주로 사용합니다.
    # for i in range(vlen):
    while True:
        ret, img = vc.read()
        if ret == False:
            break
        start = cv2.getTickCount()
        img = cv2.flip(img, 1)  # 보통 웹캠은 좌우 반전

        # 스티커 메소드를 사용
        img_result = img2sticker(img, img_sticker.copy(), detector_hog, landmark_predictor)   

        time = (cv2.getTickCount() - start) / cv2.getTickFrequency() * 1000
        print ('[INFO] time: %.2fms'%time)

        cv2.imshow('show', img_result)
        key = cv2.waitKey(1)
        if key == 27:
            break


if __name__ == '__main__':
    main()

Overwriting webcam_sticker.py


2. 스티커앱을 실행하고 카메라를 고정하고 서서히 멀어져봅니다. 혹은 아주 가까이 다가가 봅니다. 얼굴을 찾지 못하는 거리를 기록해주세요.

거리가 가깝거나 멀어도 얼굴의 형태를 카메라가 인식가능한 거리라면 스티커가 반응했다. (약 1M) 

3. 다시 자리로 돌아온 후 고개를 상하좌우로 움직여주세요. yaw, pitch, roll 각도의 개념을 직접 실험해 보고 각각 몇 도까지 정상적으로 스티커앱이 동작하는지 기록해주세요.  
일반적인 허용 범위는 아래와 같다고 알려져 있습니다.

yaw : -45 ~ 45도, 좌우
pitch : -20 ~ 30도, 상하
roll : -45 ~ 45도  , 

실제 yaw, pitch, roll의 수치상으로 나타내는데는 부족함이 있지만 카메라를 이동시켜서 얼굴의 윤곽을 잡아낼수 있는 선에서 스티커 생성, yaw의 경우 이동시 얼굴이 잘려서 나오므로 스티커생성실패, pitch의 경우도 이동시켜서 얼굴이 잘리지 않는선에서 생성성공, roll의 경우도 비슷한 얼굴형태가 나오면 생성성공 


4. 만들고 싶은 스티커앱의 스펙(허용 거리, 허용 인원 수, 허용 각도, 안정성)을 정해주세요.


* 거리 : 25cm ~ 1m → 너무 가까우면 스티커의 의미가 없음, 셀카봉을 들었을 때의 유효거리  
* 인원 수 : 2명 → 셀카꾸미지, 친구와 찍는 사진에 적용  
* 허용 각도 : pitch : -20 ~ 30도, yaw : -45 ~ 45도, roll : -45 ~ 45도 → 화면을 바라볼 수 있는 각도  
* 안정성 : 위 조건을 만족하면서 FPPI (false positive per image) 기준 < 0.003, MR (miss rate) < 1 300장당 1번 에러 = 10초=30*10에 1번 에러  
허용각도, 안정성은 노드 참조

## (3) 스티커 Out Bound 예외처리하기

지금까지 만든 스티커앱을 이용해서 예외 상황을 찾아주세요. 특히 서서히 영상에서 좌우 경계 밖으로 나가며 코드의 행동을 확인해 보세요.

```
Traceback (most recent call last):
  File "webcam_sticker.py", line 42, in <module>
    main()
  File "webcam_sticker.py", line 30, in main
    img_result = img2sticker(img, img_sticker.copy(), detector_hog, landmark_predictor)   
  File "/home/ssac26/aiffel/video_sticker_app/newaddsticker.py", line 42, in img2sticker
    cv2.addWeighted(sticker_area, 1.0, img_sticker, 0.7, 0)
cv2.error: OpenCV(4.5.2) /tmp/pip-req-build-yw7uvgqm/opencv/modules/core/src/arithm.cpp:647: error: (-209:Sizes of input arguments do not match) The operation is neither 'array op array' (where arrays have the same size and the same number of channels), nor 'array op scalar', nor 'scalar op array' in function 'arithm_op'
```

* roll과 pitch값이 일정범위이상 올라가면 프로그램이 꺼지는 현상 발생

* newaddsticker.py의 img2sticker 메소드에서 아래 부분을 수정  
*  Out bound 오류(경계 밖으로 대상이 나가서 생기는 오류)를 해결

## (4) 스티커앱 분석 - 거리, 인원 수, 각도, 시계열 안정성

In [9]:
# # sticker
# img_sticker = cv2.resize(img_sticker, (w,h), interpolation=cv2.INTER_NEAREST)

# refined_x = x - w // 2
# refined_y = y - h

# if refined_y < 0:
#     img_sticker = img_sticker[-refined_y:]
#     refined_y = 0

# ###
# # TODO : x 축 예외처리 코드 추가
# ###
# if refined_x < 0:
#     img_sticker = img_sticker[:, -refined_x:]
#     refined_x = 0
# elif refined_x + img_sticker.shape[1] >= img_orig.shape[1]:
#     img_sticker = img_sticker[:, :-(img_sticker.shape[1]+refined_x-img_orig.shape[1])]
# img_bgr = img_orig.copy()
# sticker_area = img_bgr[refined_y:refined_y+img_sticker.shape[0], refined_x:refined_x+img_sticker.shape[1]]
# ###
# img_bgr[refined_y:refined_y+img_sticker.shape[0], refined_x:refined_x+img_sticker.shape[1]] = \
#     cv2.addWeighted(sticker_area, 1.0, img_sticker, 0.7, 0)

# return img_bgr

In [10]:
%%writefile newaddsticker.py
import dlib
import cv2

def img2sticker(img_orig, img_sticker, detector_hog, landmark_predictor):
    # preprocess
    img_rgb = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)
    
    # detector
    dlib_rects = detector_hog(img_rgb, 0)
    if len(dlib_rects) < 1:
        return img_orig
    
    # landmark
    list_landmarks = []
    for dlib_rect in dlib_rects:
        points = landmark_predictor(img_rgb, dlib_rect)
        list_points = list(map(lambda p: (p.x, p.y), points.parts()))
        list_landmarks.append(list_points)
    
    # head coord
    for dlib_rect, landmark in zip(dlib_rects, list_landmarks):
        x = landmark[30][0] # nose
        y = landmark[30][1] - dlib_rect.width()//2
        w = dlib_rect.width()
        h = dlib_rect.width()
        break
    
    # sticker
    img_sticker = cv2.resize(img_sticker, (w,h), interpolation=cv2.INTER_NEAREST)
    
    refined_x = x - w // 2
    refined_y = y - h
    
    if refined_y < 0:
        img_sticker = img_sticker[-refined_y:]
        refined_y = 0
            
# #  x 축 예외처리 코드 추가

    if refined_x < 0:
        img_sticker = img_sticker[:, -refined_x:]
        refined_x = 0
    elif refined_x + img_sticker.shape[1] >= img_orig.shape[1]:
        img_sticker = img_sticker[:, :-(img_sticker.shape[1]+refined_x-img_orig.shape[1])]
    img_bgr = img_orig.copy()
    sticker_area = img_bgr[refined_y:refined_y+img_sticker.shape[0], refined_x:refined_x+img_sticker.shape[1]]
# # #
    img_bgr[refined_y:refined_y+img_sticker.shape[0], refined_x:refined_x+img_sticker.shape[1]] = \
        cv2.addWeighted(sticker_area, 1.0, img_sticker, 0.7, 0)

    return img_bgr





Overwriting newaddsticker.py


4. 다른 예외는 어떤 것들이 있는가  
test중 프로그램이 종료되는 현상이 아직 존재하나 이해부족으로 해결 못함


## (4) 스티커앱 분석 - 거리, 인원 수, 각도, 시계열 안정성

1. 멀어지는 경우에 왜 스티커앱이 동작하지 않는지 분석해주세요. detection, landmark, blending 단계 중 무엇이 문제일까요?  
 멀어지면 detector_hog 단계에서 bbox 가 출력되지 않는다.

 2. detector_hog의 문제를 해결하기 위해, 이미지 피라미드를 조절하여 성능을 향상

In [12]:
%%writefile newaddsticker.py
import dlib
import cv2

def img2sticker(img_orig, img_sticker, detector_hog, landmark_predictor):
    # preprocess
    img_rgb = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)

    # detector
    img_rgb_vga = cv2.resize(img_rgb, (640, 360))
## 기존
# dlib_rects = detector_hog(img_rgb, 0)
##
    dlib_rects = detector_hog(img_rgb_vga, 1) # <- 이미지 피라미드 수 변경 ##
    if len(dlib_rects) < 1:
        return img_orig

    # landmark
    list_landmarks = []
    for dlib_rect in dlib_rects:
        points = landmark_predictor(img_rgb_vga, dlib_rect)
        list_points = list(map(lambda p: (p.x, p.y), points.parts()))
        list_landmarks.append(list_points)

Overwriting newaddsticker.py


In [13]:
# 작업속도가 90~100으로 크게 증가함, 이미지가 실시간을 못따라오는 렉?발생함
#  기존 방식 사용

인원 수, 각도 등 각 문제에 대해서 반복해주세요. (정해진 답은 없습니다.)


## (5) 칼만 필터 적용하기

1. 카메라 앞에서 가만히 있을 때 스티커의 움직임을 관찰후 문제파악
가만히 있어도 스티커의 크리가 일정하게 유지되지 않고, 떨리는 것처럼 보이는 현상이 발생

2. 이론 강의에서 배운 칼만 필터를 적용해서 스티커 움직임을 안정화  
칼만 필터를 구현한 모듈인 kalman.py와 이를 이용하여 tracker를 구현한 kpkf.py를 이용하여 칼만필터를 적용한 webcam_sticker_kf.py를 이용

칼만필터 적용된 webcam_sticker.py만들기

In [14]:
%%writefile webcam_sticker.py

import numpy as np
import cv2
import dlib

from kfaddsticker import img2sticker_kf

detector_hog = dlib.get_frontal_face_detector()
landmark_predictor = dlib.shape_predictor('./models/shape_predictor_68_face_landmarks.dat')

def main():
    cv2.namedWindow('show', 0)
    cv2.resizeWindow('show', 640, 360)

    #vc = cv2.VideoCapture(0)
    vc = cv2.VideoCapture(0)
    img_sticker = cv2.imread('./images/king.png')

    vlen = int(vc.get(cv2.CAP_PROP_FRAME_COUNT))
    print (vlen) # 웹캠은 video length 가 0 입니다.

    # 정해진 길이가 없기 때문에 while 을 주로 사용합니다.
    # for i in range(vlen):
    while True:
        ret, img = vc.read()
        if ret == False:
            break
        start = cv2.getTickCount()
        img = cv2.flip(img, 1)  # 보통 웹캠은 좌우 반전

        # 스티커 메소드를 사용
        img_result = img2sticker_kf(img, img_sticker.copy(), detector_hog, landmark_predictor)   

        time = (cv2.getTickCount() - start) / cv2.getTickFrequency() * 1000
        print ('[INFO] time: %.2fms'%time)
        
        cv2.imshow('show', img_result)
        key = cv2.waitKey(1)
        if key == 27:
            break


if __name__ == '__main__':
    main()

Overwriting webcam_sticker.py


In [None]:
pwd

``` 칼만필터를 적용하니 스티커 이미지가 좌표도 안맞고 커져버리는 현상 발생, 실습을 따라하는데도 잘 모르겠는 내용이 많아서 어려움을 많이 겪었다```