2022-04-15 이주형

라이브러리 import 부분
https://github.com/timesler/facenet-pytorch   의 MTCNN을 utils/facenet_pytorch    에 저장해두어서 사용합니다.

In [None]:
import cv2
from multiprocessing.pool import ThreadPool
import glob
import os
from facenet_pytorch import MTCNN
import argparse
import torch
import shutil
import random

## argument 파싱 부분

args.input: 이 path 바로 아래에 변환할 영상들이 저장되어있어야 함.\
args.output: 이 path 바로 아래에 변환된 영상들이 저장될 예정.\
args.file_type: ```args.input```아래에 저장된 영상들의 확장자\
args.num_process: file I/O에 사용될 multi-process 갯수\
args.image_size: MTCNN이 얼굴을 인식하여 ```args.image_size```에 맞게 resize를 수행하여 return합니다.\
args.face_margin: MTCNN 얼굴을 return할 때, 얼굴 사면에 ```args.face_margin```만큼의 margin을 두고 return합니다.\
args.hierarchy_level: 1이면 ```args.input```바로 아래에 영상이 있어야 하고, 2 이면 ```args.input```바로 아래에 폴더들이 있고 그 아래에 영상들이 있어야 합니다.\
args.gpu: 사용할 gpu 번호\
args.num_images:
1) 양수:
 ```args.input``` 아래의 영상들의 순서를 셔플 뒤, 앞에서부터 ```args.num_images``` 만큼의 영상에서 얼굴을 추출함
2) 음수:
 ```args.input``` 아래의 영상들의 순서를 셔플 뒤, 뒤에서부터 ```args.num_images``` 만큼의 영상에서 얼굴을 추출함
3) 양수:
 ```args.input``` 아래의 영상들의 순서를 셔플 뒤, 전부 얼굴을 추출함
 
args.seed: 재현성을 위한 seed

In [None]:
parser = argparse.ArgumentParser(description='Extract face portion and save')
parser.add_argument('--input', default='../data/raw_images_eng/ANGRY', help='directory where raw images are saved')
parser.add_argument('--output', default='../data/face_images_eng/ANGRY', help='directory where cropped images will be saved')
parser.add_argument('--file-type', default='jpg', type=str, help='file type, e.g., jpg')
parser.add_argument('--num-process', default=16, type=int, help='number of process')
parser.add_argument('--image-size', default=160, type=int, help='size of extracted face image')
parser.add_argument('--face-margin', default=15, type=int, help='additional spatial margin around face')
parser.add_argument('--hierarchy-level', default=1, type=int, help='hierarchy level of files saved')
parser.add_argument('--gpu', default=0, type=int, help='hierarchy level of files saved')
parser.add_argument('--num-images', default=0, type=int, help='number of images to use per emotion category. Max: 7000')
parser.add_argument('--seed', default=3, type=int, help='seed for shuffle')

def main():
    args = parser.parse_args()

```args.output```폴더를 지우고 다시 만듬 (***조심!!!***)

In [None]:
    if os.path.isdir(args.output):
        shutil.rmtree(args.output)

    os.mkdir(args.output)

```args.face_margin```만큼의 마진을 두고 얼굴을 추출하여 ```args.image_size```사이즈로 resize한 뒤, ```args.gpu```로 카피하는 MTCNN을 instantiate

In [None]:
 mtcnn = MTCNN(image_size=args.image_size, margin=args.face_margin, device=torch.device(f'cuda:{args.gpu}'))

```path```에서 영상을 읽어서 (```cv2.imread()```), 영상이 정상이라면 (```if img is not None```) 영상을 BGR에서 RGB로 변환한다 (cv2.는 BGR로 읽는데, 모델은 rgb기준으로 훈련되어 있을 것이기 때문).\
cuda에서 버퍼를 날리고 ```mtcnn```으로 ```args.output```에 저장하는 함수를 정의

In [None]:
    def extract_and_save(path, args=args):
        img = cv2.imread(path)

        # 중요!!
        if img is not None:
            img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        try:
            torch.cuda.empty_cache()
            _ = mtcnn(img, path.replace(args.input, args.output))
        except Exception as e:
            print(f'{os.path.basename(path)} : {e}')

```args.input```에서 영상들을 읽어옵니다.
seed와 셔플은 없어도 됩니다. 전부가 아닌 몇개만 뽑아올때, 영상의 순서가 비슷한 영상들이 몰려있기 때문에 shuffle을 했습니다.

In [None]:
pp = glob.glob(args.input + ('/*' * args.hierarchy_level) + f'.{args.file_type}')
    #pp.sort()
    random.seed(args.seed)
    random.shuffle(pp)

위에서(```args```정의 부분) 설명한대로 ```args.num_images```에 따라 얼굴 추출 모드를 바꿔줍니다.

In [None]:
    if args.num_images > 0:
        print(f'Extracting faces from the first {args.num_images} images...')
        pp = pp[:args.num_images]
    elif args.num_images < 0:
        print(f'Extracting faces from the last {args.num_images} images...')
        pp = pp[args.num_images::]
    elif args.num_images == 0:
        print(f'Extracting faces from all images...')

multi-threading 을 사용하여 얼굴을 추출하고 추출된 얼굴영상을 저장합니다.\
thread 갯수는 ```args.num_process```입니다.

In [None]:
    if args.num_process > 2:
        #pass
        pool = ThreadPool(processes=args.num_process)
        pool.map(extract_and_save, (img_path for img_path in pp))
        pool.close()
        pool.join()
    else:
        for img_path in pp:
            extract_and_save(img_path, args)

본 파일을 메인 함수로 계산합니다.

In [None]:
if __name__ == '__main__':
    main()