# Inception + Resnet 모델

## 하이퍼 파라미터

In [22]:
import os
import tensorflow as tf
from tensorflow import keras
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow.keras.preprocessing.image import ImageDataGenerator, img_to_array, load_img
import time
import psutil
import random

## 데이터셋 위치 지정

In [5]:
ROOT_DATA_FOLDER = '../../../dataset/train_sample_videos'
REAL_DATA_PATH = os.path.join(ROOT_DATA_FOLDER, 'real')
FAKE_DATA_PATH = os.path.join(ROOT_DATA_FOLDER, 'fake')
REAL_DATASET_LIST = os.listdir(REAL_DATA_PATH)
FAKE_DATASET_LIST = os.listdir(FAKE_DATA_PATH)

print(f"REAL 영상 수 : {len(REAL_DATASET_LIST)}, 경로 : {REAL_DATA_PATH}")
print(f"FAKE 영상 수 : {len(FAKE_DATASET_LIST)}, 경로 : {FAKE_DATA_PATH}")

REAL 영상 수 : 46858, 경로 : ../../../dataset/train_sample_videos/real
FAKE 영상 수 : 265658, 경로 : ../../../dataset/train_sample_videos/fake


## REAL 데이터셋 리스트와 FAKE 데이터셋 리스트 라벨링 후 합치기

#### Generator를 사용해 메모리를 효율적으로 사용한다

In [45]:
# 라벨링을 해주는 Generator
def real_list_labelling(real_list):
    for img_name in real_list:
        labeled_real_set = (img_name,'real')
        yield labeled_real_set

def fake_list_labelling(fake_list):
    for img_name in fake_list:
        labeled_fake_set = (img_name,'fake')
        yield labeled_fake_set 

# 메모리 사용을 체크해주는 객체 process 생성
process = psutil.Process(os.getpid())

# 라벨링 실행전 메모리 상태 체크
before_time = time.clock()
mem_before = process.memory_info().rss / 1024 / 1024

labeled_real_gen = real_list_labelling(REAL_DATASET_LIST)
labeled_fake_gen = fake_list_labelling(FAKE_DATASET_LIST)

labeled_real_set = list(labeled_real_gen)
labeled_fake_set = list(labeled_fake_gen)

# 라벨링 실행후 메모리 상태 체크
after_time = time.clock()
mem_after = process.memory_info().rss / 1024 / 1024
total_time = after_time - before_time

print('시작 전 메모리 사용량: {} MB'.format(mem_before))
print('종료 후 메모리 사용량: {} MB'.format(mem_after))
print('총 소요된 시간: {:.6f} 초'.format(total_time))

# REAL과 FAKE를 합친후 랜덤으로 섞기 
LABELED_DATASET_LIST = labeled_real_set + labeled_fake_set
random.shuffle(LABELED_DATASET_LIST)

# 50개 데이터 확인
table = {
    "IMAGE" : LABELED_DATASET_LIST[:50],
    "LABEL" : LABELED_DATASET_LIST[:50]
}

pd.DataFrame(table)
LABELED_DATASET_LIST[:50]

시작 전 메모리 사용량: 503.91796875 MB
종료 후 메모리 사용량: 506.41796875 MB
총 소요된 시간: 0.057495 초


('prropvmcke_1.png', 'real')

## 데이터 

In [None]:
tf.keras.preprocessing.image.ImageDataGenerator(
    REAL_DATA_PATH,
    rescale=1./255
)

In [None]:
input_shape = (128, 128, 3)

a=
b=
X = []
Y = []

print("start")
for img in REAL_DATASET_NAMES:
    if len(X) < len(REAL_DATASET_NAMES)/5:
        X.append(img_to_array(load_img(data_dir+'/real/'+img)).flatten() / 255.0)
        Y.append(1)
print("end, start")
for img in FAKE_DATASET:
    if len(X) < (len(FAKE_DATASET)+len(REAL_DATASET_NAMES))/5:
        X.append(img_to_array(load_img(data_dir+'/fake/'+img)).flatten() / 255.0)
        Y.append(0)
print("end")
Y_val_org = Y

#Normalization
X = np.array(X)
Y = to_categorical(Y, 2)

#Reshape
X = X.reshape(-1, 128, 128, 3)

#Train-Test split
X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size = 0.2, random_state=5)


In [None]:
Inception_Resnet_model = keras.models.load_model('Inception_Resnet_Model.h5')

In [None]:
Inception_Resnet_model.summary()