In [1]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.preprocessing.image import ImageDataGenerator

np.random.seed(3)
tf.random.set_seed(3)

test_datagen = ImageDataGenerator(rescale=1./255, horizontal_flip = True, width_shift_range = 0.1, height_shift_range = 0.1, fill_mode = 'nearest')
test_data = test_datagen.flow_from_directory('C:/faces94/train', target_size = (150,150), batch_size = 5, class_mode = 'binary')

train_datagen = ImageDataGenerator(rescale=1./255, horizontal_flip = True, width_shift_range = 0.1, height_shift_range = 0.1, fill_mode = 'nearest')
train_data = train_datagen.flow_from_directory('C:/faces94/test', target_size = (150,150), batch_size = 5, class_mode = 'binary')



Found 800 images belonging to 2 classes.
Found 1859 images belonging to 2 classes.


로컬에서 다운 받은 여자와 남자의 얼굴 사진 데이터를 직접 test와 train 데이터로 분류하여 전처리까지 하였다.
또한, 두개의 class로 구분되어야 하기 때문에 class_mode = 'binary'로 설정하였다.

In [2]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(32, (3,3), input_shape = (150,150,3), activation = 'relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size = (2,2)))
model.add(tf.keras.layers.Conv2D(32, (3,3), activation = 'relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size = (2,2)))
model.add(tf.keras.layers.Conv2D(64, (3,3), activation = 'relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size = (2,2)))

model.add(tf.keras.layers.Flatten())

model.add(tf.keras.layers.Dense(64, activation = 'relu'))
model.add(tf.keras.layers.Dropout(0.5))
model.add(tf.keras.layers.Dense(2, activation = 'sigmoid'))


신경망 모델을 설계하였는데, 일반적인 컨볼루션 모델처럼
convolution layer + pooling layer + flatten layer + dense layer로 구성하였다.

In [3]:
model.compile(loss = 'sparse_categorical_crossentropy', optimizer = tf.keras.optimizers.Adam(learning_rate = 0.00002), metrics = ['accuracy'])

0.0과 0.1로 이미지가 구성되도록 255.0으로 나누어서 전처리를 하였으며, 그랬기 때문에 sparse_categorical_crossentropy를 이용해서 손실을 구하였다. 그리고 learning_rate를 0.00002로 설정하였을 때 더욱더 학습이 잘 되는 듯 보였다.
무엇보다 분류문제에서 제일 중요한 것은 정확도이기 때문에 metrics값으로 'accuracy'를 설정해 준다.

In [4]:
history = model.fit_generator(train_data, steps_per_epoch = 100, epochs = 20, validation_data = test_data, validation_steps = 4)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [5]:
model.evaluate(test_data)



[0.26841962405014785, 0.91125]

Accuracy: 91.125%