In [None]:
import os
import shutil  #네임 스페이스 추가 : cmd (shell util 명령어를 사용하기 위해)

import tensorflow as tf
from tensorflow import keras

from tensorflow.keras import layers
from tensorflow.keras import models

In [None]:
# 이미지를 처리하는 작업
# Original Data Path
# 현재 디렉토리 : './'
original_dataset_dir = './datasets/train'

# 저안의 이미지 데이터를 쪼개서 훈련용, 검증용, 테스트용으로 나눔

# Small Dataset Path
base_dir = './datasets/cats_and_dogs_small'

# 있으면 지우고 새로만들기
if os.path.exists(base_dir):
    shutil.rmtree(base_dir)     # retree 지우기

os.mkdir(base_dir)    # mkdir 새로만들기

In [None]:
# Train, Validation, Test data로 나누어 만들기
# 2개의 경로를 하나로 합칠때

train_dir = os.path.join(base_dir, 'train')
os.mkdir(train_dir)
validation_dir = os.path.join(base_dir, 'validation')
os.mkdir(validation_dir)
test_dir = os.path.join(base_dir, 'test')
os.mkdir(test_dir)

In [None]:
# 각 폴더마다 이미지 데이터 넣기

# 필요한 경로 설정

train_cats_dir = os.path.join(train_dir, 'cats')
train_dogs_dir = os.path.join(train_dir, 'dogs')
validation_cats_dir = os.path.join(validation_dir, 'cats')
validation_dogs_dir = os.path.join(validation_dir, 'dogs')
test_cats_dir = os.path.join(test_dir, 'cats')
test_dogs_dir = os.path.join(test_dir, 'dogs')

os.mkdir(train_cats_dir)
os.mkdir(train_dogs_dir)
os.mkdir(validation_cats_dir)
os.mkdir(validation_dogs_dir)
os.mkdir(test_cats_dir)
os.mkdir(test_dogs_dir)


In [None]:
# File copy작업
# ++이미지 파일 이름 바꾸는 것도 가능
fnames = []
for i in range(1000): # print(i) : 0부터 999까지
    filename = 'cat.{}.jpg'.format(i)
    fnames.append(filename)    
print(fnames)

In [None]:
# 한줄로 표현
fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]

In [None]:
# cats train data copy

fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(train_cats_dir, fname)          # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
# dogs train data copy

fnames = ['dog.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(train_dogs_dir, fname)          # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
print('----------------- Copy Completed------------')

In [None]:
# cats validation data copy

fnames = ['cat.{}.jpg'.format(i) for i in range(1000,1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(validation_cats_dir, fname)     # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
# dogs validation data copy

fnames = ['dog.{}.jpg'.format(i) for i in range(1000,1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(validation_dogs_dir, fname)     # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
print('----------------- Copy Completed------------')

In [None]:
# cats test data copy

fnames = ['cat.{}.jpg'.format(i) for i in range(1500,2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(test_cats_dir, fname)           # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
# dogs test data copy

fnames = ['dog.{}.jpg'.format(i) for i in range(1500,2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)    # 원본 경로 잡기
    dst = os.path.join(test_dogs_dir, fname)           # 복사할 폴더 경로 잡기
    shutil.copyfile(src, dst)
    
print('----------------- Copy Completed------------')

In [None]:
# 복사 확인 코드

# print('Train cat images: ', os.listdir(train_cats_dir))       # os.listdir() 지정된 경로내의 파일 목록
print('Train cat images: ', len(os.listdir(train_cats_dir)))    # len(os.listdir()) 지정된 경로내의 파일 갯수
print('Train dog images: ', len(os.listdir(train_dogs_dir)))
print('Validation cat images: ', len(os.listdir(validation_cats_dir)))
print('Validation dog images: ', len(os.listdir(validation_dogs_dir)))    
print('Test cat images: ', len(os.listdir(test_cats_dir)))
print('Test dog images: ', len(os.listdir(test_dogs_dir)))

In [None]:
# Build Network

from tensorflow.keras import layers
from tensorflow.keras import models

model = models.Sequential()
model.add(layers.Conv2D(32,(3,3),activation='relu', input_shape = (150,150,3)))     # input_shape = (150,150,3) 맨뒤에 3은 이미지가 컬러이기 떄문에
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))                                               # Conv2D는 특징을 잡고 Maxpooling2D는 필터역할
model.add(layers.Conv2D(128,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(128,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))   
model.add(layers.Flatten())
model.add(layers.Dense(512,activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()

In [None]:
from tensorflow.keras import optimizers

model.compile(optimizer= 'rmsprop',
              loss = 'binary_crossentropy',
              metrics = ['accuracy']
              )

In [None]:
# Data Preprocessing
# tensor로 만드는 방법
# Image Scaling 이미지 스케일 동일하게 조정

# *****test 가 아니라 validation 으로 다 고쳐야함*******

from tensorflow.keras.preprocessing.image import ImageDataGenerator

train_datagen = ImageDataGenerator(rescale = 1./255)          # tensor 바꿔줌 1을 기준으로 데이터 정제
validation_datagen = ImageDataGenerator(rescale = 1./255)           # tensor로 바꾸기위해 1.(소수점) 255사이즈로 조정하겠다

train_generator = train_datagen.flow_from_directory(
                                            train_dir,
                                            target_size = ( 150, 150 ),   # 150x150짜리로
                                            batch_size = 20,              # 20개 단위로 데이터를 던지겠다(변환하겠다)
                                            class_mode = 'binary'         # 둘중 한개 선택
                                            )

validation_generator = test_datagen.flow_from_directory(                        
                                            validation_dir,
                                            target_size = ( 150, 150 ),   # 150x150짜리로
                                            batch_size = 20,
                                            class_mode = 'binary'         # 둘중 한개 선택
                                            )

In [None]:
# tensor로 나왔는지 확인
train_generator

In [None]:
for data_batch, labels_batch in train_generator:
    print('Batch Data Size: ', data_batch.shape)
    print('Batch Labels Size', labels_batch.shape)

In [None]:
history = model.fit_generator(
    train_generator,
    steps_per_epoch = 100,               # epoch 한번에 이미지 100개 단위로 돌림, 결과도 100개 단위로 계산됨, 결국 100개 단위로 처리
    epochs = 30,
    validation_data = test_generator,
    validation_steps = 50                 # vlaidation 50개 단위로 검증    
)

In [None]:
model.save('cats_and_dogs_small_1.0.h5')    # keras 파일은 .h5 확장자
import matplotlib.pyplot as plt
# 데이터 시각화

acc = history.history['accuracy']
val_acc = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(1, len(acc)+1)

plt.plot(epochs, acc, 'bo', label='Training accuracy')
plt.plot(epochs, val_acc, 'b-', label='Validation accuracy')
plt.title('Training and Validation accuracy')
plt.legend()

plt.figure()
plt.plot(epochs, loss, 'ro', label='Training loss')
plt.plot(epochs, val_loss, 'r-', label='Validaion loss')
plt.title('Training and Validation loss')
plt.legend()

In [None]:
# 데이터 증식
data = ImageDataGenerator(
    rotation_range = 40,        # 40% 정도 돌림
    width_shift_range = 0.2,    # 좌우로 20% 정도 이동
    height_shift_range = 0.2,    # 상하로 20% 정도 이동
    shear_range = 0.2,          # 20% 정도 기울임
    zoom_range = 0.2,
    horizontal_flip = True,     # 좌우반전
    fill_mode = 'nearest'       # 빈칸 채우기 : 근처에 있는 값
)

In [None]:
from tensorflow.keras.preprocessing import image


fnames = sorted([os.path.join(train_cats_dir, fname) for fname in os.listdir(train_cats_dir)])
img_path = fnames[3]
img = image.load_img(img_path, target_size=(150, 150))

x = image.img_to_array(img) # 이미지의 x 좌표
x = x.reshape((1,)+ x.shape)

i = 0
for batch in datagen.flow(x, batch_size=1):
    plt.figure(i)
    imgplot = plt.imshow(image.array_to_img(batch[0]))
    i += 1
    if i%4 ==0:
        break
        
plt.show()

In [None]:
train_datagen = ImageDataGenerator(    
    rescale=1./255,    
    rotation_range=40,    
    width_shift_range=0.2,    
    height_shift_range=0.2,    
    shear_range=0.2,    
    zoom_range=0.2,    
    horizontal_flip=True,)
# 검증 데이터는 증식되어서는 안 됩니다!
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(       
    # 타깃 디렉터리        
    train_dir,       
    # 모든 이미지를 150 × 150 크기로 바꿉니다        
    target_size=(150, 150),        
    batch_size=32,       
    # binary_crossentropy 손실을 사용하기 때문에 이진 레이블을 만들어야 합니다        
    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
    validation_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')
history = model.fit_generator(
    train_generator,
    steps_per_epoch=10,
    epochs=100,
    validation_data=validation_generator,
    validation_steps=50)