##### Copyright 2018 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# 이미지 분류

고양이 이미지와 강아지 이미지를 분류

- `tf.keras.Sequential`을 사용하여 이미지 분류기 생성
- `tf.keras.preprocessing.image.ImageDataGenerator`을 사용하여 데이터 로드

## Import packages

In [None]:
import tensorflow as tf

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten, Dropout, MaxPooling2D
from tensorflow.keras.preprocessing.image import ImageDataGenerator

import os
import numpy as np
import matplotlib.pyplot as plt

## 데이터 불러오기

Kaggle의 <a href="https://www.kaggle.com/c/dogs-vs-cats/data" target="_blank">Dogs vs Cats</a> 데이터셋의 filtering 버젼을 사용하여 학습
- "/tmp/" directory 에 데이터셋 다운로드 및 저장

In [None]:
_URL = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'

path_to_zip = tf.keras.utils.get_file('cats_and_dogs.zip', origin=_URL, extract=True)

PATH = os.path.join(os.path.dirname(path_to_zip), 'cats_and_dogs_filtered')

데이터셋은 다음과 같은 구조를 가짐

<pre>
<b>cats_and_dogs_filtered</b>
|__ <b>train</b>
    |______ <b>cats</b>: [cat.0.jpg, cat.1.jpg, cat.2.jpg ....]
    |______ <b>dogs</b>: [dog.0.jpg, dog.1.jpg, dog.2.jpg ...]
|__ <b>validation</b>
    |______ <b>cats</b>: [cat.2000.jpg, cat.2001.jpg, cat.2002.jpg ....]
    |______ <b>dogs</b>: [dog.2000.jpg, dog.2001.jpg, dog.2002.jpg ...]
</pre>

다음과 같이 파일 path 세팅을 해줌

In [None]:
train_dir = os.path.join(PATH, 'train')
validation_dir = os.path.join(PATH, 'validation')

In [None]:
train_cats_dir = os.path.join(train_dir, 'cats')  # directory with our training cat pictures
train_dogs_dir = os.path.join(train_dir, 'dogs')  # directory with our training dog pictures
validation_cats_dir = os.path.join(validation_dir, 'cats')  # directory with our validation cat pictures
validation_dogs_dir = os.path.join(validation_dir, 'dogs')  # directory with our validation dog pictures

### 데이터 분석

Training / validation directory 안에 고양이, 강아지 이미지 갯수 살펴보기

In [None]:
num_cats_tr = len(os.listdir(train_cats_dir))
num_dogs_tr = len(os.listdir(train_dogs_dir))

num_cats_val = len(os.listdir(validation_cats_dir))
num_dogs_val = len(os.listdir(validation_dogs_dir))

total_train = num_cats_tr + num_dogs_tr
total_val = num_cats_val + num_dogs_val

In [None]:
print('total training cat images:', num_cats_tr)
print('total training dog images:', num_dogs_tr)

print('total validation cat images:', num_cats_val)
print('total validation dog images:', num_dogs_val)
print("--")
print("Total training images:", total_train)
print("Total validation images:", total_val)

전처리 및 네트워크 학습에 필요한 parameter 설정

In [None]:
batch_size = 128
epochs = 15
IMG_HEIGHT = 150
IMG_WIDTH = 150

## 데이터 준비

네트워크로 투입하기 전, 이미지 Tensor의 데이터 타입을 float로 바꿔줘야 함

1. 이미지를 읽어들여서
2. 이미지의 내용을 decode 하고 RGB format으로 변경
3. Float tensor로 변경
4. Tensor value 0 에서 1 사이의 값을 갖도록 변경


`ImageDataGenerator` class 를 사용하면 위와 같은 전처리를 쉽게 수행할 수 있음

In [None]:
train_image_generator = ImageDataGenerator(rescale=1./255) # Generator for our training data
validation_image_generator = ImageDataGenerator(rescale=1./255) # Generator for our validation data

Training 및 validation 이미지에 대한 generator를 정의한 후 `flow_from_directory` 함수를 통해 위의 전처리 수행 및 이미지 사이즈 변경 (신경망의 차원을 맞춰주기 위해서)

In [None]:
train_data_gen = train_image_generator.flow_from_directory(batch_size=batch_size,
                                                           directory=train_dir,
                                                           shuffle=True,
                                                           target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                           class_mode='binary')

In [None]:
val_data_gen = validation_image_generator.flow_from_directory(batch_size=batch_size,
                                                              directory=validation_dir,
                                                              target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                              class_mode='binary')

### 학습 이미지 시각화

`matplotlib`을 이용하여 학습 도중 batch를 추출, 이미지를 시각화

In [None]:
sample_training_images, _ = next(train_data_gen)

`next`가 데이터셋의 다음 배치를 return (`(x_train, y_train)`의 format)
- 여기서 `x_train`은 training feature를 의미
- `y_train`은 정답 label을 의미


In [None]:
# This function will plot images in the form of a grid with 1 row and 5 columns where images are placed in each column.
def plotImages(images_arr):
    fig, axes = plt.subplots(1, 5, figsize=(20,20))
    axes = axes.flatten()
    for img, ax in zip( images_arr, axes):
        ax.imshow(img)
        ax.axis('off')
    plt.tight_layout()
    plt.show()

In [None]:
plotImages(sample_training_images[:5])

## 모델 생성

In [None]:
model = Sequential([
    Conv2D(16, 3, padding='same', activation='relu', input_shape=(IMG_HEIGHT, IMG_WIDTH ,3)),
    MaxPooling2D(),
    Conv2D(32, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Conv2D(64, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Flatten(),
    Dense(512, activation='relu'),
    Dense(1)
])

### 모델 컴파일


In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              metrics=['accuracy'])

### 모델 요약

In [None]:
model.summary()

### 모델 학습

In [None]:
history = model.fit(
    train_data_gen,
    steps_per_epoch=total_train // batch_size,
    epochs=epochs,
    validation_data=val_data_gen,
    validation_steps=total_val // batch_size
)

### 학습결과 시각화

In [None]:
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

loss=history.history['loss']
val_loss=history.history['val_loss']

epochs_range = range(epochs)

plt.figure(figsize=(8, 8))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

## Overfitting

위의 plot에서 overfitting 발생한 것을 확인할 수 있음
- 학습 sample의 갯수가 작을 때 모델은 noise나 detail까지 학습을 해버리기 때문에 overfitting이 발생
- 학습에 사용되지 않은 새로운 dataset을 모델이 평가하는데 어렵게 됨
- overfitting을 극복하기 위한 다양한 방법이 존재

## Data augmentation

Overfitting을 극복하기 위한 한 가지 방법
- 현재 존재하는 학습 sample을 변형시켜서 학습 sample의 숫자를 늘리는 방법
- 이때, 변형 결과는 학습에 사용해도 되는 실제 이미지와 비슷한 것이어야 함
- 모델이 다양한 이미지를 경험함으로서 일반화를 더 잘 시키기를 기대

`tf.keras` 의 `ImageDataGenerator` class 를 사용


### Data augmentation 시각화

random horizontal filp 을 적용시키고, 이미지가 잘 변형되었는지 시각화시켜 확인


### Horizontal flip 적용

`ImageDataGenerator` class에 `horizontal_flip=True` 를 사용하여 적용

In [None]:
image_gen = ImageDataGenerator(rescale=1./255, horizontal_flip=True)

In [None]:
train_data_gen = image_gen.flow_from_directory(batch_size=batch_size,
                                               directory=train_dir,
                                               shuffle=True,
                                               target_size=(IMG_HEIGHT, IMG_WIDTH))


한 학습 이미지를 선택하여 augmentation을 다섯 번 적용

In [None]:
augmented_images = [train_data_gen[0][0][0] for i in range(5)]

In [None]:
# Re-use the same custom plotting function defined and used
# above to visualize the training images
plotImages(augmented_images)

### 이미지 회전 적용

45도의 범위 안에서 랜덤하게 학습 이미지를 회전시키는 augmentation을 적용

In [None]:
image_gen = ImageDataGenerator(rescale=1./255, rotation_range=45)

In [None]:
train_data_gen = image_gen.flow_from_directory(batch_size=batch_size,
                                               directory=train_dir,
                                               shuffle=True,
                                               target_size=(IMG_HEIGHT, IMG_WIDTH))

augmented_images = [train_data_gen[0][0][0] for i in range(5)]

In [None]:
plotImages(augmented_images)

### 이미지 확대 적용

최대 50% 까지 이미지를 확대하는 augmentation 적용

In [None]:
# zoom_range from 0 - 1 where 1 = 100%.
image_gen = ImageDataGenerator(rescale=1./255, zoom_range=0.5) # 

In [None]:
train_data_gen = image_gen.flow_from_directory(batch_size=batch_size,
                                               directory=train_dir,
                                               shuffle=True,
                                               target_size=(IMG_HEIGHT, IMG_WIDTH))

augmented_images = [train_data_gen[0][0][0] for i in range(5)]

In [None]:
plotImages(augmented_images)

### 여러 augmentation 전부 적용

Rescale, 회전, 수직 및 수평 이동, 대칭, 확대 등 여러 augmentation 전부 적용

In [None]:
image_gen_train = ImageDataGenerator(
                    rescale=1./255,
                    rotation_range=45,
                    width_shift_range=.15,
                    height_shift_range=.15,
                    horizontal_flip=True,
                    zoom_range=0.5
                    )

In [None]:
train_data_gen = image_gen_train.flow_from_directory(batch_size=batch_size,
                                                     directory=train_dir,
                                                     shuffle=True,
                                                     target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                     class_mode='binary')

위와 똑같이 5번 적용시켜 시각화

In [None]:
augmented_images = [train_data_gen[0][0][0] for i in range(5)]
plotImages(augmented_images)

### Validation data generator 생성

`ImageDataGenerator`를 사용하여 validation 이미지들을 batch로 전환
- augmentation은 일반적으로 학습 데이터에만 적용시키기 때문에 validation 에는 사용하지 않음


In [None]:
image_gen_val = ImageDataGenerator(rescale=1./255)

In [None]:
val_data_gen = image_gen_val.flow_from_directory(batch_size=batch_size,
                                                 directory=validation_dir,
                                                 target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                 class_mode='binary')

## Dropout

Dropout 적용 시 랜덤하게 drop out 될 node의 확률을 지정해주게 됨

## Dropout 사용하여 신경망 생성

In [None]:
model_new = Sequential([
    Conv2D(16, 3, padding='same', activation='relu', 
           input_shape=(IMG_HEIGHT, IMG_WIDTH ,3)),
    MaxPooling2D(),
    Dropout(0.2),
    Conv2D(32, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Conv2D(64, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Dropout(0.2),
    Flatten(),
    Dense(512, activation='relu'),
    Dense(1)
])

### 모델 컴파일 및 요약

In [None]:
model_new.compile(optimizer='adam',
                  loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
                  metrics=['accuracy'])

model_new.summary()

### 모델 학습

In [None]:
history = model_new.fit(
    train_data_gen,
    steps_per_epoch=total_train // batch_size,
    epochs=epochs,
    validation_data=val_data_gen,
    validation_steps=total_val // batch_size
)

### 모델 학습 시각화

이전보다 overfitting이 사라진 것을 확인
- 이전보다 더 학습시켜 accuracy를 더 향상시킬 수 있음

In [None]:
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs_range = range(epochs)

plt.figure(figsize=(8, 8))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()