## A conversation with Andrew Ng
* Augmentation을 위한 tensorflow의 쉬운 툴들 소개
* For avoiding overfitting
* Augmentation : 모델 학습 도중에 그때그때 이미지를 변형시킴
> * 직접 원본 이미지를 수정하는 것 X (not on-disk)
> * 메모리 상에서만 학습 시에 수행 O (in-memory)

## Introducing augmentation
* 제한된(적은) 데이터로 학습 시, overfitting이 일어나며 분류를 잘 못하게 됨
* 무한한 크기의 데이터로 완벽한 분류기를 만든다고 하면, 학습 시간이 매우 오래 걸릴 것
* 따라서 Augmentation 필요!

## Coding augmentation with ImageDataGenerator

In [None]:
# 이전 방식 (little augmentation)
train_datagen = ImageDataGenerator(rescale=1./255) # 이것부터가 little image augmentation (rescale)

In [None]:
# Updated to do image augmentation
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.4, # randomly move (proportion of the image), up to 40% of the image
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True, # 무작위 좌우반전
    fill_mode='nearest' # 위 작업에 의해 손실된 픽셀들을 채움 (uses neighbors)
)

## Demonstrating overfitting in cats vs. dogs
ImageDataGenerator에 각종 augmentation 설정 후에 overfitting이 일어나지 않음! (val_acc도 잘 올라가고, val_loss도 잘 떨어짐)

## Adding augmentation to cats vs. dogs
Data Augmentation 추가의 효과
* 처음엔 aug 하지 않았을 때보다 aug 했을 때 더 낮은 초기 acc
> random effect 때문!
* 점점 제자리(추세)를 잘 찾아감

## Exploring augmentation with horses vs. humans
* augmentation이 overfitting을 해결하는 만능 열쇠는 X!
> 이미지 다양성이 아직도 적을 수도 있음... **(여전히 train과 val이 비슷할 수 있음..!)**
* augmentation을 수행하면 **학습 데이터(train set)가 변형**되고, **검증 데이터(validation set)은 원래와 같으므로** 다른 두 모습으로 평가 가능!
* augmentation 후, training acc는 안정적으로 올라가지만 validation acc는 미친듯이 왔다갔다 함
> **image augmentation이 training set에만 random element를 적용하는 것이기 때문!** (validation set에는 같은 random 적용 X)