# Colaboratoryで実行する場合
以下を実行して、外部ファイルをダウンロードしてください。   
**このセルはColaboratoryを起動するたびに必要となります**   

In [None]:
##################################
### Colaboratoryのみ以下を実行 ###
##################################
import sys
if 'google.colab' in sys.modules:
    !wget -P ./img http://www.hal.t.u-tokyo.ac.jp/~yamakata/lecture/mediaproc/mediaproc6/yasuda.png
    !pip install tensorflow
    !pip install keras

# 補助演習：Data Augmentation

限られた訓練データを仮想的に増やすため、データを様々に加工して新しいデータを生成する処理です。   

ここでは画像のAugmentationのための関数 [ImageDataGenerator](https://keras.io/ja/preprocessing/image/#imagedatagenerator_1) を使用します。   
パラメータを変えて、どのような画像が生成されるか見てみましょう。



In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
from keras.preprocessing import image
import numpy as np

img = np.array(image.load_img('img/yasuda.png'))
plt.imshow(img)
plt.axis('off')

# 与えられた画像に対し、様々な処理を加えて新しい画像を生成するためジェネレータを作成
datagen = image.ImageDataGenerator(
        featurewise_center=False,  # 真理値．データセット全体で，入力の平均を0にします．
        samplewise_center=False,  # 真理値．各サンプルの平均を0にします．
        featurewise_std_normalization=False,  # 真理値．入力をデータセットの標準偏差で正規化します
        samplewise_std_normalization=False,  # 真理値．各入力をその標準偏差で正規化します．
        zca_whitening=False,  # 真理値．ZCA白色化を適用します．
        zca_epsilon=1e-06,  # ZCA白色化のイプシロン．デフォルトは1e-6
        rotation_range=20,  # 整数．画像をランダムに回転する回転範囲．
        width_shift_range=0.2, # 浮動小数点数（横幅に対する割合）．ランダムに水平シフトする範囲．
        height_shift_range=0.2, # 浮動小数点数（縦幅に対する割合）．ランダムに垂直シフトする範囲．
        shear_range=0.,  # 浮動小数点数．シアー強度（反時計回りのシアー角度）．
        zoom_range=0.,  # 浮動小数点数または[lower，upper]．ランダムにズームする範囲．浮動小数点数が与えられた場合，[lower, upper] = [1-zoom_range, 1+zoom_range]です．
        channel_shift_range=0.,  # 浮動小数点数．ランダムにチャンネルをシフトする範囲．
        fill_mode='nearest', # {"constant", "nearest", "reflect", "wrap"}のいずれか．デフォルトは 'nearest'です．指定されたモードに応じて，入力画像の境界周りを埋めます．
        cval=0.,  # 浮動小数点数または整数．fill_mode = "constant"のときに境界周辺で利用される値．
        horizontal_flip=True,  # 真理値．水平方向に入力をランダムに反転します．
        vertical_flip=False,  # 真理値．垂直方向に入力をランダムに反転します．
        rescale=None, # 画素値のリスケーリング係数．デフォルトはNone．Noneか0ならば，適用しない．それ以外であれば，(他の変換を行う前に) 与えられた値をデータに積算する．
        # set function that will be applied on each input
        preprocessing_function=None, # 各入力に適用される関数です．この関数は他の変更が行われる前に実行されます．この関数は3次元のNumpyテンソルを引数にとり，同じshapeのテンソルを出力するように定義する必要があります．
        data_format=None, # {"channels_first", "channels_last"}のどちらか．"channels_last"の場合，入力のshapeは(samples, height, width, channels)となり，"channels_first"の場合は(samples, channels, height, width)となります．デフォルトはKerasの設定ファイル~/.keras/keras.jsonのimage_data_formatの値です．一度も値を変更していなければ，"channels_last"になります．
        validation_split=0.0) # 浮動小数点数．検証のために予約しておく画像の割合（厳密には0から1の間）です．

# ジェネレータに画像を入力
# 本来ならミニバッチのすべての画像を一気に変換するが、今回は1枚なのでbatch_sizeは1
gen = datagen.flow(np.array([img]) , batch_size=1)  

# 30枚をランダムに生成
plt.figure(figsize=(10, 20))
for i in range(30):
    batches = next(gen)
    gen_img = batches[0].astype(np.uint8)

    plt.subplot(10, 3, i + 1)
    plt.imshow(gen_img)
    plt.axis('off')
plt.show()