### 実装

CNNの選択は可視化に影響を与えることになる。<br>

In [1]:
# 学習済みのInception V3モデルを読み込む
from keras.applications import inception_v3
from keras import backend as K

# ここではモデルを訓練しないため、訓練関係の演算を全て無効にする。
K.set_learning_phase(0)

# InceptionV3ネットワークを畳み込みベースなしで構築
# このモデルは学習済みのImageNetの重み付きで読み込まれる
model = inception_v3.InceptionV3(weights='imagenet',
                                 include_top=False)

Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5


In [6]:
# DeepDreamの構成

#　層の名前を係数にマッピングするディクショナリ。この係数は最大化の対象となる
# 損失値にその層の活性化がどれくらい貢献するのかを示す。これらの層の名前は
# 組み込みのInception V3アプリケーションにハードコーディングされていることに注意。
# 全ての層の名前はmodel.summary()で確認可能。

layer_contributions = {
    'mixed2': 0.2,
    'mixed3': 3.,
    'mixed4': 2.,
    'mixed5': 1.5,
}

In [7]:
# 最大化の対象となる損失値を定義

# 層の名前を層のインスタンスにマッピングするディクショナリを作成
layer_dict = dict([(layer.name, layer) for layer in model.layers])

# 損失値を定義
loss = K.variable(0.)
for layer_name in layer_contributions:
    coeff = layer_contributions[layer_name]
    
    # 層の出力を取得
    activation = layer_dict[layer_name].output
    
    scaling = K.prod(K.cast(K.shape(activation), 'float32'))
    
    # 層の特徴量のL2ノルムをlossに加算
    # 非境界ピクセルのみをlossに適用することで、周辺効果を回避
    loss += coeff * K.sum(K.square(activation[:, 2: -2, 2: -2, :])) / scaling



In [8]:
# 勾配上昇法のプロセス

# 生成された画像（ドリーム）を保持するテンソル
dream = model.input

# ドリームの損失関数の勾配を計算
grads = K.gradients(loss, dream)[0]

# 勾配を正規化（重要）
grads /= K.maximum(K.mean(K.abs(grads)), 1e-7)

# 入力画像に基づいて損失と勾配の値を取得する取得するKeras関数を設定
outputs = [loss, grads]
fetch_loss_and_grads = K.function([dream], outputs)

def eval_loss_and_grads(x):
    outs = fetch_loss_and_grads([x])
    loss_value = outs[0]
    grad_values = outs[1]
    return loss_value, grad_values

# 勾配上昇法を指定された回数にわたって実行する関数
def gradient_ascent(x, iterations, step, max_loss=None):
    for i in range(iterations):
        loss_value, grad_values = eval_loss_and_grads(x)
        if max_loss is not None and loss_value > max_loss:
            break
        print('...Loss value at', i, ':', loss_value)
        x += step * grad_values
    return x

In [12]:
import scipy
from keras.preprocessing import image

# 画像のサイズを変更
def resize_img(img, size):
    img = np.copy(img)
    factors = (1,
               float(size[0]) / img.shape[1],
               float(size[1]) / img.shape[2],
               1)
    return scipy.ndimage.zoom(img, factors, order=1)

# 画像を保存
def save_img(img, fname):
    pil_img = deprocess_image(np.copy(img))
    scipy.misc.imsave(fname, pil_img)

# 画像を開いてサイズを変更し、Inception V3が処理できるテンソルに変換
def preprocess_image(image_path):
    img = image.load_img(image_path)
    img = image.img_to_array(img)
    img = np.expand_dims(img, axis=0)
    img = inception_v3.preprocess_input(img)
    return img

# テンソルを有効な画像に変換
def deprocess_image(x):
    
    if K.image_data_format() == 'channels_first':
        x = x.reshape((3, x.shape[2], x.shape[3]))
        x = x.transpose((1, 2, 0))
    else:
        x = x.reshape((x.shape[1], x.shape[2], 3))
    x /= 2.
    x += 0.5
    x *= 255.
    x = np.clip(x, 0, 255).astype('uint8')
    return x

In [13]:
import numpy as np

# これらのハイパーパラメータで色々な値を試してみることでも、
# 新しい効果が得られる

step = 0.01  # 勾配上昇法のステップサイズ
num_octave = 3  # 勾配上昇法を実行する尺度の数
octave_scale = 1.4  # 尺度間の拡大率
iterations = 20  # 尺度ごとの上昇ステップの数

max_loss = 10.

base_image_path = 'photo.jpg'

# image to Numpy
img = preprocess_image(base_image_path)

# 勾配上昇法を実行する様々な尺度を定義する形状タプルのリストを準備
original_shape = img.shape[1:3]
successive_shapes = [original_shape]
for i in range(1, num_octave):
    shape = tuple([int(dim / (octave_scale ** i)) for dim in original_shape])
    successive_shapes.append(shape)

# 形状リストを逆にして昇順になるようにする
successive_shapes = successive_shapes[::-1]

# 画像のNumpy配列のサイズを最も小さな尺度に変換
original_img = np.copy(img)
shrunk_original_img = resize_img(img, successive_shapes[0])

for shape in successive_shapes:
    print('Processing image shape', shape)
    img = resize_img(img, shape)
    img = gradient_ascent(img,
                          iterations=iterations,
                          step=step,
                          max_loss=max_loss)
    upscaled_shrunk_original_img = resize_img(shrunk_original_img, shape)
    same_size_original = resize_img(original_img, shape)
    lost_detail = same_size_original - upscaled_shrunk_original_img

    img += lost_detail
    shrunk_original_img = resize_img(original_img, shape)
    save_img(img, fname='dream_at_scale_' + str(shape) + '.png')

save_img(img, fname='final_dream.png')



Processing image shape (485, 326)
...Loss value at 0 : 1.6145931
...Loss value at 1 : 2.1762729
...Loss value at 2 : 2.9225261
...Loss value at 3 : 3.726101
...Loss value at 4 : 4.563347
...Loss value at 5 : 5.3408237
...Loss value at 6 : 6.0681214
...Loss value at 7 : 6.7484293
...Loss value at 8 : 7.4300327
...Loss value at 9 : 8.08388
...Loss value at 10 : 8.701821
...Loss value at 11 : 9.316474
...Loss value at 12 : 9.895308


`imsave` is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.
Use ``imageio.imwrite`` instead.
  from ipykernel import kernelapp as app


Processing image shape (680, 457)
...Loss value at 0 : 3.2396662
...Loss value at 1 : 4.692557
...Loss value at 2 : 5.8664327
...Loss value at 3 : 6.8481517
...Loss value at 4 : 7.752559
...Loss value at 5 : 8.560488
...Loss value at 6 : 9.339886
Processing image shape (952, 640)
...Loss value at 0 : 3.150486
...Loss value at 1 : 4.5101795
...Loss value at 2 : 5.647405
...Loss value at 3 : 6.6501184
...Loss value at 4 : 7.5567083
...Loss value at 5 : 8.450484
...Loss value at 6 : 9.28908
