In [1]:
from keras.applications import inception_v3
from keras.preprocessing import image
from keras import backend as K

import numpy as np

import scipy

from imageio import imwrite

Using TensorFlow backend.


https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/8.2-deep-dream.ipynb

In [2]:
K.set_learning_phase(0) #Так как модель не будет обучаться, то запретим все операции, имеющие отношение к обучению

W0905 12:28:30.657701 139776469559104 deprecation_wrapper.py:119] From /usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:66: The name tf.get_default_graph is deprecated. Please use tf.compat.v1.get_default_graph instead.



Основная идея:<br>
Максимизировать активации выбранных слоев, чтобы их фильтры проявились на исходном изображении. <br>
Максимизация выполняется с помощью градиентного восхождения.

In [3]:
base_image_path = './Images for DeepDream (8.2)/field.jpg'
main_folder_path = './Images for DeepDream (8.2)/'
generating_folder_path = './Images for DeepDream (8.2)/generated_pictures/'

Вспомогательные функции

In [4]:
def resize_img(img, size):
    img = np.copy(img)
    factors = (1,
             float(size[0]) / img.shape[1],
             float(size[1]) / img.shape[2],
             1)
    return scipy.ndimage.zoom(img, factors, order = 1)

def save_img(img, fname):
    pil_img = deprocess_image(np.copy(img))
    imwrite(fname, pil_img)

def preprocess_image(image_path):
    img = image.load_img(image_path)
    img = image.img_to_array(img)
    img = np.expand_dims(img, axis = 0)
    img = inception_v3.preprocess_input(img)
    return img

def deprocess_image(x):
    if K.image_data_format() == 'channels_first':
        x = x.reshape((3, x.shape[2], x.shape[3]))
        x = x.transpose((1, 2, 0))
    else:
        x = x.reshape((x.shape[1], x.shape[2], 3))
    x /= 2.
    x += 0.5
    x *= 255.
    x = np.clip(x, 0, 255).astype('uint8')
    return x

In [5]:
model = inception_v3.InceptionV3(weights = 'imagenet',
                                 include_top = False)

W0905 12:28:34.348684 139776469559104 deprecation_wrapper.py:119] From /usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:541: The name tf.placeholder is deprecated. Please use tf.compat.v1.placeholder instead.

W0905 12:28:34.443398 139776469559104 deprecation_wrapper.py:119] From /usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:4432: The name tf.random_uniform is deprecated. Please use tf.random.uniform instead.

W0905 12:28:34.506173 139776469559104 deprecation_wrapper.py:119] From /usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:190: The name tf.get_default_session is deprecated. Please use tf.compat.v1.get_default_session instead.

W0905 12:28:34.507011 139776469559104 deprecation_wrapper.py:119] From /usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:197: The name tf.ConfigProto is deprecated. Please use tf.compat.v1.ConfigProto instead.

W0905 12:28:43.049032 139776469559104 depre

Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5


In [7]:
model.summary()

Model: "inception_v3"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_1 (InputLayer)            (None, None, None, 3 0                                            
__________________________________________________________________________________________________
conv2d_1 (Conv2D)               (None, None, None, 3 864         input_1[0][0]                    
__________________________________________________________________________________________________
batch_normalization_1 (BatchNor (None, None, None, 3 96          conv2d_1[0][0]                   
__________________________________________________________________________________________________
activation_1 (Activation)       (None, None, None, 3 0           batch_normalization_1[0][0]      
_______________________________________________________________________________________

In [8]:
# Определем степень вклада в общие потери выбранных слоев через коэфициенты словаря
layer_contributions = {
    'mixed2': 0.2,
    'mixed3': 3.,
    'mixed4': 2.,
    'mixed5': 1.5,
    'mixed6': 2.,
    'mixed7': 2.5
}

Определем тензор, содержащий потери: взвешенную сумму L2-норм активаций выбранных выше слоев.

In [9]:
layer_dict = dict([(layer.name, layer) for layer in model.layers])

loss = K.variable(0.)
for layer_name in layer_contributions:
    coeff = layer_contributions[layer_name]
    activation = layer_dict[layer_name].output #Выходной тензор слоя
    
    # K.cast - change dtype of tensor data https://www.tensorflow.org/api_docs/python/tf/keras/backend/cast
    # K.prod  - Multiplies the values in a tensor, alongside the specified axis https://www.tensorflow.org/api_docs/python/tf/keras/backend/prod
    scaling = K.prod(K.cast(K.shape(activation), 'float32')) #get multiplication of tensor shapes
    
    # We avoid border artifacts by only involving non-border pixels in the loss.
    loss += coeff * K.sum(K.square(activation[:, 2: -2, 2: -2, :])) / scaling

W0905 12:30:17.937252 139776469559104 variables.py:2429] Variable += will be deprecated. Use variable.assign_add if you want assignment to the variable value or 'x = x + y' if you want a new python Tensor object.


Настроим процесс градиентного восхождения

In [10]:
dream = model.input #Тензор хранящий сгенерированное изображение


grads = K.gradients(loss, dream)[0]
grads /= K.maximum(K.mean(K.abs(grads)), 1e-7) #Нормализация градиентов (см пример с визуализацией фильтров из 4.3)

outputs = [loss, grads]
fetch_loss_and_grads = K.function([dream], outputs) # outputs с учетом тензора dream

In [11]:
def eval_loss_and_grads(x):
    outs = fetch_loss_and_grads([x])
    loss_value = outs[0]
    grads_values = outs[1]
    return loss_value, grads_values

def gradient_ascent(x, iterations, step, max_loss = None):
    for i in range(iterations):
        loss_value, grad_values = eval_loss_and_grads(x)
        if max_loss is not None and loss_value > max_loss:
            break
        print('...Loss value at', i, ":", loss_value)
        x += step * grad_values
    return x    

Теперь можно настроить сам алгоритм DeepDream. <br>
Определим список масштабов (октав), в которых будут обрабатываться изображения. Каждый следующий больше предыдущего в 1,4 раза. <br>

Для каждого последующего масштаба выполняется градиентное восхождение для минимизации потерь. Таким образом, после каждой итерации изображение будет увеличиваться на 40%. 

Во избежание эффекта мозаичности, поле каждого изменения масштаба в большую картинку будут внедрятся элементы меньшей. Это возможно, так как нам известен вид исходного изображения в увеличенном масштабе.

In [13]:
step = 0.003
num_octave = 7
octave_scale = 1.1
iterations = 100 #Число шагов восхождения для каждого масштаба

max_loss = 6.

img = preprocess_image(base_image_path)

original_shape = img.shape[1:3]
successive_shapes = [original_shape]

#Генерация списков кортежей shape, определяющие разные масштабы для восхождения 
for i in range(1, num_octave):
    shape = tuple([int(dim / (octave_scale ** i)) 
                   for dim in original_shape])
    successive_shapes.append(shape)

successive_shapes = successive_shapes[::-1] #Переворачиваем, чтобы кортежи шли в порядке возрастания

original_img = np.copy(img)
shrunk_original_img = resize_img(img, successive_shapes[0]) # Умеьшаем исходную картинку до начального, наименьшего масштаба

for shape in successive_shapes:
    print('Processing image shape', shape)
    img = resize_img(img, shape) #Увеличение масштаба изображения
    img = gradient_ascent(img,
                         iterations = iterations,
                         step = step,
                         max_loss  =max_loss)
    upscaled_shrunk_original_img = resize_img(shrunk_original_img, shape)
    same_size_original = resize_img(original_img, shape) #Копия оригинального изображения в большем разрешении
    lost_detail = same_size_original - upscaled_shrunk_original_img
    
    img += lost_detail #Добавляем утерянные детали, избегаем мозаичности
    shrunk_original_img = resize_img(original_img, shape)
    save_img(img, fname = generating_folder_path + 'dream_at_scale_' + str(shape) + '.png')
    
save_img(img, fname = main_folder_path + 'final_dream.png')
    


Processing image shape (382, 722)
...Loss value at 0 : 2.240786
...Loss value at 1 : 2.7046685
...Loss value at 2 : 3.1732183
...Loss value at 3 : 3.6484675
...Loss value at 4 : 4.1482496
...Loss value at 5 : 4.6209335
...Loss value at 6 : 5.0883074
...Loss value at 7 : 5.5340457
...Loss value at 8 : 5.955046
Processing image shape (420, 794)
...Loss value at 0 : 3.8935394
...Loss value at 1 : 4.7335157
...Loss value at 2 : 5.3473735
...Loss value at 3 : 5.8793855
Processing image shape (462, 874)
...Loss value at 0 : 4.326119
...Loss value at 1 : 5.160784
...Loss value at 2 : 5.7542257
Processing image shape (508, 961)
...Loss value at 0 : 4.397387
...Loss value at 1 : 5.204374
...Loss value at 2 : 5.776157
Processing image shape (559, 1057)
...Loss value at 0 : 4.4658165
...Loss value at 1 : 5.275616
...Loss value at 2 : 5.842277
Processing image shape (615, 1163)
...Loss value at 0 : 4.506467
...Loss value at 1 : 5.301674
...Loss value at 2 : 5.879417
Processing image shape (677, 12