# 8.2 딥드림

딥드림(DeepDream)은 합성곱 신경망이 학습한 표현을 사용하여 예술적으로 이미지를 조작하는 기법입니다.

### 8.2.1 케라스 딥드림 구현

ImageNet에서 훈련한 컨브넷을 가지고 시작하겠습니다. 케라스에는 이렇게 사용할 수 있는 컨브넷이 많습니다. VGG16, VGG19, Xception, ResNet50 등입니다.

#### 8-8 사전 훈련된 인셉션 V3 모델 로드하기

In [1]:
from keras.applications import inception_v3
from keras import backend as K

K.set_learning_phase(0)  # 모델을 훈련하지 않습니다. 이 명령은 모든 훈련 연산을 비활성화합니다.

model = inception_v3.InceptionV3(weights='imagenet',
                                include_top=False)  # 합성곱 기반 층만 사용한 인셉션 V3 네트워크를 만듭니다. 사전 훈련된 ImageNet 가중치와 함께 모델을 로드합니다.

Using TensorFlow backend.
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5


#### 코드 8-9 딥드림 설정하기

In [2]:
layer_contributions = {  # 층 이름과 계수를 매핑한 딕셔너리입니다. 최대화하려는 손실에 층의 활성화가 기여할 양을 정합니다. 층 이름은 내장된 인셉션 V3 애플리케이션에 하드코딩되어 있는 것입니다. model.summary()를 사용하면 모든 층 이름을 확인할 수 있습니다.
    'mixed2': 0.2,
    'mixed3': 3.,
    'mixed4': 2.,
    'mixed5': 1.5,
}

#### 코드 8-10 최대화할 손실 정의하기

In [4]:
layer_dict = dict([(layer.name, layer) for layer in model.layers])  # 층 이름과 층 객체를 매핑한 딕셔너리를 만듭니다.
loss = K.variable(0.)  # 손실을 정의하고 각 층의 기여 분을 이 스칼라 변수에 추가할 것입니다.
for layer_name in layer_contributions:
    coeff = layer_contributions[layer_name]
    activation = layer_dict[layer_name].output  # 층의 출력을 얻습니다.
    
    scaling = K.prod(K.cast(K.shape(activation), 'float32'))
    loss += coeff * K.sum(K.square(activation[:, 2: -2, 2: -2, :])) / scaling  # 층 특성의 L2 노름 제곱을 손실에 추가합니다. 이미지 테두리는 제외하고 손실에 추가합니다.

#### 코드 8-11 경사 상습법 과정

In [6]:
dream = model.input  # 이 텐서는 생성된 딥드림 이미지를 저장합니다.

grads = K.gradients(loss, dream)[0]  # 손실에 대한 딥드림 이미지의 그래디언트를 계산합니다.

grads /= K.maximum(K.mean(K.abs(grads)), 1e-7)  # 그래디언트를 정규화합니다(이 기교가 중요합니다).

# 주어진 입력 이미지에서 손실과 그래디언트 값을 계산할 케라스 Function 객체를 만듭니다.
outputs = [loss, grads]
fetch_loss_and_grads = K.function([dream], outputs)

def eval_loss_and_grads(x):
    outs = fetch_loss_and_grads([x])
    loss_value = outs[0]
    grad_values = outs[1]
    return loss_value, grad_values

# 이 함수는 경사 상승법을 여러 번 반복하여 수행합니다.
def gradient_ascent(x, iterations, step, max_loss=None):
    for i in range(iterations):
        loss_value, grad_values = eval_loss_and_grads(x)
        if max_loss is not None and loss_value > max_loss:
            break
        print('...', i, '번째 손실 :', loss_value)
        x += step * grad_values
    return x

#### 코드 8-12 연속적인 스케일에 걸쳐 경사 상승법 실행하기

In [10]:
import numpy as np

# 하이퍼파라미터를 바꾸면 새로운 효과가 만들어집니다.
step = 0.01  # 경사 상습법 단계 크기
num_octave = 3  # 경사 상승법을 실행할 스케일 단계 횟수
octave_scale = 1.4  # 스케일 간의 크기 비율

iterations = 20  # 스케일 단계마다 수행할 경사 상승법 횟수

max_loss = 10.  # 손실이 10보다 커지면 이상한 그림이 되는 것을 피하기 위해 경사 상승법 과정을 중지합니다.

base_image_path = './datasets/original_photo_deep_dream.jpg'  # 사용할 이미지 경로를 씁니다.

img = preprocess_image(base_image_path)  # 기본 이미지를 넘파이 배열로 로드합니다(이 함수는 코드 8-13에 정의되어 있습니다).

original_shape = img.shape[1:3]
# 경사 상승법을 실행할 스케일 크기를 정의한 튜플의 리스트를 준비합니다.
successive_shapes = [original_shape]
for i in range(1, num_octave):
    shape = tuple([int(dim / (octave_scale ** i))
                  for dim in original_shape])
    successive_shapes.append(shape)
    
successive_shapes = successive_shapes[::-1]  # 이 리스트를 크기 순으로 뒤집습니다.

# 이미지의 넘파이 배열을 가장 작은 스케일로 변경합니다.
original_img = np.copy(img)
shrunk_original_img = resize_img(img, successive_shapes[0])

for shape in successive_shapes:
    print('처리할 이미지 크기', shape)
    img = resize_img(img,shape)  # 딥드림 이미지의 스케일을 키웁니다.
    img = gradient_ascent(img,
                          # 경사 상승법을 실행하고 이미지를 변경합니다.
                         iterations=iterations,
                         step=step,
                         max_loss=max_loss)
    upscaled_shrunk_original_img = resize_img(shrunk_original_img, shape)  # 작게 줄인 원본 이미지의 스케일을 높입니다. 픽셀 경계가 보일 것입니다.
    same_size_original = resize_img(original_img, shape)  # 이 크기에 해당하는 원본 이미지의 고해상도 버전을 계산합니다.
    lost_detail = sample_size_original - upscaled_shrunk_original_img  # 이 두 이미지의 차이가 스케일을 높였을 때 손실된 디테일입니다.
    img += lost_detail  # 손실된 디테일을 딥드림 이미지에 다시 주입니다.
    shrunk_original_img = resize_img(original_img, shape)
    save_img(img, fname='dream_at_scale_' + str(shape) + '.png')
    
save_img(img, fname='./datasets/final_dream.png')

FileNotFoundError: [Errno 2] No such file or directory: './datasets/original_photo_deep_dream.jpg'

코드 8-13 유틸리티 함수

In [9]:
import scipy
from keras.preprocessing import image

def resize_img(img, size):
    img = np.copy(img)
    factors = (1,
              float(size[0]) / img.shape[1],
              float(size[1]) / img.shape[2],
              1)
    return scipy.ndimage.zoom(img, factors, order=1)

def save_img(img, fname):
    pil_img = deprocess_image(np.copy(img))
    image.save_img(fname, pil_img)
    
def preprocess_image(image_path):  # 사진을 열고 크기를 줄이고 인셉션 V3가 인식하는 텐서 포맷으로 변환하는 유틸리티 함수
    img = image.load_img(image_path)
    img = image.img_to_array(img)
    img = np.expand_dims(img, axis=0)
    img = inception_v3.preprocess_input(img)
    return img

def deprocess_image(x):  # 넘파이 배열을 적절한 이미지 포맷으로 변환하는 유틸리티 함수
    if K.image_data_format() == 'channels_first':
        x = x.reshape((3, x.shape[2], x.shape[3]))
        x = x.transpose((1, 2, 0))
    else:
        x = x.reshape((x.shape[1], x.shape[2], 3))
    # inception_v3.preprocess_input 함수에서 수행한 전처리 과정을 복원합니다.
    x /= 2.
    x += 0.5
    x *= 255.
    
    x = np.clip(x, 0, 255).astype('uint8')
    return x

### 8.2.2 정리
- 딥드림은 네트워크가 학습한 표현을 기반으로 컨브넷을 거꾸로 실행하여 입력 이미지를 생성합니다.