[참고](https://github.com/rickiepark/handson-ml2/blob/master/12_custom_models_and_training_with_tensorflow.ipynb)

# 12.1 텐서플로 훑어보기
텐서플로가 제공하는 것
- GPU 지원
- 분산 컴퓨팅 지원
- JIT(just-in-time) 컴파일러를 포함. 파이썬 함수에서 **계산 그래프**(computation graph)를 추출한 다음 최적화하고 효율적으로 실행
- 훈련한 환경과 다른 환경에서 실행할 수 있음
- 자동 미분(autodiff) 기능과 RMSProp, Nadam 같은 고성능 옵티마이저 제공

# 12.2 넘파이처럼 텐서플로 사용하기
## 12.2.1 텐서와 연산


In [1]:
import tensorflow as tf

tf.constant([ [1., 2., 3.], [4., 5., 6.]]) # 행렬

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [2]:
tf.constant(42) # 스칼라

<tf.Tensor: shape=(), dtype=int32, numpy=42>

In [3]:
t = tf.constant([ [1., 2., 3.], [4., 5., 6.]])
t.shape

TensorShape([2, 3])

In [4]:
t.dtype

tf.float32

In [5]:
t[:, 1:]

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[2., 3.],
       [5., 6.]], dtype=float32)>

In [6]:
t[..., 1, tf.newaxis]

<tf.Tensor: shape=(2, 1), dtype=float32, numpy=
array([[2.],
       [5.]], dtype=float32)>

In [7]:
t + 10

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [8]:
tf.square(t)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)>

In [9]:
t @ tf.transpose(t)

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[14., 32.],
       [32., 77.]], dtype=float32)>

In [10]:
tf.add(t, 10)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [11]:
t.__add__(10)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

### 케라스의 저수준 API
`keras.backend`를 사용하는 예. 보통 별칭 `K`를 사용함.

In [12]:
from tensorflow import keras
K = keras.backend
K.square(K.transpose(t)) + 10

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[11., 26.],
       [14., 35.],
       [19., 46.]], dtype=float32)>

## 12.2.2 텐서와 넘파이

In [13]:
import numpy as np

a = np.array([2., 4., 5.])
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([2., 4., 5.])>

In [14]:
t.numpy()

array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)

In [15]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([ 4., 16., 25.])>

In [16]:
np.square(t)

array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)

넘파이는 기본으로 63비트 정밀도를 사용하지만 텐서플로는 32비트 정밀도를 사용하기 때문에 <br/> 
넘파이 배열로 텐서를 만들 때 `dtype=tf.float32`로 지정해야 함.

## 12.2.3 타입 변환
텐서플로는 어떤 타입 변환도 자동으로 수행하지 않는다.

In [17]:
# tf.constant(2.) + tf.constant(40) <--- 이렇게 하면 에러 남. 실수와 정수를 더할 수 없음.
# tf.constant(2.) + tf.constant(40., dtype=tf.float64) <--- 이렇게 해도 에러 남. 32비트와 64비트도 더할 수 없음.
tf.constant(2.) + tf.constant(40.) # 이렇게 해야 에러가 안 남!

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

In [18]:
# 타입 변환이 필요할 때는 `tf.cast()` 사용하면 됨!
t2 = tf.constant(40., dtype=tf.float64)
tf.constant(2.0) + tf.cast(t2, tf.float32)

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

## 12.2.4 변수
`tf.Tensor`는 변경이 불가능하기 때문에 변경되어야 하는 파라미터가 필요하면 `tf.Variable`를 사용하자.

In [19]:
v = tf.Variable([[1., 2., 3.], [4., 5., 6.]])
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [20]:
# assign 메서드를 사용하여 변숫값을 바꿀 수도 있음.
v.assign(2*v)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [21]:
v[0, 1].assign(42)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [22]:
v[:, 2].assign([0., 1.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  0.],
       [ 8., 10.,  1.]], dtype=float32)>

In [23]:
# scatter_nd_update() 메서드로 개별 원소를 수정할 수도 있음.
v.scatter_nd_update(indices=[[0, 0], [1, 2]], updates=[100., 200.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[100.,  42.,   0.],
       [  8.,  10., 200.]], dtype=float32)>

# 12.3 사용자 정의 모델과 훈련 알고리즘
## 12.3.1 사용자 정의 손실 함수
회귀 모델을 훈련하는 데 훈련 세트에 잡음 데이터가 조금 있을 때 후버(Huber) 손실을 사용하면 좋다.

In [24]:
def huber_fn(y_true, y_pred) :
    error = y_true - y_pred
    is_small_error = tf.abs(error) < 1
    squared_loss = tf.square(error) / 2
    linear_loss = tf.abs(error) - 0.5
    return tf.where(is_small_error, squared_loss, linear_loss)

In [25]:
# 캘리포니아 주택 가격으로 훈련
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

housing = fetch_california_housing()
X_train_full, X_test, y_train_full, y_test = train_test_split(
    housing.data, housing.target.reshape(-1, 1), random_state=42)
X_train, X_valid, y_train, y_valid = train_test_split(
    X_train_full, y_train_full, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_valid_scaled = scaler.transform(X_valid)
X_test_scaled = scaler.transform(X_test)

In [26]:
input_shape = X_train.shape[1:]

model = keras.models.Sequential([
    keras.layers.Dense(30, activation="selu", kernel_initializer="lecun_normal",
                       input_shape=input_shape),
    keras.layers.Dense(1),
])

In [27]:
model.compile(loss=huber_fn, optimizer="nadam", metrics=["mae"])

In [28]:
model.fit(X_train_scaled, y_train, epochs=2,
          validation_data=(X_valid_scaled, y_valid))

Epoch 1/2
Epoch 2/2


<tensorflow.python.keras.callbacks.History at 0x243990a11d0>

## 12.3.2 사용자 정의 요소를 가진 모델을 저장하고 로드하기

In [29]:
model.save("my_model_with_a_custom_loss.h5")

In [30]:
model = keras.models.load_model("my_model_with_a_custom_loss.h5",
                               custom_objects={"huber_fn" : huber_fn})

In [31]:
def create_huber(threshold=1.0) : 
    def huber_fn(y_true, y_pred) :
        error = y_true - y_pred
        is_small_error = tf.abs(error) < threshold
        squared_loss = tf.square(error) / 2
        linear_loss = threshold*tf.abs(error) - threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    return huber_fn
model.compile(loss=create_huber(2.0), optimizer="nadam")

`threshold` 값은 저장되지 않기 때문에 모델을 로드할 때 `threshold` 값을 지정해야 함.

In [32]:
model.save("my_model_with_a_custom_loss_threshold_2.h5")

In [33]:
model = keras.models.load_model("my_model_with_a_custom_loss_threshold_2.h5",
                                custom_objects={"huber_fn": create_huber(2.0)})

In [34]:
class HuberLoss(keras.losses.Loss):
    def __init__(self, threshold=1.0, **kwargs): 
        self.threshold = threshold
        super().__init__(**kwargs) # 이렇게 받은 값을 부모 클래스의 생성자에게 전달.
    def call(self, y_true, y_pred): # 레이블과 예측을 받고 모든 샘플의 손실을 계산.
        error = y_true - y_pred
        is_small_error = tf.abs(error) < self.threshold
        squared_loss = tf.square(error) / 2
        linear_loss  = self.threshold * tf.abs(error) - self.threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    def get_config(self): # 하이퍼파라미터 이름과 같이 매핑된 딕셔너리를 반환.
        base_config = super().get_config()
        return {**base_config, "threshold": self.threshold}

In [35]:
# 모델을 컴파일할 때 이 클래스의 인스턴스를 사용할 수 있음.
model.compile(loss=HuberLoss(2.), optimizer="nadam", metrics=["mae"])

In [36]:
model.save("my_model_with_a_custom_loss_class.h5")

In [37]:
# 모델을 저장할 때 임곗값도 저장됨.
model = keras.models.load_model("my_model_with_a_custom_loss_class.h5", # TODO: check PR #25956
                               custom_objects={"HuberLoss": HuberLoss})

## 12.3.3 활성화 함수, 초기화, 규제, 제한을 커스터마이징하기

In [38]:
keras.backend.clear_session()
np.random.seed(42)
tf.random.set_seed(42)

In [39]:
def my_softplus(z): # tf.nn.softplus(z) 값을 반환.
    return tf.math.log(tf.exp(z) + 1.0)

def my_glorot_initializer(shape, dtype=tf.float32):
    stddev = tf.sqrt(2. / (shape[0] + shape[1]))
    return tf.random.normal(shape, stddev=stddev, dtype=dtype)

def my_l1_regularizer(weights):
    return tf.reduce_sum(tf.abs(0.01 * weights))

def my_positive_weights(weights): # tf.nn.relu(weights) 값을 반환.
    return tf.where(weights < 0., tf.zeros_like(weights), weights)

In [40]:
layer = keras.layers.Dense(1, activation=my_softplus,
                           kernel_initializer=my_glorot_initializer,
                           kernel_regularizer=my_l1_regularizer,
                           kernel_constraint=my_positive_weights)

In [41]:
keras.backend.clear_session()
np.random.seed(42)
tf.random.set_seed(42)

In [42]:
class MyL1Regularizer(keras.regularizers.Regularizer):
    def __init__(self, factor):
        self.factor = factor
    def __call__(self, weights):
        return tf.reduce_sum(tf.abs(self.factor * weights))
    def get_config(self):
        return {"factor": self.factor}

## 12.3.4 사용자 정의 지표
- 손실 : 모델을 훈련하기 위해 사용하므로 미분 가능해야 하고 그레이디언트가 모든 곳에서 0이 아니어야 함. ex) 크로스 엔트로피
- 지표 : 모델을 평가할 때 사용. 미분 불능이거나 그레이디언트가 0인 부분이 있어도 됨. ex) 정확도

대부분의 경우 사용자 지표 함수와 손실 함수는 동일하게 여겨진다. 앞에서 만든 후버 손실 함수도 마찬가지.

In [43]:
model.compile(loss="mse", optimizer="nadam", metrics=[create_huber(2.0)])

일반적으로 각 배치에 대해서 정밀도의 평균을 기록하는데, <br/>
이게 항상 정밀도와 맞지 않을 때가 있기 때문에 실제 갯수를 기록할 필요가 있다. <br/>
`keras.metrics.Precision` 클래스가 그 역할을 해줌.

In [44]:
precision = keras.metrics.Precision()
precision([0, 1, 1, 1, 0, 1, 0, 1], [1, 1, 0, 1, 0, 1, 0, 1])

<tf.Tensor: shape=(), dtype=float32, numpy=0.8>

In [45]:
precision([0, 1, 0, 0, 1, 0, 1, 1], [1, 0, 1, 1, 0, 0, 0, 0])

<tf.Tensor: shape=(), dtype=float32, numpy=0.5>

- 스트리밍 지표(streaming metric, 또는 **상태가 있는 지표**stateful metric) : 배치마다 점진적으로 업데이트되는 지표 <br/>
- `result()` 매서드 : 현재 지푯값을 얻을 수 있음.
- `variables` 속성 : 변수를 확인할 수 있음.
- `reset_states()` 메서드 : 변수 초기화.

In [46]:
precision.result()

<tf.Tensor: shape=(), dtype=float32, numpy=0.5>

In [47]:
precision.variables

[<tf.Variable 'true_positives:0' shape=(1,) dtype=float32, numpy=array([4.], dtype=float32)>,
 <tf.Variable 'false_positives:0' shape=(1,) dtype=float32, numpy=array([4.], dtype=float32)>]

In [48]:
precision.reset_states() # 두 변수가 0.0으로 리셋됨.

In [49]:
precision.variables

[<tf.Variable 'true_positives:0' shape=(1,) dtype=float32, numpy=array([0.], dtype=float32)>,
 <tf.Variable 'false_positives:0' shape=(1,) dtype=float32, numpy=array([0.], dtype=float32)>]

In [50]:
# 전체 후버 손실과 지금까지 처리한 샘플 수를 기록하는 클래스
class HuberMetric(keras.metrics.Metric):
    def __init__(self, threshold=1.0, **kwargs):
        super().__init__(**kwargs) # 기본 매개변수 처리 (예를 들면, dtype)
        self.threshold = threshold
        #self.huber_fn = create_huber(threshold) # TODO: investigate why this fails
        self.total = self.add_weight("total", initializer="zeros") # 지표의 상태를 기록하기 위한 변수
        self.count = self.add_weight("count", initializer="zeros") # 윗줄은 손실의 합(total)을, 밑줄은 샘플 수(count)를 기록
    def huber_fn(self, y_true, y_pred): # 대체 방법
        error = y_true - y_pred
        is_small_error = tf.abs(error) < self.threshold
        squared_loss = tf.square(error) / 2
        linear_loss  = self.threshold * tf.abs(error) - self.threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    def update_state(self, y_true, y_pred, sample_weight=None): # 클래스를 함수처럼 사용할 때 호출됨
        metric = self.huber_fn(y_true, y_pred)
        self.total.assign_add(tf.reduce_sum(metric))
        self.count.assign_add(tf.cast(tf.size(y_true), tf.float32))
    def result(self): # 최종 결과를 계산하고 반환
        return self.total / self.count
    def get_config(self): # threshold 변수를 모델과 함께 저장
        base_config = super().get_config()
        return {**base_config, "threshold": self.threshold}

## 12.3.5 사용자 정의 층


In [51]:
# 가중치가 필요 없는 사용자 층 만들기
exponential_layer = keras.layers.Lambda(lambda x: tf.exp(x))

In [52]:
# 가중치를 가진 사용자 층 만들기
class MyDense(keras.layers.Layer):
    def __init__(self, units, activation=None, **kwargs): # 모든 하이퍼파라미터를 매개변수로 받는다.
        super().__init__(**kwargs) # kwargs가 기본 매개변수들을 처리할 수 있음.
        self.units = units
        self.activation = keras.activations.get(activation) # relu나 selu 같은 적절한 활성화 함수로 바꾼다.

    def build(self, batch_input_shape): # 층의 변수를 만드는 역할
        self.kernel = self.add_weight(
            name="kernel", shape=[batch_input_shape[-1], self.units],
            initializer="glorot_normal")
        self.bias = self.add_weight(
            name="bias", shape=[self.units], initializer="zeros")
        super().build(batch_input_shape) # 마지막에 호출해야 함.

    def call(self, X): # 이 층에서 필요한 연산 수행.
        return self.activation(X @ self.kernel + self.bias)

    def compute_output_shape(self, batch_input_shape): # 출력 크기 반환.
        return tf.TensorShape(batch_input_shape.as_list()[:-1] + [self.units])

    def get_config(self): # 활성화 함수의 전체 설정을 저장.
        base_config = super().get_config()
        return {**base_config, "units": self.units,
                "activation": keras.activations.serialize(self.activation)}

In [53]:
# 두 개의 입력과 세 개의 출력을 만드는 층. 시퀀셜 API에서는 사용 못 함.
class MyMultiLayer(keras.layers.Layer):
    def call(self, X):
        X1, X2 = X
        return X1 + X2, X1 * X2

    def compute_output_shape(self, batch_input_shape):
        batch_input_shape1, batch_input_shape2 = batch_input_shape
        return [batch_input_shape1, batch_input_shape2] # 올바르게 브로드캐스팅되어야 함.

훈련과 테스트에서 다르게 동작하는 층이 필요하다면 `call()` 메서드에 `training` 매개변수를 추가.

In [54]:
class AddGaussianNoise(keras.layers.Layer):
    def __init__(self, stddev, **kwargs):
        super().__init__(**kwargs)
        self.stddev = stddev

    def call(self, X, training=None):
        if training:
            noise = tf.random.normal(tf.shape(X), stddev=self.stddev)
            return X + noise
        else:
            return X

    def compute_output_shape(self, batch_input_shape):
        return batch_input_shape

## 12.3.6 사용자 정의 모델
`keras.Model` 클래스를 상속하여 생성자에서 층과 변수를 만들고 모델이 해야 할 작업을 `call()` 메서드에 구현하여 사용자 정의 모델 클래스를 만들 수 있음.

In [55]:
# 잔차 블록(ResidualBlock) 층 만들기
class ResidualBlock(keras.layers.Layer):
    def __init__(self, n_layers, n_neurons, **kwargs):
        super().__init__(**kwargs)
        self.hidden = [keras.layers.Dense(n_neurons, activation="elu",
                                          kernel_initializer="he_normal")
                       for _ in range(n_layers)]

    def call(self, inputs):
        Z = inputs
        for layer in self.hidden:
            Z = layer(Z)
        return inputs + Z

In [56]:
# 서브클래싱 API를 사용해 모델 정의
class ResidualRegressor(keras.models.Model):
    def __init__(self, output_dim, **kwargs):
        super().__init__(**kwargs)
        self.hidden1 = keras.layers.Dense(30, activation="elu",
                                          kernel_initializer="he_normal")
        self.block1 = ResidualBlock(2, 30)
        self.block2 = ResidualBlock(2, 30)
        self.out = keras.layers.Dense(output_dim)

    def call(self, inputs):
        Z = self.hidden1(inputs)
        for _ in range(1 + 3):
            Z = self.block1(Z)
        Z = self.block2(Z)
        return self.out(Z)

`Model` 클래스는 `Layer` 클래스의 서브클래스이므로 모델을 층처럼 정의할 수 있지만 <br/>
`compile()`, `fir()`, `evaluate()`, `predict()` 같은 추가 기능이 있고 `get_layers()` 메서드와 `save()` 메서드가 있음.

## 12.3.7 모델 구성 요소에 기반한 손실과 지표

In [57]:
# 사용자 정의 재구성 손실을 가지는 모델을 만드는 코드
class ReconstructingRegressor(keras.models.Model):
    def __init__(self, output_dim, **kwargs):
        super().__init__(**kwargs)
        self.hidden = [keras.layers.Dense(30, activation="selu",
                                          kernel_initializer="lecun_normal")
                       for _ in range(5)] # 다섯 개의 은닉층과 하나의 출력층으로 구성된 심층 신경망을 만든다.
        self.out = keras.layers.Dense(output_dim)
        # TODO: check https://github.com/tensorflow/tensorflow/issues/26260
        #self.reconstruction_mean = keras.metrics.Mean(name="reconstruction_error")

    def build(self, batch_input_shape): # 완전 연결 층을 하나 더 추가해서 모델의 입력을 재구성하는 데 사용.
        n_inputs = batch_input_shape[-1]
        self.reconstruct = keras.layers.Dense(n_inputs, name='recon')
        super().build(batch_input_shape)

    def call(self, inputs, training=None): # 재구성 손실을 계산.
        Z = inputs
        for layer in self.hidden:
            Z = layer(Z)
        reconstruction = self.reconstruct(Z)
        self.recon_loss = 0.05 * tf.reduce_mean(tf.square(reconstruction - inputs)) # 계산한 손실을 모델의 손실 리스트에 추가.
        
        #if training:
        #    result = self.reconstruction_mean(recon_loss)
        #    self.add_metric(result)
        return self.out(Z) # 은닉층의 출력을 출력층에 전달하여 얻은 출력값을 반환.
       
    def train_step(self, data):
        x, y = data

        with tf.GradientTape() as tape:
            y_pred = self(x)
            loss = self.compiled_loss(y, y_pred, regularization_losses=[self.recon_loss])

        gradients = tape.gradient(loss, self.trainable_variables)
        self.optimizer.apply_gradients(zip(gradients, self.trainable_variables))

        return {m.name: m.result() for m in self.metrics}

In [58]:
keras.backend.clear_session()
np.random.seed(42)
tf.random.set_seed(42)

In [59]:
model = ReconstructingRegressor(1)
model.compile(loss="mse", optimizer="nadam")
history = model.fit(X_train_scaled, y_train, epochs=5)
y_pred = model.predict(X_test_scaled)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


## 12.3.8 자동 미분을 사용하여 그레이디언트 계산하기

In [60]:
def f(w1, w2) :
    return 3* w1**2 + 2 * w1 * w2

In [61]:
# 파라미터가 바뀔 때마다 함수의 출력이 얼마나 변하는지 측엉해 도함수의 근삿값을 계산
w1, w2 = 5, 3
eps = 1e-6
(f(w1 + eps, w2) - f(w1, w2)) / eps

36.000003007075065

In [62]:
(f(w1, w2 + eps) - f(w1, w2)) / eps

10.000000003174137

In [63]:
# 자동 미분을 사용해보자
w1, w2 = tf.Variable(5.), tf.Variable(3.)
with tf.GradientTape() as tape:
    z = f(w1, w2)

gradients = tape.gradient(z, [w1, w2])

In [64]:
gradients

[<tf.Tensor: shape=(), dtype=float32, numpy=36.0>,
 <tf.Tensor: shape=(), dtype=float32, numpy=10.0>]

In [65]:
with tf.GradientTape() as tape:
    z = f(w1, w2)

dz_dw1 = tape.gradient(z, w1)

In [66]:
try:
    dz_dw2 = tape.gradient(z, w2) # 이렇게 하면 에러 난다는 뜻. gradient() 쓰면 테이프가 자동으로 지워져서 두 번 부르면 에러 뜸.
except RuntimeError as ex:
    print(ex)

A non-persistent GradientTape can only be used tocompute one set of gradients (or jacobians)


In [67]:
# gradient() 메서드를 한 번 이상 호출하고 싶다면
with tf.GradientTape(persistent=True) as tape:
    z = f(w1, w2)

dz_dw1 = tape.gradient(z, w1)
dz_dw2 = tape.gradient(z, w2) # works now!
del tape

In [68]:
dz_dw1, dz_dw2

(<tf.Tensor: shape=(), dtype=float32, numpy=36.0>,
 <tf.Tensor: shape=(), dtype=float32, numpy=10.0>)

In [69]:
# 변수가 아닌 다른 객체에 대한 그레이디언트를 계산하면 None이 뜸.
c1, c2 = tf.constant(5.), tf.constant(3.)
with tf.GradientTape() as tape:
    z = f(c1, c2)

gradients = tape.gradient(z, [c1, c2])

In [70]:
gradients

[None, None]

In [71]:
# 하지만 강제로 하게 할 수 있음.
with tf.GradientTape() as tape:
    tape.watch(c1)
    tape.watch(c2)
    z = f(c1, c2)

gradients = tape.gradient(z, [c1, c2])

In [72]:
gradients

[<tf.Tensor: shape=(), dtype=float32, numpy=36.0>,
 <tf.Tensor: shape=(), dtype=float32, numpy=10.0>]

In [73]:
# 신경망의 일부분에 그레이디언트가 역전파되지 않도록 막을 필요가 있을 때
def f(w1, w2):
    return 3 * w1 ** 2 + tf.stop_gradient(2 * w1 * w2)

with tf.GradientTape() as tape:
    z = f(w1, w2) # stop_gradient() 없을 때와 결과가 같음.

tape.gradient(z, [w1, w2])

[<tf.Tensor: shape=(), dtype=float32, numpy=30.0>, None]

In [74]:
# 수치적인 이슈. NaN 뜸.
x = tf.Variable(100.)
with tf.GradientTape() as tape:
    z = my_softplus(x)

tape.gradient(z, [x])

[<tf.Tensor: shape=(), dtype=float32, numpy=nan>]

In [75]:
# 좀 더 나은 softplus
@tf.custom_gradient
def my_better_softplus(z):
    exp = tf.exp(z)
    def my_softplus_gradients(grad):
        return grad / (1 + 1 / exp)
    return tf.math.log(exp + 1), my_softplus_gradients

## 12.3.9 사용자 정의 훈련 반복


In [76]:
keras.backend.clear_session()
np.random.seed(42)
tf.random.set_seed(42)

In [77]:
# 간단한 모델
l2_reg = keras.regularizers.l2(0.05)
model = keras.models.Sequential([
    keras.layers.Dense(30, activation="elu", kernel_initializer="he_normal",
                       kernel_regularizer=l2_reg),
    keras.layers.Dense(1, kernel_regularizer=l2_reg)
])

In [78]:
# 훈련 세트에서 샘플 배치를 랜덤하게 추출하는 함수
def random_batch(X, y, batch_size=32):
    idx = np.random.randint(len(X), size=batch_size)
    return X[idx], y[idx]

In [79]:
# 훈련 상태를 출력하는 함수
def print_status_bar(iteration, total, loss, metrics=None):
    metrics = " - ".join(["{}: {:.4f}".format(m.name, m.result()) # {:.4f} : 소숫점 뒤 자릿수가 4개인 실수
                         for m in [loss] + (metrics or [])])
    end = "" if iteration < total else "\n"
    print("\r{}/{} - ".format(iteration, total) + metrics,
          end=end)

In [80]:
# 실제 적용
n_epochs = 5
batch_size = 32
n_steps = len(X_train) // batch_size
optimizer = keras.optimizers.Nadam(lr=0.01)
loss_fn = keras.losses.mean_squared_error # mean_squared_error : 샘플 하나마다 손실을 반환.
mean_loss = keras.metrics.Mean()
metrics = [keras.metrics.MeanAbsoluteError()]

In [81]:
# 사용자 정의 훈련 반복

for epoch in range(1, n_epochs + 1):
    print("Epoch {}/{}".format(epoch, n_epochs))
    for step in range(1, n_steps + 1):
        X_batch, y_batch = random_batch(X_train_scaled, y_train)
        with tf.GradientTape() as tape: # 배치 하나를 위한 예측을 만들고 손실을 계산.
            y_pred = model(X_batch)
            main_loss = tf.reduce_mean(loss_fn(y_batch, y_pred)) # 배치에 대한 평균을 계산.
            loss = tf.add_n([main_loss] + model.losses) # tf.add_n() : 동일한 크기와 타입을 가진 텐서를 더하는 함수.
        gradients = tape.gradient(loss, model.trainable_variables)
        optimizer.apply_gradients(zip(gradients, model.trainable_variables))
        for variable in model.variables:
            if variable.constraint is not None:
                variable.assign(variable.constraint(variable))
        mean_loss(loss)
        for metric in metrics:
            metric(y_batch, y_pred)
        print_status_bar(step * batch_size, len(y_train), mean_loss, metrics)
    print_status_bar(len(y_train), len(y_train), mean_loss, metrics)
    for metric in [mean_loss] + metrics:
        metric.reset_states()

Epoch 1/5
11610/11610 - mean: 1.3955 - mean_absolute_error: 0.5722
Epoch 2/5
11610/11610 - mean: 0.6774 - mean_absolute_error: 0.5280
Epoch 3/5
11610/11610 - mean: 0.6351 - mean_absolute_error: 0.5177
Epoch 4/5
11610/11610 - mean: 0.6384 - mean_absolute_error: 0.5181
Epoch 5/5
11610/11610 - mean: 0.6440 - mean_absolute_error: 0.5222


In [99]:
for variable in model.variables :
    if variable.constraint is not None :
        variable.assign(variable.constraint(variable))

# 12.4 텐서플로 함수와 그래프


In [100]:
def cube(x) :
    return x**3

In [101]:
cube(2)

8

In [102]:
cube(tf.constant(2.0))

<tf.Tensor: shape=(), dtype=float32, numpy=8.0>

In [103]:
# 파이썬 함수를 텐서플로 함수로 바꾸기
tf_cube = tf.function(cube)
tf_cube

<tensorflow.python.eager.def_function.Function at 0x2439a4919b0>

In [104]:
tf_cube(2)

<tf.Tensor: shape=(), dtype=int32, numpy=8>

In [105]:
tf_cube(tf.constant(2.0))

<tf.Tensor: shape=(), dtype=float32, numpy=8.0>

In [106]:
# tf.function 데코레이터
@tf.function 
def tf_cube(x) :
    return x**3

In [107]:
# 원본 파이썬 함수가 필요하다면
tf_cube.python_function(2)

8

케라스는 함수를 자동으로 텐서플로 함수로 변환하는데, 바꾸지 못하게 하려면 모델을 만들 때 `dynamic=True`로 지정하면 됨. <br/>
다른 방법으로는 모델의 `compile()` 메서드를 호출할 때 `run_eagerly=True`로 지정.

기본적으로 텐서플로 함수는 호출에 사용되는 입력 크기와 데이터 타입에 맞춰 매번 새로운 그래프를 생성함으로써 다형성(polymorphism)을 처리.

파이썬 값으로 텐서플로 함수를 여러 번 호출하면 프로그램이 느려지고 메모리가 많이 사용됨.

## 12.4.1 오토그래프와 트레이싱
- 오토그래프(autograph) : 파이썬 함수의 소스 코드를 분석하여 `for`문, `while`문, `if`문 등과 같은 제어문을 모두 찾는 단계. <br/>
오토그래프는 함수의 모든 제어문을 텐서플로 연산으로 바꾼 없그레이드된 버전을 만든다. 


텐서플로가 업그레이드된 함수를 호출할 때 매개변수 값을 전달하는 대신 <br/>
**심볼릭 텐서**(symbolic tensor, 실제 값이 없고 이름, 타입, 크기만 가지는 텐서)를 전달하고 **그래프 모드**(graph mode)로 실행한다. 

최종 그래프는 트레이싱(tracing) 과정을 통해 생성된다.

`tf.autograph.to_code()`를 호출하면 생성된 함수의 소스 코드를 볼 수 있음. 

## 12.4.2 텐서플로 함수 사용 방법
1. 다른 라이브러리를 호출하면 트레이싱 과정에서 실행되는데 이것을 원치 않는다면 라이브러리 함수 대신 텐서플로 함수를 사용.
    - `np.random.rand()`를 `tf.random.uniform([])`로 바꾸면 호출할 때마다 난수가 생성된다.
    - 텐서플로에서 지원하지 않는 코드가 부수적인 작업을 하면 텐서플로 함수를 호출할 때 이 코드가 실행되지 않는다.
    - 어떤 임의의 코드를 `tf.py_function()`으로 감쌀 수 있지만 성능이 저하되고 이식성이 낮아진다는 단점이 있음.
2. 다른 파이썬 함수나 텐서플로 함수를 호출할 수 있지만 이런 함수들은 `@tf.function` 데코레이터를 적용할 필요가 있다.
3. 함수에서 텐서플로 변수를 만든다면 처음 호출될 때만 수행되어야 함. 
4. 파이썬 함수의 소스 코드는 텐서플로에서 사용 가능해야 함.
5. 텐서플로는 `for`문만 감지하기 때문에 `for i in range(x)` 대신 `for i in tf.range(x)`를 사용해야 함.
6. 성능면에서 반복문보다 가능한 한 벡터화된 구현을 사용하는 게 좋음.