### 2. 넘파이처럼 텐서플로 사용하기
#### 1) 텐서와 연산

In [41]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

In [3]:
tf.constant([[1., 2., 3.], [4., 5., 6.]])

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [4]:
tf.constant(42)

<tf.Tensor: shape=(), dtype=int32, numpy=42>

In [5]:
t = tf.constant([[1., 2., 3.], [4., 5., 6.]])

print(t.shape)
print(t.dtype)

(2, 3)
<dtype: 'float32'>


##### 인덱스 참조

In [6]:
t[:, 1:]

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[2., 3.],
       [5., 6.]], dtype=float32)>

In [None]:
t[..., 1]  # t[:, 1]과 같은 역할

In [7]:
t[..., 1, tf.newaxis] # 축 하나 더 만들어주기

<tf.Tensor: shape=(2, 1), dtype=float32, numpy=
array([[2.],
       [5.]], dtype=float32)>

##### 연산
- 넘파이의 대부분의 연산을 제공하나 이름이 다른 함수도 있음
- 케라스 API는 keras.backend에 자체적인 저수준 API를 가지고 있음 (다른 케라스 구현에 적용시 사용)

In [9]:
t + 10   # tf.add(t, 10)과 동일

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [10]:
tf.square(t) 

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)>

In [11]:
# 행렬곱
t @ tf.transpose(t)  # tf.matmul(t, tf.transpose(t))와 동일

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[14., 32.],
       [32., 77.]], dtype=float32)>

#### 2) 텐서와 넘파이
- 호환됨 (서로 적용해줄 수 있음)
- But, 텐서플로 그래프의 장점을 활용하기 위해서는 텐서플로 연산만 사용해야

In [14]:
a = np.array([2., 4., 5.])
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([2., 4., 5.])>

In [15]:
t.numpy()

array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)

In [16]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([ 4., 16., 25.])>

In [17]:
np.square(t)

array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)

#### 3) 타입 변환
- 타입 변환은 성능을 크게 감소시킬 수 있음 => 어떠한 타입 변환도 자동으로 수행하지 않음
- tf.cast(data, type)으로 타입 변경가능

In [18]:
tf.constant(2.) + tf.constant(40)  # int와 float의 계산 : 오류

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a int32 tensor [Op:AddV2]

In [20]:
tf.cast(t, tf.float32)  # 타입 변환하기

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

#### 4) 변수
- tf.constant는 변경 불가 -> tf.Variable
- assign() 메서드로 변수값 바꿀 수 있음 (assign_add(), assign_sub()로 덧셈, 뺄셈 가능)
- scatter_update()나 scatter_nd_update()로 개별 원소(또는 슬라이스)를 수정 가능

In [23]:
v = tf.Variable([[1., 2., 3.], [4., 5., 6.]])
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [24]:
v.assign(2 * v)   # v가 바뀜

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [25]:
v[0, 1].assign(42)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [26]:
v[:, 2].assign([0., 1.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  0.],
       [ 8., 10.,  1.]], dtype=float32)>

In [27]:
v.scatter_nd_update(indices=[[0, 0], [1, 2]], updates=[100., 200.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[100.,  42.,   0.],
       [  8.,  10., 200.]], dtype=float32)>

- 일반적으로 케라스는 add_weight() 메서드로 변수 생성을 대신 처리해주기 때문에 실전에서 변수를 직접 만드는 일은 드뭄. 
- 또한, 모델파라미터는 일반적으로 옵티마이저가 업데이트하므로 수동으로 변수를 업데이트하는 일은 드뭄
- 다른 데이터 구조  
    : 희소 텐서(tf.SparseTensor), 텐서 배열(tf.TensorArray), 레그드 텐서, 문자열 텐서, 집합, 큐

### 3. 사용자 정의 모델과 훈련 알고리즘

#### 1) 사용자 정의 손실 함수
- 전체 손실의 평균이 아니라 샘플마다 하나의 손실을 가진 텐서로 반환하는 게 좋음  
-> 클래스 가중치나 샘플 가중치 적용가능

In [29]:
# 후버 손실 (tf.keras에서 지원하긴 함)

def huber_fn(y_true, y_pred):
    error = y_true - y_pred
    is_small_error = tf.abs(error) < 1
    squared_loss = tf.square(error) / 2
    linear_loss = tf.abs(error) - 0.5
    return tf.where(is_small_error, squared_loss, linear_loss)

In [None]:
model.compile(loss=huber_fn, optimizer='nadam')

#### 2) 사용자 정의 요소가진 모델 로드하기
- 저장하는 것에는 이상이 없지만,  
로드할 때는 사용자 정의 객체의 이름과 객체를 매핑한 딕셔너리를 전달해야!

In [None]:
model = keras.models.load_model('my_model_with_a_custom_loss.h5',
                               custom_objects={'huber_fn': huber_fn})

In [30]:
# threshold 추가하기 
# threshold 값은 저장 안 됨(keras.losses.Loss 클래스를 상속하고 get_config 메서드 구현해서 해결가능)

def create_huber(threshold=1.0):
    def huber_fn(y_true, y_pred):
        error = y_true - y_pred
        is_small_error = tf.abs(error) < threshold
        squared_loss = tf.square(error) / 2
        linear_loss = threshold * tf.abs(error) - threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)

model.compile(loss=create_huber(2.0), optimzer='nadam')
model = keras.models.load_model('my_model_with_a_custom_loss.h5',
                               custom_objects={'huber_fn': create_huber(2.0)})

In [None]:
# get_config 메서드 구현하기

# 모델을 저장할 때 케라스는 손실 객체의 get_config() 메서드를 호출하여 설정을 json형태로 저장
# 모델을 로드하면 from_config() 메서드를 호출
# -> get_config에 threshold 넣어주기

class HuberLoss(keras.losses.Loss):
    def __init__(self, threshold=1.0, **kwargs):
        self.threshold = threshold
        super().__init__(**kwargs)
        
    def call(self, y_true, y_pred):
        error = y_true - y_pred
        is_small_error = tf.abs(error) < self.threshold
        squared_loss = tf.square(error) / 2
        linear_loss = self.threshold * tf.abs(error) - self.threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    
    def get_config(self):   # threshold 파라미터 추가
        base_config = super().get_config()
        return {**base_config, 'threshold':self.threshold}

In [None]:
model.compile(loss=HuberLoss(2.), optimizer='nadam')
model = keras.models.load_model('my_model_with_a_custom_loss.h5',
                               custom_objects={'HuberLoss': HuberLoss})

#### 3) 활성화 함수, 초기화, 규제, 제한 커스터마이징하기

In [33]:
def my_softplus(z):   # keras.activations.softplus()나 tf.nn.softplus()와 동일
    return tf.math.log(tf.exp(z) + 1.0) 

def my_glorot_initializer(shape, dtype=tf.float32):  # keras.initializers.glorot_normal()과 동일
    stddev = tf.sqrt(2. / (shape[0] + shape[1]))
    return tf.random.normal(shape, stddev=stddev, dtype=dtype)

def my_l1_regularizer(weights):   # keras.regularizer.l1(0.01)과 동일
    return tf.reduce_sum(tf.abs(0.01 * weights))

def my_positive_weights(weights):  # tf.nn.relu(weights)와 동일
    return tf.where(weights < 0, tf.zeros_like(weights), weights)

In [None]:
layer = keras.layers.Dense(30, activaiton=my_softplus,
                          kernel_initializer=my_glorot_initializer,
                          kernel_regularizer=my_l1_regularizer,
                          kernel_constraint=my_positive_weights)

- 만약 클래스를 상속하여 손실함수를 만든다면 하이퍼파라미터를 저정해야!  
But, 이 경우에는 부모 클래스가 없기 때문에 호출할 필요 X

#### 4) 지표
- 손실과 지표는 개념적으로 다른 것은 아님
- __손실__(ex. 엔트로피) : __모델을 훈련하기 위해 경사 하강법에서 사용__ -> 미분 가능해야하고 그레디언트가 모든 곳에서 0이 아니어야!
- __지표__(ex. 정확도) : __모델을 평가할 때__ 사용 -> 미분이 가능하지 않거나 모든 곳에서 그레디언트가 0이어도 괜찮음
- 대부분의 경우 손실 함수를 지표 함수로 사용가능
- 지표로 __MAE나 MSE__를 많이 사용

In [None]:
model.compile(loss='mse', optimizer='nadam', metrics=[create_huber(2.0)])

##### 정밀도 계산 객체
- 훈련 손실은 한 에포크에서 배치 손실값들의 평균
- But, 배치 정밀도들의 평균은 전체의 정밀도와 다름  
=> 정밀도를 계산할 수 있는 객체 필요 : keras.metrics.Precision 클래스

In [42]:
precision = keras.metrics.Precision()

In [43]:
precision([0, 1, 1, 1, 0, 1, 0, 1], [1, 1, 0, 1, 0, 1, 0, 1]) # 실제값과 예측값

<tf.Tensor: shape=(), dtype=float32, numpy=0.8>

In [44]:
precision([0, 1, 0, 0, 1, 0, 1, 1], [1, 0, 1, 1, 0, 0, 0, 0]) # 전체 정밀도가 누적됨

<tf.Tensor: shape=(), dtype=float32, numpy=0.5>

- 전체 정밀도를 누적 => __스트리밍 지표(streaming metric, 또는 stateful metrics)__

In [45]:
# 추가적인 메서드

precision.result()  # 지금까지의 정밀도

<tf.Tensor: shape=(), dtype=float32, numpy=0.5>

In [46]:
precision.variables  # 진짜 양성과 거짓 양성을 기록한 변수

[<tf.Variable 'true_positives:0' shape=(1,) dtype=float32, numpy=array([4.], dtype=float32)>,
 <tf.Variable 'false_positives:0' shape=(1,) dtype=float32, numpy=array([4.], dtype=float32)>]

In [48]:
precision.reset_states()  # 초기화

##### 스트리밍 지표 만들기
- keras.metrics.Metric 클래스 상속

In [49]:
# 지금까지의 전체 후버 손실과 처리한 샘플 수를 기록하는 클래스
# kras.metrics.Mean 클래스를 상속하는 게 더 간단

class HuberMetric(keras.metrics.Metric):
    def __init__(self, threshold=1.0, **kwargs):
        super().__intit(**kwargs)
        self.threshold = threshold
        self.huber_fn = create_huber(threshold)
        self.total = self.add_weight('total', initializer='zeros')
        self.count = self.add_weight('count', initializer='zeros')
        
    def update_state(self, y_true, y_pred, sample_wieght=None):
        metric = self.huber_fn(y_true, y_pred)
        self.total.assign_add(tf.reduce_sum(metric))
        self.count.assignn_add(tf.cast(tf.size(y_ture), tf.float32))
        
    def result(self):
        return self.total / self.count

    def get_config(self):
        base_config = super().get_config()
        return {**base_config, 'threshold' : self.threshold}

#### 5) 사용자 정의층
##### 가중치가 없는 층 만들기 (Flatten, ReLU 등) -> keras.layer.Lambda 층으로 감싸기

In [51]:
# 지수 함수를 적용하는 층 (예측값의 스케일이 매우 다를 때 사용 ex. 0.01, 1, 100)

exponential_layer = keras.layers.Lambda(lambda x: tf.exp(x))

##### 상태(가중치 등)를 가진 층 만들기 -> keras.layers.Layer 상속하기

In [52]:
class MyDense(keras.layers.Layer):
    def __init__(self, units, activation=None, **kwargs):
        super().__init__(**kwargs)
        self.units = units
        self.activation = keras.activations.get(activation)
        
    def build(self, batch_input_shape):
        self.kernel = self.add_weight(
            name='kernel', shape=[batch_input_shape[-1], self.units],
            initializer='glorot_normal')
        self.bias = self.add_weight(
            name='bias', shape=[self.units], initializer='zero')
        super().build(batch_input_shape)  # 마지막에 호출해야
        
    def call(self, X):
        return self.activation(X @ self.kernel + self.bias)
    
    def compute_output_shape(self, batch_input_shape):
        return tf.TensorShape(batch_input_shape.as_list()[:-1] + [self.units])
    
    def get_config(self):
        base_config = super().get_config()
        return {**base_config, 'units': self.units,
               'activation': keras.activation.serialize(self.activation)}

##### 여러 가지 입력을 받는 (ex. Concatenate 층) 층
- 여러 가지 입력을 받는 층을 만드려면 call() 메서드에 모든 입력이 포함된 튜플을 매개변수 값으로 전달해야!   
(compute_output_shape() 메서드의 매개변수도 각 입력의 배치 크기를 담은 튜플이어야)

In [54]:
# 두 개의 입력과 세 개의 출력을 만드는 층

class MyMultiLayer(keras.layers.Layer):
    def call(self, X):
        X1, X2 = X
        return [X1 + X2, X1 * X2, X1 / X2]
    
    def compute_output_shape(self, batch_input_shape):
        b1, b2 = batch_input_shape
        return [b1, b1, b1]

##### 훈련과 테스트에서 다르게 동작하는 층 (ex. Dropout, Batch Normalization)
- call() 메서드에 training 매개변수를 추가하여 훈련세트인지 결정

In [55]:
# 훈련 시에만 가우스 잡음을 추가하는 층

class MyGaussianNoise(keras.layers.Layer):
    def __init__ (self, stddev, **kwargs): 
        super().__init__(**kwargs)
        self.stddev = stddev
        
    def call (self, X, training=None): 
        if training : 
            noise = tf.random.normal(tf.shape(X), stddev=self.stddev)
            return X + noise
        else : 
            return X
        
    def compute_output_shape(self, batch_input_shape): 
        return batch_input_shape

#### 6) 사용자 정의 모델
- keras.Model 클래스 상속
<img src="img/12_1.png" width='500'>

In [56]:
# ResidualBlock 층 만들기 (출력에 입력을 더하는 층)

class ResidualBlock(keras.layers.Layer):
    def __init__(self, n_layers, n_neurons, **kwargs):
        super().__init__(**kwarge)
        self.hidden = [keras.layers.Dense(n_neurons, activation='elu',
                                         kernel_initializer='he_normal')
                       for _ in range(n_layers)]
        
    def call(self, inputs):
        Z = inputs
        for layer in self.hidden:
            Z = layer(Z)
        return inputs + Z

In [57]:
# 모델 정의

class ResidualRegressor(keras.Model):
    def __init_(self, output_dim, **kwargs):
        super().__init__(**kwargs)
        self.hidden1 = keras.layers.Dense(30, activation='elu',
                                         kernel_initializer='he_normal')
        self.block1 = ResidualBlock(2, 30)
        self.black2 = ResidualBlock(2, 30)
        self.out = keras.layers.Dense(output_dim)
        
    def call(self, inputs):
        Z = self.hidden1(inputs)
        for _ in range(1 + 3):
            Z = self.block1(Z)
        Z = self.block2(Z)
        return self.out(Z)

#### 7) 모델 구성 요소에 기반한 손실과 지표
- 은닉층의 가중치나 활성화 함수 등과 같이 모델의 구성 요소에 기반한 손실 (규제나 모델의 내부 상황 모니터링 시)
- __재구성 손실__ : 맨 위 은닉층의 보조출력에서 나오는 손실로, 재구성과 입력 사이의 MSE
- 재구성 손실을 주 손실에 더하여 (유용하진 않더라도) 가능한 많은 정보를 유지하도록 유도 - 이따금 일반화 성능 향상 (규제 손실처럼 작동)

In [58]:
# 사용자 정의 재구성 손실을 가지는 모델

class ReconstructionRegressor(keras.Model):
    def __init__(self, output_dim, **kwargs):
        super().__init__(**kwargs)
        self.hidden = [keras.layers.Dense(30, activation='selu',
                                         kernel_initializer='lecun_normal')
                      for _ in range(5)]
        self.out = keras.layers.Dense(output_dim)
        
    def build(self, batch_input_shape):  # 완전 연결 층 추가 (입력을 재구성)
        n_inputs = batch_input_shape[-1]
        self.reconstruct = keras.layers.Dense(n_inputs)
        super().build(batch_input_shape)
    
    def call(self, inputs):
        Z = inputs
        for layer in self.hidden:
            Z = layer(Z)
        reconstruction = self.reconstruct(Z)
        recon_loss = tf.reduce_mean(tf.square(reconstruction - inputs))
        self.add_loss(0.05 * recon_loss)
        return self.out(Z)

#### 8) 자동 미분을 사용하여 그레디언트 계산하기

In [None]:
def f(w1, w2):
    return 3 * w1**2 + 2 * w1 * w2

##### 직접 계산하기

In [59]:
w1, w2 = 5, 3
eps = 1e-6
(f(w1 + eps, w2) - f(w1, w2)) / eps

36.000003007075065

##### 자동 미분
- tf.GradientTape 블럭 만들어 이 변수와 관련된 모든 연산 자동으로 계산하기

In [66]:
w1, w2 = tf.Variable(5.), tf.Variable(3.)

with tf.GradientTape() as tape:  
    z = f(w1, w2)
    
gradients = tape.gradient(z, [w1, w2])

In [62]:
gradients

[<tf.Tensor: shape=(), dtype=float32, numpy=36.0>,
 <tf.Tensor: shape=(), dtype=float32, numpy=10.0>]

##### 지속 가능한 테이프
- 한 번 이상 호출하려면 지속 가능한 테이프 만들고 (persistent=True)
- 리소스를 해제해야

In [72]:
# GradientTape 한번 이상 호출 시

with tf.GradientTape(persistent=True) as tape:  
    z = f(w1, w2)

dz_dw1 = tape.gradient(z, w1)
dz_dw2 = tape.gradient(z, w2)
print(dz_dw1)
print(dz_dw2)

del tape 

tf.Tensor(36.0, shape=(), dtype=float32)
tf.Tensor(10.0, shape=(), dtype=float32)


##### tf.constant 그레디언트 계산
- tf.Variable에 대해서만 그레디언트 계산해줌 (tf.constant는 X)
- 하지만 필요하면 기록하도록 강제할 수 있음

In [73]:
# tf.constant 그레디언트 계산

c1, c2 = tf.constant(5.), tf.constant(3.)

with tf.GradientTape() as tape:
    tape.watch(c1)
    tape.watch(c2)
    z = f(c1, c2)
    
gradients = tape.gradient(z, [c1, c2])
gradients

[<tf.Tensor: shape=(), dtype=float32, numpy=36.0>,
 <tf.Tensor: shape=(), dtype=float32, numpy=10.0>]

##### 신경망의 일부분에 그레디언트 역전파 되지 않도록 막기
- tf.stop_gradient

In [74]:
def f(w1, w2):
    return 3 * w1**2 + tf.stop_gradient(2 * w1 * w2)  # 두번째항은 그레디언트 X

#####  NaN이 출력되는 수치적인 이슈 

In [75]:
# softplus 함수 : (부동소수점 정밀도 오류로) 무한 나누기 무한 -> NaN

x = tf.Variable([100.])
with tf.GradientTape() as tape:
    z = my_softplus(x)

tape.gradient(z, [x])

[<tf.Tensor: shape=(1,), dtype=float32, numpy=array([nan], dtype=float32)>]

In [76]:
# 해결 방법 : @tf.custom_gradient 데코레이터 사용하고 일반 출려과 그레디언트 반환

@tf.custom_gradient
def my_better_softplus(z):
    exp = tf.exp(z)
    def my_softplus_gradients(grad):
        return grad / (1 + 1 / exp)
    return tf.math.log(exp + 1), my_softplus_gradients

#### 9) 사용자 정의 훈련 반복
- fit() 메서드의 유연성 충분하지 않는 경우 (ex. 두 개의 옵티마이저를 사용할 때)
- 극도의 유연성이 필요한 것이 아니라면 fit 메서드 사용하기

### 4. 텐서플로 함수와 그래프

In [77]:
def cube(x):
    return x ** 3

print(cube(2))
print(cube(tf.constant(2.0)))

8
tf.Tensor(8.0, shape=(), dtype=float32)


In [82]:
tf_cube = tf.function(cube)  # 파이썬 함수를 텐서플로 함수로 바꿔주기
tf_cube

<tensorflow.python.eager.def_function.Function at 0x1fcd590ca08>

In [83]:
print(tf_cube(2))
print(tf_cube(tf.constant(2.0)))

tf.Tensor(8, shape=(), dtype=int32)
tf.Tensor(8.0, shape=(), dtype=float32)


In [84]:
# (다른 방법) @tf.function 데코레이터 사용

@tf.function
def tf_cube(x):
    return x ** 3

In [85]:
tf_cube(2)

<tf.Tensor: shape=(), dtype=int32, numpy=8>

In [86]:
tf_cube.python_function(2)  # 원본 파이썬 함수가 필요시

8

- 사용자 정의 손실, 지표, 함수들을 케라스 모델에 사용할 때 자동으로 텐서플로 함수로 변환해줌 (옵션으로 변환 못하게 할 수 있음)

##### 텐서플로가 그래프를 생성하는 방법 - 오토그래프와 트레이싱
- __오토그래프__ : 먼저, 파이썬 함수의 소스 코드를 분석하여 for문, break문과 같은 제어문 모두 찾은 후, 제어문을 모두  텐서플로 연산으로 바꾼 업그레이드 버전을 만듬
- 그다음, 텐서플로가 업그레이드된 함수를 호출. (매개변수 값이 아니라) 심볼릭 텐서를 전달 (어떠한 계산도 수행 X)  
cf) 심볼릭 텐서 : 실제 값이 없고 이름, 데이터 타입, 크기만 가지는 텐서
![](img/12_2.png)