# **Tensorflow & Keras를 이용한DNN (Deep Neural Network)**

## **1. Keras의 개요**

### 1-1. Keras란?

- 딥러닝 모델을 구축, 교육, 평가 및 실행을 위한 오픈 소스 신경망 라이브러리입
- 파이썬으로 작성되었음
- TensorFlow, CNTK, 혹은 Theano와 같은 저수준 딥러닝 프레임워크 위에서 동작함
- TensorFlow 2.0부터는 Keras가 TensorFlow의 공식 고수준 API로 채택되어 직접적인 지원을 받고 있음

### 1-2. Keras의 주요 특징

- 사용자 친화적
	- Keras는 일반적인 사용 사례를 단순화하여 딥러닝의 복잡성을 줄이는 데 중점을 둠
	- 코드가 짧고 가독성이 좋음
	- 쉬운 프로토타이핑이 가능함
- 모듈화 및 구성 가능성
	- Keras의 핵심 개념은 모듈의 연결을 통해 복잡한 아키텍처를 구성하는 것
	- 레이어, 손실 함수, 최적화 알고리즘, 초기화 스키마, 활성화 함수 및 정규화 스키마는 모두 독립적인 모듈로 사용할 수 있음
    - 또한 새로운 모델을 만드는 데 이러한 구성 요소를 쉽게 연결할 수 있음
- 쉬운 확장성
	- 새로운 레이어, 메트릭, 손실 함수 등을 직접 구현하고 연결할 수 있음
	- 기존 구성 요소와도 호환됨
- 멀티 백엔드 지원
	- 다양한 딥러닝 엔진 위에서 Keras를 사용할 수 있으므로, 코드를 한 엔진에서 다른 엔진으로 쉽게 마이그레이션 할 수 있음

### 1-3. Keras의 주요 구성 요소

- 모델: Keras에서는 Sequential 모델과 함수형 API를 통해 복잡한 모델을 구축할 수 있음
	- Sequential 모델: 레이어의 선형 스택을 만들기 쉽게 해줌
	- 함수형 API: 다중 입력, 다중 출력, 공유 레이어, 비선형 연결 패턴 등 복잡한 아키텍처를 구성할 수 있음
	- 레이어
        - 레이어는 신경망의 핵심 구성 요소로, 가중치와 활성화 함수 등을 포함함
        - Keras에는 다양한 레이어가 사전 정의되어 있으며 사용자 정의 레이어도 쉽게 추가할 수 있음
	- 컴파일 및 훈련
        - 모델을 컴파일하려면 손실 함수와 최적화 알고리즘을 선택해야 함
        - 훈련 중에 평가할 메트릭도 선택할 수 있음
        - 훈련은 fit 메서드를 사용하여 진행할 수 있음
        - 검증 세트를 사용해 과적합을 모니터링할 수 있음
	- 모델 평가 및 예측
        - evaluate 및 predict 메서드를 사용
        - 새로운 데이터에서 모델의 성능을 평가하거나 예측을 생성할 수 있음
- Keras는...
    - 강력한 유연성과 직관성을 갖춘 도구
    - 초보자부터 전문가까지 다양한 사용자에게 적합함
    - 연구에서 산업 현장에 이르기까지 다양한 분야에서 사용됨

## **2. Keras를 이용한 DNN 모델 개발**

### 2-1. Sequence 모델

#### 2-1-1. Sequence 모델의 사용

- Sequential 모델이 적합한 경우
	- Sequential 모델은 각 레이어에 정확히 하나의 입력 텐서와 하나의 출력 텐서가 있는 일반 레이어 스택에 적합함

- Sequential 모델이 적합하지 않은 경우
	- 모델에 다중 입력 또는 다중 출력이 있을 때
	- 레이어에 다중 입력 또는 다중 출력이 있을 때
	- 레이어 공유를 해야 할 때
	- 비선형 토폴로지(예: 잔류 연결, 다중 분기 모델)를 원할 때

#### 2-1-2. Sequence 모델의 기본 형태

In [1]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

In [2]:
model = keras.Sequential(
    [
        layers.Dense(2, activation="relu", name="layer1"),
        layers.Dense(3, activation="relu", name="layer2"),
        layers.Dense(4, name="layer3"),
    ]
)
x = tf.ones((3, 3))
y = model(x)

- Sequence 모델의 기본 형태는 다음의 함수와 동일함

In [3]:
layer1 = layers.Dense(2, activation="relu", name="layer1")
layer2 = layers.Dense(3, activation="relu", name="layer2")
layer3 = layers.Dense(4, name="layer3")

x = tf.ones((3, 3))
y = layer3(layer2(layer1(x)))

#### 2-1-3. Sequence 모델 생성하기

- 레이어의 목록을 Sequential 생성자에 전달하여 Sequential 모델을 만들 수 있음

In [4]:
model = keras.Sequential(
    [
        layers.Dense(2, activation="relu"),
        layers.Dense(3, activation="relu"),
        layers.Dense(4),
    ]
)

- 속한 레이어는 layers 속성을 통해 접근할 수 있음

In [5]:
model.layers

[<keras.layers.core.dense.Dense at 0x7c672f6ffca0>,
 <keras.layers.core.dense.Dense at 0x7c672f897c70>,
 <keras.layers.core.dense.Dense at 0x7c672f897700>]

- add() 메서드를 통해 Sequential 모델을 점진적으로 작성할 수도 있음

In [6]:
model = keras.Sequential()
model.add(layers.Dense(2, activation="relu"))
model.add(layers.Dense(3, activation="relu"))
model.add(layers.Dense(4))

- 레이어를 제거하는 pop() 메소드의 사용
    - Sequential 모델은 레이어의 리스트와 매우 유사하게 동작함

In [7]:
model.pop()
print(len(model.layers))  # 2

2


- Sequential 생성자
    - Sequence의 생성자는 Keras의 모든 레이어 또는 모델과 마찬가지로 name 인수를 허용함
    - 이것은 의미론적으로 유의미한 이름으로 TensorBoard 그래프에 주석을 달 때 유용함

In [8]:
model = keras.Sequential(name="my_sequential")
model.add(layers.Dense(2, activation="relu", name="layer1"))
model.add(layers.Dense(3, activation="relu", name="layer2"))
model.add(layers.Dense(4, name="layer3"))

#### 2-1-4. 미리 입력 형상 지정하기

- Keras의 모든 레이어는 가중치를 만들려면 입력의 형상을 알아야 함
- 다음과 같은 레이어를 만들면 처음에는 가중치가 없음

In [9]:
layer = layers.Dense(3)
layer.weights

[]

- 가중치는 모양이 입력의 형상에 따라 달라지기 때문에 입력에서 처음 호출될 때 가중치를 만듦
- 이것은 Sequential 모델에도 적용됨

In [10]:
x = tf.ones((1, 4))
y = layer(x)
layer.weights

[<tf.Variable 'dense_6/kernel:0' shape=(4, 3) dtype=float32, numpy=
 array([[ 0.49868226,  0.82953656,  0.6644926 ],
        [ 0.6160332 , -0.05794805, -0.6158738 ],
        [ 0.7144222 , -0.3688159 ,  0.63037467],
        [ 0.14119077,  0.29438412,  0.23018205]], dtype=float32)>,
 <tf.Variable 'dense_6/bias:0' shape=(3,) dtype=float32, numpy=array([0., 0., 0.], dtype=float32)>]

- 입력 형상이 없는 Sequential 모델을 인스턴스화할 때는 가중치가 없기 때문에 "빌드"되지 않음(model.weights를 호출하면 오류가 발생함)
- 모델에 처음 입력 데이터가 표시되면 가중치가 생성됨

In [11]:
model = keras.Sequential(
    [
        layers.Dense(2, activation="relu"),
        layers.Dense(3, activation="relu"),
        layers.Dense(4),
    ]
)

x = tf.ones((1, 4))
y = model(x)
print("Number of weights after calling the model:", len(model.weights))  # 6

Number of weights after calling the model: 6


- 모델이 "빌드"되면, 그 내용을 표시하기 위해 summary() 메서드를 호출할 수 있음

In [12]:
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_7 (Dense)             (1, 2)                    10        
                                                                 
 dense_8 (Dense)             (1, 3)                    9         
                                                                 
 dense_9 (Dense)             (1, 4)                    16        
                                                                 
Total params: 35
Trainable params: 35
Non-trainable params: 0
_________________________________________________________________


- 이러한 방식은 현재 출력 형상을 포함하여 지금까지 모델의 요약을 표시할 수 있도록 Sequential 모델을 점진적으로 빌드할 때 매우 유용할 수 있음
- 이 경우 Input 객체를 모델에 전달하여 모델의 시작 형상을 알 수 있도록 모델을 시작해야 함

In [13]:
model = keras.Sequential()
model.add(layers.Input(shape=(4,)))
model.add(layers.Dense(2, activation="relu"))

model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_10 (Dense)            (None, 2)                 10        
                                                                 
Total params: 10
Trainable params: 10
Non-trainable params: 0
_________________________________________________________________


- Input 객체는 레이어가 아니므로 model.layers의 일부로 표시되지 않음

In [14]:
model.layers

[<keras.layers.core.dense.Dense at 0x7c672f799b10>]

- 간단한 대안은 첫 번째 레이어에 input_shape 인수를 전달하는 것

In [15]:
model = keras.Sequential()
model.add(layers.Dense(2, activation="relu", input_shape=(4,)))

model.summary()

Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_11 (Dense)            (None, 2)                 10        
                                                                 
Total params: 10
Trainable params: 10
Non-trainable params: 0
_________________________________________________________________


- 이처럼 사전 정의된 입력 모양으로 빌드된 모델은 항상 가중치를 가지며(데이터를 보기 전에도) 항상 정의된 출력 형상을 가짐
- 일반적으로 Sequential 모델의 입력 형상을 알고 있는 경우 항상 Sequential 모델의 입력 형상을 지정하는 것이 좋음

#### 2-1-5. 일반적인 디버깅 워크플로우: add() + summary()

- 새로운 Sequential 아키텍처를 구축할 때는 add() 하여 레이어를 점진적으로 쌓고 모델 요약을 자주 인쇄하는 것이 유용함
    - 예: Conv2D 및 MaxPooling2D 레이어의 스택이 이미지 특성 맵을 다운 샘플링 하는 방법을 모니터링할 수 있음

In [16]:
model = keras.Sequential()
model.add(layers.Input(shape=(250, 250, 3)))
model.add(layers.Conv2D(32, 5, strides=2, activation="relu"))
model.add(layers.Conv2D(32, 3, activation="relu"))
model.add(layers.MaxPooling2D(3))

model.summary()

model.add(layers.Conv2D(32, 3, activation="relu"))
model.add(layers.Conv2D(32, 3, activation="relu"))
model.add(layers.MaxPooling2D(3))
model.add(layers.Conv2D(32, 3, activation="relu"))
model.add(layers.Conv2D(32, 3, activation="relu"))
model.add(layers.MaxPooling2D(2))

model.summary()

model.add(layers.GlobalMaxPooling2D())
model.add(layers.Dense(10))

Model: "sequential_6"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 123, 123, 32)      2432      
                                                                 
 conv2d_1 (Conv2D)           (None, 121, 121, 32)      9248      
                                                                 
 max_pooling2d (MaxPooling2D  (None, 40, 40, 32)       0         
 )                                                               
                                                                 
Total params: 11,680
Trainable params: 11,680
Non-trainable params: 0
_________________________________________________________________
Model: "sequential_6"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 123, 123, 32)      2432      
                            

#### 2-1-6. 모델이 완성되면 해야 할 일

- 모델을 훈련시키고 평가하며 추론을 실행함
- 모델을 디스크에 저장하고 복구함
- 다중 GPU를 활용하여 모델 훈련 속도를 향상 시킴

#### 2-1-7. Sequential 모델을 사용한 특성 추출

- Sequential 모델이 빌드되면 Functional API 모델처럼 동작함
- 이는 모든 레이어가 input 및 output 속성을 갖는다는 것을 의미함
- 이러한 속성을 사용하면 Sequential 모델 내의 모든 중간 레이어들의 출력을 추출하는 모델을 빠르게 생성하는 등 깔끔한 작업을 수행할 수 있음

In [17]:
initial_model = keras.Sequential(
    [
        layers.Input(shape=(250, 250, 3)),
        layers.Conv2D(32, 5, strides=2, activation="relu"),
        layers.Conv2D(32, 3, activation="relu"),
        layers.Conv2D(32, 3, activation="relu"),
    ]
)

feature_extractor = keras.Model(
    inputs=initial_model.inputs,
    outputs=[layer.output for layer in initial_model.layers],
)

x = tf.ones((1, 250, 250, 3))
features = feature_extractor(x)

- 한 레이어에서 특성만 추출하는 것과 유사한 예

In [18]:
initial_model = keras.Sequential(
    [
        layers.Input(shape=(250, 250, 3)),
        layers.Conv2D(32, 5, strides=2, activation="relu"),
        layers.Conv2D(32, 3, activation="relu", name="my_intermediate_layer"),
        layers.Conv2D(32, 3, activation="relu"),
    ]
)

feature_extractor = keras.Model(
    inputs=initial_model.inputs,
    outputs=initial_model.get_layer(name="my_intermediate_layer").output,
)

x = tf.ones((1, 250, 250, 3))
features = feature_extractor(x)

### 2-2. 내장 메서드를 사용한 학습 및 평가

#### 2-2-1. 모델 훈련 및 유효성 검사

- 모델 훈련 및 유효성 검사는 모든 종류의 Keras 모델에서 완전히 동일하게 작동함
- 훈련 및 유효성 검증을 위한 내장 API의 사용
    - 훈련: model.fit()
    - 평가: model.evaluate()
    - 예측(추론): model.predict()

#### 2-2-2. End-to-End 모델 예시

- 일반적인 엔드 투 엔드 워크플로의 구성
    - 훈련
    - 원래 훈련 데이터에서 생성된 홀드아웃 세트에 대한 유효성 검사
    - 테스트 데이터에 대한 평가

##### 2-2-2-1. 데이터 구성

- 데이터를 모델의 내장 훈련 루프로 전달할 때
    - NumPy 배열(데이터가 작고 메모리에 맞는 경우) 또는 tf.data Dataset 객체를 사용

In [19]:
inputs = keras.Input(shape=(784,), name="digits")
x = layers.Dense(64, activation="relu", name="dense_1")(inputs)
x = layers.Dense(64, activation="relu", name="dense_2")(x)
outputs = layers.Dense(10, activation="softmax", name="predictions")(x)

model = keras.Model(inputs=inputs, outputs=outputs)

- 옵티마이저, 손실 및 메트릭을 사용하는 방법을 보여주기 위해 MNIST 데이터세트를 NumPy 배열로 사용함

In [20]:
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

x_train = x_train.reshape(60000, 784).astype("float32") / 255
x_test = x_test.reshape(10000, 784).astype("float32") / 255

y_train = y_train.astype("float32")
y_test = y_test.astype("float32")

x_val = x_train[-10000:]
y_val = y_train[-10000:]
x_train = x_train[:-10000]
y_train = y_train[:-10000]

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


##### 2-2-2-2. 훈련 구성

- 최적화 프로그램, 손실, 메트릭 지정
- compile() 메서드 호출
    - 손실, 메트릭 및 최적화 프로그램 지정하기
        - fit()으로 모델을 훈련시키려면 손실 함수, 최적화 프로그램, 그리고 선택적으로 모니터링할 일부 메트릭을 지정해야 함
    - metrics 인수는 List
        - 모델의 메트릭 수는 여러 개도 가능함
    - 모델에 여러 개의 출력이 있는 경우
        - 각 출력에 대해 서로 다른 손실 및 메트릭을 지정
        - 모델의 총 손실에 대한 각 출력의 기여도를 조정 가능
- 이러한 내용은 compile() 메서드에 대한 인수로 모델에 전달함

In [21]:
model.compile(
    optimizer=keras.optimizers.RMSprop(),  # Optimizer
    # Loss function to minimize
    loss=keras.losses.SparseCategoricalCrossentropy(),
    # List of metrics to monitor
    metrics=[keras.metrics.SparseCategoricalAccuracy()],
)

In [22]:
# 또 다른 방법
model.compile(
    optimizer="rmsprop",
    loss="sparse_categorical_crossentropy",
    metrics=["sparse_categorical_accuracy"],
)

- 재사용하기 위해 모델 정의와 컴파일 단계를 함수에 넣을 수 있음

In [23]:
def get_uncompiled_model():
    inputs = keras.Input(shape=(784,), name="digits")
    x = layers.Dense(64, activation="relu", name="dense_1")(inputs)
    x = layers.Dense(64, activation="relu", name="dense_2")(x)
    outputs = layers.Dense(10, activation="softmax", name="predictions")(x)
    model = keras.Model(inputs=inputs, outputs=outputs)
    return model

In [24]:
def get_compiled_model():
    model = get_uncompiled_model()
    model.compile(
        optimizer="rmsprop",
        loss="sparse_categorical_crossentropy",
        metrics=["sparse_categorical_accuracy"],
    )
    return model

- 다양한 내장 최적화 프로그램, 손실 및 메트릭 사용 가능
    - 최적화 프로그램:
        - SGD()(모멘텀이 있거나 없음)
        - RMSprop()
        - Adam()
        - 기타
    - 손실:
        - MeanSquaredError()
        - KLDivergence()
        - CosineSimilarity()
        - 기타
    - 메트릭:
        - AUC()
        - Precision()
        - Recall()
        - 기타       

##### 2-2-2-3. 모델 훈련

- fit() 호출
- 데이터를 batch_size 크기의 "배치"로 분할
- 지정된 수의 epochs에 대해 전체 데이터세트를 반복 처리

In [25]:
print("Fit model on training data")
history = model.fit(
    x_train,
    y_train,
    batch_size=64,
    epochs=2,
    validation_data=(x_val, y_val),
)

Fit model on training data
Epoch 1/2
Epoch 2/2


- 반환되는 history 객체는 훈련 중 손실 값과 메트릭 값에 대한 레코드를 유지하고 있음

In [26]:
history.history

{'loss': [0.3440347909927368, 0.16582225263118744],
 'sparse_categorical_accuracy': [0.9017400145530701, 0.9514600038528442],
 'val_loss': [0.18975454568862915, 0.14473575353622437],
 'val_sparse_categorical_accuracy': [0.9451000094413757, 0.9592999815940857]}

##### 2-2-2-4. 모델 평가

- evaluate() 호출
- 테스트 데이터에 대하여 모델 평가 수행

In [27]:
print("Evaluate on test data")
results = model.evaluate(x_test, y_test, batch_size=128)
print("test loss, test acc:", results)

print("Generate predictions for 3 samples")
predictions = model.predict(x_test[:3])
print("predictions shape:", predictions.shape)

Evaluate on test data
test loss, test acc: [0.14036796987056732, 0.9553999900817871]
Generate predictions for 3 samples
predictions shape: (3, 10)


#### 2-2-3. 콜백 사용하기

- 콜백(Callback)
    - 훈련 중 다른 시점(epoch의 시작, 배치의 끝, epoch의 끝 등)에서 호출되며 다음과 같은 특정 동작을 구현하는 데 사용할 수 있는 객체
- 콜백의 기능
    - 훈련 중 서로 다른 시점에서 유효성 검사 수행(내장된 epoch당 유효성 검사에서 더욱 확장)
    - 정기적으로 또는 특정 정확도 임계값을 초과할 때 모델 검사점 설정
    - 훈련이 평탄해진 것으로 보일 때 모델의 학습률 변경
    - 훈련이 평탄해진 것으로 보일 때 최상위 레이어의 미세 조정 수행
    - 훈련이 종료되거나 특정 성능 임계값이 초과된 경우 이메일 또는 인스턴트 메시지로 알림 보내기
    - 기타
- 콜백은 fit()에 대한 호출에 목록으로 전달할 수 있음

In [28]:
model = get_compiled_model()

callbacks = [
    keras.callbacks.EarlyStopping(
        monitor="val_loss",
        min_delta=1e-2,
        patience=2,
        verbose=1,
    )
]
model.fit(
    x_train,
    y_train,
    epochs=20,
    batch_size=64,
    callbacks=callbacks,
    validation_split=0.2,
)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 6: early stopping


<keras.callbacks.History at 0x7c670c0a5d80>

- 다양한 내장 콜백을 사용 가능
	- ModelCheckpoint: 주기적으로 모델 저장
	- EarlyStopping: 훈련이 더 이상 유효성 검사 메트릭을 개선하지 못하는 경우 훈련 중단
	- TensorBoard: TensorBoard에서 시각화할 수 있는 모델 로그를 정기적으로 작성
	- CSVLogger: 손실 및 메트릭 데이터를 CSV 파일로 스트리밍
	- 기타

#### 2-2-4. 모델 검사점 설정하기

- 상대적으로 큰 데이터셋에 대한 모델을 훈련시킬 때는 모델의 검사점을 빈번하게 저장하는 것이 중요함
- ModelCheckpoint 콜백 사용(가장 쉬운 방법)
    - 내결함성 구현 가능
    - 즉, 훈련이 무작위로 중단되는 경우 모델의 마지막 저장된 상태에서 훈련을 다시 시작할 수 있음

In [29]:
model = get_compiled_model()

callbacks = [
    keras.callbacks.ModelCheckpoint(
        filepath="mymodel_{epoch}",
        save_best_only=True,
        monitor="val_loss",
        verbose=1,
    )
]
model.fit(
    x_train, y_train, epochs=2, batch_size=64, callbacks=callbacks, validation_split=0.2
)

Epoch 1/2
Epoch 1: val_loss improved from inf to 0.23627, saving model to mymodel_1
Epoch 2/2
Epoch 2: val_loss improved from 0.23627 to 0.19596, saving model to mymodel_2


<keras.callbacks.History at 0x7c66e3957790>

In [30]:
# 내결함성 구현의 예
import os

checkpoint_dir = "./ckpt"
if not os.path.exists(checkpoint_dir):
    os.makedirs(checkpoint_dir)


def make_or_restore_model():
    checkpoints = [checkpoint_dir + "/" + name for name in os.listdir(checkpoint_dir)]
    if checkpoints:
        latest_checkpoint = max(checkpoints, key=os.path.getctime)
        print("Restoring from", latest_checkpoint)
        return keras.models.load_model(latest_checkpoint)
    print("Creating a new model")
    return get_compiled_model()


model = make_or_restore_model()
callbacks = [
    keras.callbacks.ModelCheckpoint(
        filepath=checkpoint_dir + "/ckpt-loss={loss:.2f}", save_freq=100
    )
]
model.fit(x_train, y_train, epochs=1, callbacks=callbacks)

Creating a new model


<keras.callbacks.History at 0x7c66cbfee5f0>

#### 2-2-5. 학습률 일정 사용하기

- 학습률 일정(Learning Rate Schedule)
    - 딥 러닝 모델을 훈련할 때 일반적인 패턴은 훈련이 진행됨에 따라 점차적으로 학습을 줄이는 방법(학습률 감소)
    - 학습률 감소 일정
        - 정적: 현재 epoch 또는 현재 배치 인덱스의 함수로 미리 고정됨
        - 동적: 모델의 현재 동작, 특히 유효성 검사 손실에 대응

- 최적화 프로그램으로 일정 전달하기
    - 최적화 프로그램에서 schedule 객체를 learning_rate 인수로 전달하여 정적 학습률 감소 일정을 쉽게 사용할 수 있음

In [31]:
initial_learning_rate = 0.1
lr_schedule = keras.optimizers.schedules.ExponentialDecay(
    initial_learning_rate, decay_steps=100000, decay_rate=0.96, staircase=True
)

optimizer = keras.optimizers.RMSprop(learning_rate=lr_schedule)

- 콜백을 사용하여 동적 학습률 일정 구현하기
    - 최적화 프로그램은 유효성 검사 메트릭에 액세스할 수 없으므로 이러한 일정 객체로는 동적 학습률 일정(예: 유효성 검사 손실이 더 이상 개선되지 않을 때 학습률 감소)을 달성할 수 없음
    - 콜백은 유효성 검사 메트릭을 포함해 모든 메트릭에 액세스할 수 있으므로 최적화 프로그램에서 현재 학습률을 수정하는 콜백을 사용하여 이 패턴을 달성할 수 있음
    - 실제로 이 부분이 ReduceLROnPlateau 콜백으로 내장되어 있음

#### 2-2-6. 훈련 중 손실 및 메트릭 시각화하기

- TensorBoard의 사용
    - TensorBoard: 로컬에서 실행할 수 있는 브라우저 기반 애플리케이션
    - 훈련 중에 모델을 주시하는 가장 좋은 방법임
- TensorBoard에서 제공하는 정보
    - 훈련 및 평가를 위한 손실 및 메트릭을 실시간으로 플롯
    - (옵션) 레이어 활성화 히스토그램 시각화
    - (옵션) Embedding 레이어에서 학습한 포함된 공간의 3D 시각화
- pip와 함께 TensorFlow를 설치한 경우, 명령줄에서 TensorBoard를 시작할 수 있음
    - CoLab에서는 권한문제로 접근불가
    - 개인 PC 환경에서 사용할 수 있음


In [32]:
!tensorboard --logdir=/full_path_to_your_logs


NOTE: Using experimental fast data loading logic. To disable, pass
    "--load_fast=false" and report issues on GitHub. More details:
    https://github.com/tensorflow/tensorboard/issues/4784

Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
TensorBoard 2.12.3 at http://localhost:6006/ (Press CTRL+C to quit)
^C


- TensorBoard 콜백 사용하기
    - TensorBoard를 Keras 모델 및 fit() 메서드와 함께 사용하는 가장 쉬운 방법
    - 가장 간단한 경우로, 콜백에서 로그를 작성할 위치만 지정하면 바로 로그를 작성할 수 있음

In [33]:
keras.callbacks.TensorBoard(
    log_dir="/full_path_to_your_logs",
    histogram_freq=0,
    embeddings_freq=0,
    update_freq="epoch",
)

<keras.callbacks.TensorBoard at 0x7c66a6b97fa0>