# Keras (케라스)

## <span style="font-size:25px">Overview</span>

<dl style="font-size:20px">
<dt>
▶ Keras in TensorFlow 2.x</dt>
<dd>- Keras 창시자 프랑소와 숄레(François Chollet)가 TF 2.0 개발에 참여하였고, Tf 2.0에서는 공식적 <br>
이고 유일한 High-Level API로서 Keras를 채택함
</dd>
<br>
<dd>- 또한 프랑소와 숄레는 앞으로 native Keras 보다는 tf.keras처럼 TF에서 케라스를 사용할 것을 권장함
</dd>

<dt>
▶ Keras 특징</dt>
<dd>- User Fridenliness: Keras의 직관적인 API를 이용하면 일반 신경망(ANN), CNN, RNN 모델 <br>
또는 이를 조합한 다양한 딥러닝 모델을 (몇 줄의 코드만으로) 쉽게 구축 할 수 있음
</dd>
<br>
<dd>- Modularity: Keras에서 제공하는 모듈은 독립적으로 설정 가능함. 즉 신경망 층, 손실함수, <br>
활성화 함수, 최적화 알고리즘 등은 모두 독립적인 모듈이기 때문에 이러한 모듈을 서로 <br>
저합하기만 하면 새로운 딥러닝 모델을 쉽고 빠르게 만들어서 학습시킬 수 있음
</dd>
</dl>

## <span style="font-size:25px">Keras - 모델 (model)</span>

<img src="picture/TF_img_03_1" alt="TF_img_03_1" width=800 height=650>

<table style="width:80%; height:200px;">
<tr style="font-size:20px">
<td style="border-right:1px solid white;">
- 모델(model)은 각 층(layer)를 포함하고 있는 <br>인공 신경망 자체를 나타냄
</td>
<td style="text-align:center;">
- model = Sequential()    # 모델 생성
</td>
</td>

<tr style="font-size:20px">
<td style="border-right:1px solid white;">
- 모델의 기본 단위는 층(layer)이며, 이러한 <br>
층을 레고 처럼 순차적으로 쌓기만 하면 일반 <br>
신경망(ANN), CNN, RNN 또는 이들을 조합한 <br>
다양한 모델을 구축할 수 있음
</td>
<td style="text-align:center;">
- model.add(...)    # 층 추가<br>
- model.add(...)    # 층 추가<br>
- model.add(...)    # 층 추가
</td>
</tr>

<tr style="font-size:20px">
<td style="border-right:1px solid white;">
- 모델이 구축되면 손실 함수(loss function) 값이 <br>
최소가 될 때까지 ① ~ ④ 과정을 반복하며 <br>
최적의 가중치(weight)와 바이어스(bias) 값을 <br>
차는 학습(learning)이 진행됨
</td>
<td style="text-align:center;">
model.compile(...)    # 손실함수 지정 <br>
                      # 옵티마이저 지정
                      <br>
model.fit(...)        # 학습 진행 ① ~ ④
</td>
</tr>
</table>

## <span style="font-size:25px">Keras - 개발 과정 overview</span>

<img src="picture/TF_img_03_2" alt="TF_img_03_2" width=800 height=650>

## <span style="font-size:25px">Keras - 개발 과정 (데이터 생성)</span>

<span style="font-size:25px">▶ 전체 데이터로부터 train data / validation data / test data 등을 생성함</span>

<img src="picture/TF_img_03_3" alt="TF_img_03_3" width=800 height=650>

<table style="font-size:20px">
<tr>
<td style="border-right:1px solid white;">
<img src="picture/TF_img_03_4" alt="TF_img_03_4">
</td>
<td>
train data: 학습에 사용되는 데<br>이터이며, 가중치와 바이어스를 <br>최적화 하기 위해 사용됨
</td>
</tr>

<tr>
<td style="border-right:1px solid white;">
<img src="picture/TF_img_03_5" alt="TF_img_03_5">
</td>
<td>
validation data: 1 epoch 마다 <br>과적합(overfitting)을 확인
</td>
</tr>

<tr>
<td style="border-right:1px solid white;">
<img src="picture/TF_img_03_6" alt="TF_img_03_6">
</td>
<td>
test data: 학습 후에 정확도를 <br>평가하거나 임의의 입력에 대한 <br>결과를 예측하기 위해 사용되는 <br>데이터 (after learning)
</td>
</tr>
</table>

<table style="font-size:20px">
<tr>
<td>
<img src="picture/TF_img_03_7" alt="TF_img_03_7">
</td>
<td>
model = Sequential() ⋯ (1)<br>
model.add(Flatten(input_shape=(1,))) ⋯ (1)<br>
model.add(Dense(2, activation='sigmoid')) ⋯ (2)<br>
model.add(Dense(1, activation='sigmoid'))<br><br>
model.add(Dense(2, activation='sigmoid', input_shape=(1,)))  ⋯ (1)+(2)
</td>
</tr>
</table>

<dl style="border:2px dashed white;width:52%;font-size:20px;">
<dt>
▶ Flatten는 입력으로 돌아오는 다차원 데이터를 1차원으로 정렬하기 위해 사용되는 <br>
레이어이며, 입력 데이터(차원)의 수를 input_shape(1,)과 같이 기술함
</dt><br>

<dt>
▶ Dense는 각 층의 입력과 출력 사이에 있는 모든 노드가 서로 연결되어 있는 완전 <br>
연결 층(FC)을 나타내며, Dense 첫 번째 인자인 2, 1등은 출력 노드 수를 나타냄
</dt><br>
<dd>- 노드의 활성화 함수는 activation='...' 형태로 나타내며, 대표적인 활성화 함수로는 <br>
선형회귀 문제에서는 'linear', 일반적인 classification 경우에는 'sigmoid', 'softmax', <br>
'relu', 'tanh' 등이 데이터에 따라 다양하게 사용됨
</dd><br>
<dd>- 또한 첫 번째 계층에 바로 Dense 계층을 사용하는 경우라면, 코드 ①같은 Flatten(), <br>
Dense() 두 개의 코드를 ②에서 처럼 Dense에서 input_shape=(1,)을 이용하여 <br>
한 줄의 코드로 나타낼 수 있음(일반적으로 ②처럼 한 줄의 코드로 나타냄)
</dd>
</dl>

## <span style="font-size:25px">Keras - 개발 과정 (모델 컴파일, 모델 학습)</span>

<dl>
<dt style="font-size:25px">
구축된 모델을 기계가 이해할 수 있도록 컴파일(compile)을 해야 하며, <br>
최적화 방법(알고리즘), 오차함수, 학습 과정 중에 모니터링 할 지표(metric)를 나타낼 수 있음
<br><br>
일반적으로 model.compile() 후에는 model.summary()를 통해서 구축 모델을 확인함
</dt><br>

<dd>
[예1] model.compile(optimizer=SGD(learning_rate=0.1), loss='mse', metrics=['accuracy'])<br>
최적화 알고리즘 SGD, 학습률 0.1, 오차함수 mse, 메트릭은 accuracy (loss는 기본)
</dd><br>
<dd>
[예2] model.compile(optimizer=Adam(learning_rate=1e-4), loss='categorical_crossentropy')<br>
최적화 알고리즘 Adam, 학습률 1e-4, 오차함수 categorical_crossentropy
</dd>
</dl>

<div style="border:2px dashed white;width:52%;font-size:20px;">
※ 손실함수 종류로는 평균제곱오차인 'mse', 이진 분류인 'binary_crossentropy', <br>
다중 클래스 분류를 위해 'categorical_crossentropy' 또는 'sparse_categorical_crossentropy' <br>
<br>
※ 메트릭은 기본적으로 'loss'만 측정함. 즉 metrics=['loss']임
</div>

---

<dl>
<dt style="font-size:25px">
구축된 모델을 기계가 이해할 수 있도록 컴파일(compile)을 해야 하며, <br>
최적화 방법(알고리즘), 오차함수, 학습 과정 중에 모니터링 할 지표(metric)를 나타낼 수 있음
<br><br>
일반적으로 model.compile() 후에는 model.summary()를 통해서 구축 모델을 확인함
</dt><br>

<dd>
[예] model.fit(x_train, t_train, epochs=10, batch_size=100, verbose=0, validation_split=0.2)<br>
1st 인자는 입력 데이터, 2nd 인자는 정답 데이터, 전체 데이터를 총 10번 반복 (epochs=10), <br>
배치 사이즈 100(생략가능), 학습 데이터의 20%를 검증 데이터로 사용함
</dd>
</dl>

<div style="border:2px dashed white;width:52%;font-size:20px;">
※ verbose = 학습 중 손실 값, 정확도, 진행 상태 등의 출력 형태를 설정함(0, 1, 2)<br>
<br>
※ 검증 데이터가 별도로 있다면, validation_split 대신 validation_data 이용하여 지정 가능함
</div>

## <span style="font-size:25px">Keras - 개발 과정 (모델 평가, 모델 저장 및 로드)</span>

<dl>
<dt style="font-size:25px">
학습을 마친 후, test data를 통해서 모델을 평가하고 임의의 데이터에 대해 예측함
</dt><br>

<dd>
[예1] model.evaluate(x_test, t_test, epochs=10, batch_size=100)<br>
1st 인자는 테스트 데이터, 2nd 인자는 정답 데이터, 배치 사이즈 100(생략 가능)
</dd><br>
<dd>
[예2] model.predict(x_input_data, batch_size=100)<br>
1st 인자는 예측하고자 하는 데이터, batch_size 생략 가능
</dd>
</dl>

---

<dl>
<dt style="font-size:25px">
학습이 끝난(가중치와 바이어스가 최적화된) 신경망 구조를 저장해 놓는다면, <br>
다양한 테스트 데이터에 대해 재학습 없이 지속적으로 사용할 수 있음
</dt><br>

<dd>
[예1] model.save("model_name.h5")<br>
학습이 끝난 모델을 hdf5 파일에 저장함
</dd><br>
<dd>
[예2] model.tensorflow.keras.models.load_model("model_name.h5")<br>
저장되어 있는 모델(model_name.hdf5)를 불러옴
</dd>
</dl>

## <span style="font-size:25px">Keras - Simple LinearRegression Exercise</span>

In [None]:
import numpy as np
import tensorflow as tf


from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Flatten, Dense
from tensorflow.keras.optimizers import SGD

print(tf.__version__)

2.17.1


In [None]:
x_data = np.array([1, 2, 3, 4, 5, 6])
t_data = np.array([3, 4, 5, 6, 7, 8])

In [None]:
model = Sequential()                      # model
model.add(Flatten(input_shape=(1,)))      # input layer
model.add(Dense(1, activation='linear'))  # output layer

# model.add(Dense(1, input_shape=(1,), activation='linear'))

  super().__init__(**kwargs)


In [None]:
model.compile(optimizer=SGD(learning_rate=1e-2), loss='mse')
model.summary()

In [None]:
hist = model.fit(x_data, t_data, epochs=1000)

Epoch 1/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 606ms/step - loss: 96.8006
Epoch 2/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step - loss: 45.0141
Epoch 3/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - loss: 21.0442
Epoch 4/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 56ms/step - loss: 9.9486
Epoch 5/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 47ms/step - loss: 4.8118
Epoch 6/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 54ms/step - loss: 2.4328
Epoch 7/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step - loss: 1.3302
Epoch 8/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - loss: 0.8184
Epoch 9/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - loss: 0.5801
Epoch 10/1000
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 37ms/step - loss: 0.

In [6]:
result = model.predict(np.array([-3.1, 3.0, 3.5, 15.0, 20.1]))
print(result)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 223ms/step
[[-1.1641979]
 [ 4.988857 ]
 [ 5.4932055]
 [17.093227 ]
 [22.237585 ]]
