<a href="https://colab.research.google.com/github/EmjayAhn/study_deeplearning/blob/master/02_tf_keras_API_basic.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [0]:
import tensorflow as tf
import numpy as np
# tf.enable_eager_execution()

In [8]:
!pip list | grep tensorflow

mesh-tensorflow          0.0.5                
tensorflow               1.13.0rc1            
tensorflow-estimator     1.13.0rc0            
tensorflow-hub           0.2.0                
tensorflow-metadata      0.9.0                
tensorflow-probability   0.5.0                


### Introduction

tensorflow가 2.0부터 tf.keras를 main api로 채택한다고 한다. <br>
아직은 1.12버전에서 (여기서 1.12는 1 < 1.12 < 2 를 만족하는 소수를 뜻하는 것이 아니라 열두번째 버전을 의미한다.) tensorflow 고유의 symbolic graph를 이용한 연산 API를 default로 제공하고 있지만, 우리는 발빠르게 version up을 준비 할 필요가 있다. <br> 

그래야 간지가 나기 때문이다.

### example data

tf.keras API는 기본적으로 Deep Learning Model을 설계하기 위한 framework이기 때문에 Train Data가 필요하다. <br>

모델의 동작과 기능을 테스트 할 수 있는 간단한 데이터를 아래와 같이 준비해준다

In [3]:
data = np.array([[1, 2, 3, 4, 5], [5, 4, 3, 2, 1]], np.float32)
label = np.array([[1], [0]], np.float32)

for d, l in zip(data, label):
  print(d, l)

[1. 2. 3. 4. 5.] [1.]
[5. 4. 3. 2. 1.] [0.]


### keras.Sequential style

아래는 tf.keras.Sequential 클래스를 활용하여 FFNN 모델을 설계한 모습이다. <br>
여기서 주의해야 할 점은 레이어가 들어가는 부분에는 반드시 tf.keras.layer 만 들어갈 수 있다는 점이다. <br>

tf.keras.layers에 정의되어 있는 함수만 사용 할 수 있으니 이에 유의하여 레이어를 설계하면 된다. <br>

또한 이 예제에서는 모든 코드를 함수 형태로 작성하였는데,  activation이나 optimizer, loss, metrics 등은 아래와 같이 string type으로 입력이 가능하다. <br>

activation='sigmoid' <br>
optimizer='SGD' <br>
metrics=['accuracy'] <br> 
metrics=['acc'] <br>

하지만 간지와 편의성을 맞바꾸는 변태적인 품위를 유지하기 위해 앞으로도 계속 builtin function을 그대로 사용하도록 하겠다. <br>

모름지기 프로그래머라면 이정도 품위는 지켜주는 것이 좋다.

In [4]:
# 모델 생성 방법 1
model = tf.keras.Sequential([
    # 모든 connection이 모두 꽉 차있는 layer : Dense (그림1)
    tf.keras.layers.Dense(10),
    tf.keras.layers.Dense(10),
    tf.keras.layers.Dense(10),
    tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

model.compile(optimizer=tf.train.GradientDescentOptimizer(1e-2),
              loss=tf.keras.losses.binary_crossentropy,
              metrics=[tf.keras.metrics.binary_accuracy])

model.fit(data, label, epochs=10)
result = model.predict_classes(data)
print(result)

Instructions for updating:
Colocations handled automatically by placer.
Instructions for updating:
Use tf.cast instead.
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[[1]
 [0]]


### keras.Sequential style 2

꼭 Sequential 클래스의 생성자를 이용하지 않더라도 아래와 같이 add() 메서드를 이용하여 레이어를 추가해 나갈 수도 있다. <br>

이 역시 반드시 tf.keras.layers만 수용한다

In [5]:
# 모델 생성 방법 2
model = tf.keras.Sequential()
# model 을 먼저 선언하고 append 개념으로 넣어주는 방법
model.add(tf.keras.layers.Dense(10))
model.add(tf.keras.layers.Dense(10))
model.add(tf.keras.layers.Dense(10))
model.add(tf.keras.layers.Dense(1, activation=tf.nn.sigmoid))

model.compile(optimizer=tf.train.GradientDescentOptimizer(1e-2),
              loss=tf.keras.losses.binary_crossentropy,
              metrics=[tf.keras.metrics.binary_accuracy])

model.fit(data, label, epochs=10)
result = model.predict_classes(data)
print(result)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[[1]
 [0]]


### keras.Model style (we will use)

사실 Sequential은 단순하다. 그래서 간지가 나지 않는다. <br>
우리가 이제부터 사용 할 API는 tf.keras.Model이니 이 부분을 유심히 보도록 하자 <br><br>

차이점이라고 하면 tf.keras.Input 이라는 코드가 추가된 부분이라는 것과, model을 생성하는 시점, input argument 받는 방식 등이 있다. <br><br>

차근차근 살펴보면, 사실 Sequential에 차례로 넣었던 것들은 사실 함수가 아니다. <br>
layer.Dense라는 클래스의 생성자를 호출 한 것이며, 이 생성자를 통해 layers.Dense라는 객체를 생성해서 Sequential에 넘기는 방식이다. <br>
Dense 객체가 만들어지면 이 객체를 바로 함수처럼 바로 call 할 수 있도록 설계됐는데, 이는 아래 코드를 보면 알 수 있다. <br>
여기서 알 수 있는 점 한가지. Sequential에서 list로 저 함수들을 받아서 차례로 아래와 같이 call을 해주는 역할을 해준다는 것을 알 수 있다.<br><br>

파이썬을 사용해보지 않은 분들은 조금 생소한 표현 방법일 수 있지만 tf.keras는 이러한 표현 방식을 적극 수용한다. <br>
모든 layer 객체는 저렇게 생성된다고 보면 된다. <br> <br>

우리가 이 API를 사용 할 필요가 있는 이유는 입출력 interface가 노출되어 있다는 점이다. <br>
Sequential을 시용할 경우 입력, 출력 값에 우리가 접근 할 방법이 없다. <br>
레이어를 설계하다보면 좀 샛길이 생길수도 있고, 갈림길도 생길 수 있다<br><br>

고속도로같은 레이어 설계를 할 때는 Sequential을 이용하는게 편리하지만, 조금이라도 복잡한 모델을 짜는걸 생각한다면 아래의 스타일을 따르는 것이 편리하다.<br><br>

마지막으로 Input 부분인데, Sequential에선 볼 수 없는 라인이다. <br>
여기다가는 내가 입력할 데이터의 shape을 적어주면 된다. <br> 
그렇게 Input과 output이 정의되면 tf.keras.Model은 input, output으로 정의된 부분을 받아서 모델 전체를 정의 할 수 있다


In [6]:
# 이것은 다른 방법
# 큰 차이점 : input output 이 처음것은 명시되어 있지 않음
# 이것은 input, output layer 가 있음
# middle level 의 api 이 전것들은 high level

# input : shape을 넣어주면서 왜 input 을 넣어주어야 하는가?
# 이전에 placeholder (shape()) 으로 넣어주었다.
# placeholder 를 input 으로 많이 사용했었다. 
# w(weight)와 const(value) 상수를 내부적으로 정해놓고 갈수가 있음, model 안에서 정의될 수 있는 value 이다.
# 사용자가 w 와 const 를 건드릴 수 없다.
# 사용자의 data를 초깃값으로 placeholder 에 넣어줄 수 있다.
inputs = tf.keras.Input(shape=(5,)) # 옛날의 placeholder 개념이 여기 input 으로 사용되게 된다.
x = tf.keras.layers.Dense(10)(inputs) # 두 개의 괄호 : lambda 표현식 Dense(10)이 생성자

# def __init__(self)
#   이 생성자는 return 이 없어야 한다

# def __call__(self)
#   리턴 타입이 함수형이다.
#   return function 

x = tf.keras.layers.Dense(10)(x)
x = tf.keras.layers.Dense(10)(x)
out = tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)(x)

# 모델은 시작과 끝만 알려주면 된다. 연결성은 위에서 정의를 해준다.
# 이는 symbolic graphic 형태이기 때문에 가질 수 있는 장점이다.
# input 과 output 을 여러개로 넣고 빼려면 () 튜플 형태로 넣어주면된다.
model = tf.keras.Model(inputs=inputs, outputs=out)

# compile (train 시 lossfounction, optimizer, matrix 등을 추가해서 해석)
model.compile(optimizer=tf.train.GradientDescentOptimizer(1e-2),
              loss=tf.keras.losses.binary_crossentropy,
              metrics=[tf.keras.metrics.binary_accuracy])

# train (fit)
model.fit(data, label, epochs=10)
result = model.predict(data)
print(result)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[[0.9385344 ]
 [0.08961135]]


### keras.Lambda

사실 tf.keras API 가 단순연산에 그렇게 직관적인 편은 아니다. <br>
5랑 10을 곱하기가 이렇게 힘들다. <br><br>

사실 tf.keras.layers에 모든 연산이 다 정의 돼있진 않기 때문에 (딥러닝에 쓸만한 몇가지 연산만 정의돼있다.) 사용자가 직접 tf.keras.layer 클래스를 상속받아서 custom layer를 작성하거나 아래처럼 Labmda 를 이용하여 lambda 표현식으로 layer 형태로 연산을 수행 할 수 있다. <br><br>

In [9]:
input1 = tf.keras.Input(shape=(1,))
input2 = tf.keras.Input(shape=(1,))

# 기본 연산을 해주기 위해서 Lambda layer 를 활용해주는 것이다.
# input1 과 input2 가 x[0], x[1]에 들어가는 것 
# 이 연산을 해주기 위해서 Lambda layer 가 들어가는 것
out = tf.keras.layers.Lambda(lambda x: x[0] * x[1])([input1, input2])
model = tf.keras.Model(inputs=(input1, input2), outputs=out)

result = model.predict(([5], [10]))
print(result)


[[50.]]


이를 직관적으로 표현하는 방법으로 tensorflow에서는 eager mode를 제공하고 있다.

In [0]:
# eagermode 가 실행 되었을 때, 계산 방법
const1 = tf.constant(5)
const2 = tf.constant(10)
result = const1 * const2
print(result)

In [3]:
# eager mode 가 없을 때는, interprete 하게 계산을 하고 결과를 확인해줄 수 있게끔 해주는 것이다.
const1 = tf.constant(5)
const2 = tf.constant(10)
result = const1 * const2
print(result)

with tf.Session() as sess:
  res = sess.run(result)
  print(res)

Tensor("mul_1:0", shape=(), dtype=int32)
50
