# Tensorflow로 모델링 하는 2가지 방법
* Sequential 모델링을 활용하는 방법
  * keras에서 제공하는 레이어들을 이어 붙여 가면서 모델링 하는 방법
  * 쉽고 빠르게 모델링이 가능
  * 커스터마이징이 조금 힘들다
* Functional API를 활용하는 방법
  * 개발자가 직접 레이어를 정의해서 keras의 레이어처럼 사용하게 할 수 있다.(tf.keras.layer.상속)
  * 기타 평가 방식이나 Loss, Optimizer 등등을 직접 정의해서 사용할 수 있다.

# tf.data 사용하기
* 일반적인 배열이 아닌, 병렬 처리된 배열을 이용하여 매우 빠른 속도로 데이터의 입출력이 가능
* dataset 이라는 개녕을 이용해서 feature, label을 손쉽게 관리 할 수 있다.

In [1]:
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras import datasets

In [2]:
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = x_train[..., tf.newaxis]
x_test = x_test[..., tf.newaxis]

x_train, x_test = x_train / 255.0, x_test / 255.0

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


# tf.data의 함수들
* from_tensor_slices() : feature, label을 합친 데이터세트(ds)를 생성
* shuffle() : 데이터세트에 들어있는 데이터를 랜덤하게 섞음
* batch() : 배치 생성하기

In [21]:
# 제너레이트 할 데이터를 넣어준다
# 데이터를 병렬로 처리할 수 있다. => 속도가 매우 빨라짐
train_ds = tf.data.Dataset.from_tensor_slices((x_train, y_train))

# 데이터 섞기
train_ds = train_ds.shuffle(1000) # 매개 변수 숫자는 랜덤 시드가 아닌 랜던을 생성하기 위한 버퍼 사이즈( 보통 1kb 정도로 설정 )

# 배치 생성
train_ds = train_ds.batch(32) # iteration 할 때마다 batch_size만큼 데이터가 나온다

In [22]:
# 테스트 ds 만들기
test_ds = tf.data.Dataset.from_tensor_slices((x_test, y_test))

In [23]:
# 테스트 세트는 셔플이 필요 없다
test_ds = test_ds.batch(32)

# tf.data로 만든 데이터세트의 시각화

In [8]:
import matplotlib.pyplot as plt
%matplotlib inline

take() 함수를 이용하면 데이터 배치 사이즈만큼 가지고 올 수 있다.

In [9]:
for images, labels in train_ds.take(2):
  image = images[0, ..., 0]
  label = labels.numpy()[0]

  plt.title(label)
  plt.imshow(image, 'gray')
  plt.show()

# tf.data를 이용한 CNN 모델 훈련

In [11]:
from tensorflow.keras.layers import Conv2D, Activation, MaxPool2D
from tensorflow.keras.layers import Dropout, Flatten, Dense

input_shape = ( 28, 28, 1 )
num_classes = 10
inputs = layers.Input(shape=input_shape)

# Feature Extraction
net = Conv2D(32, 3, padding='SAME')(inputs)
net = Activation("relu")(net)
net = Conv2D(32, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = MaxPool2D((2, 2))(net)
net = layers.Dropout(0.25)(net)
net = Conv2D(64, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = Conv2D(64, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = MaxPool2D((2, 2))(net)
net = layers.Dropout(0.25)(net)

# Fully Connected
net = Flatten()(net)
net = Dense(512)(net)
net = Activation("relu")(net)
net = Dropout(0.25)(net)

# Output Layer
net = Dense(num_classes)(net)
net = Activation("softmax")(net)

model = tf.keras.Model(inputs=inputs, outputs=net, name='Basic_CNN')

In [12]:
model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")

In [13]:
# tf.data를 이용해서 훈련
model.fit(train_da, epochs=1) 



<tensorflow.python.keras.callbacks.History at 0x7feb9222c748>

# Functional API 사용해 보기

Loss Function이나 Optimizer등을 Tensorflow 및 keras에서 제공하는 것이 아닌, 개발자가 직접 함수를 만들어서 사용할 때 커스터마이징하기 위한 방법

In [16]:
# Loss Function
loss_object = tf.keras.losses.SparseCategoricalCrossentropy()

# Optimizer
optimizer = tf.keras.optimizers.Adam()

In [14]:
train_loss = tf.keras.metrics.Mean(name="train_loss")
train_accuracy = tf.keras.metrics.SparseCategoricalAccuracy(name="train_accuracy")

test_loss = tf.keras.metrics.Mean(name="test_loss")
test_accuracy = tf.keras.metrics.SparseTopKCategoricalAccuracy(name='test_accuracy')

## @tf.function
Functional API에서 제일 많이 사용되는 어노테이션으로써, Tensorflow 세션에서 관리하는 함수가 될 수 있도록 해준다

`@tf.fuction`이 붙은 함수는 계산그래프가 모두 그려지고 실제 학습 되면서 수랭되기 때문에, Tensorflow의 리소스를 이용할 수 있게 된다. 

보통 학습 및 테스트하는 함수에 붙는다. 

In [15]:
# MNIST 추가 학습을 방지하기 위한 리모델링
input_shape = ( 28, 28, 1 )
num_classes = 10

inputs = layers.Input(shape=input_shape)

# Feature Extraction
net = Conv2D(32, 3, padding='SAME')(inputs)
net = Activation("relu")(net)
net = Conv2D(32, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = MaxPool2D((2, 2))(net)
net = layers.Dropout(0.25)(net)
net = Conv2D(64, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = Conv2D(64, 3, padding='SAME')(net)
net = Activation("relu")(net)
net = MaxPool2D((2, 2))(net)
net = layers.Dropout(0.25)(net)

# Fully Connected
net = Flatten()(net)
net = Dense(512)(net)
net = Activation("relu")(net)
net = Dropout(0.25)(net)

# Output Layer
net = Dense(num_classes)(net)
net = Activation("softmax")(net)

model = tf.keras.Model(inputs=inputs, outputs=net, name='Basic_CNN')

In [27]:
@tf.function
def train_step(images, labels):
  
  # 자동 미분 수행을 위한 환경 만들기 => loss 를 구하는 과정
  with tf.GradientTape() as tape:
    # 1. 예측
    prediction = model(images)
    
    # 2. loss 값 구하기
    loss = loss_object(labels, prediction)
  
  # 3. 오차 역전파 수행( gradients : 수정 되어야 할 기울기 벡터 )
  gradients = tape.gradient(loss, model.trainable_variables) # model.trainable_variables : 가중치, 편향 정보 ( 수정 가능한..)
  
  # 4. 최적화(apply_gradients : 매개변수 업데이트)
  optimizer.apply_gradients(zip(gradients, model.trainable_variables))

  # loss, accuracy 기록
  train_loss(loss)
  train_accuracy(labels, prediction)

In [19]:
@tf.function
def test_step(images, labels):
  prediction = model(images)
  t_loss = loss_object(labels, prediction)

  test_loss(t_loss)
  test_accuracy(labels, prediction)

In [28]:
# Functional API 방식으로 훈련

epochs = 10

for epoch in range(epochs):

  # 1 에폭은 모든 데이터에 대한 학습
  for images, labels in train_ds:
    train_step(images, labels)

  for test_images, test_labels in test_ds:
    test_step(test_images, test_labels)

  template = 'Epoch {}, Loss : {:.3f}, Accuracy: {:.3f}, Test Loss : {:.3f}, Test Accuracy: {:.3f}'
  print(template.format(epoch + 1, train_loss.result(), train_accuracy.result() * 100, test_loss.result(), test_accuracy.result() * 100))

Epoch 1, Loss : 0.097, Accuracy: 97.002, Test Loss : 0.066, Test Accuracy: 99.990
Epoch 2, Loss : 0.066, Accuracy: 97.960, Test Loss : 0.050, Test Accuracy: 99.995
Epoch 3, Loss : 0.052, Accuracy: 98.383, Test Loss : 0.048, Test Accuracy: 99.987
Epoch 4, Loss : 0.044, Accuracy: 98.632, Test Loss : 0.043, Test Accuracy: 99.990
Epoch 5, Loss : 0.038, Accuracy: 98.822, Test Loss : 0.040, Test Accuracy: 99.992
Epoch 6, Loss : 0.033, Accuracy: 98.957, Test Loss : 0.039, Test Accuracy: 99.993
Epoch 7, Loss : 0.030, Accuracy: 99.061, Test Loss : 0.037, Test Accuracy: 99.994
Epoch 8, Loss : 0.027, Accuracy: 99.149, Test Loss : 0.037, Test Accuracy: 99.995
Epoch 9, Loss : 0.025, Accuracy: 99.215, Test Loss : 0.037, Test Accuracy: 99.996
Epoch 10, Loss : 0.024, Accuracy: 99.268, Test Loss : 0.037, Test Accuracy: 99.995
