# FUNDAMENTALS 21. TF2 API 개요

##🍎 학습목표
- Tensorflow V2의 개요와 특징을 파악한다.
- Tensorflow V2의 3가지 주요 API 구성 방식을 이해하고 활용할 수 있다.
- GradientTape를 활용해 보고 좀 더 로우 레벨의 딥러닝 구현 방식을 이해한다.

### 🍎 TensorFlow2에서 딥러닝 모델을 작성하는 방법 3가지
- Sequential, Functional, 그리고 Model Subclassing입니다. 
- 아마 Sequential 모델은 이미 몇 번 사용해 보셔서 정확한 개념은 몰라도 익숙하실 것입니다. Functional은 Sequential의 보다 일반화된 개념입니다.
- Subclassing은 클래스로 구현된 기존의 모델을 상속받아 자신만의 모델을 만들어나가는 방식입니다.


## 1) TensorFlow2 Sequential Model
```
import tensorflow as tf
from tensorflow import keras

model = keras.Sequential()
model.add(__넣고싶은 레이어__)
model.add(__넣고싶은 레이어__)
model.add(__넣고싶은 레이어__)

model.fit(x, y, epochs=10, batch_size=32)
```
앞선 자료에서 공부했던 모델은 대부분 위와 같은 형식이었습니다. `model = keras.Sequential()` 이라고 선언한 부분이 눈에 띄시나요? Sequential 모델을 활용하면 손쉽게 딥러닝 모델을 쌓아나갈 수 있습니다. 입력부터 출력까지 레이어를 그야말로 sequential하게 차곡차곡 add해서 쌓아나가기만 하면 됩니다. 무엇보다 이 방식은 초보자가 접근하기에 매우 쉽다는 장점이 있습니다. 그렇지만 모델의 입력과 출력이 여러 개인 경우에는 적합하지 않은 모델링 방식입니다. Sequential 모델은 반드시 입력 1가지, 출력 1가지를 전제로 합니다.

아래 참고 자료에서 Sequential Model로 작성한 모델의 전체 코드를 확인해 주세요. 실습 세션에서 해당 모델링을 직접 진행해 볼 예정입니다.

- [텐서플로 2.0 시작하기: 초보자용](https://www.tensorflow.org/tutorials/quickstart/beginner)

## 2) TensorFlow2 Functional API
```
import tensorflow as tf
from tensorflow import keras

inputs = keras.Input(shape=(__원하는 입력값 모양__))
x = keras.layers.__넣고싶은 레이어__(관련 파라미터)(input)
x = keras.layers.__넣고싶은 레이어__(관련 파라미터)(x)
outputs = keras.layers.__넣고싶은 레이어__(관련 파라미터)(x)

model = keras.Model(inputs=inputs, outputs=outputs)
model.fit(x,y, epochs=10, batch_size=32)
```
여기서 위 `Sequential Model`을 활용하는 것과 다른 점은 바로 `keras.Model`을 사용한다는 점입니다. 그래서 `Sequential Model`을 쓰는 것보다 더 일반적인 접근인 것입니다. `Sequential Model`이란 사실 `keras.Model`을 상속받아 확장한 특수 사례에 불과한 것이니까요. `Functional API`를 활용하면 앞서 배운 `Sequential Model`을 활용하는 것보다 더 자유로운 모델링을 진행할 수 있습니다. `Functional`이라는 뜻이 뭔가요? 함수형으로 모델을 구성한다는 것, 즉 **입력과 출력을 규정함으로써 모델 전체를 규정**한다는 생각입니다. 그래서 이번에는 `Input`이라는 것을 규정합니다. `Input`이 될 수 있는 텐서가 여러 개가 될 수도 있습니다. 그리고 레이어들을 자유롭게 엮어 출력(Output)까지 규정하면 Model이란 바로 `inputs`와 `outputs` 만으로 규정됩니다. 정말 Functional하지 않나요?

Sequential Model의 제약점이 1개의 입력/출력이었다면 Functional API를 통해 다중 입력/출력을 가지는 모델을 구성할 수 있습니다.

아래 참고 자료에서 Functional API를 활용해서 모델링 하는 방법에 대해서 살펴봐 주세요. 실습 세션에서 해당 모델링을 직접 진행해 볼 예정입니다.

- [The Keras functional API](https://www.tensorflow.org/guide/keras/functional)

## 3) TensorFlow2 Subclassing
```
import tensorflow as tf
from tensorflow import keras

class CustomModel(keras.Model):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.__정의하고자 하는 레이어__()
        self.__정의하고자 하는 레이어__()
        self.__정의하고자 하는 레이어__()
    
    def call(self, x):
        x = self.__정의하고자 하는 레이어__(x)
        x = self.__정의하고자 하는 레이어__(x)
        x = self.__정의하고자 하는 레이어__(x)
        
        return x
    
model = CustomModel()
model.fit(x,y, epochs=10, batch_size=32)
```
마지막으로 `Subclassing`을 활용하면 제일 자유로운 모델링을 진행할 수 있습니다. 사실 본질적으로는 `Functional`한 접근과 차이가 없습니다. 이것은 `keras.Model`을 상속받은 모델 클래스를 만드는 것이기 때문입니다. 처음 만났던 `Sequential Model`도 따지고 보면 `keras.Model`을 상속받은 모델 클래스의 하나일 뿐입니다. `keras.Model`은 위와 같이 `__init__()`이라는 메서드 안에서 레이어 구성을 정의합니다. 그리고 `call()`이라는 메서드 안에서 레이어 간 `forward propagation`을 구현합니다. 이것으로 끝입니다. 다만, 각 레이어에 대한 깊은 이해가 필요하고 초심자에게 의도치 않은 버그를 유발할 수 있습니다. 그렇지만 여러분들이 공부해 나가시면서 복잡한 모델링을 진행하시게 되면 가장 많이 접하게 되실 모델링 스타일이기에 실습 세션에서 다뤄볼 예정입니다.

아래 참고 자료에서 `Subclassing`을 활용한 모델링에 대해서 살펴봐주세요. 실습세션에서 해당 모델링을 직접 진행해볼 예정입니다.

- [텐서플로 2.0 시작하기: 전문가용](https://www.tensorflow.org/tutorials/quickstart/advanced)

## Tensorflow2 API로 모델 작성하기
### 🍎 MNIST (1) Sequential API 활용

In [1]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

In [2]:
# 데이터 구성부분
mnist = keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

x_train=x_train[...,np.newaxis]  # : = ... 같은거임 !!!
x_test=x_test[...,np.newaxis]

print(len(x_train), len(x_test))

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
60000 10000


In [3]:
# Sequential Model을 구성해주세요.
"""
Spec:
1. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. 64개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
3. Flatten 레이어
4. 128개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
5. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
"""

# 여기에 모델을 구성해주세요
model = keras.Sequential([
    keras.layers.Conv2D(32, 3, activation='relu'),
    keras.layers.Conv2D(64, 3, activation='relu'),
    keras.layers.Flatten(),
	keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

In [4]:
# 모델 학습 설정

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 8s - loss: 0.0528 - accuracy: 0.9885 - 8s/epoch - 25ms/step


[0.05278196558356285, 0.9884999990463257]

###🍎 MNIST (2) Functional API 활용
- `keras.Model`을 직접 활용
- `keras.Input`으로 정의된 input 및 output 레이어 구성을 통해 model 구현

In [5]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

In [6]:
mnist = keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

x_train=x_train[...,np.newaxis]
x_test=x_test[...,np.newaxis]

print(len(x_train), len(x_test))

60000 10000


In [7]:
"""
Spec:
0. (28X28X1) 차원으로 정의된 Input
1. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. 64개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
3. Flatten 레이어
4. 128개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
5. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
"""

# 여기에 모델을 구성해 주세요.
inputs = keras.Input(shape=(28, 28, 1))

x = keras.layers.Conv2D(32, 3, activation='relu')(inputs)
x = keras.layers.Conv2D(64, 3, activation='relu')(x)
x = keras.layers.Flatten()(x)
x = keras.layers.Dense(128, activation='relu')(x)
predictions = keras.layers.Dense(10, activation='softmax')(x)

model = keras.Model(inputs=inputs, outputs=predictions)

In [8]:
# 모델 학습 설정

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 8s - loss: 0.0551 - accuracy: 0.9862 - 8s/epoch - 26ms/step


[0.05506592243909836, 0.9861999750137329]

##🍎 MNIST (3) Subclassing 활용
- `Subclassing` 방법은 `keras.Model`을 상속받은 클래스를 만드는 것
- `__init__()` 메서드 안에서 레이어를 선언
- `call()` 메서드 안에서 `forward propagation`을 구현하는 방식
- `Functional` 방식과 비교하자면, `call()`의 입력이 Input이고, `call()`의 리턴값이 Output이 된다

In [9]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

In [10]:
# 데이터 구성부분
mnist = keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

x_train=x_train[...,np.newaxis]
x_test=x_test[...,np.newaxis]

print(len(x_train), len(x_test))

60000 10000


In [11]:
# Subclassing을 활용한 Model을 구성해주세요.
"""
Spec:
0. keras.Model 을 상속받았으며, __init__()와 call() 메서드를 가진 모델 클래스
1. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. 64개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
3. Flatten 레이어
4. 128개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
5. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
6. call의 입력값이 모델의 Input, call의 리턴값이 모델의 Output
"""

# 여기에 모델을 구성해주세요
class CustomModel(keras.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = keras.layers.Conv2D(32, 3, activation='relu')
        self.conv2 = keras.layers.Conv2D(64, 3, activation='relu')
        self.flatten = keras.layers.Flatten()
        self.fc1 = keras.layers.Dense(128, activation='relu')
        self.fc2 = keras.layers.Dense(10, activation='softmax')
        
    def call(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.fc2(x)
        
        return x
        
model = CustomModel()

In [None]:
# 모델 학습 설정

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 8s - loss: 0.0399 - accuracy: 0.9882 - 8s/epoch - 25ms/step


[0.039857883006334305, 0.9882000088691711]

## TensorFlow2 API로 모델 작성 및 학습하기
###🍎 CIFAR-100 (1) Sequential API 활용
> #### [CIFAR-10 dataset](https://www.cs.toronto.edu/~kriz/cifar.html)  
The CIFAR-10 dataset consists of 60000 32x32 colour images in 10 classes, with 6000 images per class. There are 50000 training images and 10000 test images.

In [None]:
import tensorflow as tf
from tensorflow import keras

In [None]:
# 데이터 구성부분
cifar100 = keras.datasets.cifar100

(x_train, y_train), (x_test, y_test) = cifar100.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
print(len(x_train), len(x_test))

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz
50000 10000


In [None]:
# Sequential Model을 구성해주세요.
"""
Spec:
1. 16개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. pool_size가 2인 MaxPool 레이어
3. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
4. pool_size가 2인 MaxPool 레이어
5. 256개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
6. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
"""

# 여기에 모델을 구성해주세요
model = keras.Sequential([
    keras.layers.Conv2D(16, 3, activation='relu'),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Conv2D(32, 3, activation='relu'),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Flatten(),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(100, activation='softmax')
])

In [None]:
# 모델 학습 설정
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 학습 관련 부분을 작성해주세요
model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 3s - loss: 2.6136 - accuracy: 0.3501 - 3s/epoch - 10ms/step


[2.6135876178741455, 0.35010001063346863]

##🍎 CIFAR-100 (2) Functional API 활용
- `keras.Model`을 직접 활용
- `keras.Input`으로 정의된 input 및 output 레이어 구성을 통해 model 구현

In [None]:
import tensorflow as tf
from tensorflow import keras

In [None]:
cifar100 = keras.datasets.cifar100

(x_train, y_train), (x_test, y_test) = cifar100.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
print(len(x_train), len(x_test))

50000 10000


In [None]:
# Functional API를 활용한 Model을 구성해주세요.
"""
Spec:
0. (32X32X3) 차원으로 정의된 Input
1. 16개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. pool_size가 2인 MaxPool 레이어
3. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
4. pool_size가 2인 MaxPool 레이어
5. 256개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
6. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
"""

# 여기에 모델을 구성해주세요
inputs = keras.Input(shape=(32, 32, 3))

x = keras.layers.Conv2D(16, 3, activation='relu')(inputs)
x = keras.layers.MaxPool2D((2,2))(x)
x = keras.layers.Conv2D(32, 3, activation='relu')(x)
x = keras.layers.MaxPool2D((2,2))(x)
x = keras.layers.Flatten()(x)
x = keras.layers.Dense(256, activation='relu')(x)
predictions = keras.layers.Dense(100, activation='softmax')(x)

model = keras.Model(inputs=inputs, outputs=predictions)

In [None]:
# 모델 학습 설정
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 학습 관련 부분을 작성해주세요
model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 3s - loss: 2.5922 - accuracy: 0.3537 - 3s/epoch - 10ms/step


[2.5922296047210693, 0.35370001196861267]

## 🍎 CIFAR-100 (3) Subclassing 활용
- `Subclassing` 방법은 `keras.Model`을 상속받은 클래스를 만드는 것
- `__init__()` 메서드 안에서 레이어를 선언
- `call()` 메서드 안에서 `forward propagation`을 구현하는 방식
- `Functional` 방식과 비교하자면, `call()`의 입력이 Input이고, `call()`의 리턴값이 Output이 된다

여전히 정확도는 40% 미만의 수치

In [None]:
import tensorflow as tf
from tensorflow import keras

In [None]:
# 데이터 구성부분
cifar100 = keras.datasets.cifar100

(x_train, y_train), (x_test, y_test) = cifar100.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
print(len(x_train), len(x_test))

50000 10000


In [None]:
# Subclassing을 활용한 Model을 구성해주세요.
"""
Spec:
0. keras.Model 을 상속받았으며, __init__()와 call() 메서드를 가진 모델 클래스
1. 16개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
2. pool_size가 2인 MaxPool 레이어
3. 32개의 채널을 가지고, 커널의 크기가 3, activation function이 relu인 Conv2D 레이어
4. pool_size가 2인 MaxPool 레이어
5. 256개의 아웃풋 노드를 가지고, activation function이 relu인 Fully-Connected Layer(Dense)
6. 데이터셋의 클래스 개수에 맞는 아웃풋 노드를 가지고, activation function이 softmax인 Fully-Connected Layer(Dense)
7. call의 입력값이 모델의 Input, call의 리턴값이 모델의 Output
"""

# 여기에 모델을 구성해주세요
class CustomModel(keras.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = keras.layers.Conv2D(16, 3, activation='relu')
        self.maxpool1 = keras.layers.MaxPool2D((2,2))
        self.conv2 = keras.layers.Conv2D(32, 3, activation='relu')
        self.maxpool2 = keras.layers.MaxPool2D((2,2))
        self.flatten = keras.layers.Flatten()
        self.fc1 = keras.layers.Dense(256, activation='relu')
        self.fc2 = keras.layers.Dense(100, activation='softmax')
        
    def call(self, x):
        x = self.conv1(x)
        x = self.maxpool1(x)
        x = self.conv2(x)
        x = self.maxpool2(x)
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.fc2(x)
        
        return x
        
model = CustomModel()

In [None]:
# 모델 학습 설정
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 학습 관련 부분을 작성해주세요
model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 3s - loss: 2.6665 - accuracy: 0.3469 - 3s/epoch - 9ms/step


[2.6665449142456055, 0.34689998626708984]

## 🍎 GradientTape의 활용
### Automatic differentiation - GradientTape
우리는 조금 전까지 아주 비슷한 테스크 2개를, 본질적으로 큰 차이가 없는 3개의 모델 구성 방법을 활용하여 딥러닝으로 구현해 보았습니다. 그동안 완전히 동일하게 구성했던 것은 바로 아래와 같이 구성된 모델 학습 관련 부분입니다.
```
# 모델 학습 설정
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)
```
Numpy만 가지고 딥러닝을 구현하는 것을 회상해 봅시다. `model.fit()`이라는 한 줄로 수행 가능한 딥러닝 모델 훈련 과정은 실제로는 어떠했나요?
###🍎 train_step
1. Forward Propagation 수행 및 중간 레이어값 저장
2. Loss 값 계산
3. 중간 레이어값 및 Loss를 활용한 체인룰(chain rule) 방식의 역전파(Backward Propagation) 수행
4. 학습 파라미터 업데이트
> 이런 과정이 TF2 API에는 `model.fit()`이라는 메서드 안에 모두 추상화되어 포함되어 있다.

##🍎 Tensorflow에서 제공하는 `tf.GradientTape`
- 위와 같이 순전파(forward pass) 로 진행된 모든 연산의 중간 레이어값을 **tape**에 기록하고, 이를 이용해 gradient를 계산한 후 **tape**를 폐기하는 기능을 수행
- 그래디언트를 좀 더 고급스럽게 활용하는 다양한 기법을 통해 자주 사용됨

### 이전 스텝에서 진행했던 학습을 `tf.GradientTape`를 이용한 것으로 변형해 보자. 

In [None]:
import tensorflow as tf
from tensorflow import keras

# 데이터 구성부분
cifar100 = keras.datasets.cifar100

(x_train, y_train), (x_test, y_test) = cifar100.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
print(len(x_train), len(x_test))

# 모델 구성부분
class CustomModel(keras.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = keras.layers.Conv2D(16, 3, activation='relu')
        self.maxpool1 = keras.layers.MaxPool2D((2,2))
        self.conv2 = keras.layers.Conv2D(32, 3, activation='relu')
        self.maxpool2 = keras.layers.MaxPool2D((2,2))
        self.flatten = keras.layers.Flatten()
        self.fc1 = keras.layers.Dense(256, activation='relu')
        self.fc2 = keras.layers.Dense(100, activation='softmax')

    def call(self, x):
        x = self.conv1(x)
        x = self.maxpool1(x)
        x = self.conv2(x)
        x = self.maxpool2(x)
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.fc2(x)

        return x

model = CustomModel()

50000 10000


여기까지는 앞에서 다루었던 Subclassing을 활용한 모델 작성법과 전혀 다르지 않습니다. 달라지는 것은 model.compile(), model.fit()을 통해 손쉽게 진행했던 학습 세팅 및 수행 부분입니다.
```
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
```
- **model.compile()**: 모델 학습을 위해 `loss`, `optimizer`를 지정해 주면 내부적으로는 매 스텝 학습이 진행될 때마다 발생하는 loss 및 그래디언트가 어떻게 학습 파라미터를 업데이트하게 되는지를 지정해 주는 작업이 `model.compile()` 안에서 자동으로 진행

### 🍎 아래 코드
- `tape.gradient()`를 통해 매 스텝 학습이 진행될 때마다 발생하는 그래디언트를 추출한 후 
- `optimizer.apply_gradients()`를 통해 발생한 그래디언트가 
- 업데이트해야 할 파라미터 `model.trainable_variables`를 지정해 주는 과정을 기술한 것입니다.

In [None]:
loss_func = tf.keras.losses.SparseCategoricalCrossentropy()
optimizer = tf.keras.optimizers.Adam()

# tf.GradientTape()를 활용한 train_step
def train_step(features, labels):
    with tf.GradientTape() as tape:  # with로 GradientTape()를 tape로 잠깐 사용 후 반납 
        predictions = model(features)
        loss = loss_func(labels, predictions)
        gradients = tape.gradient(loss, model.trainable_variables)
    optimizer.apply_gradients(zip(gradients, model.trainable_variables))  # zip 압축
    return loss

> 매 스텝 진행되는 학습의 실제 동작이 `train_step()` 메서드로 구현되었습니다.
```
model.fit(x_train, y_train, epochs=5, batch_size=32)
```
### `model.fit()`으로 위와 같이 한 줄로 간단하게 수행되던 실제 배치 학습 과정
- 매 스텝마다 위에서 구현했던 `train_step()`가 호출되는 과정으로 바꾸어 구현 가능. 
- `model.fit()` 호출 시에 결정되는 `batch_size`만 결정해 주면 된다.



In [None]:
import time
def train_model(batch_size=32):
    start = time.time()
    for epoch in range(5):
        x_batch = []
        y_batch = []
        for step, (x, y) in enumerate(zip(x_train, y_train)):  # x_train, y_train 쌍의 크기만큼의 step마다 (x_train이랑 y_train)이 쌍으로 append
            x_batch.append(x)
            y_batch.append(y)
            if step % batch_size == batch_size-1:  # 이걸 만족하는 경우 x_batch, y_batch 초기화 // step =0부터 시작 batch size 0~31까지 가야지만 batch_size=32가 되니까..ㅇㅇ
                loss = train_step(np.array(x_batch, dtype=np.float32), np.array(y_batch, dtype=np.float32)) # epoch별로 loss값을 계산하기 위해 필요한 코드
                x_batch = []
                y_batch = []
        print('Epoch %d: last batch loss = %.4f' % (epoch, float(loss))) 
    print("It took {} seconds".format(time.time() - start))

train_model()

Epoch 0: last batch loss = 3.0676
Epoch 1: last batch loss = 2.5280
Epoch 2: last batch loss = 2.3113
Epoch 3: last batch loss = 2.1450
Epoch 4: last batch loss = 2.0090
It took 374.85196232795715 seconds


> #### 🍎 위에서 구현한 `train_model()` 메서드가 실은 우리가 그동안 사용했던 `model.fit()` 메서드와 기능적으로 같다.

- 이렇듯 `tf.GradientTape()`를 활용하면 `model.compile()`과 `model.fit()` 안에 감추어져 있던 한 스텝의 학습 단계(위 예제에서는 `train_step` 메서드)를 끄집어내서 자유롭게 재구성
- 지도학습 방식과 다른 강화학습 또는 GAN(Generative Advasarial Network)의 학습을 위해서는 `train_step` 메서드의 재구성이 필수적이므로 `tf.GradientTape()`의 활용법 숙지 필요 !!


In [None]:
# evaluation
prediction = model.predict(x_test, batch_size=x_test.shape[0], verbose=1)
temp = sum(np.squeeze(y_test) == np.argmax(prediction, axis=1))  # squeeze: 3*2*1인 경우 1차원의 배열 삭제 // 확률값 가장 높은 것 argmax: prediction값들 중 max index -> 만족하는게 True인 값들만 temp
temp/len(y_test)  # Accuracy  # 실제 라벨하고 prediction의 max값이 가장 큰 거랑 같은 애들만 뽑아옴. 



0.3441

- 그래디언트를 활용할 필요가 없는 evaluation 단계: 기존 `model.predict()` 메서드 다시 활용
- 충분한 성능을 확인할 수 있을 만큼의 학습이 진행된 상태가 아니니 최종 Accuracy 값은 신경 ❌

여기까지 Tensorflow V2 API 활용법을 살펴보았습니다.

In [None]:
y_test

array([[49],
       [33],
       [72],
       ...,
       [51],
       [42],
       [70]])