# TensorFlow 2.x Basics

TensorFlow는 ML 모델을 개발하고 학습시키는 데 도움이 되는 핵심 오픈소스 라이브러리입니다.

TensorFlow와 Keras는 모두 약 4년전쯤 릴리즈 되었습니다 (Keras는 2015년 3월, TensorFlow는 2015년 11월). 이는 딥러닝 세계의 관점에서 볼 때, 꽤 오랜시간이라고 볼 수 있습니다!

과거에 TensorFlow 1.x + Keras는 여러가지 알려진 문제점을 가지고 있었습니다:
- TensorFlow를 사용한다는것은 정적인 계산 그래프를 조작함을 의미하는것으로, Imperative 코딩 스타일을 사용하는 프로그래머로 하여금 어렵고, 불편한 느낌을 받게 했었습니다.
- TensorFlow API가 매우 강력하면서도 유연하지만, 빠른 코드의 작성의 가능성이 결여되어 있었으며 종종 사용법은 어렵고 혼란스러웠습니다.
- Keras는 매우 생산적이고 사용이 쉽지만, 연구에 사용된 사례에서 종종 유연성이 결여되었었습니다.

### TensorFlow 2.0은 TensorFlow와 Keras를 대대적으로 새로이 디자인한 것으로, 지난 4년간의 사용자 피드백과 기술의 진보가 모두 고려되었습니다. 위에서 언급된 문제점들을 대규모로 수정합니다.

TensorFlow 2.0은 아래와 같은 주요 아이디어에 기반하고 있습니다:

- 사용자들이 계산을 eager mode로 수행할 수 있게 해줍니다. 이는 Numpy를 사용하는법과 유사하며, TensorFlow 2.0을 이용한 프로그래밍이 직관적이며 동시에 pythonic할 수 있게끔 해 줍니다.
- 1.x에서의 컴파일된 그래프의 엄청난 이점을 그대로 보존하는데, 이는 성능, 분산, 그리고 배포를 위함입니다. 이 내용은 TensorFlow를 빠르고, 분산 구조에서의 확장 가능하며, 상용화에 준비될 수 있도록 해 줍니다.
- Keras를 딥러닝의 고수준 API로 채택하여, TensorFlow를 이해하기 쉬우면서도 높은 생산성을 가질 수 있게 만들어 줍니다.
- 매우 고수준(더 쉬운 사용성, 약간 부족한 유연성) 에서부터 매우 저수준(더 깊은 전문성, 매우 뛰어난 유연성)의 다양한 범위의 작업으로까지 Keras를 확장합니다.

In [None]:
## TensorFlow library는 아래와 같이 import 합니다
import tensorflow as tf

In [None]:
## TensorFlow와 함께 많이 쓰이는 numpy library는 아래와 같이 import 합니다
import numpy as np

In [None]:
## TensorFlow 내부에는 TensorFlow를 쉽고 편하게 쓸 수 있게 해주는 high-level framework인 Keras가 포함되어 있습니다.
from tensorflow import keras

In [None]:
## TensorFlow와 Keras의 version을 확인해봅시다
print(tf.__version__)
print(keras.__version__)

## TensorFlow 2.0 시작하기

[MNIST 데이터셋](http://yann.lecun.com/exdb/mnist/)을 로드하여 준비합니다. 샘플 값을 정수에서 부동소수로 변환합니다:

In [None]:
mnist = keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

층을 차례대로 쌓아 `tf.keras.Sequential` 모델을 만듭니다. 훈련에 사용할 옵티마이저(optimizer)와 손실 함수를 선택합니다:

In [None]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

모델을 훈련하고 평가합니다:

In [None]:
model.fit(x_train, y_train, epochs=10)

model.evaluate(x_test,  y_test)

데이터를 탐색해봅시다:

In [None]:
idx = np.random.randint(len(x_train))
image = x_train[idx]

In [None]:
import matplotlib.pyplot as plt
plt.imshow(image, cmap='gray')
plt.show()

In [None]:
y_train[idx]

내가 쓴 손글씨로 Test 해봅시다

In [None]:
import os
from PIL import Image
## 그림판을 이용하여 손으로 숫자를 쓴 다음 파일로 저장하고 아래를 실행하여 upload 합니다
from google.colab import files

uploaded = files.upload()

for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
      name=fn, length=len(uploaded[fn])))

In [None]:
## image file의 경로 설정
cur_dir = os.getcwd()
img_path = os.path.join(cur_dir, 'image.png')
## image file 읽기
cur_img = Image.open(img_path)
## 28x28로 resize
cur_img = cur_img.resize((28, 28))
image = np.asarray(cur_img)

## color image일 경우 RGB 평균값으로 gray scale로 변경
try:
  image = np.mean(image, axis=2)
except:
  pass
## upload한 image는 흰 배경에 검은 글씨로 되어 있으므로, MNIST data와 같이 검은 배경에 흰 글씨로 변경
image = np.abs(255-image)
## MNIST와 동일하게 data preprocessing(255로 나눠줌)
image = image.astype(np.float32)/255.
## 화면에 출력하여 확인
plt.imshow(image, cmap='gray')
plt.show()

In [None]:
image = np.reshape(image, (1, 28, 28))
model.predict(image)

In [None]:
## shape을 변경하여 학습된 model에 넣고 결과 확인
image = np.reshape(image, (1, 28, 28))
print("Model이 예측한 값은 {} 입니다.".format(np.argmax(model.predict(image), -1)))

## TensorFlow의 기본

### Tensors(텐서)

Tensor는 multi-dimensional array를 나타내는 말로, TensorFlow의 기본 data type입니다

In [None]:
## Hello World
hello = tf.constant([3,3], dtype=tf.float32)
print(hello)

In [None]:
## 상수형 tensor는 아래와 같이 만들 수 있습니다
## 출력해보면 tensor의 값과 함께, shape과 내부의 data type을 함께 볼 수 있습니다
x = tf.constant([[1.0, 2.0],
                 [3.0, 4.0]])
print(x)
print(type(x))

In [None]:
## 아래와 같이 numpy ndarray나 python의 list도 tensor로 바꿀 수 있습니다
x_np = np.array([[1.0, 2.0],
                [3.0, 4.0]])
x_list = [[1.0, 2.0], 
         [3.0, 4.0]]

print(type(x_np))
print(type(x_list))

In [None]:
x_np = tf.convert_to_tensor(x_np)
x_list = tf.convert_to_tensor(x_list)

print(type(x_np))
print(type(x_list))

In [None]:
## 반대로 tensor를 다음과 같이 numpy ndarray로 바꿀 수도 있습니다
x.numpy()

In [None]:
print(type(x.numpy()))

In [None]:
## Tensor는 numpy ndarray와 마찬가지로 dtype과 shape이라는 속성을 가지고 있습니다
print('dtype:', x.dtype)
print('shape:', x.shape)

In [None]:
## 상수형 tensor를 생성하는 방법으로 아래와 같은 방법이 많이 사용됩니다
print(tf.ones(shape=(2,2))*0.2)
print(tf.zeros(shape=(2,2)))

In [None]:
## tensor끼리의 4칙 연산은 element-wise 연산을 기본으로 합니다
a = tf.ones((2,2))*2
b = tf.ones((2,2))*6
print (a.numpy())
print (b.numpy())

## 덧셈
print ("덧셈")
print (tf.add(a, b).numpy())
print ((a + b).numpy())

## 뺄셈
print ("뺄셈")
print (tf.subtract(b, a).numpy())
print ((b - a).numpy())

## 곱셈
print ("곱셈")
print (tf.multiply(a, b).numpy())
print ((a * b).numpy())

## 나눗셈
print ("나눗셈")
print (tf.divide(b, a).numpy())
print ((b / a).numpy())

In [None]:
print(tf.matmul(a, b).numpy())

In [None]:
## Tensor와 numpy ndarray는 많은 경우에 자동으로 호환됩니다
ndarray = np.ones((3, 3))
print(ndarray)

## Tensor연산에 입력으로 tensor가 아닌 ndarray가 입력으로 들어갈 수 있습니다
print("TensorFlow operations convert numpy arrays to Tensors automatically")
tensor = tf.multiply(ndarray, 10)
print(tensor)

## numpy ndarray연산에 입력으로 tensor가 들어갈 수도 있습니다
print("And NumPy operations convert Tensors to numpy arrays automatically")
print(np.add(tensor, 2))

In [None]:
## Random한 상수형 tensor는 다음과 같이 만들 수 있습니다
## 아래는 표준정규분포로부터 상수를 생성합니다

tf.random.normal(shape=(2,2), mean=0., stddev=1.)

In [None]:
## 아래는 균등(uniform)분포로부터 random 상수를 생성합니다
tf.random.uniform(shape=(2, 2), minval=0, maxval=10, dtype='int32')

### Variables (변수)
[Variables](https://www.tensorflow.org/guide/variable)는 변할 수 있는 상태를 저장하는데 사용되는 특별한 텐서 입니다. 

우리는 대부분의 경우에 우리가 학습해야하는 가중치(weight, parameter)들을 variable로 생성합니다.

In [None]:
## 초기값을 사용해서 Variable을 생성할 수 있습니다
initial_value = tf.random.normal(shape=(2, 2))
weight = tf.Variable(initial_value)
print(weight)

In [None]:
## 아래와 같이 variable을 초기화해주는 initializer들을 사용할 수도 있습니다
weight = tf.Variable(tf.random_normal_initializer(stddev=1.)(shape=(2,2)))
print(weight)

In [None]:
## variable은 `.assign(value)`, `.assign_add(increment)`, 또는 `.assign_sub(decrement)`
## 와 같은 메소드를 사용해서 Variable의 값을 갱신합니다:'''

new_value = tf.random.normal(shape=(2,2))
print(new_value)
weight.assign(new_value)
print(weight)

In [None]:
added_value = tf.ones(shape=(2,2))
weight.assign_sub(added_value)
print(weight)

### Tensor Operations

#### Indexing, Slicing

In [None]:
x = tf.constant([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(x)

In [None]:
## indexing - indexing을 사용하면 항상 차원이 감소합니다
print(x[0])
print(x[1])
print(x[2])
print(x[0, 1])
print(x[1, 2])
print(x[2, 3])

In [None]:
## slicing
print(x[2:, 3:])
# print(x[:2, 1:3])
# print(x[1:3, 3:])

#### Reshape

In [None]:
t = tf.constant([[[0, 1, 2], 
                [3, 4, 5]],              
               [[6, 7, 8], 
                [9, 10, 11]]])
print(t.shape)

In [None]:
print(tf.reshape(t, shape=[-1, 3]))

In [None]:
print(tf.reshape(t, shape=[-1, 1, 3]))

#### Reduce Mean/Sum

In [None]:
x = tf.constant([[1., 2.],
                [3., 4.]])

print(x)
print(tf.reduce_mean(x))

In [None]:
print(tf.reduce_mean(x, axis=0))

In [None]:
print(tf.reduce_mean(x, axis=1))

In [None]:
print(tf.reduce_mean(x, axis=-1))

여기서 축(axis)은 각 배열의 차원에 해당되는 인덱스입니다. 위의 예를 설명하면

- x.shape 은 (2, 2) 입니다.
- tf.reduce_mean(x, axis=0) 은
- x.shape[axis]: x.shape[0] 에 대하여 연산을 하라는 의미
입니다.

X.shape == (5, 3, 2) 인 경우를 생각해봅시다. 이 경우 tf.reduce_mean(X, axis=1) 의 결과값은

1. X.shape[axis] => X.shape[1] 에 대해서 연산을 하기 때문에
2. tf.reduce_mean(X, axis=1).shape 은 (5, 3, 2) -> (5, 2) 가 됩니다.

In [None]:
print(tf.reduce_sum(x))

In [None]:
print(tf.reduce_sum(x, axis=0))

In [None]:
print(tf.reduce_sum(x, axis=-1))

#### Argmax

In [None]:
x = [[3, 4, 5],
     [5, 4, 3]]
print(x)
print(tf.argmax(x, axis=0))

In [None]:
print(tf.argmax(x, axis=1))

In [None]:
print(tf.argmax(x, axis=-1))

#### One-hot Encoding

In [None]:
label = tf.constant([0, 1, 2, 0])
onehot1 = tf.one_hot(label, depth=3)
onehot2 = keras.utils.to_categorical(label, num_classes=3)

print(onehot1, type(onehot1))
print(onehot2, type(onehot2))

#### Type Casting

In [None]:
print(tf.cast([1.8, 2.2, 3.3, 4.9], tf.int32))

In [None]:
print(tf.cast([True, False, 1 == 1, 0 == 1], tf.int32))

### tf.data를 이용하여 Dataset 만들기

TensorFlow를 이용하여 deep learning model을 학습할 때, input data 및 label을 공급해주기 위하여 tf.data.Dataset을 이용합니다.

In [None]:
a = np.arange(10)
print(a)

In [None]:
## 0에서 9까지 정수가 input data라고 가정해봅시다
a = np.arange(10)
print(a)

## dataset은 아래와 같이 만들 수 있습니다
ds_tensors = tf.data.Dataset.from_tensor_slices(a)
print(ds_tensors)

## dataset에서 앞 5개 data를 꺼내서 확인해보겠습니다
#data = ds_tensors.take(5)
for x in ds_tensors:
    print (x)
    #model(x)

In [None]:
## dataset 내의 각 data에 함수를 적용하기 위해서는 아래와 같이 map을 사용합니다
## 이는 data 전처리에 많이 사용됩니다
## 또한 data를 섞어주는 shuffle과 batch size만큼 data를 꺼내주는 batch도 사용할 수 있습니다

ds_tensors = ds_tensors.map(tf.square).shuffle(10).batch(2)

In [None]:
## 실제 data를 꺼내서 사용할 때는 아래와 같이 for문에 dataset을 넣어주면 됩니다.
print('Elements of ds_tensors:')
print('='*50)
for _ in range(3):
    for x in ds_tensors:
        print(x)
    print('='*50)

### TensorFlow를 이용하여 자동미분 계산하기

Deep learning model을 학습시키기 위해서는 gradient descent 방법을 사용하고, 이를 위해서는 gradient 즉 미분을 계산해야 합니다.
(Loss 를 weight로 미분)

TensorFlow에서 자동으로 미분을 계산하는 방법을 알아보겠습니다

TensorFlow는 자동 미분을 위한 tf.GradientTape API를 제공합니다. 

tf.GradientTape는 컨텍스트(context) 안에서 실행된 모든 연산을 테이프(tape)에 "기록"합니다. 

그 다음 TensorFlow는 후진 방식 자동 미분(reverse mode differentiation)을 사용해 테이프에 "기록된" 연산의 그래디언트를 계산합니다.

In [None]:
## GradientTape를 열게되면, 그때부턴 tape.watch()를 통해 tensor를 확인하고, 
## 이 tensor를 입력으로써 사용하는 미분을 자동으로 계산하는것이 가능합니다.
x = tf.ones((1,))*3

with tf.GradientTape() as t:
    t.watch(x)
    y = tf.square(x)

# 입력 텐서 x에 대한 z의 미분
dy_dx = t.gradient(y, x)
print(dy_dx)

In [None]:
## 기본적으로 Variable들은 자동으로 watch가 적용되어 있기 때문에, 수동으로 `watch`를 해 줄 필요는 없습니다.
x = tf.Variable(x)

with tf.GradientTape() as t:
    y = tf.square(x)

# 입력 텐서 x에 대한 z의 미분
dy_dx = t.gradient(y, x)
print(dy_dx)

## End-to-End 예제: 선형 회귀

가장 간단한 model중 하나인 선형 회귀(linear regression) 모델을 만들고 학습을 해보겠습니다

In [None]:
## Library import
import matplotlib.pyplot as plt

In [None]:
## For reproducibility
np.random.seed(777)
tf.random.set_seed(777)

In [None]:
x = np.linspace(0, 1, 100, dtype=np.float32)
x

In [None]:
## Input data 생성
## y = 1 * x + 2를 따르는 noisy한 data를 100개 생성함

## inputs
x = np.linspace(0, 1, 100, dtype=np.float32)

## ground truth
# 기울기
slopes = 1
# 절편에 noise 추가
intercept = np.random.normal(2, 0.2, 100).astype(np.float32)

## outputs
# y = 1*x + 2
y = x * slopes + intercept

In [None]:
print(slopes)

In [None]:
print(intercept)

In [None]:
## 만들어진 data와 ground truth 확인
plt.scatter(x, y)
#plt.plot(x, x * 1 + 2., label="ground truth", c="r")
#plt.legend()
plt.show()

In [None]:
## input data type 확인
x.dtype

In [None]:
## label type 확인
y.dtype

In [None]:
## input data shape 확인
x.shape

In [None]:
## label shape 확인
y.shape

In [None]:
## Dataset 만들기
dataset = tf.data.Dataset.from_tensor_slices((x, y))
dataset = dataset.shuffle(buffer_size=100).batch(50)

In [None]:
## Weight와 bias 만들기
w = tf.Variable(.1, tf.float32)
b = tf.Variable(0., tf.float32)

In [None]:
# learning rate
learning_rate = 0.1

In [None]:
## linear regression model 만들기
def compute_predictions(x):
    return x * w + b

In [None]:
## loss function - Mean Squared Error
def compute_loss(labels, predictions):
    return tf.reduce_mean(tf.square(labels - predictions))

In [None]:
## gradient 계산하여 gradient descent 학습법으로 weight와 bias update
def train_on_batch(x, y):
    with tf.GradientTape() as tape:
        predictions = compute_predictions(x)
        loss = compute_loss(y, predictions)
        dloss_dw, dloss_db = tape.gradient(loss, [w, b])
    w.assign_sub(learning_rate * dloss_dw)
    b.assign_sub(learning_rate * dloss_db)
    return loss

In [None]:
## 20 epoch 동안 학습진행
loss_list, w_list, b_list = [], [], []
for epoch in range(20):
    loss = 0.
    for x, y in dataset:
        loss_ = train_on_batch(x, y)
        loss += loss_ / 2.
    print(epoch+1, "\t", loss.numpy(), "\t", w.numpy(), "\t", b.numpy())
    loss_list.append(loss.numpy())
    w_list.append(w.numpy())
    b_list.append(b.numpy())

In [None]:
# Training graph
plt.plot(loss_list, label="loss")
plt.plot(w_list, label="w")
plt.plot(b_list, label="b")
plt.legend()
plt.show()

In [None]:
## 결과 확인
plt.scatter(x, y)
plt.plot(x, x * w_list[-1] + b_list[-1], label="model", c="r")
plt.plot(x, x * 1 + 2., label="ground truth", c="g")
plt.legend()
plt.show()

In [None]:
plt.scatter(x, y)
plt.show()