# TensorFlow 2.x Basics

본 실습강좌는 이진원 강사님이 정리한 강좌입니다.


In [None]:
## TensorFlow library는 아래와 같이 import 합니다
import tensorflow as tf

In [None]:
## TensorFlow와 함께 많이 쓰이는 numpy library는 아래와 같이 import 합니다
import numpy as np

In [None]:
## TensorFlow 내부에는 TensorFlow를 쉽고 편하게 쓸 수 있게 해주는 high-level framework인 Keras가 포함되어 있습니다.
from tensorflow import keras

In [None]:
## TensorFlow와 Keras의 version을 확인해봅시다
print(tf.__version__)
print(keras.__version__)

## TensorFlow의 기본

### Tensors(텐서)

Tensor는 multi-dimensional array를 나타내는 말로, TensorFlow의 기본 data type입니다

In [None]:
## Hello World
hello = tf.constant("Hello World")
print(hello)

In [None]:
## 상수형 tensor는 아래와 같이 만들 수 있습니다
## 출력해보면 tensor의 값과 함께, shape과 내부의 data type을 함께 볼 수 있습니다
x = tf.constant([[1.0, 2.0],
                 [3.0, 4.0]])
print(x)
x = tf.constant([[1, 2],
                 [3, 4]], dtype=tf.int32)
print(x)

In [None]:
## 아래와 같이 numpy ndarray나 python의 list도 tensor로 바꿀 수 있습니다
x_np = np.array([[1.0, 2.0],
                [3.0, 4.0]])
x_list = [[1.0, 2.0], 
         [3.0, 4.0]]

print(type(x_np))
print(type(x_list))

In [None]:
x_np = tf.convert_to_tensor(x_np)
x_list = tf.convert_to_tensor(x_list)

print(type(x_np))
print(type(x_list))

In [None]:
## 맨 처음에 생성한 tensor의 type도 동일합니다
print(type(x))

In [None]:
## 반대로 tensor를 다음과 같이 numpy ndarray로 바꿀 수도 있습니다
x.numpy()

In [None]:
print(type(x.numpy()))

In [None]:
## Tensor는 numpy ndarray와 마찬가지로 dtype과 shape이라는 속성을 가지고 있습니다
print('dtype:', x.dtype)
print('shape:', x.shape)

In [None]:
## 상수형 tensor를 생성하는 방법으로 아래와 같은 방법이 많이 사용됩니다
print(tf.ones(shape=(2,2)))
print(tf.ones(shape=(2,2))*3)
print(tf.zeros(shape=(2,2)))

In [None]:
## tensor끼리의 4칙 연산은 element-wise 연산을 기본으로 합니다
a = tf.ones((2,2))*2
b = tf.ones((2,2))*6
print (a.numpy())
print (b.numpy())

## 덧셈
print ("덧셈")
print (tf.add(a, b).numpy())
print ((a + b).numpy())

## 뺄셈
print ("뺄셈")
print (tf.subtract(b, a).numpy())
print ((b - a).numpy())

## 곱셈
print ("곱셈")
print (tf.multiply(a, b).numpy())  # tf.mul
print ((a * b).numpy())

## 나눗셈
print ("나눗셈")
print (tf.divide(b, a).numpy())
print ((b / a).numpy())

In [None]:
## Tensor와 numpy ndarray는 많은 경우에 자동으로 호환됩니다
tfarray = tf.ones((3,3))
ndarray = np.ones((3, 3))
print(tfarray)
print(ndarray)

## Tensor연산에 입력으로 tensor가 아닌 ndarray가 입력으로 들어갈 수 있습니다
print("TensorFlow operations convert numpy arrays to Tensors automatically")
tensor = tf.multiply(ndarray, 10)
print(tensor)

## numpy ndarray연산에 입력으로 tensor가 들어갈 수도 있습니다
print("And NumPy operations convert Tensors to numpy arrays automatically")
print(np.add(tensor, 2))

In [None]:
## Random한 상수형 tensor는 다음과 같이 만들 수 있습니다
## 아래는 표준정규분포로부터 상수를 생성합니다
tf.random.normal(shape=(2,2), mean=0., stddev=1.)

In [None]:
## 아래는 균등(uniform)분포로부터 random 상수를 생성합니다
tf.random.uniform(shape=(2, 2), minval=0, maxval=10, dtype='int32')

### Variables (변수)
[Variables](https://www.tensorflow.org/guide/variable)는 변할 수 있는 상태를 저장하는데 사용되는 특별한 텐서 입니다. 

우리는 대부분의 경우에 우리가 학습해야하는 가중치(weight, parameter)들을 variable로 생성합니다.

In [None]:
## 초기값을 사용해서 Variable을 생성할 수 있습니다
initial_value = tf.random.normal(shape=(2, 2))
print(initial_value)
weight = tf.Variable(initial_value)
print(weight)

In [None]:
## 아래와 같이 variable을 초기화해주는 initializer들을 사용할 수도 있습니다
weight = tf.Variable(tf.random_normal_initializer(stddev=0.1)(shape=(2,2)))
print(weight)

In [None]:
## variable은 `.assign(value)`, `.assign_add(increment)`, 또는 `.assign_sub(decrement)`
## 와 같은 메소드를 사용해서 Variable의 값을 갱신합니다:'''
new_value = tf.random.normal(shape=(2,2))
print(new_value)
weight.assign(new_value)
print(weight)

In [None]:
added_value = tf.ones(shape=(2,2))
weight.assign_add(added_value)
print(weight)

### Tensor Operations

#### Indexing, Slicing

In [None]:
a = tf.constant([1,2,3,6,7,8])
print(a[2])
x = tf.constant([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(x)

In [None]:
## indexing - indexing을 사용하면 항상 차원이 감소합니다
print(x[0])
print(x[1])
print(x[2])
print(x[0, 1])
print(x[1, 2])
print(x[2, 3])

In [None]:
## slicing
print(x[1:3, 1:3])
print(x[:2, 1:3])
print(x[1:3, 3:])

#### Reshape, Expend_dims

In [None]:
t = tf.constant([[[0, 1, 2], 
                [3, 4, 5]],              
               [[6, 7, 8], 
                [9, 10, 11]]])
print(t.shape)

In [None]:
print(tf.reshape(t, shape=[-1, 3]))

In [None]:
print(tf.reshape(t, shape=[-1, 1, 3]))

In [None]:
x = tf.constant([0, 1, 2])
print(x.shape)

In [None]:
print(tf.expand_dims(x, axis=0))
print(tf.expand_dims(x, axis=1))

#### Reduce Mean/Sum

In [None]:
x = tf.constant([[1., 2.],
                [3., 4.]])

print(tf.reduce_mean(x))

In [None]:
print(tf.reduce_mean(x, axis=0))

In [None]:
print(tf.reduce_mean(x, axis=1))

In [None]:
print(tf.reduce_mean(x, axis=-1))

여기서 축(axis)은 각 배열의 차원에 해당되는 인덱스입니다. 위의 예를 설명하면

- x.shape 은 (2, 2) 입니다.
- tf.reduce_mean(x, axis=0) 은
- x.shape[axis]: x.shape[0] 에 대하여 연산을 하라는 의미
입니다.

X.shape == (5, 3, 2) 인 경우를 생각해봅시다. 이 경우 tf.reduce_mean(X, axis=1) 의 결과값은

1. X.shape[axis] => X.shape[1] 에 대해서 연산을 하기 때문에
2. tf.reduce_mean(X, axis=1).shape 은 (5, 3, 2) -> (5, 2) 가 됩니다.

In [None]:
print(tf.reduce_sum(x))

In [None]:
print(tf.reduce_sum(x, axis=0))

In [None]:
print(tf.reduce_sum(x, axis=-1))

In [None]:
print(tf.reduce_mean(tf.reduce_sum(x, axis=-1)))

#### Argmax

In [None]:
x = [[0, 1, 2],
     [2, 1, 0]]
print(tf.argmax(x, axis=0))

In [None]:
x = [[0, 1, 2],
     [2, 1, 0]]
print(tf.argmax(x))

In [None]:
print(tf.argmax(x, axis=1))

In [None]:
print(tf.argmax(x, axis=-1))

#### One-hot Encoding

In [None]:
label = tf.constant([0, 1, 2, 7])
onehot1 = tf.one_hot(label, depth=10)
onehot2 = keras.utils.to_categorical(label, num_classes=10)

print(onehot1, type(onehot1))
print(onehot2, type(onehot2))

#### Type Casting

In [None]:
print(tf.cast([1.8, 2.2, 3.3, 4.9], tf.int32))

In [None]:
print(tf.cast([True, False, 1 == 1, 0 == 1], tf.int32))

### tf.data를 이용하여 Dataset 만들기

TensorFlow를 이용하여 deep learning model을 학습할 때, input data 및 label을 공급해주기 위하여 tf.data.Dataset을 이용합니다.

In [None]:
## 0에서 9까지 정수가 input data라고 가정해봅시다
a = np.arange(10)
print(a)

In [None]:
## dataset은 아래와 같이 만들 수 있습니다
ds_tensors = tf.data.Dataset.from_tensor_slices(a)
print(ds_tensors)

In [None]:
data = ds_tensors.take(5)
print(data)

In [None]:
## dataset에서 앞 5개 data를 꺼내서 확인해보겠습니다
data = ds_tensors.take(5)
for x in data:
    print (x)

In [None]:
ds_tensors2 = ds_tensors.map(tf.square).batch(4)

In [None]:
data = ds_tensors2.take(10)
for x in data:
    print (x)

In [None]:
## dataset 내의 각 data에 함수를 적용하기 위해서는 아래와 같이 map을 사용합니다
## 이는 data 전처리에 많이 사용됩니다
## 또한 data를 섞어주는 shuffle과 batch size만큼 data를 꺼내주는 batch도 사용할 수 있습니다

ds_tensors = ds_tensors.map(tf.square).shuffle(10).batch(2)

In [None]:
## 실제 data를 꺼내서 사용할 때는 아래와 같이 for문에 dataset을 넣어주면 됩니다.
print('Elements of ds_tensors:')
for _ in range(3):
  for x in ds_tensors:
      print(x)