# [ 2. Tensorflow Basics ] 

# 1. 머신러닝을 위한 엔드 투 엔드 플랫폼, 텐서플로우
## (1) 머신러닝 프레임워크
머신러닝을 위한 플랫폼인 텐서플로우에 대해 배워보겠습니다. DeepLearning Overview에서 머신러닝 프레임워크인 텐서플로우에 대해 간단히 다뤘습니다. 우선 프레임워크의 의미에 대해 복습을 하고 텐서플로우에 대해 자세히 알아보겠습니다. 프레임워크란 무엇일까요?
1. 어떠한 목적을 달성하기 위해 필요한 문제를 해결하기 위한 도구들로 이루어진 뼈대입니다.
2. 복잡하게 얽혀있는 문제를 해결하기 위한 표준과 클래스로 구성된 시스템입니다.
<br>
**한마디로 복잡한 문제를 편리하게 해결하기 위해 사람들이 만든 시스템입니다.**



#### 그렇다면 머신러닝 프레임워크가 필요한 이유가 무엇일까요?
1. 필요한 클래스들을 하나씩 구현할 필요 없이 여러분들이 필요한 클래스들을 한 문장의 형태로 해결이 가능하기 때문에 간단하다는 장점이 있습니다.
아래의 문장을 머신러닝 프레임워크인 텐서플로우로 작성하면 간편하게 필요한 기능을 불러올 수 있습니다.

In [None]:
from tensorflow.keras.layers import Dense

2. 인공지능 모델의 학습에는 미분연산이 필요합니다. 텐서플로우는 미분연산을 지원하기 때문에 수식전개 없이 자동으로 계산을 할 수 있습니다.
![image-8.png](attachment:image-8.png)
<br>
<br>
3. 다양한 디바이스 위에서 연산을 할 수 있습니다.
이것이 가능한 이유는 CPU뿐 아니라 GPU, TPU 등 다양한 디바이스 위에서 동작이 가능하기 때문입니다.
![image-9.png](attachment:image-9.png)
<br>

#### 머신러닝을 개발하기 위해 필요한 도구들은 어떤것이 있을까요?
파이썬 프로그래밍 언어를 활용하여 다른 프레임워크 위에서 딥러닝 모델을 쉽고 빠르게 구현할 수 있는 도구인 케라스를 활용하여 코드를 구현한 후 넘파이 배열을 입력하여 텐서플로우에서 모델을 학습시킬 것입니다.
![image-5.png](attachment:image-5.png)
이러한 이유 때문에 머신러닝 프레임워크인 텐서플로우를 사용하면 복잡한 문제를 편리하게 해결할 수 있습니다.

## (2) 텐서플로우 특징
#### 텐서플로우에서 텐서와 플로우란 무엇일까요?
![image.png](attachment:image.png)
출처 : https://excelsior-cjh.tistory.com/148
<br>
텐서란 이차원으로 나타낼 수 있는 배열인 행렬을 높은 차원으로 확장한 다차원 배열입니다. 즉, 딥러닝에서 데이터를 표현하는 방식이라고 생각하겠습니다.<br>
텐서 형태의 데이터들이 딥러닝 모델을 구성하는 연산들의 그래프를 따라 흐르면서 연산이 일어나는데 이때, 이 연산이 수행되는 형태를 Flow라고 합니다. <br>
따라서, 딥러닝에서 데이터를 의미하는 Tensor 와 DataFlow Graph를 따라 연산이 수행되는 형태(Flow)를 합쳐 TensorFlow 란 이름이 나오게 되었습니다.<br>

텐서플로우에 대해 알아보았다면 이번엔 텐서플로우의 특징에 대해 설명하겠습니다.
+ `텐서(Tensor)`와 연산으로 `데이터 플로우`를 먼저 설계 할 수 있습니다.
+ 설계를 기반으로 생성된 모델에 데이터를 입력하여 학습하고 추론할 수 있습니다.
+ 계산 구조와 목표 함수만 정의하면 **`자동으로 미분 계산을 처리`** 할 수 있다는 장점이 있습니다.

# 2. 텐서의 구성요소와 핸들링


텐서플로우를 사용하기 전에 jupyter notebook에서 텐서플로우를 불러오겠습니다. <br>
저희는 tensorflow를 약어로 **tf**라고 지칭하겠습니다. 다음으로 tensorflow 위에서 작동하는 **keras** 라는 프레임워크를 자주 사용하기 때문에 텐서플로우의 케라스를 불러오기 위한 코드를 작성하겠습니다.

In [None]:
# 텐서플로우 불러오기
import tensorflow as tf
# 텐서플로우의 케라스 불러오기 : 케라스의 클래스와 표준을 이용
from tensorflow import keras

## (1) 텐서의 구성요소
텐서의 구성 요소는 텐서의 자료형을 확인할 수 있는 .dtype과 원소값을 넘파이로 불러올 수 있는 ts.numpy(), 텐서의 모양을 불러오기 위한 .shape 와 같은 요소들이 있습니다.

tensor 뒤에 점을 찍고 dtype을 타이핑하면 텐서의 자료형을 불러올 수 있습니다.

In [None]:
# Tensor의 자료형(dtype) 불러오기
tensor.dtype

tensor 뒤에 점을 찍고 numpy를 타이핑하면 텐서의 원소값을 넘파이로 불러올 수 있습니다.

In [None]:
# Tensor의 원소값을 넘파로 불러오기
tensor.numpy()

tensor 뒤에 점을 찍고 shape을 타이핑하면 텐서의 모양을 불러올 수 있습니다.

In [None]:
# Tensor의 모양(shape) 불러오기
tensor.shape

## (2) 텐서의 자료형
기본적으로는, 데이터의 형태에 따라 자료형을 자동으로 설정해줍니다.
텐서의 자료형은 dtype을 지정하여 설정하고 확인하는 것도 가능하다는 것을 확인할 수 있었습니다.


In [None]:
tf.constant([1,2,3]).dtype # tf.int32
tf.constant([1.,2.,3.,]).dtype # tf.float32
tf.constant([1,2,3],dtype=tf.float32) # dtype을 지정할 수 있다.

py_list라는 리스트를 만들어준 다음 리스트를 텐서 형태로 변경시켜주고 tensor라고 부르겠습니다. <br>
방금 만든 tensor의 자료형은 int64라는 것을 알 수 있지만 저희는 float64 형태로 바꾸어주겠습니다.

In [None]:
# 텐서(tensor) 만들기
py_list = [
    [  1,   2,   3],
    [ 10,  20,  30],
    [100, 200, 300]
]
tensor = tf.constant(py_list)
print(tensor)
tensor = tf.cast(tensor, tf.float64)
print(tensor.dtype)

## (3) 텐서의 인덱싱
텐서의 인덱싱을 배우기에 앞서
우선 넘파이 배열을 만든 후 텐서 형태로 변환시켜줍니다.

In [None]:
# tensor 만들기
import numpy as np
nd_arr = np.array([[  1,   2,   3],
                   [ 10,  20,  30],
                   [100, 200, 300]])
tensor = tf.constant(nd_arr)

In [None]:
nd_arr, tensor

출력 값을 통해 넘파이 배열의 정보와 텐서 형태로 변환된 정보를 알 수 있습니다.<br>
텐서의 특정 축을 기점으로 인덱싱하는 예제를 보겠습니다.

#### 특정 축에서의 원소 위치를 지정하여 인덱싱하는 방법
axis가 달라지면서 행을 가져올지 열을 가져올지를 지정할 수 있고 <br>
0 ~ 1 또는 1 ~ 2 사이의 범위를 지정해주면서 몇번째 행 또는 몇번째 열을 가져올지 직접 지정할 수 있습니다.

In [None]:
tf.gather(tensor,[0,1], axis=0) # 0번째 행과 1번째 행 가져오기

In [None]:
tf.gather(tensor,[1,2], axis=1) # 1번째 열과 2번째 열 가져오기

## (4) 텐서의 모양(shape)
텐서플로우에서 텐서의 모양(shape)은 굉장히 중요하기 때문에 예시를 통해 다뤄보겠습니다.<br>
`텐서의 모양(Shape)`은 원소의 개수가 동일하다는 가정하에 자유자재로 바꿀 수 있습니다. <br>
또한 `넘파이 배열(ndarray)`의 메소드 이름과 동작이 유사하고 매개명수명으로 주로 `shape`을 사용합니다.

In [None]:
# tensor 만들기
py_list = [[  1,   2,   3,   4],
           [ 10,  20,  30,  40],
           [100, 200, 300, 400]]
tensor = tf.constant(py_list)
tensor.shape

py_list로 만든 텐서는 현재 (3,4)의 모양을 가지는 것을 확인할 수 있습니다.<br>
**이번에는 (4,3) 모양을 갖는 텐서로 모양을 변경해보겠습니다.**

In [None]:
# (4,3) 모양을 갖는 텐서로 바꾸기
tf.reshape(tensor,(4,3))

텐서의 shape이 (3,4)인 텐서에서 (4,3) 모양을 갖는 텐서로 변경한 결과를 확인할 수 있습니다.
#### tranpose를 통해 텐서의 0번축을 1번축으로, 1번축으로 0번축으로 변경하겠습니다.

In [None]:
# 0번축을 1번축으로, 1번축을 0번축으로 바꾸기
tf.transpose(tensor)

그 결과 각각의 축을 기준으로 변경된 텐서 값을 확인할 수 있습니다.

# 3. 텐서의 생성과 결합
## (1) 다양한 텐서의 생성 방법
다양한 텐서를 생성하고 생성된 텐서를 결합하는 작업을 하겠습니다.
우선 필요한 라이브러리를 import 시켜주겠습니다.

In [None]:
%matplotlib inline
import tensorflow as tf 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

썬의 기본 자료구조로 텐서를 생성하겠습니다. 파이썬의 기본 자료구조는 `스칼라`, `리스트`, `튜플`, `세트`, `딕셔너리` 가 있습니다. 
<br>
파이썬 기본 자료구조이자 하나의 원소를 갖는 스칼라로 텐서를 만들어 보겠습니다.


In [None]:
# 단일 원소를 갖는 스칼라로 텐서 만들기
tf.constant(1)

In [None]:
tf.constant(1.)

In [None]:
tf.constant("1")

In [None]:
tf.constant(True)

원소인 데이터 type에 따라 dtype이 달라지는 텐서를 가지는 것을 확인할 수 있습니다. <br>
다음으로 파이썬의 자료구조인 리스트, 튜플, 세트로 텐서를 만들어 보겠습니다.

In [None]:
# 리스트로 텐서 만들기
py_list = [1,2,3]
tf.constant(py_list)

In [None]:
# 튜플로 텐서 만들기
py_tpl = (1,2,3)
tf.constant(py_tpl)

In [None]:
# 세트로 텐서 만들기
py_set = {1,2,3}
tf.constant(py_set)
# valueError : 순서가 있는 자료형이어야 한다. 그래서 딕셔너리도 불가능하다.

다음으로 파이썬의 자료구조인 리스트, 튜플, 세트로 텐서를 만들어 보겠습니다. 세트로 텐서를 만들 때 Value Error가 발생하는 이유는 텐서로 만들어주기 위해선 순서가 있는 자료형이어야만 가능하기 때문입니다. 그러므로 세트와 딕셔너리 형태는 텐서로 만들어줄 수 없다는 것을 에러를 통해 알 수 있습니다.

## (2) 다수의 텐서 결합, 분할
여러개의 텐서를 하나의 텐서로 결합하겠습니다.
**첫번째로 새로운 축을 만들어 다수의 텐서 쌓아보겠습니다.**
tf.stack()은 각 텐서를 원소로 하여 새로운 축을 만드는 것입니다. 여기서 axis를 지정하지 않으면 자동으로 새로운 axis=0번 축을 기준으로하여 텐서를 쌓게됩니다.

In [None]:
tensor_1 = tf.constant([1,2,3])
tensor_2 = tf.constant([10,20,30])

# 0번 축을 만들며 텐서 쌓기
tf.stack([tensor_1, tensor_2])

In [None]:
# 1번 축을 만들며 텐서 쌓기
tf.stack([tensor_1, tensor_2], axis=1)

축을 다르게 지정함으로서 텐서의 shape이 달라졌다는 것을 알 수 있습니다. 
#### 두번째로는 특정 축을 기준으로 다수의 텐서 합치는 실습을 해보겠습니다.
tf.concat()을 사용하면 새로운 축을 생성하지 않고 텐서의 원소에 새로운 텐서의 원소를 덧붙일 수 있습니다.

In [None]:
tensor_1 = tf.constant(
    [1, 2, 3]
)
tensor_2 = tf.constant(
    [10, 20, 30]
)

In [None]:
# 0번째 축의 원소로 텐서 합치기
tf.concat([tensor_1, tensor_2], axis=0)

#### 다음으로는 다수의 텐서를 분할하는 방법을 보시겠습니다.
(4,6)의 tensor를 만들고 텐서의 원소를 특정 개수씩 분할하기 위해 tf.split()을 사용하겠습니다.

In [None]:
tensor = tf.constant([
    [   1,    2,    3,    4,    5,    6],
    [  10,   20,   30,   40,   50,   60],
    [ 100,  200,  300,  400,  500,  600],
    [1000, 2000, 3000, 4000, 5000, 6000]    
])

만들어둔 tensor에서 axis=0을 기준으로 하고 2개의 텐서로 나누어보겠습니다. 참고로 Axis=0을 입력하지 않아도 기본값으로 저장되어 있습니다.


In [None]:
# 0번축의 원소를 두 개로 나누기
tf.split(tensor,2)

원래의 tensor에서 axis=1을 기준으로 하여 3개의 텐서로 나누어보겠습니다.

In [None]:
# 1번축의 운소를 세 개로 나누기
tf.split(tensor,3,axis=1)

# 4. 텐서의 다양한 연산
## (1) 원소 단위 수치 연산
텐서플로우에서 자주 사용하는 다양한 연산을 적용해보겠습니다. 하나의 텐서 내 각 원소를 연산하는 과정입니다.<br>
**tf.math.abs()** 는 각 원소에 절대값을 적용하여 양수의 값을 가지는 텐서를 확인할 수 있습니다.

In [None]:
tensor = tf.constant([-2, -0.5, 0, 1])
tf.math.abs(tensor)

**tf.math.round()** 는 각 원소에 반올림이 적용된 결과를 알 수 있습니다. 

In [None]:
tensor = tf.constant([-1.8, -0.5, 0, 1, 1.8])
tf.math.round(tensor)

**tf.math.pow()** 는  원소를 제곱하는 연산으로 얼마만큼 제곱할지를 지정할 수 있습니다.

In [None]:
tensor = tf.constant([0., 1., 2., 4., 10.])
tf.math.pow(tensor,2) #2제곱
tf.math.pow(tensor,3) #3제곱

## (2) 텐서의 정렬과 원소 위치

**tf.argsort()** 는 원소 값들의 크기의 순서를 가져오는 함수입니다. 
아래 예제에서 3,1,5 상수를 생성하여 텐서에 넣었을 때 1,3,5 순으로 값이 커진다는 것을 알 수 있습니다.<br>
여기서 순서이자 인덱스는 0부터 순서를 매기기 때문에 1,0,2 순서를 가진다는 것을 알 수 있습니다. 

In [None]:
tensor = tf.constant([3,1,5])
# 0번 축 원소들의 크기 순서 가져오기
tf.argsort(tensor, axis=0)

**tf.argmax()** 는 원소 값 중 가장 큰 값의 위치를 가져오는 메소드로 
아래 예제에서 처음 원소의 위치를 0으로 했을 때, 가장 큰 원소의 위치는 2번째라는 것을 알 수 있습니다.

In [None]:
tensor = tf.constant([2,1,4,3])
tf.argmax(tensor, axis=0)

**tf.argmin()** 은 원소 값 중 가장 작은값의 위치를 가져오는 메소드로
아래 예제에서 처음 원소의 위치를 0으로 했을 때, 가장 작은 원소의 위치는 1번째라는 것을 알 수 있습니다.

In [None]:
tensor = tf.constant([2,1,4,3])
tf.argmin(tensor, axis=0)

# 5. 텐서플로우의 핵심, 자동 미분
텐서플로우를 사용하는 가장 큰 이유인 자동 미분에 대해 알아보겠습니다. 우선 간단하게 미분 개념에 대해 이해하고 텐서플로우를 활용한 미분 연산으로 넘어가겠습니다.
## (1) 미분 개념 및 텐서플로우를 활용한 미분 연산

`미분값(derivative)`은 
**"특정 정의역 $x$에서 함수값 $f(x)$의 순간 변화량"**을 의미하며 $f'(x)$ 로 표기합니다.
<br>

$$
f'(x) = \lim_{x \rightarrow a} \frac{f(x) - f(a)}{x - a}
$$

즉, "x에 따른 f(x)에서의 접선의 기울기의 변화를 나타내는 함수"라고 이해하면 되겠습니다.
![image.png](attachment:image.png)

텐서플로우에서의 $\frac{\partial{y}}{\partial{x}}$ 자동 미분 프로그래밍을 하기 위해 아래와 같은 원시함수를 정의하면 됩니다.
```python
with tf.GradientTape() as tape:
    tape.watch(x)
    y = f(x)
tape.gradient(y, x)
```
텐서플로우의 가장 큰 장점인 미분식을 전개하지 않고 원시함수의 정의만으로 자동으로 미분값을 구할 수 있다는 것을 확인할 수 있습니다.

텐서플로우를 활용한 미분 연산을 위해 텐서플로우의 **tf.Variable**객체를 사용하겠습니다.<br>
tf.Variable 객체는 값을 갱신할 수 있는 텐서플로우의 핸들이자 머신러닝에서 가중치를 정의할때 주로 사용됩니다.

tf.Variable 객체를 update 하는 것은 가중치에 따른 손실함수의 미분값을 통해 가중치를 갱신하는 것으로 머신러닝의 학습에서 핵심입니다.
$$
W := W - \alpha \frac{dL}{dW}
$$

가중치를 각각 0.5, 1이라고 두고, 실제 값과 예측값의 차이를 계산하는 손실함수인 loss_function을 정의했습니다.<br>
x에는 (2,3) 텐서를, y에는 (1.5, 2.5) 텐서를 데이터로 정의하고 데이터 플로우에 적용하면 자동으로 미분값을 구할 수 있습니다.

In [None]:
# 가중치가 각각 0.5 ,1이라면
weight = tf.Variable([0.5, 1.])
def f(w,x):
    return w*x

# 함수의 결과와, 실제 y값과의 차이를 계산하는 함수
def loss_function(true, pred):
    return tf.abs(true - pred)

# 데이터
x = tf.constant([2., 3.])
y = tf.constant([1.5, 2.5])

#데이터 플로우 정의
with tf.GradientTape() as tape:
    y_pred = f(weight,x)
    loss = loss_function(y, y_pred)

grad = tape.gradient(loss,weight)
grad