In [1]:
import tensorflow as tf
from tensorflow import keras

# 12.0. 텐서플로를 사용한 사용자 정의 모델과 훈련
- 앞서서는 고수준 API인 케라스로 작업을 했음
- 보통의 딥러닝 작업이라면 대부분은 tf.keras와 tf.data로 처리가 가능할 것임
- 하지만 저수준 API도 알고 있어야함
- 나만의 손실함수, 지표, 층, 모델, 초기화, 규제, 가중치 규제 등을 만들어서 세부적으로 제어하고자 할 때 필요함

# 12.1. 텐서플로 훑어보기
- 강려크한 수치 계산용 라이브러리
- 텐서플로가 제공하는 것을 간단히 정리하자면 아래와 같음
    - 1) 핵심 구조는 numpy와 매우 비슷하나 GPU를 지원
    - 2) 분산 컴퓨팅 지원
    - 3) 일종의 JIT컴파일러를 포함하여 속도를 높이고 메모리 사용량을 줄이기 위한 계산 최적화 과정 실행
        - 이를 위해 파이썬 함수로부터 **계산그래프**를 추출하여 최적화하고(pruning과 같은 작업 수행), 효율적으로 수행함
    - 4) 계산 그래프는 플랫폼 중립 포맷으로 내보낼 수 있으므로, 리눅스/윈도/안드로이드 가리지않고 실행 가능
    - 5) 자동미분 기능과 RMSProp, Nadam과 같은 고성능 옵티마이저를 제공하므로, 모든 종류의 손실함수를 최소화하기 좋음
- ![image.png](attachment:image.png)
    - https://dschloe.github.io/img/python_edu/07_deeplearning/Chapter_7_3_1_tensorflow_basic/api_summary.png

- 가장 저수준의 텐서플로 연산(op)는 매우 효율적인 C++코드로 구현되어있으며, 많은 연산은 **커널**이라고 불리는 여러 구현을 가짐
- 각 커널은 CPU, GPU, TPU와 같은 특정 장치에 맞춰서 만들어짐
    - GPU는 계산을 쪼개서 여러 GPU 스레드에서 병렬로 실행하여 속도를 쥰내 향상시키고, TPU도 거 쥰내 빠름

- 텐서플로는 윈도, 리눅스, 맥 뿐 아니라 텐서플로 Lite로 IOS나 안드로이드같은 모바일 장치에서도 실행할 수 있음
- 또한 파이썬 이외에도 C++, Java, Golang, Swift API를 활용할 수도 있음

- 텐서플로는 하나의 라이브러리라기보다는 일종의 생태계라고 보는 것이 좋음
    - TFX : 구글에서 만든 텐서플로 제품화를 위한 라이브러리 모음
    - tensorflow hub : 사전 훈련 신경망을 다운로드하여 재사용 가능
    - tensorflow resource page ; 다양한 텐서플로 기반 프로젝트 모음

# 12.2. 넘파이처럼 텐서플로 사용하기
- 텐서플로 API는 tensor를 순환시키는 역할을 함
- 텐서는 넘파이의 ndarray와 매우 유사하여, 다차원 배열이긴 하지만 스칼라값을 가질 수도 있음

### 12.2.1. 텐서와 연산
- tf.constant() 함수로 텐서를 만들 수 있음

In [5]:
t = tf.constant([[1, 2, 3], [4, 5, 6]])
t

<tf.Tensor: shape=(2, 3), dtype=int32, numpy=
array([[1, 2, 3],
       [4, 5, 6]], dtype=int32)>

In [4]:
tf.constant(42)

<tf.Tensor: shape=(), dtype=int32, numpy=42>

In [6]:
t.shape

TensorShape([2, 3])

In [7]:
t.dtype

tf.int32

In [8]:
t[:, 1:]

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[2, 3],
       [5, 6]], dtype=int32)>

In [9]:
t[..., 1, tf.newaxis]

<tf.Tensor: shape=(2, 1), dtype=int32, numpy=
array([[2],
       [5]], dtype=int32)>

In [10]:
t+10

<tf.Tensor: shape=(2, 3), dtype=int32, numpy=
array([[11, 12, 13],
       [14, 15, 16]], dtype=int32)>

In [11]:
tf.square(t)

<tf.Tensor: shape=(2, 3), dtype=int32, numpy=
array([[ 1,  4,  9],
       [16, 25, 36]], dtype=int32)>

In [12]:
t @ tf.transpose(t) #행렬 곱을 지원하는 매직메서드이며, python = 3.5에서 추가됨(tf.matmul과 동일한 역할 수행)

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[14, 32],
       [32, 77]], dtype=int32)>

- 필요한 모든 기본 수학연산과 넘파이에서 제공하는 대부분의 연산(ex : tf.reshape, tf.sqrt, tf.exp, tf.squeeze, tf.tile)등을 제공
- 일부 함수들은 이름이 좀 다름
    - ex : tf.reduce_mean, tf.reduce_sum, tf.reduce_max, tf.math.log 얘네들은 아래와 동일
    - ex : np.mean, np.sum, np.max, np,log
- 이름이 다른 이유
    - ex : tf.transpose(t)는 넘파이의 개념으로 가져오면 t.T로 쓰면 됨
        - 그런데, tf.transpose()는 T와 완전히 동일한 작업을 수행하지는 않음
        - 넘파이에서는 그저 동일 데이터가 전치된 뷰이짖만, tf에서는 전치된 데이터의 복사본으로 새로운 텐서를 만들기 떄문
    - ex : reduce_sum
        - GPU커널이 원소가 추가된 순서를 보장하지 않는 리듀스 알고리즘을 사용하기 때문

##### 케라스 저수준 API
- 케라스 API도 keras.backend에 자체적인 저수준 API를 가지고 있으며, square, exp, sqrt같은 함수들이 포함되어있음
- 보통 이런 함수들은 상응하는 텐서플로 연산을 호출하는 게 전부이며, 다른 케라스 구현에 적용하고싶다면 이를 써야함
    - 하지만, 너무 일부만 지원하기 때문에 요기서는 tf연산을 직접 이용할 것

### 12.2.2. 텐서와 넘파이
- 넘파이와 함께 사용하기 좋음.
- 넘파이로 텐서를 만들 수도 있고, 반대도 가능함

In [15]:
import numpy as np

a = np.array([2, 4, 5])
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=int64, numpy=array([2, 4, 5])>

In [16]:
t.numpy()

array([[1, 2, 3],
       [4, 5, 6]], dtype=int32)

In [17]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=int64, numpy=array([ 4, 16, 25])>

In [18]:
np.square(t)

array([[ 1,  4,  9],
       [16, 25, 36]], dtype=int32)

- *numpy는 기본적으로 64비트 정밀도를 이용하고, tf는 32비트 정밀도를 이용함. 그래서 넘파이 배열을 텐서로 만들 때는 dtype = tf.float32로 지정해줘야함*

### 12.2.3. 타입 변환
- 자동으로 타입변환이 될 경우 성능을 크게 감소시킬 수 있음
- 따라서 텐서플로는 어떤 타입 변환도 자동으로 수행하지는 않음
    - 따라서 호환되지 않는 타입의 텐서로 연산을 실행할 시 예외가 발생함
- ex) 정수 텐서 + 실수 텐서 -> 에러

In [19]:
tf.constant(2.) + tf.constant(40)

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a int32 tensor [Op:AddV2]

In [20]:
tf.constant(2.) + tf.constant(40, dtype = tf.float64) #float32 + float64 -> Error

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a double tensor [Op:AddV2]

In [21]:
tf.constant(2.) + tf.constant(40, dtype = tf.float32) #float32 + float64 -> Error

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

- 저 변환 과정이 없어서 속도가 충분히 빨라질 수 있으며, 타입변환이 필요할 시, tf.cast()를 이용할 수 있음

In [22]:
t2 = tf.constant(40, dtype = tf.float64)
tf.constant(2.0) + tf.cast(t2, tf.float32)

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

### 12.2.4. 변수
- 지금까지 본 Tensor는 변경이 불가능한 객체로 텐서의 내용을 바꿀 수 없었음
    - 따라서 신경망에서는 역전파로 가중치를 변경해야하는데, 이를 구현할 수 없음
- 그리고 모멘텀 옵티마이저나, 학습률 변경처럼 일부 하이퍼파라미터는 시간에따라 변경이 되어야함
- 이를 가능케 하는 것이 **tf.Variable**

In [3]:
v = tf.Variable([[1., 2., 3.], [4., 5., 6.]])
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

- 보면 텐서와 거의 비슷하게 동작하며, 동일 연산을 수행할 수 있고 넘파이와도 잘 호환됨
- 까다로운 데이터 타입에서도 마찬가지인데, assign()메서드를 사용하여 변숫값을 바꿀 수 있음
    - 그리고 비슷하게 assign_add나 assign_sub메서드를 사용하면 주어진 값만큼 변수를 증가시키거나 감소시킬 수 있음
    - 그리고 원소의 assign메서드나 scatter_update, scatter_nd_update메서드를 사용하여 개별 원소나 슬라이스를 수정할 수도 있음
- *대신 assign 메서드를 이용할 경우 해당 변수를 다시 할당하지 않아도 자동으로 inplace처리됨*

In [4]:
v.assign(2 * v)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [5]:
v[0, 1].assign(42)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [7]:
v[:, 2].assign([0., 1.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  0.],
       [ 8., 10.,  1.]], dtype=float32)>

In [8]:
v.scatter_nd_update(indices = [[0, 0], [1, 2]], updates = [100., 200.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[100.,  42.,   0.],
       [  8.,  10., 200.]], dtype=float32)>

### 12.2.5. 다른 데이터 구조
- 다음과 같이 몇 가지 다른 데이터 구조도 지원함
    - tf.SparseTensor : 희소 텐서
        - 희소 텐서를 효율적으로 나타내주며, tf.sparse 패키지는 희소 텐서를 위한 연산을 제공함
    - tf.TensorArray : 텐서 배열
        - 텐서의 리스트
        - 고정된 길이를 가지는게 기본이지만, 동적으로 변경할 수 있음
        - 리스트 내 모든 텐서는 크기와 데이터 타입이 동일해야함
    - tf.RaggedTensor : 래그드 텐서
        - 리스트의 리스트를 나타냄
        - tf.ragged 패키즈는 레그드 텐서를 위한 연산을 제공
    - 문자열 텐서
        - tf.string타입의 텐서도 지원하나, 유니코드가 아닌 바이트 문자열을 나타냄
        - tf.strings 패키지는 바이트 문자열과 유니코드 문자열, 그리고 일반적인 텐서 사이의 변환을 위한 연산을 제공
    - 집합
        - 일반적인 텐서나 희소텐서로 나타냄
        - tf.constant([[1, 2], [3, 4]])는 두 개의 집합 {1, 2}와 {3, 4}를 나타냄
        - 일반적으로 각 집합은 텐서의 마지막 축에 있는 벡터에 의해 표현됨
        - tf.sets 패키지의 연산을 통해 집합을 다룰 수 있음
    - 큐
        - 단계별로 텐서를 저장하며, 여러 종류의 큐를 제공
        - 자세한 건 tf.queue 패키지 문서 확인