## 그래프란 무엇인가

* 그래프 실행은 텐서 계산이 `tf.Graph` 또는 간단히 '그래프'라고도 하는 TensorFlow 그래프로 실행됨을 의미


* 그래프: 계산의 단위를 나타내는 `tf.Operation` 객체와 연산 간에 흐르는 데이터의 단위를 나타내는 `tf.Tensor` 객체의 세트를 포함. 데이터 구조는 `tf.Graph` 컨텍스트에서 정의

## 그래프의 이점

* 그래프 사용시, 유연성이 크게 향상됨 => 빠르게, 병렬로, 여러 기기에서 실행 시 아주 유용

In [1]:
import tensorflow as tf
import timeit
from datetime import datetime

## 그래프 이용하기

`tf.function`


- 직접 호출 또는 데코레이터를 사용하여 TensorFlow에서 그래프를 만들고 실행


- 일반 함수를 입력 받아 Function을 반환 (Python의 경우도 동일한 방식으로 Function을 사용) <br>
  But, 안을 들여다보면 다르다 !! **하나의 API 뒤에서 여러 `tf.Graph`를 캡슐화 함**
  
  
- 함수 및 이 함수가 호출하는 다른 모든 함수에 적용

In [4]:
def a_regular_function(x, y, b):
    x = tf.matmul(x, y)  # matmul : 행렬 곱을 더 간단하게 나타낼 수 있음
    x = x + b
    return x

a_function_that_uses_a_graph = tf.function(a_regular_function)

x1 = tf.constant([[1.0, 2.0]])
y1 = tf.constant([[2.0], [3.0]])
b1 = tf.constant(4.0)

orig_value = a_regular_function(x1, y1, b1).numpy()

# 파이썬에서 사용하는 것처럼 함수 사용
tf_function_value = a_function_that_uses_a_graph(x1, y1, b1).numpy()
assert(orig_value == tf_function_value)

In [5]:
def inner_function(x, y, b):
    x = tf.matmul(x, y)
    x = x + b
    return x

# outer_function을 Function으로 만들어 데코레이터로 사용
@tf.function
def outer_function(x):
    y = tf.constant([[2.0], [3.0]])
    b = tf.constant(4.0)

    return inner_function(x, y, b)

outer_function(tf.constant([[1.0, 2.0]])).numpy()
# constant : 텐서 같은 객체에서 상수 텐서 생성

array([[12.]], dtype=float32)

### Python 함수를 그래프로 변환하기

* TensorFlow를 사용하여 작성하는 모든 함수에는 if-then 절, 루프, break, return, continue 등과 같은 내장된 TF 연산과 Python 논리가 혼합


* `tf.function`은 AutoGraph(`tf.autograph`)라는 라이브러리를 사용하여 Python 코드를 그래프 생성 코드로 변환

In [6]:
def simple_relu(x):
    if tf.greater(x, 0):
        return x
    else:
        return 0

# `tf_simple_relu` is a TensorFlow `Function` that wraps `simple_relu`.
tf_simple_relu = tf.function(simple_relu)

print("First branch, with graph:", tf_simple_relu(tf.constant(1)).numpy())
print("Second branch, with graph:", tf_simple_relu(tf.constant(-1)).numpy())

First branch, with graph: 1
Second branch, with graph: 0


### 다형성: 하나의 Function, 다수의 그래프

`tf.Graph`


- 특정 유형의 입력에 특화되어 있음 (특정 dtype, 동일한 id를 가진 객체)


- Function을 호출할 때마다, 새 인수에 특화된 새 `tf.Graph`를 생성
    - 유형 사양을 **입력 서명** 또는 **서명**이라고 함
    - 하지만, 이 서명으로 이미 호출된 경우 새로운 `tf.Graph`를 생성하지 않음
    
    
- Function은 해당 서명에 대응하는 `tf.Graph`를 ConcreteFunction에 저장


- 여러 그래프로 뒷받침된다는 점에서 다형성의 특징을 가짐
    - 단일 `tf.Graph`로 나타낼 수 있는 것보다 더 많은 입력 유형을 지원하고 더 우수한 성능을 가질 수 있도록 최적화 할 수 있음

In [9]:
# @tf.function : tf1.x 스타일로 해당 함수 내의 로직이 동작하므로, 속도가 빨라질 수 있음
# But, 값을 바로 계산해 볼 수 없어서 모든 로직에 대한 프로그래밍이 끝난 뒤에 붙이는게 좋음
@tf.function
def my_relu(x):
    return tf.maximum(0., x)

print(my_relu(tf.constant(5.5)))
print(my_relu([1, -1]))
print(my_relu(tf.constant([3., -3.])))

tf.Tensor(5.5, shape=(), dtype=float32)
tf.Tensor([1. 0.], shape=(2,), dtype=float32)
tf.Tensor([3. 0.], shape=(2,), dtype=float32)


In [12]:
# 여기서는 새로운 그래프를 생성하지 않음
print(my_relu(tf.constant(-2.5))) # Signature matches `tf.constant(5.5)`.
print(my_relu(tf.constant([-1., 1.]))) # Signature matches `tf.constant([3., -3.])`.

tf.Tensor(0.0, shape=(), dtype=float32)
tf.Tensor([0. 1.], shape=(2,), dtype=float32)


In [13]:
# ConcreteFunction에 3가지 특징이 있음 -> 타입과 쉐입을 반환
print(my_relu.pretty_printed_concrete_signatures())

my_relu(x)
  Args:
    x: float32 Tensor, shape=()
  Returns:
    float32 Tensor, shape=()

my_relu(x=[1, -1])
  Returns:
    float32 Tensor, shape=(2,)

my_relu(x)
  Args:
    x: float32 Tensor, shape=(2,)
  Returns:
    float32 Tensor, shape=(2,)


## tf.function 사용하기

### 그래프 실행 vs. 즉시 실행

`Function` : 즉시 실행 또는 그래프 실행이 가능 (기본적으로 코드를 그래프로 실행함)

`tf.config.run_functions_eagerly(True)`
- 그래프 실행이 아닌 즉시 실행하도록 할 수 있음


- 코드를 정상적으로 실행하는 대신에 그래프를 생성하고 실행하는 Function의 기능을 해제하는 스위치


- 하지만, 코드를 다 실행하고 나면 다시 원상태로 돌려야 함

In [14]:
@tf.function
def get_MSE(y_true, y_pred):
    sq_diff = tf.pow(y_true - y_pred, 2)
    return tf.reduce_mean(sq_diff)

In [15]:
# random.uniform : 랜덤으로 균일분포 난수 생성하는 함수
y_true = tf.random.uniform([5], maxval=10, dtype=tf.int32)
y_pred = tf.random.uniform([5], maxval=10, dtype=tf.int32)
print(y_true)
print(y_pred)

tf.Tensor([4 0 0 7 9], shape=(5,), dtype=int32)
tf.Tensor([5 4 1 4 8], shape=(5,), dtype=int32)


In [16]:
get_MSE(y_true, y_pred)

<tf.Tensor: shape=(), dtype=int32, numpy=5>

In [17]:
# 그래프 실행 말고, 즉시 실행하도록 바꿈
tf.config.run_functions_eagerly(True)

In [18]:
get_MSE(y_true, y_pred)

<tf.Tensor: shape=(), dtype=int32, numpy=5>

In [19]:
# Don't forget to set it back when you are done.
tf.config.run_functions_eagerly(False)

`Function`은 그래프 및 즉시 실행에서 서로 다르게 동작할 수도 있음
- 아래 예시를 보면 get_MSE는 3번 호출되었지만 한 번만 인쇄됨


- print문은 Function이 원래 코드를 실행할 때 실행되며, 이 때 "트레이싱"이라는 프로세스를 통해 그래프를 생성함


- **추적은 TensorFlow 연산을 그래프로 캡쳐하고 print는 그래프로 캡쳐되지 않음** 이 그래프는 세 번의 모든 호출 시 실행되지만 Python 코드를 다시 실행하지 않음

In [20]:
@tf.function
def get_MSE(y_true, y_pred):
    print("Calculating MSE!")
    sq_diff = tf.pow(y_true - y_pred, 2)
    return tf.reduce_mean(sq_diff)

In [21]:
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)

Calculating MSE!


In [22]:
# 그래프 즉시 실행
tf.config.run_functions_eagerly(True)

In [23]:
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)

Calculating MSE!
Calculating MSE!
Calculating MSE!


In [24]:
# 그래프 즉시 실행 해제
tf.config.run_functions_eagerly(False)

cf) 즉시 및 그래프 실행 모두에서 값을 인쇄하려면 `tf.print`를 대신 사용하기

### 비평가(Non-strict) 실행

* 그래프 실행 결과
    - 함수의 반환 값
    - 다음과 같은 문서화된 잘 알려진 부작용:
        - `tf.print`와 같은 입/출력 작업
        - `tf.debugging`의 어설션 기능과 같은 디버깅 작업
        - `tf.Variable`의 변형
    - 이 동작은 일반적으로 '비평가 실행'으로 알려져 있음 (즉시 실행과 구분됨)
    
    
* 그래프 실행
    - 필요하거나 필요하지 않은 모든 프로그램 작업을 단계별로 실행
    - 런타임 오류 검사는 관찰 가능한 효과로 간주되지 않음.
    - 아래의 예제에서 불필요한 작업인 `tf.gather`를 건너뛰므로, 런타임 오류 (InvalidArgumentError) 발생 안함

In [27]:
def unused_return_eager(x):
    # Get index 1 will fail when `len(x) == 1`
    tf.gather(x, [1]) # unused 
    return x

try:
    print(unused_return_eager(tf.constant([0.0])))
except tf.errors.InvalidArgumentError as e:
    # 즉시 실행이 동작하는 동안 모든 오퍼레이션이 실행되므로, 에러가 올라감
    print(f'{type(e).__name__}: {e}')

InvalidArgumentError: {{function_node __wrapped__GatherV2_device_/job:localhost/replica:0/task:0/device:CPU:0}} indices[0] = 1 is not in [0, 1) [Op:GatherV2]


In [28]:
@tf.function
def unused_return_graph(x):
    tf.gather(x, [1]) # unused
    return x

# 그래프 실행하는 동안 오직 필요한 오퍼레이션만 실행. 에러는 올라가지 않음
print(unused_return_graph(tf.constant([0.0])))

tf.Tensor([0.], shape=(1,), dtype=float32)


### tf.function의 모범 사례

`tf.function`으로 시험용 함수를 사용하면서 즉시 실행에서 그래프 실행으로 이동하는 과정 체험 가능

* `tf.config.run_functions_eagerly` : 즉시 실행과 그래프 실행 사이에 조기에 자주 전환하여 두 모드가 서로 달라지는지, 언제 달라지는지 정확하게 파악 가능


* `tf.Variable` : Python 함수 외부에서 실행하고, 수정은 내부에서 수행함. keras.layers, keras.Model 및 tf.optimizers와 같이 tf.Variable을 사용하는 객체의 경우도 마찬가지


* 외부 Python 변수에 의존하는 함수를 작성하지 말아야 함 (`tf.Variable`과 Keras 객체 제외)


* 텐서 및 기타 TensorFlow 유형을 입력으로 사용하는 함수를 작성하는 것 좋음. 다른 객체 유형을 전달할 수 있지만 주의하기 !


* 성능 이점을 극대화 하기 위해, `tf.Function` 하에서 계산이 가능한 한 많이 포함되도록 함

## 속도 향상 확인하기

`tf.function`
- 기본적으로 속도 향상을 하지만, 정도는 실행하는 계산의 종류에 따라 다름
- 작은 계산의 경우, 그래프를 호출하는 오버헤드에 지배될 수 있음

[참고] 코드가 TensorFlow 제어 흐름에서 과중하고 작은 텐서를 많이 사용하는 경우, 성능 개선의 효과를 높이기 위해 `tf.function(jit_compile=True)`를 시도해볼 수도 있음.

In [29]:
x = tf.random.uniform(shape=[10, 10], minval=-1, maxval=2, dtype=tf.dtypes.int32)

def power(x, y):
    result = tf.eye(10, dtype=tf.dtypes.int32)
    for _ in range(y):
        result = tf.matmul(x, result)
    return result

In [30]:
print("Eager execution:", timeit.timeit(lambda: power(x, 100), number=1000), "seconds")

Eager execution: 4.686657600001126 seconds


In [31]:
power_as_graph = tf.function(power)
print("Graph execution:", timeit.timeit(lambda: power_as_graph(x, 100), number=1000), "seconds")

Graph execution: 0.7170433999999659 seconds


### 성능과 상충 관계

* 그래프는 속도를 높일 수 있지만 오버헤드 발생 가능 (그래프 생성이 실행보다 오래 걸릴 수도?)
    - 이 경우, 트레이싱으로 인해 느려질 수 있음
    
    
* 모델 크기에 관계없이, 빈번한 추적은 피하기

## Function은 언제 트레이싱하나?

* Function은 트레이싱 할 때마다 print 문을 실행함


* 새 Python 인수는 항상 새 그래프 생성을 트리거하므로 추가 트레이싱이 발생함

In [32]:
@tf.function
def a_function_with_python_side_effect(x):
    print("Tracing!") # An eager-only side effect.
    return x * x + tf.constant(2)

# This is traced the first time.
print(a_function_with_python_side_effect(tf.constant(2)))

# The second time through, you won't see the side effect.
print(a_function_with_python_side_effect(tf.constant(3)))

Tracing!
tf.Tensor(6, shape=(), dtype=int32)
tf.Tensor(11, shape=(), dtype=int32)


In [33]:
# This retraces each time the Python argument changes,
# as a Python argument could be an epoch count or other
# hyperparameter.
print(a_function_with_python_side_effect(2))
print(a_function_with_python_side_effect(3))

Tracing!
tf.Tensor(6, shape=(), dtype=int32)
Tracing!
tf.Tensor(11, shape=(), dtype=int32)
