In [1]:
from __future__ import absolute_import, division, print_function, unicode_literals
import numpy as np

In [None]:
!pip install -q tensorflow==2.0.0-beta1

In [2]:
import tensorflow as tf

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


In [None]:
# tf.function을 함수에 붙이면 여전히 다른 함수들처럼 사용할 수 있지만, 컴파일 되었을 때 더 빠르게 실행하고, GPU나 TPU를 사용해서 작동하고,
# 세이브드모델(SavedModel)로 보내지는 것이 가능해집니다.
@tf.function
def simple_nn_layer(x,y):
    return tf.nn.relu(tf.matmul(x,y))

x = tf.random.uniform((3,3))
y = tf.random.uniform((3,3))

simple_nn_layer(x,y)

In [2]:
@tf.function
def simple_nn_layer_test(x,y):
    return tf.matmul(x+y,y)

def simple_nn_layer_test2(x,y):
    return tf.matmul(x+y,y)

NameError: name 'tf' is not defined

In [1]:
import timeit
x = tf.random.uniform((3,3))
y = tf.random.uniform((3,3))
print("tf time: ", timeit.timeit(lambda: simple_nn_layer_test(x,y), number=10))
print("nontf time: ", timeit.timeit(lambda: simple_nn_layer_test2(x,y)), number=10)

NameError: name 'tf' is not defined

In [4]:
simple_nn_layer

<tensorflow.python.eager.def_function.Function at 0x2aee80a9dc8>

In [3]:
#데코레이터를 붙인 결과를 확인해보면, 텐서플로 런타임시의 모든 상호작용들을 다룰 수 있다는 것을 알 수 있습니다.
def linear_layer(x):
    return 2*x+1

@tf.function
def deep_net(x):
    return tf.nn.relu(linear_layer(x))

deep_net(tf.constant((1,2,3)))

<tf.Tensor: id=12, shape=(3,), dtype=int32, numpy=array([3, 5, 7])>

TypeError: in converted code:


    TypeError: tf__deep_net() got an unexpected keyword argument 'number'


In [6]:
#작은 연상들을 많이 포함한 그랴프의 경우 함수들은 즉시 실행코드(eager code)보다 빠르게 짝동합니다.
# 하지만 무거운 연산들을 포함한 그래프의 경우(컨볼루션 등), 그렇게 빠른 속도 향상은 기대하기 어렵습니다.
import timeit
conv_layer = tf.keras.layers.Conv2D(100,3)

@tf.function
def conv_fn(image):
    return conv_layer(image)

image = tf.zeros([1,200,200,100])
#데이터 준비(warm up)
conv_layer(image); conv_fn(image)
print("Eager conv: ", timeit.timeit(lambda: conv_layer(image), number=10))
print("Function conv: ", timeit.timeit(lambda: conv_fn(image), number=10))
print("Note how there's not much difference in performance for convolutions")

Eager conv:  0.002595200000087061
Function conv:  0.0027620000000752043
Note how there's not much difference in performance for convolutions


In [7]:
lstm_cell = tf.keras.layers.LSTMCell(10)

@tf.function
def lstm_fn(input, state):
    return lstm_cell(input, state)

input = tf.zeros([10,10])
state = [tf.zeros([10,10])]*2
# 데이터 준비 (warm up)
lstm_cell(input, state); lstm_fn(input, state)
print("eager lstm: ", timeit.timeit(lambda: lstm_cell(input, state), number=10))
print("function lstm: ", timeit.timeit(lambda: lstm_fn(input, state), number=10))

eager lstm:  0.004846400000133144
function lstm:  0.003141000000141503


In [11]:
# tf.function 내에서 데이터 기반 제어흐름을 사용할 때, 파이썬의 제어흐름 문을 사용할 수 있고,
# 오토그래프 기능은 그것들을 모두 적절한 텐서플로 연산으로 변환할 수 있습니다.
# 예를 들어 if 문은 tensor를 기반으로 작동해야할 때 tf.cond() 로 변환 될 수 있습니다.
# 아래 예시에서, x는 tensor이지만 if문이 예상한대로 정상 작동합니다.
@tf.function
def square_if_positive(x):
    if x > 0:
        x = x * x
    else:
        x = 0
    return x

print("square_if_positive(2) = {}".format(square_if_positive(tf.constant(2))))
print("square_if_positive(-2) = {}".format(square_if_positive(tf.constant(-2))))

#위 예시에서는 스칼라값으로 간단한 조건절을 사용하였지만 실제 코드에서는 배치(batching)가 주로 사용됩니다.

square_if_positive(2) = 4
square_if_positive(-2) = 0


In [16]:
def sip(x):
    if x > 0:
        x = x*x
    else:
        x = 0
    return x

print(square_if_positive(2))
print(sip(2))
print(sip(tf.constant(2)))

tf.Tensor(4, shape=(), dtype=int32)
4
tf.Tensor(4, shape=(), dtype=int32)


In [17]:
# 오토그래프는 기본적인 파이썬 문인 while, for, if, break, continue, return과 nesting을 지원합니다.
# 이는 Tensor표현을 while과 if 문의 조건부분에서 사용하거나 for루프에서 Tensor를 반복할 수 있다는 것을 의미합니다.
@tf.function
def sum_even(items):
    s = 0
    for c in items:
        if c % 2 > 0:
            continue
        s += c
    return s

sum_even(tf.constant([10,12,15,20]))

<tf.Tensor: id=663, shape=(), dtype=int32, numpy=42>

In [18]:
# 오토그래프는 고급 사용자를 위해 낮은 수준(low-level)의 API를 제공합니다. 
# 예를들어 여러분들은 생성된 코드를 확인하기 위해 다음과 같이 작성할 수 있습니다.
print(tf.autograph.to_code(sum_even.python_function))

def tf__sum_even(items):
  do_return = False
  retval_ = ag__.UndefinedReturnValue()
  s = 0

  def loop_body(loop_vars, s_2):
    c = loop_vars
    continue_ = False
    cond = c % 2 > 0

    def get_state():
      return ()

    def set_state(_):
      pass

    def if_true():
      continue_ = True
      return continue_

    def if_false():
      return continue_
    continue_ = ag__.if_stmt(cond, if_true, if_false, get_state, set_state)
    cond_1 = ag__.not_(continue_)

    def get_state_1():
      return ()

    def set_state_1(_):
      pass

    def if_true_1():
      s_1, = s_2,
      s_1 += c
      return s_1

    def if_false_1():
      return s_2
    s_2 = ag__.if_stmt(cond_1, if_true_1, if_false_1, get_state_1, set_state_1)
    return s_2,
  s, = ag__.for_stmt(items, None, loop_body, (s,))
  do_return = True
  retval_ = s
  cond_2 = ag__.is_undefined_return(retval_)

  def get_state_2():
    return ()

  def set_state_2(_):
    pass

  def if_true_2():
    retval_ = None


In [20]:
# 제어흐름예시
@tf.function
def fizzbuzz(n):
    msg = tf.constant('')
    for i in tf.range(n):
        if tf.equal(i % 3, 0):
            tf.print('Fizz')
        elif tf.equal(i % 5, 0):
            tf.print('Buzz')
        else:
            tf.print(i)

fizzbuzz(tf.constant(15))

Fizz
1
2
Fizz
4
Buzz
Fizz
7
8
Fizz
Buzz
11
Fizz
13
14


In [21]:
#케라스와 오토그래프
# 오토그래프는 기본적으로 non-dynamic 케라스 모델에서 사용 가능합니다. 더 자세한 정보를 원한다면, tf.keras를 참고

class CustomModel(tf.keras.models.Model):
    @tf.function
    def call(self, input_data):
        if tf.reduce_mean(input_data) > 0:
            return input_data
        else:
            return input_data // 2
        
model = CustomModel()
model(tf.constant([-2,-4]))

<tf.Tensor: id=784, shape=(2,), dtype=int32, numpy=array([-1, -2])>

In [22]:
# 부수효과 (side effect)
#즉시실행모드(eager mode)처럼 부수효과를 사용할 수 있습니다. 예를 들면, tf.function 내에 있는 tf.assign이나 tf.print가 있습니다.
# 또한, 부수효과들은 작업들이 순서대로 실행된다는 것을 보장하기위해 필수적인 제어 의존성(control dependency)을 추가합니다.

v = tf.Variable(5)

@tf.function
def find_next_odd():
    v.assign(v + 1)
    if tf.equal(v % 2, 0):
        v.assign(v + 1)
        
find_next_odd()
v

<tf.Variable 'Variable:0' shape=() dtype=int32, numpy=7>

In [9]:
# 디버깅
# tf.function과 오토그래프는 코드를 생성하고 텐서플로 그래프 내에서 해당코드를 추적함으로써 동작합니다. 이 메커니즘은 아직까지는 pdb같은
# 단계적(step-by-step) 디버거를 지원하지 않습니다. 하지만 일시적으로 tf.function 내에서 즉시 실행(eager execution)을 가능하게 하는 
#tf.config.run_functions_eagerly(True)을 사용하고 가장 선호하는 디버거를 사용할 수 있습니다.

@tf.function
def f(x):
    if x > 0:
        # 여기에 중단점을 설정하세요
        import pdb
        pdb.set_trace()
        x = x+1
    return x
tf.config.experimental_run_functions_eagerly(True)

# 이제 중단점을 설정하고 디버거 내에서 코드를 실행할 수 있습니다.
f(tf.constant(1))

tf.config.experimental_run_functions_eagerly(False)


> <ipython-input-9-f3c5164d083a>(12)f()
-> x = x+1
(Pdb) quit


BdbQuit: 

In [24]:
#데이터 다운로드

def prepare_mnist_features_and_labels(x, y):
    x = tf.cast(x, tf.float32) / 255.0
    y = tf.cast(y, tf.int64)
    return x, y

def mnist_dataset():
    (x,y), _ = tf.keras.datasets.mnist.load_data()
    ds = tf.data.Dataset.from_tensor_slices((x,y))
    ds = ds.map(prepare_mnist_features_and_labels)
    ds = ds.take(20000).shuffle(20000).batch(100)
    return ds

train_dataset = mnist_dataset()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [25]:
model = tf.keras.Sequential((
    tf.keras.layers.Reshape(target_shape=(28*28,), input_shape = (28,28)),
    tf.keras.layers.Dense(100, activation='relu'),
    tf.keras.layers.Dense(100, activation = 'relu'),
    tf.keras.layers.Dense(10)))
model.build()
optimizer = tf.keras.optimizers.Adam()

In [26]:
# 훈련 루프정의
compute_loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
compute_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()

def train_one_step(model, optimizer, x, y):
    with tf.GradientTape() as tape:
        logits = model(x)
        loss = compute_loss(y, logits)
        
    grads = tape.gradient(loss, model.trainable_variables)
    optimizer.apply_gradients(zip(grads, model.trainable_variables))
    
    compute_accuracy(y, logits)
    return loss

@tf.function
def train(model, optimizer):
    train_ds = mnist_dataset()
    step = 0
    loss = 0.0
    accuracy = 0.0
    for x, y in train_ds:
        step += 1
        loss = train_one_step(model, optimizer, x, y)
        if tf.equal(step % 10, 0):
            tf.print('스텝',step, ': 손실', loss,' ; 정확도', compute_accuracy.result())
    return step, loss, accuracy

step, loss, accuracy = train(model, optimizer)
print('최종 스텝', step,' : 손실',loss,' ; 정확도',compute_accuracy.result())

스텝 10 : 손실 1.86079204  ; 정확도 0.349
스텝 20 : 손실 1.18597269  ; 정확도 0.498
스텝 30 : 손실 0.734994  ; 정확도 0.579666674
스텝 40 : 손실 0.786540449  ; 정확도 0.63875
스텝 50 : 손실 0.422231287  ; 정확도 0.678
스텝 60 : 손실 0.371722907  ; 정확도 0.709666669
스텝 70 : 손실 0.345035553  ; 정확도 0.732142866
스텝 80 : 손실 0.547361  ; 정확도 0.75075
스텝 90 : 손실 0.48620984  ; 정확도 0.766333342
스텝 100 : 손실 0.386355966  ; 정확도 0.7792
스텝 110 : 손실 0.333828747  ; 정확도 0.790818155
스텝 120 : 손실 0.284371495  ; 정확도 0.801333308
스텝 130 : 손실 0.297033519  ; 정확도 0.809307694
스텝 140 : 손실 0.322968632  ; 정확도 0.816
스텝 150 : 손실 0.23251316  ; 정확도 0.823666692
스텝 160 : 손실 0.398751408  ; 정확도 0.829062521
스텝 170 : 손실 0.277974784  ; 정확도 0.833411753
스텝 180 : 손실 0.330270797  ; 정확도 0.838833332
스텝 190 : 손실 0.230622709  ; 정확도 0.842894733
스텝 200 : 손실 0.263557315  ; 정확도 0.8474
최종 스텝 200  : 손실 tf.Tensor(0.2635573, shape=(), dtype=float32)  ; 정확도 tf.Tensor(0.8474, shape=(), dtype=float32)


In [27]:
# 배치
#실제 적용시 배치는 성능을 위해 필수적입니다. 오토그래프로 변환하기 가장 좋은 코드는 제어흐름이 배치수준에서 결정되는 코드입니다.
# 만일 제어 흐름이 개별적인 예제수준에서 결정된다면, 성능을 유지하기위해 배치APi들을 사용해야 합니다.

def square_if_positive(x):
    return [i ** 2 if i > 0 else i for i in x]

square_if_positive(range(-5,5))

[-5, -4, -3, -2, -1, 0, 1, 4, 9, 16]

In [28]:
# 위 파이썬 코드를 텐서플로에서
@tf.function
def square_if_positive_naive(x):
    result = tf.TensorArray(tf.int32, size = x.shape[0])
    for i in tf.range(x.shape[0]):
        if x[i] > 0:
            result = result.write(i, x[i] ** 2)
        else:
            result = result.write(i, x[i])
    return result.stack()

square_if_positive_naive(tf.range(-5,5))

<tf.Tensor: id=36661, shape=(10,), dtype=int32, numpy=array([-5, -4, -3, -2, -1,  0,  1,  4,  9, 16])>

In [29]:
# 또는
def square_if_positive_vectorized(x):
    return tf.where(x > 0, x**2, x)

square_if_positive_vectorized(tf.range(-5,5))

<tf.Tensor: id=36671, shape=(10,), dtype=int32, numpy=array([-5, -4, -3, -2, -1,  0,  1,  4,  9, 16])>