# 텐서플로우(TensorFlow) 시작하기
[원본 문서](https://www.tensorflow.org/get_started/get_started)

이 안내서는 텐서플로우에서 프로그래밍을 시작하도록 안내합니다. 이 안내서를 사용하기 전에, [텐서플로우를 설치하십시오](https://www.tensorflow.org/install/). 이 가이드를 최대한 활용하려면, 다음 사항들을 알아야 합니다:

* 파이썬(Python)으로 프로그래밍하는 법.
* 적어도 배열에 대한 약간의 지식.
* 이상적으로는, 기계 학습에 관한 것입니다. 그러나, 기계 학습에 대해 거의 또는 전혀 알지 못하는 경우에도, 이것이 그래도 읽어야 할 첫 번째 가이드입니다.

텐서플로우는 여러 API들을 제공합니다. 최저 수준의 API--텐서플로우 Core--는 완벽한 프로그래밍 제어를 제공합니다. 텐서플로우 Core는 기계 학습 연구자 및 모델을 정밀하게 제어해야 하는 사람들을 위해 권장됩니다. 높은 수준의 API는 텐서플로우 Core 위에 구축됩니다. 이러한 상위 수준의 API는 일반적으로 텐서플로우 Core보다 배우고 사용하기가 쉽습니다. 또한 상위 수준의 API는 반복적인 작업을 여러 사용자간에 보다 쉽고 일관되게 만듭니다. tf.estimator와 같은 고급 API를 통해 데이터 셋, 추정자(estimator), 학습 및 추론을 처리할 수 있습니다.

이 안내서는 텐서플로우 Core에 대한 자습서로 시작됩니다. 나중에, tf.estimator에서 동일한 모델을 구현하는 방법을 보여줍니다. 텐서플로우 Core의 원리를 아는 것은 보다 간결한 고수준의 API를 사용할 때 내부적으로 어떤 일이 일어나는 지에 대한 훌륭한 개념 모델을 제공합니다.

# 텐서(Tensors)

텐서플로우 데이터의 중심 단위는 **텐서(tensor)**입니다. 텐서는 임의의 차원 배열 구조(shape)인 원시 값들(primitive values)의 집합으로 구성됩니다. 텐서의 **순위(rank)**는 차원 수입니다. 다음은 텐서들의 몇 가지 예입니다:

In [2]:
3 # a rank 0 tensor; this is a scalar with shape []

3

In [3]:
[1., 2., 3.] # a rank 1 tensor; this is a vector with shape [3]

[1.0, 2.0, 3.0]

In [4]:
[[1., 2., 3.], [4., 5., 6.]] # a rank 2 tensor; a matrix with shape [2, 3]

[[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]]

In [5]:
[[[1., 2., 3.]], [[7., 8., 9.]]] # a rank 3 tensor with shape [2, 1, 3]

[[[1.0, 2.0, 3.0]], [[7.0, 8.0, 9.0]]]

## 텐서플로우 핵심 자습서
<hr/>

### 텐서플로우 가져 오기

텐서플로우 프로그램에 대한 표준 import 문은 다음과 같습니다:

In [2]:
import tensorflow as tf

이렇게 하면 파이썬은 텐서플로우의 모든 클래스, 메소드 및 심볼에 접근 할 수 있습니다. 대부분의 문서에서는 이미 이 작업을 했다고 가정합니다.

### 연산 그래프(Computational Graph)

텐서플로우 핵심 프로그램은 두 개의 분리된 부분으로 구성되어 있다고 생각할 수 있습니다:

1. 연산 그래프의 작성.
2. 연산 그래프의 실행.

**연산 그래프**는 일련의 텐서플로우 작업을 노드 그래프로 배열한 것입니다. 간단한 연산 그래프를 작성해 봅시다. 각 노드는 0 이상의 텐서를 입력으로 사용하고 텐서를 출력으로 생성합니다. 노드의 한 유형은 상수입니다. 모든 텐서플로우 상수와 마찬가지로, 입력을 받지 않으며, 내부적으로 저장하는 값을 출력합니다. 다음과 같이 두 개의 부동 소수점 텐서 `node1`과 `node2`를 생성할 수 있습니다:

In [3]:
node1 = tf.constant(3.0, dtype=tf.float32)
node2 = tf.constant(4.0) # also tf.float32 implicitly
print(node1, node2)

Tensor("Const:0", shape=(), dtype=float32) Tensor("Const_1:0", shape=(), dtype=float32)


마지막 출력문의 결과는 ↑

노드의 출력이 아마도 기대했을 값들인 `3.0`과 `4.0`로 출력되지 않는다는 것에 주목하십시오. 대신, 평가될 때, 각각 3.0과 4.0를 생성하는 노드입니다. 노드를 실제로 평가하려면, **세션(session)** 내에서 연산 그래프를 실행해야 합니다. 세션은 텐서플로우 런타임의 제어(control)와 상태(state)를 캡슐화합니다.

다음 코드는 `Session` 객체를 만든 다음 `run` 메소드를 호출하여 `node1`과 `node2`를 평가하는 만큼의 연산 그래프를 실행합니다. 다음과 같이 세션에서 연산 그래프를 실행하면:

In [4]:
sess = tf.Session()
print(sess.run([node1, node2]))

[3.0, 4.0]


예상했던 값인 3.0과 4.0가 나타납니다: ↑

`Tensor` 노드들을 작업(작업 또한 노드입니다)들과 결합하여 보다 복잡한 연산을 만들 수 있습니다. 예를 들어, 두 개의 상수 노드를 추가하여 다음과 같이 새 그래프를 생성 할 수 있습니다:

In [5]:
node3 = tf.add(node1, node2)
print("node3:", node3)
print("sess.run(node3):", sess.run(node3))

node3: Tensor("Add:0", shape=(), dtype=float32)
sess.run(node3): 7.0


마지막 두 개의 출력 문의 결과입니다 ↑

텐서플로우는 연산 그래프의 그림을 표시하는 텐서보드(TensorBoard)라는 유틸리티를 제공합니다. 다음은 텐서보드가 그래프를 시각화하는 방법을 보여주는 스크린 샷입니다:
<img alt="TensorBoard screenshot" src="https://www.tensorflow.org/images/getting_started_add.png">
이대로, 이 그래프는 항상 동일한 결과를 산출하기 때문에 특별히 흥미롭지는 않습니다. **자리 표시자(placeholder)**라고 하는 외부 입력을 허용하도록 그래프를 매개변수화(parameterized)할 수 있습니다. **자리 표시자**는 나중에 값을 제공하겠다는 약속입니다.

In [6]:
a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
adder_node = a + b  # + provides a shortcut for tf.add(a, b)

위의 세 줄은 입력 매개변수들(a와 b)을 정의한 다음 해당 매개변수들에 대한 연산을 정의하는 함수 또는 람다와 조금 비슷합니다. [run 메소드](https://www.tensorflow.org/api_docs/python/tf/Session#run)에 feed_dict 인수를 통해 구체적인 값을 자리표시자에 공급함으로써 이 그래프를 여러 입력으로 평가할 수 있습니다:

In [7]:
print(sess.run(adder_node, {a: 3, b: 4.5}))
print(sess.run(adder_node, {a: [1, 3], b: [2, 4]}))

7.5
[ 3.  7.]


출력 결과 ↑

텐서보드(TensorBoard)에서 그래프는 다음과 같습니다:
<img alt="TensorBoard screenshot" src="https://www.tensorflow.org/images/getting_started_adder.png">
다른 연산을 추가하여 연산 그래프를 더 복잡하게 만들 수 있습니다. 예를 들어,

In [8]:
add_and_triple = adder_node * 3.
print(sess.run(add_and_triple, {a: 3, b: 4.5}))

22.5


출력을 만듭니다 ↑

앞의 연산 그래프는 텐서보드에서 다음과 같이 나타납니다:
<img alt="TensorBoard screenshot" src="https://www.tensorflow.org/images/getting_started_triple.png">
기계 학습에서 우리는 일반적으로 위와 같은 임의의 입력을 취할 수 있는 모델을 원할 것입니다. 모델을 학습 가능하게 만들려면, 동일한 입력으로 새로운 출력을 얻기 위해 그래프를 수정할 수 있어야 합니다. **변수**를 사용하면 그래프에 학습 가능한 매개변수를 추가할 수 있습니다. 그것들은 타입과 초기 값으로 구성됩니다:

In [13]:
W = tf.Variable([.3], dtype=tf.float32)
b = tf.Variable([-.3], dtype=tf.float32)
x = tf.placeholder(tf.float32)
linear_model = W * x + b

상수는 `tf.constant`를 호출할 때 초기화되며 값은 절대로 변경될 수 없습니다. 반대로 `tf.Variable`을 호출하면 변수가 초기화되지 않습니다. 텐서플로우 프로그램의 모든 변수를 초기화하려면 다음과 같이 특수한 작업을 명시적으로 호출해야합니다:

In [14]:
init = tf.global_variables_initializer()
sess.run(init)

`init`이 텐서플로우 하위 그래프에 모든 전역 변수를 초기화하는 처리임을 인식하는 것이 중요합니다. `sess.run`을 호출할 때까지 변수는 초기화되지 않습니다.

`x`는 자리표시자이므로, 다음과 같이 `x`의 여러 값들에 대해 `linear_model`을 일제히 평가할 수 있습니다:

In [15]:
print(sess.run(linear_model, {x: [1, 2, 3, 4]}))

[ 0.          0.30000001  0.60000002  0.90000004]


출력을 만듭니다 ↑

우리는 모델을 만들었지만, 아직 얼마나 좋은지 모릅니다. 교육 데이터에 대한 모델을 평가하려면, 원하는 값을 제공하기 위해 `y` 자리표시자가 필요하며, 손실함수(loss function)를 작성해야 합니다.

손실함수는 제공된 모델로부터 현재 모델이 얼마나 떨어져 있는지를 측정합니다. 현재 모델과 제공된 데이터 사이의 델타 제곱을 합한 선형회귀분석(linear regression)에 표준손실모델(standard loss model)을 사용합니다. `linear_model - y`는 각 요소에 해당하는 예의 오차 델타 벡터를 만듭니다. `tf.square`를 호출하여 오차를 제곱합니다. 그런 다음, `tf.reduce_sum`을 사용해, 모든 오차의 제곱을 합함으로써 모든 예들의 오차를 대표(abstract)하는 단일 스칼라를 만듭니다:

In [16]:
y = tf.placeholder(tf.float32)
squared_deltas = tf.square(linear_model - y)
loss = tf.reduce_sum(squared_deltas)
print(sess.run(loss, {x: [1, 2, 3, 4], y: [0, -1, -2, -3]}))

23.66


손실 값을 만듭니다 ↑

`W`와 `b`를 정확한 값들인 -1과 1로 재할당하여 수동으로 향상시킬 수 있습니다. 변수는 `tf.Variable`을 통해 초기화되지만 `tf.assign`과 같은 연산을 사용해 변경할 수 있습니다. 예를 들어, `W=-1`과 `b=1`은 우리 모델에서 최적의 매개변수들입니다. `W`와 `b`를 적절하게 변경할 수 있습니다:

In [17]:
fixW = tf.assign(W, [-1.])
fixb = tf.assign(b, [1.])
sess.run([fixW, fixb])
print(sess.run(loss, {x: [1, 2, 3, 4], y: [0, -1, -2, -3]}))

0.0


마지막 출력은 손실이 0임을 보여줍니다. ↑

우리는 `W`와 `b`의 "정확한" 값들을 추측했지만, 기계 학습의 요점은 올바른 모델 매개변수들을 자동으로 찾는 것입니다. 다음 절에서 이것을 이루는 방법을 보여주겠습니다.

## tf.train API
<hr/>

기계 학습에 대한 완전한 논의는 본 자습서의 범위를 벗어납니다. 하지만, 텐서플로우는 손실 함수를 최소화하기 위해 각 변수를 조금씩 변경하는 **옵티마이저(optimizer)**들을 제공합니다. 가장 간단한 옵티마이저는 **경사 하강(gradient descent)**입니다. 해당 변수의 손실에 대한 미분 크기에 따라 각 변수를 수정합니다. 일반적으로, 수작업으로 계산하는 것은 지루하고 오류가 발생하기 쉽습니다. 따라서, 텐서플로우는 `tf.gradients` 함수를 사용하여 주어진 모델에 대한 서술만으로 미분값을 자동으로 생성할 수 있습니다. 단순화 하자면, 옵티마이저가 일반적으로 이를 수행합니다. 예를 들어,

In [18]:
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

In [19]:
sess.run(init) # reset values to incorrect defaults.
for i in range(1000):
  sess.run(train, {x: [1, 2, 3, 4], y: [0, -1, -2, -3]})

print(sess.run([W, b]))

[array([-0.9999969], dtype=float32), array([ 0.99999082], dtype=float32)]


최종 모델에서 매개변수 결과: ↑

이제 진짜 기계 학습을 했습니다! 이 간단한 선형회귀를 수행하더라도 텐서플로우 코어 코드가 많이 필요하지는 않지만, 모델에 데이터를 입력하는 더 복잡한 모델과 메서드는 더 많은 코드를 필요로 합니다. 그래서 텐서플로우는 일반적인 패턴, 구조 및 기능에 대한 보다 높은 수준의 추상화를 제공합니다. 다음 절에서 이러한 추상화의 일부를 사용하는 방법을 배웁니다.

### 완성된 프로그램

완성된 훈련 가능한 선형회귀 모델을 보면:

In [20]:
import tensorflow as tf

# Model parameters
W = tf.Variable([.3], dtype=tf.float32)
b = tf.Variable([-.3], dtype=tf.float32)
# Model input and output
x = tf.placeholder(tf.float32)
linear_model = W * x + b
y = tf.placeholder(tf.float32)

# loss
loss = tf.reduce_sum(tf.square(linear_model - y)) # sum of the squares
# optimizer
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

# training data
x_train = [1, 2, 3, 4]
y_train = [0, -1, -2, -3]
# training loop
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init) # reset values to wrong
for i in range(1000):
  sess.run(train, {x: x_train, y: y_train})

# evaluate training accuracy
curr_W, curr_b, curr_loss = sess.run([W, b, loss], {x: x_train, y: y_train})
print("W: %s b: %s loss: %s"%(curr_W, curr_b, curr_loss))

W: [-0.9999969] b: [ 0.99999082] loss: 5.69997e-11


실행하면, 결과가 ↑

손실이 아주 작은 수(거의 0에 가깝습니다)라는 것에 주목하세요. 이 프로그램을 실행하면 모델이 의사 난수 값으로 초기화되기 때문에 손실이 정확히 같지 않을 수 있습니다.

이런 보다 복잡한 프로그램 역시 텐서보드에서 시각화할 수 있습니다.
<img alt="TensorBoard final model visualization" src="https://www.tensorflow.org/images/getting_started_final.png">

## tf.estimator
<hr/>

`tf.estimator`는 기계 학습의 기법을 단순화하는 고수준 텐서플로우 라이브러리로, 다음을 포함합니다:

* 학습 루프의 실행
* 평가 루프의 실행
* 데이터셋 관리

tf.estimator는 많은 일반 모델들을 정의합니다.

### 기본 사용법

`tf.estimator`로 선형회귀 프로그램이 얼마나 간단해졌는지 주목하십시오:

In [22]:
import tensorflow as tf
# NumPy is often used to load, manipulate and preprocess data.
import numpy as np

# Declare list of features. We only have one numeric feature. There are many
# other types of columns that are more complicated and useful.
feature_columns = [tf.feature_column.numeric_column("x", shape=[1])]

# An estimator is the front end to invoke training (fitting) and evaluation
# (inference). There are many predefined types like linear regression,
# linear classification, and many neural network classifiers and regressors.
# The following code provides an estimator that does linear regression.
estimator = tf.estimator.LinearRegressor(feature_columns=feature_columns)

# TensorFlow provides many helper methods to read and set up data sets.
# Here we use two data sets: one for training and one for evaluation
# We have to tell the function how many batches
# of data (num_epochs) we want and how big each batch should be.
x_train = np.array([1., 2., 3., 4.])
y_train = np.array([0., -1., -2., -3.])
x_eval = np.array([2., 5., 8., 1.])
y_eval = np.array([-1.01, -4.1, -7, 0.])
input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_train}, y_train, batch_size=4, num_epochs=None, shuffle=True)
train_input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_train}, y_train, batch_size=4, num_epochs=1000, shuffle=False)
eval_input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_eval}, y_eval, batch_size=4, num_epochs=1000, shuffle=False)

# We can invoke 1000 training steps by invoking the  method and passing the
# training data set.
estimator.train(input_fn=input_fn, steps=1000)

# Here we evaluate how well our model did.
train_metrics = estimator.evaluate(input_fn=train_input_fn)
eval_metrics = estimator.evaluate(input_fn=eval_input_fn)
print("train metrics: %r"% train_metrics)
print("eval metrics: %r"% eval_metrics)

INFO:tensorflow:Using default config.
INFO:tensorflow:Using config: {'_model_dir': '/tmp/tmp1ovxbcgn', '_tf_random_seed': 1, '_save_summary_steps': 100, '_save_checkpoints_secs': 600, '_save_checkpoints_steps': None, '_session_config': None, '_keep_checkpoint_max': 5, '_keep_checkpoint_every_n_hours': 10000, '_log_step_count_steps': 100}
INFO:tensorflow:Create CheckpointSaverHook.
INFO:tensorflow:Saving checkpoints for 1 into /tmp/tmp1ovxbcgn/model.ckpt.
INFO:tensorflow:loss = 13.0, step = 1
INFO:tensorflow:global_step/sec: 1253.18
INFO:tensorflow:loss = 0.404879, step = 101 (0.083 sec)
INFO:tensorflow:global_step/sec: 1367.07
INFO:tensorflow:loss = 0.0710876, step = 201 (0.074 sec)
INFO:tensorflow:global_step/sec: 1332.47
INFO:tensorflow:loss = 0.0199711, step = 301 (0.074 sec)
INFO:tensorflow:global_step/sec: 1223.98
INFO:tensorflow:loss = 0.00589484, step = 401 (0.081 sec)
INFO:tensorflow:global_step/sec: 1282.52
INFO:tensorflow:loss = 0.000747879, step = 501 (0.077 sec)
INFO:tensor

실행하면, 결과가 ↑

우리의 평가 데이터가 얼마간 더 큰 손실이 났지만, 여전히 0에 가깝다는 것에 주목하세요. 그것은 우리가 올바르게 학습하고 있음을 의미합니다.

### 커스텀 모델

`tf.estimator`는 미리 정의된 모델들로만 제한하지 않습니다. 텐서플로우에 내장되어 있지 않은 커스텀 모델을 만들고 싶다고 가정해 보겠습니다. 우리는 여전히`tf.estimator`의 데이터셋, 공급(feeding), 훈련 등에 대한 고수준 추상화를 유지할 수 있습니다. 예를 들어, 하위 레벨 텐서플로우 API에 대한 지식을 사용하여 `LinearRegressor`와 동등한 우리만의 모델을 구현하는 방법을 보여주겠습니다.

`tf.estimator`와 함께 동작하는 커스텀 모델을 정의하려면, `tf.estimator.Estimator`를 사용해야 합니다. `tf.estimator.LinearRegressor`는 실제로 `tf.estimator.Estimator`의 하위 클래스입니다. `Estimator`의 하위 클래스로 하는 대신에, 단순히 `tf.estimator`에게 어떻게 예측, 학습 단계, 손실을 평가할 수 있는지를 알려주는 `model_fn` 함수를 `Estimator`에게 제공합니다. 코드는 다음과 같습니다:

In [24]:
import numpy as np
import tensorflow as tf

# Declare list of features, we only have one real-valued feature
def model_fn(features, labels, mode):
  # Build a linear model and predict values
  W = tf.get_variable("W", [1], dtype=tf.float64)
  b = tf.get_variable("b", [1], dtype=tf.float64)
  y = W * features['x'] + b
  # Loss sub-graph
  loss = tf.reduce_sum(tf.square(y - labels))
  # Training sub-graph
  global_step = tf.train.get_global_step()
  optimizer = tf.train.GradientDescentOptimizer(0.01)
  train = tf.group(optimizer.minimize(loss),
                   tf.assign_add(global_step, 1))
  # EstimatorSpec connects subgraphs we built to the
  # appropriate functionality.
  return tf.estimator.EstimatorSpec(
      mode=mode,
      predictions=y,
      loss=loss,
      train_op=train)

estimator = tf.estimator.Estimator(model_fn=model_fn)
# define our data sets
x_train = np.array([1., 2., 3., 4.])
y_train = np.array([0., -1., -2., -3.])
x_eval = np.array([2., 5., 8., 1.])
y_eval = np.array([-1.01, -4.1, -7, 0.])
input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_train}, y_train, batch_size=4, num_epochs=None, shuffle=True)
train_input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_train}, y_train, batch_size=4, num_epochs=1000, shuffle=False)
eval_input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_eval}, y_eval, batch_size=4, num_epochs=1000, shuffle=False)

# train
estimator.train(input_fn=input_fn, steps=1000)
# Here we evaluate how well our model did.
train_metrics = estimator.evaluate(input_fn=train_input_fn)
eval_metrics = estimator.evaluate(input_fn=eval_input_fn)
print("train metrics: %r"% train_metrics)
print("eval metrics: %r"% eval_metrics)

INFO:tensorflow:Using default config.
INFO:tensorflow:Using config: {'_model_dir': '/tmp/tmpwns0ghnb', '_tf_random_seed': 1, '_save_summary_steps': 100, '_save_checkpoints_secs': 600, '_save_checkpoints_steps': None, '_session_config': None, '_keep_checkpoint_max': 5, '_keep_checkpoint_every_n_hours': 10000, '_log_step_count_steps': 100}
INFO:tensorflow:Create CheckpointSaverHook.
INFO:tensorflow:Saving checkpoints for 1 into /tmp/tmpwns0ghnb/model.ckpt.
INFO:tensorflow:loss = 17.3073748566, step = 1
INFO:tensorflow:global_step/sec: 1339.49
INFO:tensorflow:loss = 0.0416367058214, step = 101 (0.078 sec)
INFO:tensorflow:global_step/sec: 1318.66
INFO:tensorflow:loss = 0.00252774516377, step = 201 (0.075 sec)
INFO:tensorflow:global_step/sec: 1363.17
INFO:tensorflow:loss = 5.93164722352e-05, step = 301 (0.073 sec)
INFO:tensorflow:global_step/sec: 1441.82
INFO:tensorflow:loss = 1.58568519768e-05, step = 401 (0.070 sec)
INFO:tensorflow:global_step/sec: 1343.92
INFO:tensorflow:loss = 4.4833211

실행하면, 결과는 ↑

커스텀 `model_fn()` 함수의 내용이 저수준 API의 수동 모델 훈련 루프와 얼마나 비슷한지 주목하십시오.

## 다음 단계
<hr/>

이제 텐서플로우의 기본에 대한 실무 지식을 습득했습니다. 우리는 더 많이 배울 수있는 몇 가지 자습서들을 가지고 있습니다. 기계 학습의 초보자인 경우는 [MNIST for beginners](https://www.tensorflow.org/get_started/mnist/beginners)를 보시고, 그렇지 않으면 [Deep MNIST for experts](https://www.tensorflow.org/get_started/mnist/pros)를 보세요.
<hr/>
별도로 명시된 경우를 제외하고, 이 페이지의 내용은 Creative Commons Attribution 3.0 License로 라이센스가 부여되며, 코드 샘플은 Apache 2.0 License에 의거한 라이센스가 부여됩니다. 자세한 내용은 우리의 사이트 정책을 참조하십시오. Java는 Oracle 및/또는 그 계열사의 등록 상표입니다.

2017.8월 17, 최종 수정됨 