# 00. 설정

In [1]:
# 공통
import numpy as np
import os

# 일관된 출력을 위해 유사난수 초기화
def reset_graph(seed=42):
    tf.reset_default_graph()
    tf.set_random_seed(seed)
    np.random.seed(seed)

# 맷플롯립 설정
%matplotlib inline
import matplotlib
import matplotlib.pyplot as plt
plt.rcParams['axes.labelsize'] = 14
plt.rcParams['xtick.labelsize'] = 12
plt.rcParams['ytick.labelsize'] = 12

# 한글출력
plt.rcParams['font.family'] = 'NanumBarunGothic'
plt.rcParams['axes.unicode_minus'] = False

# 그림을 저장할 폴더
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "tensorflow"

def save_fig(fig_id, tight_layout=True):
    path = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID, fig_id + ".png")
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format='png', dpi=300)

# 01. 텐서플로우

Tensorflow는 수치 게산을 위한 강력한 오픈소스 소프트웨어 라이브러리로 특히 대규모 머신러닝에 맞춰 세밀하게 튜닝되어 있다. 계산 그래프를 여러 부분으로 나누어 CPU나 GPU에서 병렬로 실행할 수도 있다. 텐서플로우의 깔끔한 설계, 확장성, 유연성과 잘 정돈된 문서 덕분에 단숨에 가장 높은 인기를 얻었다.

# 02. 계산그래프를 만들어 세션에서 실행하기

In [2]:
import tensorflow as tf

x = tf.Variable(3, name="x")
y = tf.Variable(4, name="y")
f = x*x*y + y + 2

# 이 코드가 뭔가 계산하는 것 같아 보이지만 실제로는 어떤 계산도 수행하지 않는다.
# 단지 계산 그래프만 만들 뿐이다. 변수조차도 초기화되지 않는다.
# 이 계산 그래프를 실행하려면 텐서플로우 세션을 시작하고 변수를 초기화한 다음 f를 실행해야 한다.

In [3]:
sess = tf.Session()
sess.run(x.initializer)
sess.run(y.initializer)
result = sess.run(f)
print(result)
sess.close()

# 이 코드는 세션을 만들고 변수를 초기화한 다음 f를 실행하고 세션을 닫는다.

42


In [4]:
with tf.Session() as sess : 
    x.initializer.run()
    y.initializer.run()
    reslt = f.eval()
    
# 매번 sess.run()을 반복하면 번거로운데, 이 코드로 해결할 수 있다. 

In [5]:
init = tf.global_variables_initializer()
with tf.Session() as sess : 
    init.run()
    result = f.eval()
    
# 각 변수의 초기화를 일일히 하는 대신 이런 코드로 한번에 초기화할 수 있다.

In [6]:
sess = tf.InteractiveSession()
init.run()
result = f.eval()
print(result)
sess.close()

# 일반적인 Session과는 다르게 InteractiveSession은 자동으로 자신을 기본 세션으로 지정한다. 
# 그러므로 with 블록을 사용할 필요가 없다.
# 그러나 끝났을 때는 수동으로 종료해줘야 한다.

42


일반적으로 텐서플로우 프로그램은 두 부분으로 나눈다. 첫 부분은 계산 그래프를 만들고(구성 단계), 두 번째 부분은  이 그래프를 실행한다(실행 단계). 구성 단게에서는 훈련에 필요한 계산과 머신러닝 모델을 표현한 계산 그래프를 만든다. 실행 단계에서는 훈련 스텝을 반복해서 평가하고, 모델 파라미터를 점진적으로 개선하기 위해 반복 루프를 수행한다.

# 03. 계산 그래프 관리

In [7]:
x1 = tf.Variable(1)
x1.graph is tf.get_default_graph()

# 노드를 만들면 자동으로 기본 계산 그래프에 추가된다. 대부분 이것으로 충분하지만
# 가끔은 독립적인 계산 그래프를 여러 개 만들어야 할 때가 있다.
# 이렇게 하려면 다음과 같이 새로운 Graph 객체를 만들어 with 블록 안에서 임시로 사용할 수 있다.

True

In [8]:
graph = tf.Graph()
with graph.as_default() : 
    x2 = tf.Variable(2)

print(x2.graph is graph)
print(x2.graph is tf.get_default_graph())

True
False


# 04. 노드 값의 생애주기

In [9]:
w = tf.constant(3)
x = w + 2
y = x + 5
z = x + 3

with tf.Session() as sess : 
    print(x.eval())
    print(y.eval())
    print(z.eval())

# 한 노드를 실행할 때 텐서플로우는 이 노드가 의존하고 있는 다른 노드들을 자동으로 찾아 먼저 실행한다.
# 텐서플로우는 자동으로 y가 x에 의존한다는 것과 x가 w에 의존한다는 것을 감지한다.
# 그러나 z를 평가할 때 w와 x를 다시 한 번 평가한다. 평가된 것들을 재사용하지는 않는다.

5
10
8


In [10]:
with tf.Session() as sess : 
    y_val, z_val = sess.run([y,z])
    print(y_val)
    print(z_val)
    
# 모든 노드의 값은 계산 그래프 실행 간에 유지되지 않는다.
# 변수값은 예외로, 그래프 실행 간에도 세션에 의해 유지된다.
# 변수는 초기화될 때 일생이 시작되고 세션이 종료될 때까지 남아 있는다.

10
8


# 05. 텐서플로우를 이용한 선형 회귀 (정규방정식)

In [11]:
import numpy as np
from sklearn.datasets import fetch_california_housing

housing = fetch_california_housing()
m,n = housing.data.shape
housing_data_plus_bias = np.c_[np.ones((m,1)), housing.data]

X = tf.constant(housing_data_plus_bias, dtype=tf.float32, name="X")
Y = tf.constant(housing.target.reshape(-1,1),dtype=tf.float32, name="Y")
XT = tf.transpose(X)
theta = tf.matmul(tf.matmul(tf.matrix_inverse(tf.matmul(XT,X)),XT),Y)

with tf.Session() as sess : 
    theta_value = theta.eval()
    print(theta.eval())
    
# 캘리포니아 주택 가격 데이터셋 대한 선형 회귀이다.
# 먼저 데이터셋을 추출하고 모든 훈련 샘플에 편향에 대한 입력 특성(x0=1)을 추가한다.
# 그런 다음 2개의 텐서플로우 상수 노드 X와 Y를 만들고 데이터와 타깃을 담는다.
# 그리고 텐서플로우에서 행렬 연산을 사용해 theta를 정의한다.

[[-3.7185181e+01]
 [ 4.3633747e-01]
 [ 9.3952334e-03]
 [-1.0711310e-01]
 [ 6.4479220e-01]
 [-4.0338000e-06]
 [-3.7813708e-03]
 [-4.2348403e-01]
 [-4.3721911e-01]]


### 넘파이와 비교

In [25]:
X = housing_data_plus_bias
y = housing.target.reshape(-1, 1)
theta_numpy = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)

print(theta_numpy)

[[-3.69419202e+01]
 [ 4.36693293e-01]
 [ 9.43577803e-03]
 [-1.07322041e-01]
 [ 6.45065694e-01]
 [-3.97638942e-06]
 [-3.78654265e-03]
 [-4.21314378e-01]
 [-4.34513755e-01]]


### 사이킷런과 비교

In [26]:
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(housing.data, housing.target.reshape(-1, 1))

print(np.r_[lin_reg.intercept_.reshape(-1, 1), lin_reg.coef_.T])

[[-3.69419202e+01]
 [ 4.36693293e-01]
 [ 9.43577803e-03]
 [-1.07322041e-01]
 [ 6.45065694e-01]
 [-3.97638942e-06]
 [-3.78654265e-03]
 [-4.21314378e-01]
 [-4.34513755e-01]]


# 6. 경사 하강법 구현

In [24]:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaled_housing_data = scaler.fit_transform(housing.data)
scaled_housing_data_plus_bias = np.c_[np.ones((m, 1)), scaled_housing_data]

### 직접 그래디언트 계산

In [27]:
reset_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
gradients = 2/m * tf.matmul(tf.transpose(X), error)
training_op = tf.assign(theta, theta - learning_rate * gradients)

init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("에포크", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    
    best_theta = theta.eval()

에포크 0 MSE = 9.161543
에포크 100 MSE = 0.71450067
에포크 200 MSE = 0.5667049
에포크 300 MSE = 0.5555719
에포크 400 MSE = 0.5488112
에포크 500 MSE = 0.5436362
에포크 600 MSE = 0.5396294
에포크 700 MSE = 0.53650916
에포크 800 MSE = 0.5340678
에포크 900 MSE = 0.5321474


In [28]:
best_theta

array([[ 2.0685523 ],
       [ 0.8874027 ],
       [ 0.14401656],
       [-0.34770885],
       [ 0.36178368],
       [ 0.00393811],
       [-0.04269556],
       [-0.66145283],
       [-0.6375278 ]], dtype=float32)

### 자동 미분 사용

In [32]:
def my_func(a, b):
    z = 0
    for i in range(100):
        z = a * np.cos(z + i) + z * np.sin(b - i)
    return z

In [33]:
my_func(0.2, 0.3)

-0.21253923284754914

In [34]:
reset_graph()

a = tf.Variable(0.2, name="a")
b = tf.Variable(0.3, name="b")
z = tf.constant(0.0, name="z0")
for i in range(100):
    z = a * tf.cos(z + i) + z * tf.sin(b - i)

grads = tf.gradients(z, [a, b])
init = tf.global_variables_initializer()

In [35]:
# a=0.2 와 b=0.3 일 때의 함수 값을 계산하고 a와 b에 대한 편미분을 계산
with tf.Session() as sess:
    init.run()
    print(z.eval())
    print(sess.run(grads))

-0.21253741
[-1.1388494, 0.19671395]


### GradientDescentOptimizer 사용

In [36]:
reset_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")

In [38]:
gradients = tf.gradients(mse, [theta])[0]

In [39]:
training_op = tf.assign(theta, theta - learning_rate * gradients)

init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("에포크", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    
    best_theta = theta.eval()

print("best_theta:")
print(best_theta)

에포크 0 MSE = 9.161543
에포크 100 MSE = 0.7145006
에포크 200 MSE = 0.566705
에포크 300 MSE = 0.5555719
에포크 400 MSE = 0.5488112
에포크 500 MSE = 0.5436362
에포크 600 MSE = 0.5396294
에포크 700 MSE = 0.5365092
에포크 800 MSE = 0.5340678
에포크 900 MSE = 0.5321474
best_theta:
[[ 2.0685525 ]
 [ 0.8874027 ]
 [ 0.14401658]
 [-0.34770882]
 [ 0.36178368]
 [ 0.00393811]
 [-0.04269556]
 [-0.6614528 ]
 [-0.6375277 ]]


### 모멘텀 옵티마이저 사용

In [40]:
reset_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")

In [41]:
optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate, momentum=0.9)

In [42]:
training_op = optimizer.minimize(mse)

init = tf.global_variables_initializer()

In [43]:
with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        sess.run(training_op)
    
    best_theta = theta.eval()

print("best_theta:")
print(best_theta)

best_theta:
[[ 2.068558  ]
 [ 0.8296286 ]
 [ 0.11875337]
 [-0.26554456]
 [ 0.3057109 ]
 [-0.00450251]
 [-0.03932662]
 [-0.89986444]
 [-0.87052065]]


# 07. 훈련 알고리즘에 데이터 주입

### 플레이스홀더 노드

In [45]:
A = tf.placeholder(tf.float32, shape=(None,3))
B = A + 5

with tf.Session() as sess : 
    B_val_1 = B.eval(feed_dict = {A : [[1,2,3]]})
    B_val_2 = B.eval(feed_dict = {A : [[4,5,6],[7,8,9]]})
    
print(B_val_1)     

[[6. 7. 8.]]


In [46]:
print(B_val_2)  

[[ 9. 10. 11.]
 [12. 13. 14.]]


### 미니배치경사하강법

In [49]:
n_epochs = 1000
learning_rate = 0.01

In [50]:
reset_graph()

X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")

In [51]:
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
training_op = optimizer.minimize(mse)

init = tf.global_variables_initializer()

In [52]:
n_epochs = 10

In [53]:
batch_size = 100
n_batches = int(np.ceil(m / batch_size))

In [54]:
def fetch_batch(epoch, batch_index, batch_size):
    np.random.seed(epoch * n_batches + batch_index)  # not shown in the book
    indices = np.random.randint(m, size=batch_size)  # not shown
    X_batch = scaled_housing_data_plus_bias[indices] # not shown
    y_batch = housing.target.reshape(-1, 1)[indices] # not shown
    return X_batch, y_batch

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        for batch_index in range(n_batches):
            X_batch, y_batch = fetch_batch(epoch, batch_index, batch_size)
            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})

    best_theta = theta.eval()

In [55]:
best_theta

array([[ 2.0703337 ],
       [ 0.8637145 ],
       [ 0.12255151],
       [-0.31211874],
       [ 0.38510373],
       [ 0.00434168],
       [-0.01232954],
       [-0.83376896],
       [-0.8030471 ]], dtype=float32)

# 08. 모델의 저장과 복원

In [56]:
reset_graph()

n_epochs = 1000                                                                       # 책에는 없습니다.
learning_rate = 0.01                                                                  # 책에는 없습니다.

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")            # 책에는 없습니다.
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")            # 책에는 없습니다.
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")                                      # 책에는 없습니다.
error = y_pred - y                                                                    # 책에는 없습니다.
mse = tf.reduce_mean(tf.square(error), name="mse")                                    # 책에는 없습니다.
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)            # 책에는 없습니다.
training_op = optimizer.minimize(mse)                                                 # 책에는 없습니다.

init = tf.global_variables_initializer()
saver = tf.train.Saver()

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("에포크", epoch, "MSE =", mse.eval())                                # 책에는 없습니다.
            save_path = saver.save(sess, "/tmp/my_model.ckpt")
        sess.run(training_op)
    
    best_theta = theta.eval()
    save_path = saver.save(sess, "/tmp/my_model_final.ckpt")

에포크 0 MSE = 9.161543
에포크 100 MSE = 0.7145006
에포크 200 MSE = 0.566705
에포크 300 MSE = 0.5555719
에포크 400 MSE = 0.5488112
에포크 500 MSE = 0.5436362
에포크 600 MSE = 0.5396294
에포크 700 MSE = 0.5365092
에포크 800 MSE = 0.5340678
에포크 900 MSE = 0.5321474


In [57]:
best_theta

array([[ 2.0685525 ],
       [ 0.8874027 ],
       [ 0.14401658],
       [-0.34770882],
       [ 0.36178368],
       [ 0.00393811],
       [-0.04269556],
       [-0.6614528 ],
       [-0.6375277 ]], dtype=float32)

In [58]:
with tf.Session() as sess:
    saver.restore(sess, "/tmp/my_model_final.ckpt")
    best_theta_restored = theta.eval() # 책에는 없습니다.

INFO:tensorflow:Restoring parameters from /tmp/my_model_final.ckpt


In [60]:
np.allclose(best_theta, best_theta_restored)

True

In [62]:
saver = tf.train.Saver({"weights": theta})

In [63]:
reset_graph()
# 빈 그래프로 시작합니다

saver = tf.train.import_meta_graph("/tmp/my_model_final.ckpt.meta")  # 그래프 구조를 로드합니다.
theta = tf.get_default_graph().get_tensor_by_name("theta:0") # 책에는 없습니다.

with tf.Session() as sess:
    saver.restore(sess, "/tmp/my_model_final.ckpt")  # 그래프 상태를 로드합니다.
    best_theta_restored = theta.eval() # 책에는 없습니다.

INFO:tensorflow:Restoring parameters from /tmp/my_model_final.ckpt


In [64]:
np.allclose(best_theta, best_theta_restored)

True

# 09. 텐서보드로 그래프와 학습 곡선 시각화하기

In [76]:
reset_graph()

from datetime import datetime

now = datetime.utcnow().strftime("%Y%m%d%H%M%S")
root_logdir = "tf_logs"
logdir = "{}/run-{}/".format(root_logdir, now)

In [77]:
n_epochs = 1000
learning_rate = 0.01

X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0, seed=42), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
training_op = optimizer.minimize(mse)

init = tf.global_variables_initializer()

In [78]:
mse_summary = tf.summary.scalar('MSE', mse)
file_writer = tf.summary.FileWriter(logdir, tf.get_default_graph())

In [79]:
n_epochs = 10
batch_size = 100
n_batches = int(np.ceil(m / batch_size))

In [80]:
with tf.Session() as sess:                                                        # 책에는 없습니다.
    sess.run(init)                                                                # 책에는 없습니다.

    for epoch in range(n_epochs):                                                 # 책에는 없습니다.
        for batch_index in range(n_batches):
            X_batch, y_batch = fetch_batch(epoch, batch_index, batch_size)
            if batch_index % 10 == 0:
                summary_str = mse_summary.eval(feed_dict={X: X_batch, y: y_batch})
                step = epoch * n_batches + batch_index
                file_writer.add_summary(summary_str, step)
            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})

    best_theta = theta.eval()                                                     # 책에는 없습니다.

In [81]:
file_writer.close()

In [82]:
best_theta

array([[ 2.0703337 ],
       [ 0.8637145 ],
       [ 0.12255151],
       [-0.31211874],
       [ 0.38510373],
       [ 0.00434168],
       [-0.01232954],
       [-0.83376896],
       [-0.8030471 ]], dtype=float32)