# グラフの作成とセッション内での実行

In [2]:
import tensorflow as tf

x = tf.Variable(3, name='x')
y = tf.Variable(4, name='y')
f = x*x*y + y +2

In [4]:
sess = tf.Session()
sess.run(x.initializer)
sess.run(y.initializer)
result = sess.run(f)#feed_dict={x:5, y:6}でこのように指定することも可能
print(result)

42


In [5]:
sess.close()

withブロック内では、このセッションがデフォルトセッションに設定される。
x.initializer.run()呼び出しはtf.get_default_session().run(x.initializer)と同じであり、
f.eval()呼び出しはtf.get_default_session().run(f)と同じである。
これでコードが少し読みやすくなり、ブロックの最後でセッションは自動的に閉じられる

with tf.Session() as sess:
    x.initializer.run()
    y.initializer.run()
    result = f.eval()

また、一つ一つの変数について初期化子をマニュアルで実行しなくても、global_variables_initializer()関数を使う方法もある。
この関数は実際にすぐに初期化を行うのではなく、実行されたら全ての変数を初期化するようなノードをグラフ内に作るだけである。

In [6]:
init = tf.global_variables_initializer() #initノードを準備する
with tf.Session() as sess:
    init.run()#実際に全ての変数を初期化する
    result = f.eval()

Jupyterやpythonシェルでは、InteractiveSessionを作った方がいいかもしれない。
通常のSessionとの違いは、InteractiveSessionを作ると、自動的にそれがデフォルトセッションとなるので、withブロックが不要になる。
しかしマニュアルでセッションを閉じる必要がある。

In [7]:
sess = tf.InteractiveSession()
init.run()
result = f.eval()
print(result)

42


In [8]:
sess.close()

# グラフの管理

作成したノードは自動的にデフォルトグラフに追加される

In [7]:
x1 = tf.Variable(1)
x1.graph is tf.get_default_graph()

True

複数の独立したグラフを管理したい時、新しいGraphを作り、withブロックでそれを一時的にデフォルトグラフにする。

In [9]:
graph = tf.Graph()
with graph.as_default():
    x2 = tf.Variable(2)
x2.graph is graph

True

In [10]:
x2.graph is tf.get_default_graph()

False

Jupyterでは実験している間に同じコマンドをなんども実行するのが普通であるので、デフォルトグラフにノードがたくさん重複してしまう。
カーネルを再起動すれば解決できるが、tf.reset_default_graph()を実行してリセットするのが簡単である。

In [11]:
tf.reset_default_graph()

In [12]:
w = tf.constant(3)
x = w + 2
y = x + 5
z = x * 3

In [13]:
with tf.Session() as sess:
    print(y.eval())
    print(z.eval())

10
15


全てのノードの値は、グラフを実行するたびに捨てられる。
つまりyを評価する時にxとwを
zを評価する時にxとwを評価するように二度評価している。

In [14]:
with tf.Session() as sess:
    y_val, z_val = sess.run([y, z])
    print(y_val) # 10
    print(z_val) # 15

10
15


# TensorFlowによる線形回帰

In [27]:
import numpy as np
from sklearn.datasets import fetch_california_housing

housing = fetch_california_housing()
m, n = housing.data.shape
housing_data_plus_bias = np.c_[np.ones((m, 1)), housing.data] #1列目に1をm行 + housing.data
#np.c_は配列を結合
X = tf.constant(housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1,1), dtype=tf.float32, name = "y")#列ベクトルにreshape(-1,1) -1は未指定
XT = tf.transpose(X)
theta = tf.matmul(tf.matmul(tf.matrix_inverse(tf.matmul(XT, X)), XT), y)
#housing.target
#housing_data_plus_bias
#そもそもyのターゲットが何を表しているかがわからないので要確認

In [28]:
with tf.Session() as sess:
    theta_value = theta.eval()
    print(theta_value)
#この値は式がtargetになるような各変数の適切な値を示している

[[-3.7185181e+01]
 [ 4.3633747e-01]
 [ 9.3952334e-03]
 [-1.0711310e-01]
 [ 6.4479220e-01]
 [-4.0338000e-06]
 [-3.7813708e-03]
 [-4.2348403e-01]
 [-4.3721911e-01]]


# 勾配降下法の実装
勾配降下法を使う時には、まず入力特徴量ベクトルを正規化することが大切だということを忘れないようにしよう。
TensorFlow,NumPy, scikit-learnのStandardScalerその他好みで使う

### それぞれの関数の説明
random_uniform()はNumPyのrand()と同じように、与えられた形状と値の範囲に基づいて無作為値を格納するテンソルを生成する。

assign()は変数に新しい値を代入するノードを作る。この場合は、バッチ勾配降下法のステップ
$$
\theta^{next step} = \theta - \eta\nabla MSE(\theta)
$$
を実装している

In [31]:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaled_housing_data = scaler.fit_transform(housing.data)
scaled_housing_data_plus_bias = np.c_[np.ones((m, 1)), scaled_housing_data]

### マニュアルでの勾配計算

In [64]:
tf.reset_default_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name = "mse")#平均絶対誤差？二条誤差な気がする
gradients = 2/m * tf.matmul(tf.transpose(X), error)
training_op = tf.assign(theta, theta - learning_rate * gradients)#thetaにtheta- learning_rate * gradientsを入れる learning_rateはε

init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    
    for epoch in range(1,n_epochs+1):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
    

Epoch 100 MSE = 0.8805999
Epoch 200 MSE = 0.6533796
Epoch 300 MSE = 0.6168516
Epoch 400 MSE = 0.59244907
Epoch 500 MSE = 0.57465094
Epoch 600 MSE = 0.5616155
Epoch 700 MSE = 0.552048
Epoch 800 MSE = 0.54500866
Epoch 900 MSE = 0.5398164
Epoch 1000 MSE = 0.5359755


In [65]:
best_theta

array([[ 2.0685523 ],
       [ 0.8439831 ],
       [ 0.15675251],
       [-0.22662628],
       [ 0.24448644],
       [ 0.00913461],
       [-0.04284709],
       [-0.60938144],
       [-0.57851386]], dtype=float32)

### 自動微分を使った方法

この下の関数偏微分して勾配求めるの大変だよねという例

In [53]:
def my_func(a, b):
    z = 0
    for i in range(100):
        z = a * np.cos(z + i) + z * np.sin(b - i )
    return z

gradients()は入力としてオペレーション(ここではmse)と変数リスト(この場合はtheta)を与えられると、ops(変数ごとに一つずつ)のリストを作り、ここの変数に対応する勾配を計算する。
つまりgradientsノードは、thetaについてMSEの勾配ベクトルを計算することになる

In [60]:
tf.reset_default_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name = "mse")#平均絶対誤差？二条誤差な気がする

gradients = tf.gradients(mse, [theta])[0]

training_op = tf.assign(theta, theta - learning_rate * gradients)#thetaにtheta- learning_rate * gradientsを入れる learning_rateはε

init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    
    for epoch in range(1,n_epochs+1):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()

Epoch 100 MSE = 0.79361415
Epoch 200 MSE = 0.6641973
Epoch 300 MSE = 0.62399554
Epoch 400 MSE = 0.5962904
Epoch 500 MSE = 0.57633835
Epoch 600 MSE = 0.5619313
Epoch 700 MSE = 0.5515252
Epoch 800 MSE = 0.5440061
Epoch 900 MSE = 0.53857213
Epoch 1000 MSE = 0.53464353


### オプティマイザを使う

In [68]:
tf.reset_default_graph()

n_epochs = 1000
learning_rate = 0.01



X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name = "mse")#平均絶対誤差？二条誤差な気がする


optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
# optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate, momentum=0.9)
training_op = optimizer.minimize(mse)


init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    
    for epoch in range(1,n_epochs+1):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()

Epoch 100 MSE = 0.7197253
Epoch 200 MSE = 0.55939525
Epoch 300 MSE = 0.5447405
Epoch 400 MSE = 0.53930706
Epoch 500 MSE = 0.53562206
Epoch 600 MSE = 0.5329009
Epoch 700 MSE = 0.53086853
Epoch 800 MSE = 0.5293428
Epoch 900 MSE = 0.5281918
Epoch 1000 MSE = 0.52732044


### プレースホルダーを使う

In [69]:
A = tf.placeholder(tf.float32, shape = (None, 3))
B = A + 5
with tf.Session() as sess:
    B_val_1 = B.eval(feed_dict = {A: [[1, 2, 3]]})
    B_val_2 = B.eval(feed_dict = {A:[[4, 5, 6], [7, 8, 9]]})

In [71]:
print(B_val_1)

[[6. 7. 8.]]


In [72]:
print(B_val_2)

[[ 9. 10. 11.]
 [12. 13. 14.]]


In [83]:
tf.reset_default_graph()
sess.close()

n_epochs = 1000
learning_rate = 0.01

X = tf.placeholder(tf.float32, shape=(None, n+1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")

theta = tf.Variable(tf.random_uniform([n+1, 1], -1.0, 1.0), name="theta")
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name = "mse")#平均絶対誤差？二条誤差な気がする


optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
# optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate, momentum=0.9)
training_op = optimizer.minimize(mse)

init = tf.global_variables_initializer()

batch_size=100
n_batches=int(np.ceil(m/batch_size)) #バッチの数

def fetch_batch(epoch, batch_index, batch_size):
    np.random.seed(epoch * n_batches + batch_index) 
    indices = np.random.randint(m, size=batch_size)
    X_batch = scaled_housing_data_plus_bias[indices] 
    y_batch = housing.target.reshape(-1, 1)[indices]
    return X_batch, y_batch

with tf.Session() as sess:
    sess.run(init)
    
    for epoch in range(n_epochs):
        if epoch %100 == 0:
            print("Epoch", epoch)
        for batch_index in range(n_batches):
            X_batch, y_batch = fetch_batch(epoch, batch_index, batch_size)
            sess.run(training_op, feed_dict={X:X_batch, y:y_batch})
            
    best_theta = theta.eval()

Epoch 0
Epoch 100
Epoch 200
Epoch 300
Epoch 400
Epoch 500
Epoch 600
Epoch 700
Epoch 800
Epoch 900


In [84]:
print(best_theta)

[[ 2.0714476 ]
 [ 0.8462012 ]
 [ 0.11558535]
 [-0.26835832]
 [ 0.32982782]
 [ 0.00608358]
 [ 0.07052915]
 [-0.87988573]
 [-0.8634251 ]]


### モデルの保存と復元
実行フェーズでモデルを保存したい時にセッションとチェックポイントファイルのパスを渡してノードのsave()メソッドを呼び出すだけである。

In [97]:
tf.reset_default_graph()

n_epochs = 1000
learning_rate = 0.01

X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y") 

theta = tf.Variable(tf.random_uniform([n+1, 1] , -1.0, 1.0), name="theta")

y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
training_op = optimizer.minimize(mse) 

init = tf.global_variables_initializer()
saver = tf.train.Saver({"theta": theta})

with tf.Session() as sess:
    sess.run(init)
    
    for epoch in range(n_epochs):
        if epoch % 100 ==0:
            print("Epoch", epoch, "MSE =", mse.eval())
            save_path = saver.save(sess, "./tmp/my_model.ckpt")
            
        sess.run(training_op)
        
    best_theta = theta.eval()
    save_path = saver.save(sess, "./tmp/my_model_final.ckpt")

Epoch 0 MSE = 7.331847
Epoch 100 MSE = 0.94874805
Epoch 200 MSE = 0.7409974
Epoch 300 MSE = 0.6823726
Epoch 400 MSE = 0.6440384
Epoch 500 MSE = 0.6157159
Epoch 600 MSE = 0.5944649
Epoch 700 MSE = 0.57843405
Epoch 800 MSE = 0.56628406
Epoch 900 MSE = 0.55703163


In [99]:
with tf.Session() as sess:
    saver.restore(sess, "./tmp/my_model_final.ckpt")
    best_theta_restored = theta.eval()

INFO:tensorflow:Restoring parameters from ./tmp/my_model_final.ckpt


weightsという名前のもとにtheta変数だけを保存、復元する
デフォルトではsave()はグラフの構造を同じ名前に.meta拡張しを加えたファイルに保存する。そのグラフ構造はtf.train.import_meta_graph()を使って読み込むことができる。そのグラフはデフォルトグラフに追加され、グラフの状態の復元に使えるSaverインスタンスが返される。

In [101]:
saver = tf.train.Saver({"weight": theta})

In [None]:
tf.reset_default_graph()

saver = tf.train.import_meta_graph("./tmp/my_model_final.ckpt.meta")
theta = tf.get_default_graph().get_tensor_by_name("theta:0")


with tf.Session() as sess:
    saver.restore(sess, "./tmp/my_model_final.ckpt")
    