In [21]:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import tensorflow as tf
#数値計算ライブラリー
import numpy as np
import matplotlib.pyplot as plt

In [22]:
#xに相当する変数を定義する。トレーニングセットのデータを保存する
x = tf.placeholder(tf.float32, [None, 5])

In [23]:
#tf.zeros([5, 1])は、変数の初期値を与えており、これは、すべての要素が0の5×1行列になる。
w = tf.Variable(tf.zeros([5, 1]))

In [4]:
#行列の掛け算を行う関数、この時点ではxには値は入っていない。
y = tf.matmul(x, w)

In [5]:
#データ数の部分は任意に取れるように[None1]というサイズ指定を行う
t = tf.placeholder(tf.float32, [None, 1])

In [6]:
#これを用いて，誤差関数の式は次のようになる
loss = tf.reduce_sum(tf.square(y-t))

In [7]:
#二乗誤差Eを最小にパラメーターのを決定するという処理へと進む。Tensorflowは勾配降下方によるパラメータ最適化のアルゴリズムを内蔵している。ここでは、最適化に使用するアルゴリズム（トレーニングアルゴリズム）を選択している。
train_step = tf.train.AdamOptimizer().minimize(loss)

In [8]:
#↑ベクトルの反対方向にパラメータを修正するという、学習率に相当するパラメータを自動的に調整する仕組みを持っている

In [9]:
#トレーニングアルゴリズムの実行環境となる「セッション」を用意して,この中でパラメーター、すなわち、Variableに相当する変数の値を計算をしていく。
sess = tf.Session()
#新しいセッションを用意して↑、Variableを初期化する処理を行う。
sess.run(tf.initialize_all_variables())

In [11]:
#Pythonのリストに対して、数値計算処理に便利な機能を追加したラッパーである
#train_tは、実際に観測された気温のデータ（12個のデータを一次元リストとして用意）
train_t = np.array([5.2, 5.7, 8.6, 14.9, 18.2, 20.4,
                   25.5, 26.4, 22.8, 17.5, 11.1, 6.6])
#reshapeで12×1行列に変換
train_t = train_t.reshape([12,1])

#要素0が入っている12×5行列
train_x = np.zeros([12, 5])
for row, month in enumerate(range(1, 13)):
    for col, n in enumerate(range(0, 5)):
        train_x[row][col] = month**n

In [12]:
#勾配降下法によるパラメータの最適化を実施する。定義した、トレーニングアルゴリズムを用いて、相当する修正を100000回繰り返す。10000回実施するごとに、その時点での誤差関数の値を計算して表示している
i = 0
for _ in range(100000):
    i += 1
    #セッション内でトレーニングアルゴリズムtrain_stepを実行することで，Variableに当たる変数(今の場合はw）の値を修正している。この時、feed_dictオプションでplaceholderに具体的な値をセットしている。
    #Placeholderを定義した変数をキーとするディクショナリーで値を指定する。
    sess.run(train_step, feed_dict={x:train_x, t:train_t})
    if i % 10000 == 0:
        #セッション内で計算値lossを評価しており、これは、その時点の値を取り出す効果がある。つまり、セッション内における、その時点でのVariablesの値を用いて計算した結果を返す。Placeholderには、feed_dictオプションで指定された値が入る。
        loss_val = sess.run(loss, feed_dict={x:train_x, t:train_t})
        print ('Step: %d, Loss: %f' % (i, loss_val))
#この実行結果を見ると、パラメーターの修正を繰り返すことで、誤差関数の値が減少していくことが分かる。

Step: 10000, Loss: 31.012341
Step: 20000, Loss: 29.450821
Step: 30000, Loss: 28.034981
Step: 40000, Loss: 26.853539
Step: 50000, Loss: 25.776312
Step: 60000, Loss: 24.763887
Step: 70000, Loss: 23.833887
Step: 80000, Loss: 23.012321
Step: 90000, Loss: 31.459843
Step: 100000, Loss: 21.431906


In [13]:
for _ in range(100000):
    i += 1
    sess.run(train_step, feed_dict={x:train_x, t:train_t})
    if i % 10000 == 0:
        loss_val = sess.run(loss, feed_dict={x:train_x, t:train_t})
        print ('Step: %d, Loss: %f' % (i, loss_val))

Step: 110000, Loss: 20.748278
Step: 120000, Loss: 20.200783
Step: 130000, Loss: 19.524529
Step: 140000, Loss: 35.969006
Step: 150000, Loss: 18.509336
Step: 160000, Loss: 18.014692
Step: 170000, Loss: 17.631437
Step: 180000, Loss: 17.175123
Step: 190000, Loss: 16.803270
Step: 200000, Loss: 16.465893


In [18]:
#セッション内でVariableのwを評価することで、セッション内に保持されている値を取り出している
#Placeholderの値はVariableの値に影響しないので、ここでは、feed_dictオプションの指定は不要である。
w_val = sess.run(w)
#NumPyのarrayオブジェクトとして取り出されており、Print文で表示すると、行列形式に整形されて表示される。
print w_val

[[ 6.1079483 ]
 [-4.0438776 ]
 [ 2.51106262]
 [-0.28175303]
 [ 0.00834802]]


In [19]:
#続いて、この計算を用いて、予測気温を計算する関数を用意する。
def predict(x):
    result = 0.0
    for n in range(0, 5):
        result += w_val[n][0] * x**n
    return result

In [25]:
#図形領域を示すオブジェクトの取得
fig = plt.figure()
#その中にグラフを描く領域を用意している。
subplot = fig.add_subplot(1,1,1)
#x軸の表示範囲の設定
subplot.set_xlim(1,12)
#トレーニングセットのデータ、すなわち、実際に観測された月々の平均気温を散布図にプロットしている。
subplot.scatter(range(1,13), train_t)
#1～12の範囲を等間隔に分けた100個の値のリストを返す。
linex = np.linspace(1,12,100)
#このリストを関数に代入することで、それぞれに対応する関数値のリストを取得
liney = predict(linex)
#得られた結果を折れ線グラフに表示する。
subplot.plot(linex,liney)
plt.show()

  if self._edgecolors == 'face':
