# TensorFlow最初の一歩

# TensorFlowで線形回帰モデル

### 参考資料

- [Getting Started With TensorFlow](https://www.tensorflow.org/get_started/get_started)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

## TensorFlowのAPI

TensorFlowにはレベルに応じた複数のAPIが存在

- 低レベルAPI
  - 自分でモデルを改良したい人向け
  - TensorFlow Core　←　**今回はこっち**
- 高レベルAPI
  - 既存のモデルを素早く試したい人向け
  - tf.contrib.learn
  - tf.contrib.slim
  - tf.contrib.keras (it's coming)
    - [tf-keras](https://github.com/fchollet/keras/tree/tf-keras)  on the Keras side
    - [tf.contrib.keras](https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/keras) on the TensorFlow side
    - [F. Cholletさんによるツイッター上でのコメント](https://twitter.com/fchollet/status/820746845068505088)



contribとついているのはまだ開発中ということ

## テンソル

- テンソル（tensor）がTensorFlowで扱うデータ形式の基本
- テンソルのランク（rank）＝テンソルの次元

```
3 # ランク 0 のテンソル。 シェイプが [] のスカラ
[1. ,2., 3.] # ランク1のテンソル。シェイプが [3] のベクトル
[[1., 2., 3.], [4., 5., 6.]] # ランク2のテンソル。シェイプが [2, 3] の行列
[[[1., 2., 3.]], [[7., 8., 9.]]] # ランク3でシェイプが[2, 3]のテンソル
```

## TensorFlowのインポート

## 計算グラフ

計算グラフの裏にある思想
- 重い計算は全てPythonの外側でやる

Pythonの仕事
  - 計算グラフを作ること
  - どの部分の計算グラフを実行するか決めること

２つのステップ

- ステップ１：計算グラフの構築
- ステップ２：計算グラフの実行

計算グラフとは？

- 計算グラフとは計算の手順を表した「ノード」のあつまり

ノード

- ノードは0以上のテンソルを入力として受け取り、1つのテンソルを出力する。
- 例： constantノード
- ノードを評価して値を得るためには、セッション中で計算グラフを実行しなくてはいけない

## 計算グラフの構築

テンソルノード（`tf.Tensor`）に演算（Operation）を適用することで、より複雑な計算グラフを構築していく

In [None]:
# 定数ノードを作成（node1とnode2）
<--- FILL_IN --->

# 2つの定数ノードを足し合わせて、新しいノード（node3）を作成
<--- FILL_IN --->

print(node1)
print(node2)
print(node3)

## 計算グラフの実行

- sess = tf.Session()
- sess = tf.InteractiveSession()
- `sess.run(t)` と `t.eval()` はほぼ同じ。
- `sess.run()`の場合は、`t.eval()`と違い、`sess.run([a, b, c])`とできる

## TensorFlowのセッション: tf.Session()

- TensorFlowはC++のバックエンドに繋いでから計算する。
- このバックエンドとのコネクションはセッションと呼ばれる。
- 通常は計算グラフを構築した後、セッション内で実行。

In [None]:
# withを抜けるとセッションは自動的に閉じられる。
<--- FILL_IN --->
    
    print(sess)
    print('----')
    
    print(<--- FILL_IN --->)
    print(<--- FILL_IN --->)
    print('----')    
    
    print(sess.run([node1, node2, node3]))

In [None]:
# withを抜けるとセッションが閉じられれているので以下のコードはエラーになる
#sess.run(node1)  # エラー
#node1.eval()  # エラー

## TensorFlowのインタラクティブセッション:  tf.InteractiveSession()

- インタラクティブなセッションというのも可能
- IPythonやJupyter NotebookでTensorFlowを使う場合に便利
- `sess.close()` で明示的に閉じる必要あり

In [None]:
sess = <--- FILL_IN --->
print(sess)

In [None]:
sess.run(node3)

In [None]:
node3.eval()

In [None]:
# セッションを閉じる
<--- FILL_IN --->

In [None]:
#sess.run(node3)

In [None]:
sess = tf.InteractiveSession()

In [None]:
print(sess)
print('----')

print(sess.run(node1))
print(node1.eval())
print('----')

print(sess.run(node2))
print(node2.eval())
print('----')

print(sess.run(node3))
print(node3.eval())
print('----')

print(sess.run([node1, node2, node3]))

feed_dictで評価時にテンソルの値を変更。placeholder以外でもテンソルなら何でも変更できる。

In [None]:
print(sess.run([node1, node2, node3]))
print(sess.run([node1, node2, node3], feed_dict={node1:10.0}))

## 計算グラフの可視化

## 方法１：計算グラフをテキストで可視化

- `tf.get_default_graph().as_graph_def()`

## 方法２: TensorBoard

In [None]:
writer = <--- FILL_IN --->  # イベントファイルを保存
writer.close()

ターミナルに以下のコードを打って、tensorboardを立ち上げる。

```
tensorboard --logdir="./graphs01" --port 6006
```

ウエブブラウザで以下のアドレスに行き、tensorboardを見る。

```
localhost:6006
```

## 外部入力（`tf.placeholder`）

```
tf.placeholder(dtype, shape=None, name=None)
```

- このままだと同じ出力しか出てこないので面白くない...
- 外部入力ほしい！
- そんなときの placeholder (`tf.placeholder`)
- placeholderで計算グラフに外部入力をつける（後でここに値入れますよと約束する）

#### やってみよう
a, bという２つの外部入力から得られた値を足し合わせる計算グラフを構築せよ。

ヒント: `tf.placeholder`, `tf.add`

In [None]:
a = <--- FILL_IN --->
b = <--- FILL_IN --->

In [None]:
adder_node = tf.add(a, b)  # a + b は tf.add(a, b) のショートカット

- sess.run()の第二引数（`feed_dict`）を使い、計算グラフの外部入力（placeholder）に値を入れる。
- feed_dictの中のキー`a` と`b`はテンソル
- `shape=None`の問題
  - 簡単だが、後々デバッグが大変になる
  - 子ノードのshapeの自動推定ができなくなる
- placeholderはops  

In [None]:
# aに3.0, bに4.5という値を入れて評価
print(sess.run(<--- FILL_IN --->))

In [None]:
# aに[1, 3], bに[2, 4]というベクトルを入れて評価
print(sess.run(<--- FILL_IN --->))

In [None]:
writer = <--- FILL_IN --->  # イベントファイルを保存
writer.close()

計算グラフに徐々に処理を追加していける。

In [None]:
# adder_nodeを三倍する処理を計算ノードに追加
add_and_triple = <--- FILL_IN --->.
print(sess.run(add_and_triple, {a: 3, b: 4.5})) # feed_dictは省略できる

In [None]:
writer = tf.summary.FileWriter('./graphs01', sess.graph)  # イベントファイルを保存
writer.close()

## 変数（`tf.Variable`）

- パラメータ
- データ型と初期値を与えて初期化    `tf.Variable([.3], tf.float32)`

y = 0.3 x - 0.3

In [None]:
# 線形モデルの計算グラフを構築
W = <--- FILL_IN --->  # パラメータ
b = <--- FILL_IN --->  # パラメータ
x = <--- FILL_IN --->  # 外部入力
linear_model = <--- FILL_IN --->  # 線形モデル

In [None]:
writer = tf.summary.FileWriter('./graphs01', sess.graph)  # イベントファイルを保存
writer.close()

## 初期化

- `tf.constant`は呼んだときに初期化され、値は変化しない。
- `tf.Variable`を初期化するには、以下のようにする必要あり。

In [None]:
# 変数の初期化
init = <--- FILL_IN --->  # 変数を初期化する処理を計算グラフに追加
sess.run(init) # 初期化を実行

## 複数の値に対して実行

In [None]:
sess.run(linear_model, {x:[1,2,3,4]})

## 出力の評価

- モデルの出力を評価するためには正しい出力が必要
- 正しい出力を入れるところ（外部入力）が必要

In [None]:
y = tf.placeholder(tf.float32)  # 正しい出力を入れるところ

In [None]:
squared_deltas = <--- FILL_IN --->  ## 各要素を二乗

In [None]:
loss = <--- FILL_IN --->  ## ベクトル要素を足し合わせ、二乗誤差を作成

In [None]:
sess.run(loss, {x: [1, 2, 3, 4], y: [0, -1, -2, -3]})

In [None]:
writer = tf.summary.FileWriter('./graphs01', sess.graph)  # イベントファイルを保存
writer.close()

## 手動でパラメータの値を設定

<!-- [-1, 1] -->

In [None]:
# 手動で値を設定（tf.assign）
fixW = tf.assign( <--- FILL_IN ---> )
fixb = tf.assign( <--- FILL_IN ---> )

In [None]:
sess.run([W, b])

In [None]:
sess.run([fixW, fixb])

In [None]:
sess.run([W, b])

In [None]:
# エラーの値を表示
sess.run(<--- FILL_IN --->, {x: [1, 2, 3, 4], y: [0, -1, -2, -3]})

In [None]:
writer = tf.summary.FileWriter('./graphs01', sess.graph)  # イベントファイルを保存
writer.close()

## 自動でパラメータの値を調整（tf.train API）

- TensorFlow自体が最適化手法（損失関数を減らすように少しずつパラメータを変化させる方法）のAPIを提供
- 勾配法が一番シンプル
- 損失関数のパラメータに対する勾配は`tf.gradients`で得られる

In [None]:
# 最適化手法を選定
optimizer =  <--- FILL_IN ---> 

In [None]:
# 最適化する損失関数を登録
train =  <--- FILL_IN ---> 

In [None]:
all_loss = []
all_W = []
all_b = []

sess.run(init)

curr_loss, curr_W, curr_b = sess.run([loss, W, b], 
                                     feed_dict={x: [1, 2, 3, 4], y: [0, -1, -2, -3]})

all_loss.append(curr_loss)
all_W.append(curr_W)
all_b.append(curr_b)

for i in range(500):
    
    _, curr_loss , curr_W, curr_b= sess.run([ <--- FILL_IN --->], 
                            feed_dict={x: [1, 2, 3, 4], y: [0, -1, -2, -3]})

    all_loss.append(curr_loss)
    all_W.append(curr_W)
    all_b.append(curr_b)

In [None]:
writer = tf.summary.FileWriter('./graphs01', sess.graph)  # イベントファイルを保存
writer.close()

In [None]:
fig, ax = plt.subplots(2,1,figsize=(10, 10))

ax[0].plot(all_loss)
ax[0].set_ylabel('Loss')


ax[1].plot(all_W, label='W')
ax[1].plot(all_b, label='b')
ax[1].set_ylabel('Parameter values')
ax[1].legend()