# [MNIST For ML Beginners](https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners)

## [The MNIST Data](https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html#the-mnist-data)

In [1]:
# MNISTはexamplesにあって、ダウンロードもメソッド一発
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Extracting MNIST_data/train-images-idx3-ubyte.gz
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz


In [4]:
# mnist datasetにはtrain, validation, testの３つのデータが入っている
# それぞれDataSetというクラス(mnist自体はDatasetsというクラス)
mnist

Datasets(train=<tensorflow.contrib.learn.python.learn.datasets.mnist.DataSet object at 0x11202a0b8>, validation=<tensorflow.contrib.learn.python.learn.datasets.mnist.DataSet object at 0x10b6f0320>, test=<tensorflow.contrib.learn.python.learn.datasets.mnist.DataSet object at 0x10b6f3908>)

In [12]:
# イメージ数は
# (ndarrayの次元はshapeメソッドを使う)
# train: 55000 images
# validation: 5000 images
# validation: 10000 images

# イメージはそれぞれ size 784 のarray. 28 x 28 pixelの画像
print(mnist.train.images.shape)
print(mnist.validation.images.shape)
print(mnist.test.images.shape)

(55000, 784)
(5000, 784)
(10000, 784)


In [19]:
# それぞれのイメージがどの数字を表しているかはlabelsに入っている
# 0~9のどこかに1が入っている
print(mnist.train.labels.shape)
print(mnist.validation.labels.shape)
print(mnist.test.labels.shape)

(55000, 10)
(5000, 10)
(10000, 10)


# [Implementing the Regression](https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html#implementing-the-regression)

In [16]:
# 回帰用の計算グラフの定義
import tensorflow as tf

# 入力層
# placeholderとして定義されている
# float型で、n行 784列の行列のplaceholderとして定義
# (最初の次元のNoneは任意の次元を表す)
x = tf.placeholder(tf.float32, [None, 784])

# 入力層と出力層を繋ぐ重みとbias
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

# 出力層
y = tf.nn.softmax(tf.matmul(x, W) + b)

# [Training](https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html#training)

In [21]:
# 学習時に利用する教師データのラベル用のplaceholder
y_ = tf.placeholder(tf.float32, [None, 10])

# 学習時のcost(loss)
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1]))

In [22]:
# cross_entropyという計算グラフを
# Gradient Descentを使って学習を1ステップ行う計算グラフ
#   学習ステップを実行するとVariablesが変化する
# パラメータである 0.5 は学習率(learning rate)
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

In [25]:
# 実際に学習させてみる
# 変数を初期化して、train_stepという計算を1000回行ってみる
init = tf.initialize_all_variables()
sess = tf.Session()
sess.run(init)
for i in range(1000):
  batch_xs, batch_ys = mnist.train.next_batch(100)
  sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

# [Evaluating Our Model](https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html#evaluating-our-model)

In [27]:
# y(予測値) と y_(正答)を比較して、同じだったらTrueになるような計算グラフを作る
# (argmaxは値が最大になるような添字を返す)
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))

# 真理値をflaotにcastして、平均値(0, 1ベクトルの平均なので正答率)を出す計算グラフ
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 正答率は約92%のはず
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))

0.9159
