In [1]:
import os 
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

In [2]:
# 加载数据集
mnist = input_data.read_data_sets(os.path.join(os.getcwd(), 'MNIST_data'), one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /Users/zoe/Documents/GitHub/July-NLP/TF/DATAGURU/Lec 06/MNIST_data/train-images-idx3-ubyte.gz
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /Users/zoe/Documents/GitHub/July-NLP/TF/DATAGURU/Lec 06/MNIST_data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Extracting /Users/zoe/Documents/GitHub/July-NLP/TF/DATAGURU/Lec 06/MNIST_data/t10k-images-idx3-ubyte.gz
Extracting /Users/zoe/Documents/GitHub/July-NLP/TF/DATAGURU/Lec 06/MNIST_data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.


In [3]:
# 设置常用参数
# 每个批次大小
batch_size = 100
# 计算一共有多少个批次
n_batch = mnist.train.num_examples // batch_size

In [4]:
# 初始化权值
def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.1)  # 生成一个截断的正态分布
    return tf.Variable(initial)

In [5]:
# 初始化偏置
def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

In [6]:
# 卷积层 conv2d是一个二维的卷积操作。
def conv2d(x, W):
    # x input tensor of shape [batch, in_height, in_width, in_channels]
    # filter/kernel tensor of shape [filter_height, filter_width, in_channels, out_channels]
    # strides[0] = strides[3] =1  strides[1]表示x方向的步长，strides[2]表示y方向的步长
    # padding: A string from : "SAME", "VALID"
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')

Signature:   
**tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=True, data_format='NHWC', dilations=[1, 1, 1, 1], name=None)**

Docstring:
Computes a 2-D convolution given 4-D `input` and `filter` tensors.

In [7]:
# 池化层
def max_pool_2x2(x):
    # ksize [1, x, y , 1]
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')

Signature:     
tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None)

Docstring:
Performs the max pooling on the input.

参数是四个，和卷积很类似：


- 第一个参数value：
需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape。

- 第二个参数ksize： 
池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1。

- 第三个参数strides：
和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]。

- 第四个参数padding：
和卷积类似，可以取'VALID' 或者'SAME'。

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式。



In [8]:
# 定义两个placeholder
x = tf.placeholder(tf.float32, [None, 784]) # 28x28=784
y = tf.placeholder(tf.float32, [None, 10])

In [9]:
# 改变x的格式，转化为4D的向量[batch, in_height, in_width, in_channels]
x_image = tf.reshape(x, [-1, 28, 28, 1])

In [10]:
# 初始化第一个卷积层的权值和偏置
W_conv1 = weight_variable([5,5,1,32]) # 5x4的采样窗口，32个卷积核从1个平面中抽取特征。
b_conv1 = bias_variable([32]) # 每一个卷积核一个偏置值

In [11]:
# 把x_image和权值向量进行卷积，再加上偏置值，然后应用于relu激活函数
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)
除去name参数用以指定该操作的name，与方法有关的一共五个参数：

- 第一个参数input：
指需要做卷积的输入图像，它要求是一个Tensor，
具有[batch, in_height, in_width, in_channels]这样的shape，
具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]，
注意这是一个4维的Tensor，要求类型为float32和float64其中之一

- 第二个参数filter：
相当于CNN中的卷积核，它要求是一个Tensor，
具有[filter_height, filter_width, in_channels, out_channels]这样的shape，
具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，
要求类型与参数input相同，有一个地方需要注意，第三维in_channels，就是参数input的第四维

- 第三个参数strides：
卷积时在图像每一维的步长，这是一个一维的向量，长度4

- 第四个参数padding：
string类型的量，只能是"SAME","VALID"其中之一，这个值决定了不同的卷积方式。

- 第五个参数：use_cudnn_on_gpu:
bool类型，是否使用cudnn加速，默认为true

结果返回一个Tensor，这个输出，就是我们常说的feature map，shape仍然是[batch, height, width, channels]这种形式。

In [12]:
h_pool1 = max_pool_2x2(h_conv1) # 进行max-pooling

In [13]:
# 初始化第二个卷积层的权值和偏置
W_conv2 = weight_variable([5,5,32,64]) # 5x5的采样窗口，64个卷积核从32个平面抽取特征
b_conv2 = bias_variable([64]) # 每一个卷积核一个偏置值

# 将h_pool1和权值向量进行军啊即，再加上偏置值，然后应用于relu激活函数
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)


#### 28x28的图片第一次卷积后还是28x28，第一次池化后变成了14x14
#### 第二次卷积后是14x14，第二次池化变为了7x7
#### 经过上面操作后得到64张7x7的平面。

In [14]:
# 初始化第一个全连接层的权值
W_fc1 = weight_variable([7*7*64, 1024])    # 上一层有7x7x64个神经元，全连接层有1024个神经元
b_fc1 = bias_variable([1024]) # 1024个节点

In [15]:
# 把池化层2的输出flatten 展开为1维
h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])

In [16]:
# 求第一个全连接层的数据
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

In [17]:
# keep_prob用来表示神经元的输出概率
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

In [18]:
# 初始化第二个全连接层
W_fc2 = weight_variable([1024,10])
b_fc2 = bias_variable([10])

# 输出
prediction = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

In [19]:
# 交叉熵代价函数
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y, logits=prediction))

In [20]:
# 使用AdamOptimizer进行优化
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

In [21]:
# 结果存放在一个布尔型列表中
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(prediction,1))
# 准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

In [22]:
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_step, feed_dict={x: batch_xs, y: batch_ys, keep_prob: 0.7})
            
        acc = sess.run(accuracy, feed_dict={x: mnist.test.images, y: mnist.test.labels, keep_prob: 1.0})
        print('Iter' + str(epoch) + ', Testing Accuracy=' + str(acc))

Iter0, Testing Accuracy=0.8646
Iter1, Testing Accuracy=0.877
Iter2, Testing Accuracy=0.9749
Iter3, Testing Accuracy=0.9802
Iter4, Testing Accuracy=0.9812
Iter5, Testing Accuracy=0.9824
Iter6, Testing Accuracy=0.9866
Iter7, Testing Accuracy=0.9855
Iter8, Testing Accuracy=0.9873
Iter9, Testing Accuracy=0.9882
Iter10, Testing Accuracy=0.9885
Iter11, Testing Accuracy=0.989
Iter12, Testing Accuracy=0.9895
Iter13, Testing Accuracy=0.9902
Iter14, Testing Accuracy=0.9893
Iter15, Testing Accuracy=0.9895
Iter16, Testing Accuracy=0.9898
Iter17, Testing Accuracy=0.9907
Iter18, Testing Accuracy=0.9904
Iter19, Testing Accuracy=0.9907
Iter20, Testing Accuracy=0.9901
