In [None]:
import numpy as np
import tensorflow as tf;
import matplotlib.pylab as plt;

import tensorflow.examples.tutorials.mnist.input_data as input_data 

# 载入数据
mnist = input_data.read_data_sets("MNIST_data",one_hot = True)


# 每个批次的大小
batch_size = 100;
# 计算一共有多少批次
n_batch = mnist.train.num_examples // batch_size;


# 初始化权值
def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev=0.1)
    return tf.Variable(initial)


# 初始化偏置值
def bias_variable(shape):
    initial = tf.constant(0.1,shape=shape)
    return tf.Variable(initial)


# 卷积层定义
def conv2d(x,W):
    #x  input也就是这里的x是一个4d输入[batch_size, in_height, in_width, n_channels]，表示图片的批数，大小和通道。
    
    #W filter是一个4d输入[filter_height, filter_width, in_channels, out_channels]，
    #表示kernel的大小，输入通道数和输出通道数，其中输出通道数表示从上一层提取多少特征。
    
    #strides是一个1d输入，长度为4，其中stride[0]和stride[3]必须为1，一般格式为[1, stride[1], stride[2], 1]，
    #strides[1]代表x方向的步长  strides[2]代表y方向的步长
    #在大部分情况下，因为在height和width上的步进设为一样，因此通常为[1, stride, stride, 1]。 
    #计算公式为： 
    #output[b,i,j,k]=∑di,dj,qinput[b,strides[1]∗i+di,strides[2]∗j+dj,q]∗filter[di,dj,q,k]
    #其中b为batch_id, i,j分别是图片的像素索引, k是输出通道的索引，q是输入通道的索引，
    #从公式可以看出，conv2d是将一个图片的所有输入通道卷积合成一个输出通道的，这个和tf.nn.depthwise_conv2d有所不同。
    
    #padding是一个字符串输入，分为SAME和VALID分别表示是否需要填充，
    #因为卷积完之后因为周围的像素没有卷积到，因此一般是会出现卷积完的输出尺寸小于输入的现象的
    
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding="SAME")
    
# 池化层
def max_pool_2x2(x):
    #第一个参数value：需要池化的输入，一般池化层接在卷积层后面，
    #所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

    #第二个参数ksize：池化窗口的大小，取一个四维向量，
    #一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

    #第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

    #第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding="SAME")
    
#定义两个placeholder
x = tf.placeholder(tf.float32,[None,784]) #28*28
y = tf.placeholder(tf.float32,[None,10])

# 改变x的格式转换为4D的向量[betch,in_height,in_width,in_channels] 
# betch标示批次   in_height图片的高 in_width标示图片的宽  in_channels标示图片是否是彩色
x_image = tf.reshape(x,[-1,28,28,1])


# 初始化第一个卷积神经网络的权值和偏置值
W_conv1 = weight_variable([5,5,1,32]) #5*5的采样窗口，32个卷积核从1个平面中采样抽取特征，抽取出32个特征平面
b_conv1 = bias_variable([32]) #每一个卷积核一个偏置值

#把x_image和权值向量进行卷积操作，在加上偏置值，然后应用于relu激活函数
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1) #进行max-pooling

# 初始化第二个卷积神经网络的权值和偏置值
W_conv2 = weight_variable([5,5,32,64]) #5*5的采样窗口，64个卷积核从32个平面中采样抽取特征，抽取出64个特征平面
b_conv2 = bias_variable([64]) #每一个卷积核一个偏置值

#把h_pool1和权值向量进行卷积操作，在加上偏置值，然后应用于relu激活函数
h_conv2 = tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)
h_pool2 = max_pool_2x2(h_conv2) #进行max-pooling


#28*2的图片第一次卷积后还是28*28，第一次池化后变为
#第二次卷积后为14*14，第二次池化后变为7*7
#经过上面操作后得到64张7*7的平面

# 初始化一个全连接的权值
W_fcl = weight_variable([7*7*64,1024]) #池化之后变成一个 7*7的的图片 同时有64个神经元，同时设置全连接为1024个神经元
b_fcl = bias_variable([1024])#神经元相同的偏置值

# 把池化层2的输出扁平化为一个一维数据
h_pool2_flat = tf.reshape(h_pool2,[-1,7*7*64])
#求第一个全连接的输出
h_fcl = tf.nn.relu(tf.matmul(h_pool2_flat,W_fcl) + b_fcl)

##keep_prob用来表示神经元的输出概率
keep_prob = tf.placeholder(tf.float32)
h_fcl_drop = tf.nn.dropout(h_fcl,keep_prob)


# 初始化二个全连接的权值
W_fcl2 = weight_variable([1024,10]) 
b_fcl2 = bias_variable([10])
logits = tf.matmul(h_fcl_drop,W_fcl2)+b_fcl2
perdiction = tf.nn.sigmoid(logits)
# perdiction = tf.nn.softmax(logits)


 # 交叉熵优化
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y,logits = logits))

train_setp = tf.train.AdadeltaOptimizer(learning_rate=1).minimize(loss)
# train_setp = tf.train.AdamOptimizer(learning_rate=1e-4).minimize(loss)


init = tf.global_variables_initializer()

# 将返回最大的值放在一个一维张量中
correct_prediction = tf.equal(tf.argmax(perdiction,1),tf.argmax(y,1))
# 测试准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_setp, feed_dict={x:batch_xs,y:batch_ys,keep_prob:0.7})
            
            
        test_acc =  sess.run(accuracy, feed_dict={x:mnist.test.images,y:mnist.test.labels,keep_prob:1.0})
        
        train_acc = sess.run(accuracy, feed_dict={x:mnist.train.images,y:mnist.train.labels,keep_prob:1.0})
        
        print("Iter" + str(epoch) + ",Testing Acc"+ str(test_acc) + " Train acc:"+str(train_acc))
#         print("Iter" + str(epoch) + ",Testing Acc"+ str(test_acc) )





W0902 16:22:34.590052 16908 deprecation.py:323] From <ipython-input-1-f81763fac284>:8: read_data_sets (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed in a future version.
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
W0902 16:22:34.597057 16908 deprecation.py:323] From E:\TensorFlow\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py:260: maybe_download (from tensorflow.contrib.learn.python.learn.datasets.base) is deprecated and will be removed in a future version.
Instructions for updating:
Please write your own downloading logic.
W0902 16:22:34.598558 16908 deprecation.py:323] From E:\TensorFlow\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py:262: extract_images (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed in a future version.
Instructions for updati

Extracting MNIST_data\train-images-idx3-ubyte.gz


W0902 16:22:34.844737 16908 deprecation.py:323] From E:\TensorFlow\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py:267: extract_labels (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed in a future version.
Instructions for updating:
Please use tf.data to implement this functionality.
W0902 16:22:34.849240 16908 deprecation.py:323] From E:\TensorFlow\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py:110: dense_to_one_hot (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed in a future version.
Instructions for updating:
Please use tf.one_hot on tensors.
W0902 16:22:34.897776 16908 deprecation.py:323] From E:\TensorFlow\envs\tensorflow\lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py:290: DataSet.__init__ (from tensorflow.contrib.learn.python.learn.datasets.mnist) is deprecated and will be removed i

Extracting MNIST_data\train-labels-idx1-ubyte.gz
Extracting MNIST_data\t10k-images-idx3-ubyte.gz
Extracting MNIST_data\t10k-labels-idx1-ubyte.gz


W0902 16:22:35.142953 16908 deprecation.py:506] From <ipython-input-1-f81763fac284>:103: calling dropout (from tensorflow.python.ops.nn_ops) with keep_prob is deprecated and will be removed in a future version.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.
W0902 16:22:35.172474 16908 deprecation.py:323] From <ipython-input-1-f81763fac284>:115: softmax_cross_entropy_with_logits (from tensorflow.python.ops.nn_ops) is deprecated and will be removed in a future version.
Instructions for updating:

Future major versions of TensorFlow will allow gradients to flow
into the labels input on backprop by default.

See `tf.nn.softmax_cross_entropy_with_logits_v2`.



Iter0,Testing Acc0.9773 Train acc:0.97827274
Iter1,Testing Acc0.9842 Train acc:0.9882182
Iter2,Testing Acc0.9864 Train acc:0.99127275


In [None]:
import numpy as np
import tensorflow as tf;
import matplotlib.pylab as plt;

import tensorflow.examples.tutorials.mnist.input_data as input_data 

# 载入数据
mnist = input_data.read_data_sets("MNIST_data",one_hot = True)


# 每个批次的大小
batch_size = 100;
# 计算一共有多少批次
n_batch = mnist.train.num_examples // batch_size;


# 初始化权值
def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev=0.1)
    return tf.Variable(initial)


# 初始化偏置值
def bias_variable(shape):
    initial = tf.constant(0.1,shape=shape)
    return tf.Variable(initial)

# 记录变量
def variable_summaries(var):
    with tf.name_scope('summaries'):
        mean = tf.reduce_mean(var)
        tf.summary.scalar('mean', mean)
        with tf.name_scope('stddev'):
            stddev = tf.sqrt(tf.reduce_mean(tf.square(var-mean)))
        tf.summary.scalar('stddev', stddev)
        tf.summary.scalar('max', tf.reduce_max(var))
        tf.summary.scalar('min', tf.reduce_min(var))
        tf.summary.histogram('histogram', var)

# 卷积层定义
def conv2d(x,W):
    #x  input也就是这里的x是一个4d输入[batch_size, in_height, in_width, n_channels]，表示图片的批数，大小和通道。
    
    #W filter是一个4d输入[filter_height, filter_width, in_channels, out_channels]，
    #表示kernel的大小，输入通道数和输出通道数，其中输出通道数表示从上一层提取多少特征。
    
    #strides是一个1d输入，长度为4，其中stride[0]和stride[3]必须为1，一般格式为[1, stride[1], stride[2], 1]，
    #strides[1]代表x方向的步长  strides[2]代表y方向的步长
    #在大部分情况下，因为在height和width上的步进设为一样，因此通常为[1, stride, stride, 1]。 
    #计算公式为： 
    #output[b,i,j,k]=∑di,dj,qinput[b,strides[1]∗i+di,strides[2]∗j+dj,q]∗filter[di,dj,q,k]
    #其中b为batch_id, i,j分别是图片的像素索引, k是输出通道的索引，q是输入通道的索引，
    #从公式可以看出，conv2d是将一个图片的所有输入通道卷积合成一个输出通道的，这个和tf.nn.depthwise_conv2d有所不同。
    
    #padding是一个字符串输入，分为SAME和VALID分别表示是否需要填充，
    #因为卷积完之后因为周围的像素没有卷积到，因此一般是会出现卷积完的输出尺寸小于输入的现象的
    
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding="SAME")
    
# 池化层
def max_pool_2x2(x):
    #第一个参数value：需要池化的输入，一般池化层接在卷积层后面，
    #所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

    #第二个参数ksize：池化窗口的大小，取一个四维向量，
    #一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

    #第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

    #第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding="SAME")
    
#定义两个placeholder
x = tf.placeholder(tf.float32,[None,784]) #28*28
y = tf.placeholder(tf.float32,[None,10])

# 改变x的格式转换为4D的向量[betch,in_height,in_width,in_channels] 
# betch标示批次   in_height图片的高 in_width标示图片的宽  in_channels标示图片是否是彩色
x_image = tf.reshape(x,[-1,28,28,1])


# 初始化第一个卷积神经网络的权值和偏置值
W_conv1 = weight_variable([5,5,1,32]) #5*5的采样窗口，32个卷积核从1个平面中采样抽取特征，抽取出32个特征平面
b_conv1 = bias_variable([32]) #每一个卷积核一个偏置值

#把x_image和权值向量进行卷积操作，在加上偏置值，然后应用于relu激活函数
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1) #进行max-pooling

# 初始化第二个卷积神经网络的权值和偏置值
W_conv2 = weight_variable([5,5,32,64]) #5*5的采样窗口，64个卷积核从32个平面中采样抽取特征，抽取出64个特征平面
b_conv2 = bias_variable([64]) #每一个卷积核一个偏置值

#把h_pool1和权值向量进行卷积操作，在加上偏置值，然后应用于relu激活函数
h_conv2 = tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2)
h_pool2 = max_pool_2x2(h_conv2) #进行max-pooling


#28*2的图片第一次卷积后还是28*28，第一次池化后变为
#第二次卷积后为14*14，第二次池化后变为7*7
#经过上面操作后得到64张7*7的平面

# 初始化一个全连接的权值
W_fcl = weight_variable([7*7*64,1024]) #池化之后变成一个 7*7的的图片 同时有64个神经元，同时设置全连接为1024个神经元
b_fcl = bias_variable([1024])#神经元相同的偏置值

# 把池化层2的输出扁平化为一个一维数据
h_pool2_flat = tf.reshape(h_pool2,[-1,7*7*64])
#求第一个全连接的输出
h_fcl = tf.nn.relu(tf.matmul(h_pool2_flat,W_fcl) + b_fcl)

##keep_prob用来表示神经元的输出概率
keep_prob = tf.placeholder(tf.float32)
h_fcl_drop = tf.nn.dropout(h_fcl,keep_prob)


# 初始化二个全连接的权值
W_fcl2 = weight_variable([1024,10]) 
b_fcl2 = bias_variable([10])
logits = tf.matmul(h_fcl_drop,W_fcl2)+b_fcl2
perdiction = tf.nn.sigmoid(logits)
# perdiction = tf.nn.softmax(logits)


 # 交叉熵优化
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y,logits = logits))

train_setp = tf.train.AdadeltaOptimizer(learning_rate=1).minimize(loss)
# train_setp = tf.train.AdamOptimizer(learning_rate=1e-4).minimize(loss)


init = tf.global_variables_initializer()

# 将返回最大的值放在一个一维张量中
correct_prediction = tf.equal(tf.argmax(perdiction,1),tf.argmax(y,1))
# 测试准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_setp, feed_dict={x:batch_xs,y:batch_ys,keep_prob:0.7})
            
            
        test_acc =  sess.run(accuracy, feed_dict={x:mnist.test.images,y:mnist.test.labels,keep_prob:1.0})
        
        train_acc = sess.run(accuracy, feed_dict={x:mnist.train.images,y:mnist.train.labels,keep_prob:1.0})
        
        print("Iter" + str(epoch) + ",Testing Acc"+ str(test_acc) + " Train acc:"+str(train_acc))
#         print("Iter" + str(epoch) + ",Testing Acc"+ str(test_acc) )



