In [3]:
# LeNet-5模型：卷积层 - 池化层 - 卷积层 - 池化层 - 全连接层 - 全连接层 - 全连接层
import tensorflow as tf

In [2]:
# 1. 损失函数和方向传播，都可以复用第五章全连接网络的计算。唯一的区别在于卷积神经网络的输入层为一个三维矩阵，所以需要调整输入数据的格式

# 在第五章全连接网络识别手写数据基础上修改
# 调整输入数据placeholder 的格式，输入为一个四维矩阵
x = tf.placeholder(tf.float32, [
    BTACH_SIZE,
    mnist_inference.IMAGE_SIZE,
    mnist_inference.IMAGE_SIZE,
    mnist_inference.NUM_CHANNELS],
name = 'x-input')

# 类似地将输入的训练数据格式调整为一个四维矩阵，并将这个调整后的数据传入sess.run过程
reshaped_xs = np.reshape(xs, [BTACH_SIZE,
    mnist_inference.IMAGE_SIZE,
    mnist_inference.IMAGE_SIZE,
    mnist_inference.NUM_CHANNELS])

In [None]:
# 2. LeNet-5模型示例
import tensorflow as tf 

# 配置神经网络的参数
INPUT_NODE = 784
OUTPUT_NODE = 10

INMAE_SIZE = 28
NUM_CHANNELS = 1
NUM_LABELS = 10

# 第一层卷积层的尺寸和深度
CONV1_DEEP = 32
CONV1_SIZE = 5

# 第二层卷积层的尺寸和深度
CONV2_DEEP = 64
CONV2_SIZE = 5

# 全连接层的节点个数
FC_SIZE = 512

# 定义卷积神经网络的前向传播
# 程序中使用了dropout防止过拟合
 def inference(input_tensor, train, regularizer):
        # 声明第一卷积层的变量并实现前向传播过程
        # 通过使用不同的命名空间来隔离不同层的变量，这可以让每一层中变量命名只需要考虑当前作用层的作用，而不需要担心重名的问题
        # 输入为28*28*1， 全0填充，所以输出为28*28*32
        with tf.variable_scope('layer1-conv1'):
            conv1_weights = tf.get_variable(
                # 四维矩阵前两维代表了过滤器的尺寸，第三维表示当前层的深度，第四维度表示过滤器的深度
                'weights', [ CONV1_SIZE, CONV1_SIZE, NUM_CHANNELS, CONV1_DEEP],
                 initializer = tf.truncated_normal_initializer(stddev = 0.1))
            conv1_biases = tf.get_variable(
                'bias', [CONV1_DEEP], 
                 initializer = tf.constant_initializer(0.0))
            
            # 使用边长为5，深度为32的过滤器，过滤器移动的步长为1，且使用全0填充
            conv1 = tf.nn.conv2d(
                 input_tensor, conv1_weights, strides=[1,1,1,1], padding='SAME')
            
            relu1 = tf.nn.relu(tf.nn.bias_add(conv1, conv1_biases))
            
        # 实现第二层池化层的前向传播过程
        # 这里使用最大池化层
        # 这一层的输入就是上一层的输出，即28*28*32，输出为14*14*32
        with tf.name_scope('layer2-pool1'):
            pool1 = tf.nn.max_pool(
                relu1, ksize = [1,2,2,1], strides=[1,2,2,1], padding = 'SAME')
        
        # 声明第三层卷积层的变量并实现前向传播过程
        # 这一层的输入为14*14*32， 输出为14*14*64的矩阵
        with tf.variable_scope('layer3-conv2'):
            conv2_weights = tf.get_variable(
                # 四维矩阵前两维代表了过滤器的尺寸，第三维表示当前层的深度，第四维度表示过滤器的深度
                'weights', [ CONV2_SIZE, CONV2_SIZE, CONV1_DEEP, CONV2_DEEP],
                 initializer = tf.truncated_normal_initializer(stddev = 0.1))
            conv2_biases = tf.get_variable(
                'bias', [CONV2_DEEP], 
                 initializer = tf.constant_initializer(0.0))
            
            # 使用边长为5，深度为64的过滤器，过滤器移动的步长为1，且使用全0填充
            conv2 = tf.nn.conv2d(
                 pool1, conv2_weights, strides=[1,1,1,1], padding='SAME')
            
            relu2 = tf.nn.relu(tf.nn.bias_add(conv2, conv2_biases))
            
        # 实现第四层池化层的前向传播过程，这一层和第二层的结构一样
        # 这一层的输入为14*14*64， 输出为7*7*64的矩阵
        with tf.name_scope('layer4-pool2'):
            pool2 = tf.nn.max_pool(
                relu2, ksize = [1,2,2,1], strides=[1,2,2,1], padding = 'SAME')
            
        # 将第四层池化层的输出转换为第五层全连接层的输入格式。
        # 第四层的输出为7*7*64的矩阵，然而第五层全连接层需要的输入格式为向量，所以在这里需要将这个7*7*64的矩阵拉直成一个向量
        pool_shape = pool2.get_shape().aslist()
        
        # 计算将矩阵拉直成向量之后的长度，这个长度就是矩阵长宽及深度的乘积。
        # 注意这里pool_shape[0]为一个batch中数据的个数
        nodes = pool_shape[1] * pool_shape[2] * pool_shape[3]
        
        # 通过tf.reshape函数将第四层的输出变成一个batch的向量
        reshaped = tf.reshape(pool2, [pool_shape[0], nodes])
        
        # 声明第五层全连接层的变量并实现前向传播过程。
        # 这一层是拉直之后的一组向量，向量长度为3136，输出是一组长度为512的向量
        # 该层使用dropout正则化避免过拟合，dropout一般只在全连接层而不是卷积层或池化层使用
        with tf.variable_scope('layer5-fc1'):
            fc1_weights = tf.get_variable(
                'weights', [ nodes, FC_SIZE],
                initializer = tf.truncated_normal_initializer(stddev = 0.1))
            # 只有全连接层的权重需要加入正则化
            if regularizer != None:
                tf.add_to_collection('losses', regularizer(fc1_weights))
            fc1_biases = f.get_variable(
                'bias', [FC_SIZE], 
                 initializer = tf.constant_initializer(0.1))
            
            fc1 = tf.nn.relu(tf.matmul(reshaped, fc1_weights) + fc1_biases)
            if train : fc1 = tf.nn.dropout(fc1, 0.5)
                
        # 声明第六层全连接层的变量并实现前向传播过程。
        # 这一层输入为一组长度为512的向量，输出为一组长度为10的向量
        # 这一层的输出通过Softmax之后就得到了最后的分类结果
        with tf.variable_scope('layer6-fc2'):
            fc2_weights = tf.get_variable(
                'weights', [FC_SIZE, NUM_LABELS],
                initializer = tf.truncated_normal_initializer(stddev = 0.1))
            # 只有全连接层的权重需要加入正则化
            if regularizer != None:
                tf.add_to_collection('losses', regularizer(fc2_weights))
            fc2_biases = f.get_variable(
                'bias', [NUM_LABELS], 
                 initializer = tf.constant_initializer(0.1))
            
            logit = tf.matmul(fc1, fc2_weights) + fc1_biases
            
        # 返回第六层的输出
        return logit