最近用用CNN比较多，梳理一下CNN的发展史，也加深一下对CNN的理解，也给出tensorflow的实现
## LeNet-5
LeNet是现在广泛使用的CNN的源头。虽然网络规模比较小，但是麻雀虽小，五脏俱全，已经包含了CNN的精华思想。CNN的的特点是卷积层和池化层，卷积层可以看做是提取局部特征，池化层可以看作是压缩特征。随着层数的增加，不断抽象原始的特征，最后达到分类的效果。再提一个细节就是对池化层的理解，最早理解的是采用最大池化是因为卷积神经网络的灵感来源是猫的视觉神经，视觉总是容易被更亮的吸引，所以用最大池化，后来才发现，最大池化其实就是取的无穷范数平均。用数学的角度最大池化平均池化都是某个范数下的平均。这样就为我们打开了一个新的思路，池化层可以有多种选择，可以调整取平均的p范数来尝试优化池化层，但可能池化层所能贡献的精度有限，也没太多人做这方面的工作。

In [2]:
import tensorflow as tf

In [9]:
def conv(inputs, kernel_width, kernel_num, stride, padding, name):
    channel = tf.shape(inputs)[-1]
    with tf.variable_scope(name):
        kernel = tf.get_variable("kernel", [kernel_width, kernel_width, channel, kernel_num])
        b = tf.get_variable("bias", [kernel_num])
        act = tf.nn.bias_add(tf.nn.conv2d(inputs, kernel, [1, stride, stride, 1], padding=padding, name="act"), b)
    return tf.nn.relu()

In [10]:
def max_pool(inputs, kernel_width, stride, padding, name):
    return tf.nn.max_pool(inputs, [1, kernel_width, kernel_width, 1], [1, stride, stride, 1], padding=padding, name=name)

In [11]:
def fc(inputs, out_num, relu, name):
    in_num = tf.shape(inputs)[-1]
    with tf.variable_scope(name):
        W = tf.get_variable("weight", [in_num, out_num])
        b = tf.get_variable("bias", [out_num])
    if relu:
        return tf.nn.relu(tf.matmul(inputs, W)+b)
    else:
        return tf.matmul(inputs, W)+b

In [12]:
def inference(inputs, n_class):
    x = tf.reshape(inputs, [-1,32,32,1]) #input:32*32*1
    
    conv1 = conv(x, 5, 6, "VALID", "conv1") #conv1: 5*5*6 stride=1 -> 28*28*6
    pool1 = max_pool(conv1, 2, 2, "VALID", "pool1") #pool: 2*2 stride=2 -> 14*14*6
    
    conv2 = conv(x, 5, 16, "VALID", "conv1") #conv1: 5*5*16 stride=1 -> 10*10*16
    pool2 = max_pool(conv1, 2, 2, "VALID", "pool1") #pool: 2*2 stride=2 -> 5*5*16
    
    conv2 = conv(x, 5, 120, "VALID", "conv1") #conv1: 5*5*120 stride=1 -> 1*1*120
    flatten = tf.reshape(conv2, [-1, 120]) #flatten conv2 to 1D
    
    fc1 = fc(flatten, 84, False, "fc") #fc1: 120 -> 84
    
    logit = fc(flatten, 10, False, "fc") #fc1: 84 -> 10, Original text using RBF as classifier
    
    return logit

## AlexNet
由于算力的有限，CNN的发展并不是很顺利，直到Alex把CNN重新带回大众的视野。与LeNet相比的创新点是：
- 1.增加了卷积层的个数
- 2.运用了local response normalization
- 3.运用了dropout防止过拟合
- 4.运用了Relu作为激活函数增加非线性

In [14]:
def lrn(inputs, depth_radius, bias, alpha, beta, name):
    return tf.nn.local_response_normalization(inputs, depth_radius=depth_radius, bias=bias, alpha=alpha, beta=beta, name=name)

In [None]:
def inference(inputs, )