## TensorFlow中的卷积

在TensorFlow中去做卷积，我们有很多内建的层可以使用。你可以输入2维数据做1维卷积，输入3维数据做2维卷积，输入4维数据做3维卷积，最常用的是2维卷积。

```python
# 函数模型
tf.nn.conv2d(
    input,
    filter,
    strides,
    padding,
    use_cudnn_on_gpu=True,
    data_format='NHWC',
    dilations=[1, 1, 1, 1],
    name=None)

Input: Batch size (N) x Height (H) x Width (W) x Channels (C)
Filter: Height x Width x Input Channels x Output Channels
(e.g. [5, 5, 3, 64])
Strides: 4 element 1-D tensor, strides in each direction
(often [1, 1, 1, 1] or [1, 2, 2, 1])
Padding: 'SAME' or 'VALID'
Dilations: The dilation factor. If set to k > 1, there will be k-1 skipped cells between each filter element on that dimension.
Data_format: default to NHWC
```

作一个有趣的练习：GitHub中的kernes.py文件中看到一些著名的核的值，在07_run_kernels.py中看到它们的用法。

## 用CNN处理MNIST

在第三课中学习了逻辑回归处理MNIST，现在我们使用CNN来处理，看看结果如何！

将采用如下架构：两个步长为1的卷积层，每个卷积层后跟一个relu激活层与最大池化层Maxpool，最后跟两个全连接层。

### 1.卷积层


- 输入尺寸(W)
- 过滤器尺寸(F)
- 步长(S)
- 零填充(P)

在定义函数之前，让我们看一下获取输出大小的公式。当您具有上述输入值时，输出的大小如下所示：

$$ \frac{W-F+2P}{S}+1 $$


在我们的MNIST模型中，输入为28x28，滤波器为5x5。并且步幅使用1和填充使用2。因此，输出的大小如下:

$$ \frac{28-5+2\times2}{1}+1 = 28 $$

In [7]:
def conv_relu(inputs, filters, k_size, stride, padding, scope_name):
    with tf.variable_scope(scope_name, reuse=tf.AUTO_REUSE) as scope:
        # rgb通道
        in_channels = inputs.shape[-1]
        # 卷积核
        kernel = tf.get_variable('kernel', [k_size, k_size, in_channels, filters],
                                initializer=tf.truncated_normal_initializer())
        biases = tf.get_variable('biases', [filters],
                            initializer=tf.random_normal_initializer())
        # 卷积结果
        conv = tf.nn.conv2d(inputs, kernel, strides=[1, stride, stride, 1], padding=padding)
    # relu层对卷积结果处理
    return tf.nn.relu(conv + biases, name=scope.name)

### 2.池化层

池化可减少要素图的维数，提取要素并缩短执行时间。

通常使用max-pooling或average-pooling。

由于在此模型中使用了max-pooling，因此我们定义了max-pooling函数，如下所示:


- 输入尺寸（W）
- 池化大小（K）
- 池化步长（S）
- 池化零填充（P）


$$ \frac{W-K+2P}{S}+1 $$


在我们的模型中，输入是28x28，池大小是2x2，补长是2，零填充，所以我们将输出大小如下。

$$ \frac{28-2+2\times0}{2}+1=14 $$

In [9]:
def maxpool(inputs, ksize, stride, padding='VALID', scope_name='pool'):
    with tf.variable_scope(scope_name, reuse=tf.AUTO_REUSE) as scope:
        pool = tf.nn.max_pool(inputs,
                            ksize=[1, ksize, ksize, 1],
                            strides=[1, stride, stride, 1],
                            padding=padding)
    return pool

### 3.全连接层