# 卷积函数

- 卷积函数定义在tensorflow/python/ops下的nn_impl.py和nn_ops.py文件中

### tf.nn.conv2d(input,filter,padding,use_cudnn_on_gpu=None,name=None)
- input: 需要做卷积的输入数据，注意：这是一个四维张量([batch,in_height,in_width,in_channels])，要求类型为float32或float64其中之一。
- strides: 图像每一维的步长，是一个一维向量，长度为4
- padding: 定义元素边框与元素内容之间的空间。“SAME”或"VALID",这个值决定了不同的卷积方式。当为"SAME"时，表示边缘填充，适用于全尺寸操作;当为"VALID"时，表示边缘不填充。
- use_cudnn_on_gpu: bool类型，是否使用cudnn加速
- name: 该操作的名称
- 返回值: 返回一个tensor,即feature map

In [2]:
import tensorflow as tf
import numpy as np

input_data = tf.Variable(np.random.rand(10,9,9,4),dtype=np.float32)
filter_data = tf.Variable(np.random.rand(3,3,4,2),dtype=np.float32)

y = tf.nn.conv2d(input_data,filter_data,strides=[1,1,1,1],padding='SAME')
#y = tf.nn.conv2d(input_data,filter_data,strides=[1,1,1,1],padding='VALID')

print(input_data)
print(y)

<tf.Variable 'Variable:0' shape=(10, 9, 9, 4) dtype=float32, numpy=
array([[[[0.81511784, 0.7365257 , 0.9329872 , 0.5723945 ],
         [0.03926967, 0.26281175, 0.8758649 , 0.5777648 ],
         [0.9335356 , 0.92758393, 0.337397  , 0.34378815],
         ...,
         [0.679633  , 0.2578549 , 0.74483484, 0.28466934],
         [0.35234553, 0.37610388, 0.5367089 , 0.11288024],
         [0.19722691, 0.7440176 , 0.29039636, 0.5022826 ]],

        [[0.4755836 , 0.8370883 , 0.8803621 , 0.7785688 ],
         [0.2739349 , 0.6650074 , 0.20307316, 0.05831267],
         [0.87965995, 0.7826387 , 0.4795753 , 0.4020257 ],
         ...,
         [0.73590446, 0.39003524, 0.1335612 , 0.8663966 ],
         [0.15719019, 0.96287847, 0.7995426 , 0.8864122 ],
         [0.9381285 , 0.08304755, 0.13171005, 0.12151249]],

        [[0.02816666, 0.32843846, 0.01007494, 0.6894051 ],
         [0.10459179, 0.5547534 , 0.16794908, 0.26104206],
         [0.9832139 , 0.9341483 , 0.00955544, 0.8106472 ],
         ...,
 

# 池化函数

- 卷积函数定义在tensorflow/python/ops下的nn.py和gen_nn_ops.py文件中

#### 最大池化:tf.nn.max_pool(value,ksize,strides,padding,name=None)
#### 平均池化:tf.nn.avg_pool(value,ksize,strides,padding,name=None)
- value: 需要池化的输入。一般池化层接在卷积层后面，所以输入通常是conv2d所输出的feature map,依然是4维的张量([batch,height,width,channels]).
- ksize: 池化窗口的大小，由于一般不在batch和channel上做池化,所以ksize一般是[1,height,width,1]
- strides:图像每一维的步长，是一个一维向量，长度为4
- padding: 和卷积函数中padding含义一样
- name: 该操作的名称
- 返回值: 返回一个tensor

In [7]:
import tensorflow as tf
import numpy as np
input_data = tf.Variable(np.random.rand(10,6,6,4),dtype=np.float32)
filter_data = tf.Variable(np.random.rand(2,2,4,2),dtype=np.float32)
y = tf.nn.conv2d(input_data,filter_data,strides=[1,1,1,1],padding='SAME')

# 最大池化
#output = tf.nn.max_pool(y,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

# 平均池化
output = tf.nn.avg_pool(y,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

print('conv:',y)
print('pool_padding_valid:',output)

conv: tf.Tensor(
[[[[4.0034313  3.2442021 ]
   [4.1971254  3.6911187 ]
   [4.0408125  3.9927845 ]
   [3.2679462  3.1909392 ]
   [3.8336072  4.3016953 ]
   [2.096505   1.878803  ]]

  [[4.2786565  4.2392445 ]
   [4.2940993  4.7508    ]
   [4.047538   3.7876127 ]
   [4.6552277  4.5507874 ]
   [5.1920385  3.917994  ]
   [1.8998301  2.3797324 ]]

  [[4.091566   4.026267  ]
   [4.942702   4.4908257 ]
   [4.6637344  4.823879  ]
   [5.1761584  4.6934366 ]
   [4.1313586  4.219719  ]
   [1.159306   1.4907649 ]]

  [[3.9907494  3.9943237 ]
   [3.8064377  3.6742768 ]
   [4.616341   4.7164526 ]
   [4.266692   4.452199  ]
   [3.740313   4.0988135 ]
   [1.3872218  1.206899  ]]

  [[4.520876   4.094776  ]
   [4.521053   4.243536  ]
   [4.101763   4.525977  ]
   [5.092986   5.215057  ]
   [4.722991   4.157341  ]
   [1.9289879  1.7082599 ]]

  [[2.6786027  2.4162319 ]
   [1.7083927  2.7720423 ]
   [2.1073065  1.6440754 ]
   [2.5139675  3.052474  ]
   [2.1987767  2.2433584 ]
   [0.62690496 1.0751351 ]]]