# MXNET的符号API

本节中，我将介绍MXNET主要的符号API。符号是神经网络的构件。每个符号可以被视为具有前向和后向操作的功能对象。单个符号可以组成更复杂的符号，从而成为神经网络。

有关Symbolic API的更详细的教程，请参阅：[http://mxnet.io/api/python/symbol.html](http://mxnet.io/api/python/symbol.html)  


## 符号变量
[`mxnet.symbol.Variable(name, attr=None, shape=None)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Variable)

创建具有指定名称的符号变量。
参数：

> name（str） - 变量的名称。
> attr（字符串的dict - > string） - 对变量设置的附加属性。
> shape（tuple） - 可选地，可以指定变量的形状。 这将在形状推理期间使用。 如果用户在调用形状推断时使用关键字参数为此变量指定了不同的形状，则此形状信息将被忽略。

返回：

> variable - 创建的变量符号。

## 全连接层和卷积层  

### 全连接层
[`mxnet.symbol.FullyConnected(*args, **kwargs)`](https://turi.com/products/create/docs/generated/graphlab.mxnet.symbol.FullyConnected.html#graphlab.mxnet.symbol.FullyConnected)    
作用：将矩阵乘法应用于输入，然后加上偏置。  

参数：

**data**：符号

>将数据输入到FullyConnectedOp。

**weight**：符号

>权值矩阵。

**bias**：符号

>偏置参数。

** num_hidden **：int，必需

>输出的隐藏节点数。

** no_bias **：boolean，可选，default = False

>是否禁用偏置参数。

** name **：string，可选。

>结果符号的名称。


返回：

symbol：符号
 >结果符号。

### 卷积层

[`mxnet.symbol.Convolution(*args, **kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Convolution)

将卷积应用于输入，然后添加偏置。
参数：

data：符号

>输入数据到ConvolutionOp。

weight：符号

>权值矩阵。

bias：符号

>偏置参数。

kernel：Shape（tuple），required

>卷积核大小：（y，x）

stride：Shape（tuple），optional，default =（1,1）

>卷积窗移动步长：（y，x）

dilate：Shape（tuple），optional，default =（1,1）

>卷积扩张：（y，x）

pad：Shape（tuple），optional，default =（0,0）

>卷积的填充：（y，x）

num_filter：int（非负数），必需

>卷积滤波器（通道）号

num_group：int（非负数），可选，default = 1

>分组的分区数。这个选项不支持CuDNN，你可以使用SliceChannel到num_group，应用卷积和concat来实现相同的需要。

workspace：long（non-negative），可选，default = 512

>Tmp卷积的工作空间（MB）。

no_bias：boolean，可选，default = False

>是否禁用偏置参数。

name：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

### 反卷积层

[`mxnet.symbol.Deconvolution(*args, **kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Deconvolution)
将反卷积应用于输入，然后添加偏置。
参数：

data：符号

>输入数据到DeconvolutionOp。

weight：符号

>权值矩阵。

bias：符号

>偏置参数。

kernel：Shape（tuple），required

>反卷积核大小：（y，x）

stride：Shape（tuple），optional，default =（1,1）

>反卷积移动步长：（y，x）

pad：Shape（tuple），optional，default =（0,0）

>反卷积的填充：（y，x）

num_filter：int（非负数），必需

>反卷积滤波器（通道）数

num_group：int（非负数），可选，default = 1

>分组分区数

workspace：long（non-negative），可选，default = 512

>反褶积工作区（MB）

no_bias：boolean，optional，default = True

>是否禁用偏置参数。

name：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

### 池化层

[`mxnet.symbol.Pooling(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Pooling)
作用：对输入执行空间合并。
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据到池操作符。
* ** global_pool **(_boolean，可选，default = False_) - 忽略内核大小，根据当前输入要素图进行全局池化。这对于具有不同形状的输入有用
* **kernel**(_Shape(tuple)，required_) - 合并内核大小：(y，x)或(d，y，x)
* ** pool_type **(_ {'avg'，'max'，'sum'}，required_) - 要应用的池化类型。
* ** pooling_convention **(_ {'full'，'valid'}，可选，default ='valid'_) - 要应用的池规则.kValid是Mxnet的默认设置，并舍弃输出池大小.kFull是兼容Caffe和舍入输出池大小。
* ** stride **(_Shape(tuple)，optional，default =(1,1)_) - 池化窗口移动的步长(y，x)or(d，y，x)
* ** pad **(_Shape(tuple)，optional，default =(0,0)_) - 池化窗的填充(y，x)or(d，y，x)
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)

## 激活层
### 激活层

[mxnet.symbol.Activation(*args, **kwargs)](https://turi.com/products/create/docs/generated/graphlab.mxnet.symbol.Activation.html#graphlab.mxnet.symbol.Activation)  
作用：将激活函数应用于输入。
支持以下激活类型（操作按元素应用于输入张量的每个标量）：
* relu：整流线性单元，$y = max(x，0)$
* sigmoid：$y = 1 /(1 + exp(-x))$
* tanh：双曲正切，$y =(exp(x)-exp(-x))/(exp(x)+ exp(-x))$
* softreLu：SoftReLU或SoftPlus，$y = log(1 + exp(x))$
 

有关参数的其他激活，请参见LeakyReLU。


参数：

**data**：符号

>输入数据到激活功能。

** act_type **：{'relu'，'sigmoid'，'softrelu'，'tanh'}，required

>激活函数类型。

** name **：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

## softmax激活层

[mxnet.symbol.SoftmaxActivation(*args, **kwargs)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.SoftmaxActivation)

作用：应用softmax激活输入。这是为内部层而准备的。对于输出（损失层），请使用SoftmaxOutput。如果type = instance，此运算符将为batch中的每个实例计算一个softmax，这是默认的模式。如果type = channel，此运算符将在每个实例的每个位置计算一个num_channel个类的softmax;这可以用于全卷积网络，图像分割等。Softmax激活仅适用于GPU上的CUDNN，并且如果输入为4D，将在每个通道的每个位置计算。  

参数：

**数据**：符号

>输入数据到激活功能。

** mode **：{'channel'，'instance'}，可选，default ='instance'

> Softmax模式。如果设置为实例，此运算符将为batch中的每个实例计算一个softmax;这是默认模式。如果设置为channel，此运算符将在每个实例的每个位置计算num_channel类softmax;这可以用于完全卷积网络，图像分割等。

** name **：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。



## 输出层

### 线性回归输出层

[`mxnet.symbol.LinearRegressionOutput(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.LinearRegressionOutput)
作用：对最终输出使用线性回归，这用于网的最终输出。
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据到函数。
* ** label **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入标签到函数。
* ** grad_scale **(_float，optional，default = 1_) - 梯度缩放因子
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)

### 逻辑回归输出层

[`mxnet.symbol.LogisticRegressionOutput(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.LogisticRegressionOutput)
作用：对最终输出使用Logistic回归，这用于网络的最终输出。逻辑回归适用于二进制分类或概率预测任务。
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据到函数。
* ** label **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入标签到函数。
* ** grad_scale **(_float，optional，default = 1_) - 梯度缩放因子
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)

### MAE输出层

[`mxnet.symbol.MAERegressionOutput(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.MAERegressionOutput)
作用：对最终输出使用平均绝对误差回归，这用于网的最终输出。
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据到函数。
* ** label **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入标签到函数。
* ** grad_scale **(_float，optional，default = 1_) - 梯度缩放因子
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)

### softmax输出层
[mxnet.symbol.SoftmaxOutput(*args，**kwargs)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.SoftmaxOutput)

对输入执行softmax变换，使用logloss执行backprop。
参数：

data：符号

>输入数据到softmax。

label：符号

>标签数据。

grad_scale：float，optional，default = 1

> 通过浮点因子缩放梯度

ignore_label：float，optional，default = -1

>标签值将在回传期间被忽略（仅当use_ignore设置为true时才起作用）。

multi_output：boolean，可选，default = False

>如果设置为true，则对于（n，k，x_1，...，x_n）维输入张量，softmax将生成n * x_1 * ... * x_n输出，每个输出具有k个类

use_ignore：boolean，可选，default = False

>如果设置为true，ignore_label值将不会对回传梯度有贡献

normalization：{'batch'，'null'，'valid'}，可选，default ='null'

>如果设置为null，op将不会对输出梯度执行任何操作。如果设置为batch，op将通过除以batch size对梯度进行归一化。如果设置为valid，op将通过除以样本数进行梯度的归一化。

name：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。



## Reshape层
### Reshape层

[`mxnet.symbol.Rechape(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Reshape)
作用：重新塑造目标形状的输入
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据以重塑。
* ** target_shape **(_Shape(tuple)，可选，default =(0,0)_) - (不推荐，请使用shape。)目标新形状。一个并且只有一个dim可以是0，在这种情况下，将从剩余的dims中推断出
* ** keep_highest **(_boolean，可选，默认值= False_) - (不推荐，请使用shape。)是否保持最高的dim不变。如果设置为true，则target_shape中的第一个dim被忽略，
* **shape**(_，可选，默认=()_) - 目标新形状。如果dim是相同的，将其设置为0 \。如果dim设置为-1，则将从其余dims中推断出。一个且只有一个dim可以是-1
* ** reverse **(_boolean，可选，default = False_) - 是否匹配形状从向后。如果reverse为true，则将从后面搜索 shape 参数中的0个值。例如，原始形状是(10,5,4)，形状参数是(-1,0)。如果reverse为true，则新形状应为(50，4)。否则将是(40，5)。
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)

### Cast层

[mxnet.symbol.Cast(_*args_, _**kwargs_)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Cast)

将数组转换为不同的数据类型。

参数：

**data**：符号

>输入数据以投射函数。

** dtype **：{'float16'，'float32'，'float64'，'int32'，'uint8'}，必需

>目标数据类型。

** name **：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

### Concat层
[mxnet.symbol.Concat(_*args_, _**kwargs_)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Concat)
在channel dim指定的维（defaut为1）上执行特征拼接。此函数支持可变长度的位置输入。

参数：

**数据**：符号

>要拼接的张量组成的列表

** num_args **：int，必填

>要连接的输入数量。

** dim **：int，optional，default ='1'

>要连接的维。

** name **：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

例子：
```python
>>> import mxnet as mx
>>> data = mx.nd.array(range(6)).reshape((2,1,3))
>>> print "input shape = %s" % data.shape
>>> print "data = %s" % (data.asnumpy(), )
input shape = (2L, 1L, 3L)
data = [[[ 0\.  1\.  2.]]
 [[ 3\.  4\.  5.]]]

>>> # concat two variables on different dimensions
>>> a = mx.sym.Variable('a')
>>> b = mx.sym.Variable('b')
>>> for dim in range(3):
... cat = mx.sym.Concat(a, b, dim=dim)
... exe = cat.bind(ctx=mx.cpu(), args={'a':data, 'b':data})
... exe.forward()
... out = exe.outputs[0]
... print "concat at dim = %d" % dim
... print "shape = %s" % (out.shape, )
... print "results = %s" % (out.asnumpy(), )
concat at dim = 0
shape = (4L, 1L, 3L)
results = [[[ 0\.  1\.  2.]]
 [[ 3\.  4\.  5.]]
 [[ 0\.  1\.  2.]]
 [[ 3\.  4\.  5.]]]
concat at dim = 1
shape = (2L, 2L, 3L)
results = [[[ 0\.  1\.  2.]
 [ 0\.  1\.  2.]]
 [[ 3\.  4\.  5.]
 [ 3\.  4\.  5.]]]
concat at dim = 2
shape = (2L, 1L, 6L)
results = [[[ 0\.  1\.  2\.  0\.  1\.  2.]]
 [[ 3\.  4\.  5\.  3\.  4\.  5.]]]
```

### ElementWiseSum层

[mxnet.symbol.ElementWiseSum(*args, **kwargs)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.ElementWiseSum)
对所有输入执行按元素（element-wise）求和。 此功能支持位置输入的可变长度。
参数：

num_args：int，必需

> 要汇总的输入数。

name：string，可选。

> 结果符号的名称。

返回：

symbol：符号

>结果符号。

### Embedding层

[`mxnet.symbol.Embedding(*args，**kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Embedding)
作用：将整数索引映射到向量表示(嵌入)。这些嵌入是可学习的参数。对于形状(d1，...，dK)的输入，输出形状为(d1，...，dK，output_dim)。所有输入值应为 [0，input_dim)范围内的整数。
>**参数：**
* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 输入数据到EmbeddingOp。
* ** weight **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)) - 包含权重矩阵。
* ** input_dim **(_int，required_) - 输入索引的词汇大小。
* ** output_dim **(_int，required_) - 嵌入向量的维数。
* ** name **(_string，optional._) - 结果符号的名称。

>返回：
* ** symbol ** - 结果符号。
返回类型：[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol)


### Flattern层
[mxnet.symbol.Flatten(*args, **kwargs)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Flatten)

平整输入
参数：

data：符号

>输入数据展平。

name：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

### Group层

[mxnet.symbol.Group(symbols)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Group)

创建将符号分组在一起的符号。
参数：

symbol：列表

>待分组的符号列表。

返回：

sym：符号

>创建的组符号。

### SliceChannel层
[mxnet.symbol.SliceChannel(_*args_，_** kwargs_)](http://mxnet.io/api/python/symbol.html#mxnet.symbol.SliceChannel)
沿指定轴均等地切割输入


参数：

** num_outputs **：int，必填

>要切片的输出数。

** axis **：int，optional，default ='1'

>沿着切片的尺寸。

** squeeze_axis **：boolean，可选，default = False

>如果为true且切片维度变为1，请压缩该维度。

** name **：string，可选。

>结果符号的名称。

返回：

symbol：符号

>结果符号。

### Upsampling层

[mxnet.symbol.UpSampling(*args, **kwargs)]()

执行最近邻域/双线性采样到输入此功能支持位置输入的可变长度。
参数：

data：Symbol[]

>上采样的张量数组

scale：int（非负数），必需

>上采样比例

num_filter：int（非负数），可选，default = 0

>输入滤波器。仅由双线性样本类型使用。

sample_type：{'bilinear'，'nearest'}，必填

>上采样方法

multi_input_mode：{'concat'，'sum'}，可选，default ='concat'

>如何处理多个输入。连接意味着沿着通道维度连接上采样图像。求和装置将所有图像相加在一起，仅可用于最近邻上采样。

num_args：int，必需

>要上采样的输入数。对于最近邻居上采样，这可以是1-N;输出的大小将是（scale * h_0，scale * w_0），所有其他输入将被上采样到相同的大小。对于双线性上采样，这必须是2; 1个输入和1个重量。

workspace：long（non-negative），可选，default = 512

>反卷积工作区（MB）

name：string，可选。

>结果符号的名称。

返回：

Symbol：符号

>结果符号。

## Regularization层

### BatchNorm层

 [`mxnet.symbol.BatchNorm(*args, **kwargs)`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.BatchNorm)

将批次标准化应用于输入。
参数：

* ** data **([_Symbol_](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol“mxnet.symbol.Symbol”)) - 输入数据以进行批次标准化
* ** eps **(_float，可选，默认值= 0.001_) - Epsilon防止div 0
* ** momentum **(_float，可选，默认值= 0.9_) - 移动平均值的动量
* ** fix_gamma **(_boolean，optional，default = True_) - 训练时修正gamma
* ** use_global_stats **(_boolean，可选，default = False_) - 是否使用全局移动统计，而不是使用本地批处理。 这将强制改变批处理规范为缩放移位算子。
* ** name **(_string，optional._) - 结果符号的名称。

  
返回：

** symbol ** - 结果符号。

返回类型：

[Symbol](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Symbol“mxnet.symbol.Symbol”)

### Dropout层

[`mxnet.symbol.Dropout（* args，** kwargs）`](http://mxnet.io/api/python/symbol.html#mxnet.symbol.Dropout)

 对输入应用dropout。 在训练期间，输入的每个元素随机地以概率p设置为零。 然后整个张量被重新缩放1 /（1-p），以保持期望与应用dropout之前相同。 在测试时间期间，这表现为恒等映射。
 参数：

>* data（符号） - 输入数据到dropout。

>* p（float，optional，default = 0.5） - 在训练时丢弃的比例
 
> * name（字符串，可选。） - 结果符号的名称。

 返回：

 >* symbol  - 结果符号。
 
 >返回类型： 符号

## 参考  
1.http://mxnet.io/api/python/symbol.html#mxnet.symbol.Activation 
2.https://turi.com/products/create/docs/graphlab.mxnet.html