# 自定义层

## 定义一个简单的层（没有模型参数）

In [1]:
from mxnet import nd
from mxnet.gluon import nn

class CenteredLayer(nn.Block):
    def __init__(self, **kwargs):
        super(CenteredLayer, self).__init__(**kwargs)
        
    def forward(self, x):
        return x - x.mean()

In [2]:
# 马上实例化这个层
layer = CenteredLayer()
layer(nd.array([1, 2, 3, 4, 5]))


[-2. -1.  0.  1.  2.]
<NDArray 5 @cpu(0)>

构建复杂的神经网络

In [3]:
net = nn.Sequential()
with net.name_scope():
    net.add(nn.Dense(128))
    net.add(nn.Dense(64))
    net.add(CenteredLayer())

net.initialize()
y = net(nd.random_uniform(shape=(4, 8)))
# 应该为0，但是一般为一个很接近0的小数
y.mean()


[-3.203695e-10]
<NDArray 1 @cpu(0)>

## 带有模型参数的自定义层

我们之前访问`Dense`权重的时候是通过`dense.weight.data()`，这里的`weight`是一个`Parameter`的类型。我们可以显示构造。

这里构建一个`3*3`大小的参数取名`exciting_parameter_yay`。然后默认初始化，打印结果

In [4]:
from mxnet import gluon
my_param = gluon.Parameter("exciting_parameter_yay", shape=(3, 3))

In [5]:
my_param.initialize()
(my_param.data(), my_param.grad())

(
 [[-0.02548236  0.05326662 -0.01200318]
  [ 0.05855297 -0.06101935 -0.0396449 ]
  [ 0.0269461   0.00912645  0.0093242 ]]
 <NDArray 3x3 @cpu(0)>, 
 [[0. 0. 0.]
  [0. 0. 0.]
  [0. 0. 0.]]
 <NDArray 3x3 @cpu(0)>)

在自定义层的时候我们还可以使用`Block`自带的`ParameterDict`类型的成员变量`params`。顾名思义，这是一个由字符串类型的参数名字映射到`Parameter`类型的模型参数的字典。我们可以通过`get`函数从`ParameterDict`创建`Parameter`。

In [6]:
pd = gluon.ParameterDict(prefix='block1_')
pd.get('exciting_parameter_yay', shape=(3, 3))
pd

block1_ (
  Parameter block1_exciting_parameter_yay (shape=(3, 3), dtype=<type 'numpy.float32'>)
)

In [9]:
class MyDense(nn.Block):
    def __init__(self, uints, in_uints, **kwargs):
        super(MyDense, self).__init__(**kwargs)
        with self.name_scope():
            self.weight = self.params.get(
                'weight', shape=(in_uints, uints))
            self.bias = self.params.get('bias', shape=(uints,))
    def forward(self, x):
        linear = nd.dot(x, self.weight.data()) + self.bias.data()
        return nd.relu(linear)

In [10]:
dense = MyDense(5, in_uints=10, prefix='o_my_dense_')
dense.params

o_my_dense_ (
  Parameter o_my_dense_weight (shape=(10, 5), dtype=<type 'numpy.float32'>)
  Parameter o_my_dense_bias (shape=(5,), dtype=<type 'numpy.float32'>)
)

In [11]:
dense.initialize()
dense(nd.random_uniform(shape=(2, 10)))


[[0.         0.         0.03019281 0.09594411 0.13613266]
 [0.         0.         0.00460231 0.10275272 0.15692511]]
<NDArray 2x5 @cpu(0)>

我们构造的层和gluon构造的层使用起来没有什么区别

In [12]:
net = nn.Sequential()
with net.name_scope():
    net.add(MyDense(32, in_uints=64))
    net.add(MyDense(2, in_uints=32))
net.initialize()
net(nd.random_uniform(shape=(2, 64)))


[[0.         0.04586763]
 [0.         0.05547486]]
<NDArray 2x2 @cpu(0)>

如果我们使用自定义层，需要指出输入的大小