模型参数

模型参数为模型中的 weight 和 bias 统称，在 fluid 中对应 fluid.Parameter 类，继承自 fluid.Variable，是一种可持久化的 variable。模型的训练就是不断学习更新模型参数的过程。模型参数相关的属性可以通过 cn_api_fluid_ParamAttr 来配置，可配置内容有：

初始化方式
正则化
梯度剪切
模型平均

初始化方式

fluid 通过设置 ParamAttr 的 initializer 属性为单个 parameter 设置初始化方式。示例如下：

param_attrs = fluid.ParamAttr(name="fc_weight",
                          initializer=fluid.initializer.ConstantInitializer(1.0))
y_predict = fluid.layers.fc(input=x, size=10, param_attr=param_attrs)

以下为 fluid 支持的初始化方式：

1. BilinearInitializer

线性初始化方法。用该方法初始化的反卷积操作可当做线性插值操作使用。

可用别名：Bilinear

API 请参考：cn_api_fluid_initializer_BilinearInitializer

2. ConstantInitializer

常数初始化方式，将 parameter 初始化为指定的数值。

可用别名：Constant

API 请参考：cn_api_fluid_initializer_ConstantInitializer

3. MSRAInitializer

该初始化方法参考论文: https://arxiv.org/abs/1502.01852

可用别名：MSRA

API 请参考：cn_api_fluid_initializer_MSRAInitializer

4. NormalInitializer

随机高斯分布初始化方法。

可用别名：Normal

API 请参考：cn_api_fluid_initializer_NormalInitializer

5. TruncatedNormalInitializer

随机截断高斯分布初始化方法。

可用别名：TruncatedNormal

API 请参考：cn_api_fluid_initializer_TruncatedNormalInitializer

6. UniformInitializer --------------------

随机均匀分布初始化方式。

可用别名：Uniform

API 请参考：cn_api_fluid_initializer_UniformInitializer

7. XavierInitializer

该初始化方式参考论文: http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf

可用别名：Xavier

API 请参考：cn_api_fluid_initializer_XavierInitializer

正则化方式

fluid 通过设置 ParamAttr 的 regularizer 属性为单个 parameter 设置正则化。

param_attrs = fluid.ParamAttr(name="fc_weight",
                          regularizer=fluid.regularizer.L1DecayRegularizer(0.1))
y_predict = fluid.layers.fc(input=x, size=10, param_attr=param_attrs)

以下为 fluid 支持的正则化方式：

cn_api_fluid_regularizer_L1DecayRegularizer (别名：L1Decay)
cn_api_fluid_regularizer_L2DecayRegularizer (别名：L2Decay)

Clipping

fluid 通过设置 ParamAttr 的 gradient_clip 属性为单个 parameter 设置 clipping 方式。

param_attrs = fluid.ParamAttr(name="fc_weight",
                          regularizer=fluid.regularizer.L1DecayRegularizer(0.1))
y_predict = fluid.layers.fc(input=x, size=10, param_attr=param_attrs)

以下为 fluid 支持的 clipping 方式：

1. ErrorClipByValue

用来将一个 tensor 的值 clipping 到指定范围。

API 请参考：cn_api_fluid_clip_ErrorClipByValue

2. GradientClipByGlobalNorm

用来将多个 Tensor 的 global-norm 限制在 clip_norm 以内。

API 请参考：cn_api_fluid_clip_GradientClipByGlobalNorm

3. GradientClipByNorm

将 Tensor 的 l2-norm 限制在 max_norm 以内。如果 Tensor 的 l2-norm 超过了 max_norm ，会将计算出一个 scale ，该 Tensor 的所有值乘上计算出来的 scale .

API 请参考：cn_api_fluid_clip_GradientClipByNorm

4. GradientClipByValue

将 parameter 对应的 gradient 的值限制在[min, max]范围内。

API 请参考：cn_api_fluid_clip_GradientClipByValue

模型平均

fluid 通过 ParamAttr 的 do_model_average 属性设置单个 parameter 是否进行平均优化。示例如下：

param_attrs = fluid.ParamAttr(name="fc_weight",
                          do_model_average=true)
y_predict = fluid.layers.fc(input=x, size=10, param_attr=param_attrs)

在 miniBatch 训练过程中，每个 batch 过后，都会更新一次 parameters，模型平均做的就是平均最近 k 次更新产生的 parameters。

平均后的 parameters 只是被用来进行测试和预测，其并不参与实际的训练过程。

具体 API 请参考：cn_api_fluid_optimizer_ModelAverage

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

parameter.rst

parameter.rst

模型参数

初始化方式

1. BilinearInitializer

2. ConstantInitializer

3. MSRAInitializer

4. NormalInitializer

5. TruncatedNormalInitializer

7. XavierInitializer

正则化方式

Clipping

1. ErrorClipByValue

2. GradientClipByGlobalNorm

3. GradientClipByNorm

4. GradientClipByValue

模型平均

Files

parameter.rst

Latest commit

History

parameter.rst

File metadata and controls

模型参数

初始化方式

1. BilinearInitializer

2. ConstantInitializer

3. MSRAInitializer

4. NormalInitializer

5. TruncatedNormalInitializer

7. XavierInitializer

正则化方式

Clipping

1. ErrorClipByValue

2. GradientClipByGlobalNorm

3. GradientClipByNorm

4. GradientClipByValue

模型平均