Skip to content

Latest commit

 

History

History
47 lines (28 loc) · 1.73 KB

MSRAInitializer_cn.rst

File metadata and controls

47 lines (28 loc) · 1.73 KB

MSRAInitializer

该接口实现MSRA方式的权重初始化(a.k.a. Kaiming初始化)

该接口为权重初始化函数,方法来自Kaiming He,Xiangyu Zhang,Shaoqing Ren 和 Jian Sun所写的论文:Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification 。这是一个鲁棒性特别强的初始化方法,并且适应了非线性激活函数(rectifier nonlinearities)。 可以选择使用均匀分布或者正态分布初始化权重; 在均匀分布中,范围为[-x,x],其中:

$$x = gain \times \sqrt{\frac{3}{fan\_in}}$$

在正态分布中,均值为0,标准差为:

$$\frac{gain}{\sqrt{{fan\_in}}}$$

参数

  • uniform (bool,可选) - 为 True 表示使用均匀分布,为 False 表示使用正态分布。
  • fan_in (float16|float32,可选) - 可训练的 Tensor 的 in_features 值。如果设置为 None,程序会自动计算该值。如果你不想使用 in_features,你可以自己设置这个值。默认值为 None。
  • seed (int32,可选) - 随机种子。
  • negative_slope (float,可选) - 只适用于使用leaky_relu作为激活函数时的negative_slope参数。默认值为 0.0
  • nonlinearity (str,可选) - 非线性激活函数。默认值为relu。

返回

对象

Note

在大多数情况下推荐设置 fan_in 为 None。

代码示例

COPY-FROM: paddle.fluid.initializer.MSRAInitializer