# EMA

在 TensorFlow 中提供了 `tf.train.ExponentialMovingAverage` 来实现滑动平均模型，在采用随机梯度下降算法训练神经网络时，使用其可以提高模型在测试数据上的健壮性（robustness)。

TensorFlow 下的 `tf.train.ExponentialMovingAverage` 需要提供一个衰减率 
decay。该衰减率用于控制模型更新的速度。

In [7]:
import tensorflow as tf

## 定义变量及滑动平均类

In [14]:
v1 = tf.Variable(0, dtype=tf.float32)
step = tf.Variable(0, trainable=False)

## 查看不同迭代中变量取值的变化。

In [24]:
def test_ema(decay):
    ema = tf.train.ExponentialMovingAverage(decay, step)
    maintain_averages_op = ema.apply([v1])
    with tf.Session() as sess:

        # 初始化
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        print(sess.run([v1, ema.average(v1)]))

        # 更新变量v1的取值
        sess.run(tf.assign(v1, 5))
        sess.run(maintain_averages_op)
        print(sess.run([v1, ema.average(v1)]))

        # 更新step和v1的取值
        sess.run(tf.assign(step, 10000))  
        sess.run(tf.assign(v1, 10))
        sess.run(maintain_averages_op)
        print(sess.run([v1, ema.average(v1)]))

        # 更新一次v1的滑动平均值
        sess.run(maintain_averages_op)
        print(sess.run([v1, ema.average(v1)]))

In [25]:
test_ema(0.99)

[0.0, 0.0]
[5.0, 4.5]
[10.0, 4.555]
[10.0, 4.60945]


In [26]:
test_ema(0.5)

[0.0, 0.0]
[5.0, 4.5]
[10.0, 7.25]
[10.0, 8.625]


In [27]:
test_ema(0.1)

[0.0, 0.0]
[5.0, 4.5]
[10.0, 9.45]
[10.0, 9.945]


## 总结

decay 决定了模型更新的速度，越大越趋于稳定