为Keras实现梯度累积版优化器

特点

继承Optimizer类，包装原有优化器，实现梯度累积功能。能够无缝对接原有优化器，不需要重写优化器。

如下例子等价于直接使用batch_size=100的Adam优化器（代价就是你跑了10个epoch，实际上只相当于batch_size=100跑了1个epoch）：

opt = AccumOptimizer(Adam(), 10) # 10是累积步数
model.compile(loss='mse', optimizer=opt)
model.fit(x_train, y_train, epochs=10, batch_size=10)

读者也可以直接跑一跑mnist_mlp_example.py。

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
README.md		README.md
README_en.md		README_en.md
accum_optimizer.py		accum_optimizer.py
mnist_mlp_example.py		mnist_mlp_example.py