Skip to content

Latest commit

 

History

History
11 lines (9 loc) · 587 Bytes

3. DDP Training Tricks.md

File metadata and controls

11 lines (9 loc) · 587 Bytes

DDP Training Tricks

1. SyncBN

支持多机多卡的 BatchNormalization

  • BN包含moving meanmoving variance 两个buffer
  • DP模式中的BN被设计为只利用主卡上的结果来计算moving meanmoving variance,进而广播给其他卡,这样实际上的batch_size就只有主卡上batch_size大小 当模型很大,batch_size很小的时候,BN操作会限制模型的性能
  • SyncBN 利用分布式进程通讯接口在各个卡间进行通讯,进而利用所有数据计算BN

2. DDP下利用Gradient Accumulation进一步加速