MXNET_GPU_MEM_POOL_TYPE=Round python --dataset WMT2014BPE --src_lang en --tgt_lang de --batch_size 2700 --optimizer adam --num_accumulated 16 --lr 3.0 --warmup_steps 4000 --save_dir transformer_en_de_u512 --epochs 60 --gpus 0,1,2,3,4,5,6,7 --scaled --average_start 15 --num_buckets 20 --bucket_scheme exp --bleu 13a —log_interval 10