【paddle.fleet】fleet support non_distributed training in dygraph mode #27714

danleifeng · 2020-09-29T07:51:18Z

New features

APIs

fleet support non_distributed training in dygraph mode

after this PR, we can use python train.py to launch single_card dygraph training.

paddle-bot-old · 2020-09-29T07:51:26Z

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

… dygraph_fleet_single

gavin1332 · 2020-09-30T03:05:04Z

多机回退有一个要素是：单卡和多卡共享一套代码，但是上述代码的改动仅涉及单卡程序支持多卡的fleet初始化，还没有完全实现单卡代码和多卡代码的对齐，比如apply_collective_gradient和scale_loss的调用在样例代码里单卡和多卡不一致。

danleifeng · 2020-09-30T03:12:50Z

多机回退有一个要素是：单卡和多卡共享一套代码，但是上述代码的改动仅涉及单卡程序支持多卡的fleet初始化，还没有完全实现单卡代码和多卡代码的对齐，比如apply_collective_gradient和scale_loss的调用在样例代码里单卡和多卡不一致。

apply_collective_gradient and scale_loss apis have been removed yesterday.
PR: #27603

gavin1332

LGTM

fleet support non_distributed training in dygraph mode; test=develop

e516bda

danleifeng added 2 commits September 29, 2020 07:52

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

33e9d6b

… dygraph_fleet_single

fleet support non_distributed training in dygraph mode; test=develop

4a9a2d5

gavin1332 approved these changes Sep 30, 2020

View reviewed changes

danleifeng requested a review from kolinwei September 30, 2020 03:22

kolinwei approved these changes Sep 30, 2020

View reviewed changes

danleifeng merged commit a01bc6b into PaddlePaddle:develop Sep 30, 2020

Provide feedback