[amp] refine transformer fp16 train #1574

zhangbo9674 · 2022-01-10T05:21:18Z

PR types

Performance optimization

PR changes

Models

Description

优化transformer动态图fp16速度

1、优化点：

Adam优化器使用multi_tensor策略
clear_grad使用set_to_zero=False策略
dataloader num_workers支持>0 ：--num_workers
优化一些代码调用顺序

2、性能测试：

…nto dev/transformer_opt

FrostML · 2022-01-10T09:45:33Z

examples/machine_translation/transformer/train.py

-                scaler = paddle.amp.GradScaler(
-                    init_loss_scaling=args.scale_loss)
-                with paddle.amp.auto_cast():
+                with paddle.amp.auto_cast(custom_black_list={'scale', 'reduce_sum', 'elementwise_div'} if amp_level=='O2' else {}, level=amp_level):


run pre-commit.

FrostML · 2022-01-11T03:23:26Z

examples/machine_translation/transformer/train.py

@@ -71,6 +72,11 @@ def parse_args():
        default=None,
        type=str,
        help="The eos token. It should be provided when use custom vocab_file. ")
+    parser.add_argument(


若使用 arg parser 的方式新增 --num_workers，注意还需要在：

tests/transformer/train.py

examples/machine_translation/transformer/predict.py

examples/machine_translation/transformer/static/train.py

examples/machine_translation/transformer/static/predict.py

examples/machine_translation/transformer/deploy/python/inference.py

examples/machine_translation/transformer/faster_transformer/encoder_decoding_predict.py

也需要补充下。

或是加在 yaml 文件：

examples/machine_translation/transformer/configs/transformer.base.yaml

examples/machine_translation/transformer/configs/transformer.big.yaml
28 行，Args for reader 的位置。

FrostML

LGTM

zhangbo9674 added 4 commits January 10, 2022 05:18

refine fp16 train

dd3aea0

refine clear_grad

f9997b1

refine code

79b66e8

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

59196e2

…nto dev/transformer_opt

FrostML reviewed Jan 10, 2022

View reviewed changes

add num_workers

403d9e2

FrostML reviewed Jan 11, 2022

View reviewed changes

refine numwork

c8650cf

FrostML approved these changes Jan 11, 2022

View reviewed changes

FrostML added 3 commits January 11, 2022 13:03

Merge branch 'develop' into dev/transformer_opt

3d3dbf8

Merge branch 'develop' into dev/transformer_opt

35254d6

Merge branch 'develop' into dev/transformer_opt

cce3412

FrostML merged commit 1e4975d into PaddlePaddle:develop Jan 12, 2022

This was referenced Jan 25, 2022

Fix Transformer amp (Fix #1574) #1635

Merged

PaddleNLP 2.2.4 Release Note Candidate #1614

Closed

FrostML added a commit that referenced this pull request Jan 25, 2022

Fix Transformer amp (Fix #1574) (#1635)

2455ec2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[amp] refine transformer fp16 train #1574

[amp] refine transformer fp16 train #1574

zhangbo9674 commented Jan 10, 2022 •

edited

Loading

FrostML Jan 10, 2022

zhangbo9674 Jan 10, 2022

FrostML Jan 11, 2022

zhangbo9674 Jan 11, 2022

FrostML left a comment

[amp] refine transformer fp16 train #1574

[amp] refine transformer fp16 train #1574

Conversation

zhangbo9674 commented Jan 10, 2022 • edited Loading

PR types

PR changes

Description

FrostML Jan 10, 2022

Choose a reason for hiding this comment

zhangbo9674 Jan 10, 2022

Choose a reason for hiding this comment

FrostML Jan 11, 2022

Choose a reason for hiding this comment

zhangbo9674 Jan 11, 2022

Choose a reason for hiding this comment

FrostML left a comment

Choose a reason for hiding this comment

zhangbo9674 commented Jan 10, 2022 •

edited

Loading