[Inference]add blha_get_max_len op & modify block_multihead_attention op #64246

ming1753 · 2024-05-13T05:45:54Z

PR Category

Inference

PR Types

New features

Description

Pcard-71500

新增算子：blha_get_max_len，输入为seq_lens_encoder、seq_lens_decoder、bsz，输出为max_enc_len_this_time、max_dec_len_this_time

使用示例：

import paddle
paddle.device.set_device('gpu')
seq_lens_encoder = paddle.cast(paddle.randn(shape=[10]), dtype=paddle.int32)
seq_lens_decoder = paddle.cast(paddle.randn(shape=[10]), dtype=paddle.int32)
bsz = 10
batch_size = paddle.ones(shape=[bsz])
max_enc_len_this_time, max_dec_len_this_time = paddle.incubate.nn.functional.blha_get_max_len(seq_lens_encoder, seq_lens_decoder, batch_size)

修改block_multihead_attention，新增两个可选参数max_enc_len_this_time和max_dec_len_this_time，在传入时不在kernel内部计算

paddle-bot · 2024-05-13T05:45:59Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

vivienfanghuagood · 2024-05-16T12:28:17Z

python/paddle/incubate/nn/functional/blha_get_max_len.py

+            >>> batch_size = paddle.ones(shape=[bsz])
+            >>> max_enc_len_this_time, max_dec_len_this_time = paddle.incubate.nn.functional.blha_get_max_len(seq_lens_encoder, seq_lens_decoder, batch_size)
+    """
+    if in_dynamic_mode():


应该in_dynamic_or_pir_mode

carryyu · 2024-05-16T12:28:50Z

谢谢，已收到！

jzhang533 · 2024-05-20T07:51:32Z

hi, running sample code in paddle.incubate.nn.functional.block_multihead_attention raised NotImplementedError in PR-CI-Static-Check.

btw: change to api no longer requires my approval since #64212 , but please feel free to assign me if you think my review helps.

ming1753 · 2024-05-20T08:47:56Z

Thanks for review. PR-CI-Static-Check raised NotImplementedError in because there is no implementation of FlashAttention on it, not PR's fault.

jzhang533 · 2024-05-20T09:05:46Z

I think we have two options:

surrounding the sample codes with doctest: +SKIP("reason"), doctest: -SKIP directives to instruct doctest skip running the sample codes.
upgrade the env of PR-CI-Static-Check.

[Inference]add blha_get_max_len op & modify block_multihead_attention op

d83c6e3

ming1753 added 8 commits May 13, 2024 07:38

modify batch_size from int attr to tensor(shape[0])

f5f05f9

fix bug

03ee47c

add test

72a5479

only gpu

81f0b15

fix bug

87e6daf

fix bug

9872864

fix doc bug

ea065b5

fix bug

642ab05

carryyu previously approved these changes May 16, 2024

View reviewed changes

vivienfanghuagood reviewed May 16, 2024

View reviewed changes

fix bug

16840b1

ming1753 dismissed carryyu’s stale review via 16840b1 May 16, 2024 12:55

ming1753 assigned jzhang533 May 17, 2024

ronny1996 mentioned this pull request May 20, 2024

[NPU] add blha_get_max_len PaddlePaddle/PaddleCustomDevice#1246

Merged

qingqing01 approved these changes May 21, 2024

View reviewed changes

wanghuancoder approved these changes May 21, 2024

View reviewed changes

ming1753 merged commit 669a261 into PaddlePaddle:develop May 21, 2024
31 checks passed

ming1753 mentioned this pull request May 21, 2024

modify block_multihead_attention api PaddlePaddle/PaddleNLP#8456

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Inference]add blha_get_max_len op & modify block_multihead_attention op #64246

[Inference]add blha_get_max_len op & modify block_multihead_attention op #64246

ming1753 commented May 13, 2024 •

edited

paddle-bot bot commented May 13, 2024

vivienfanghuagood May 16, 2024

ming1753 May 16, 2024

carryyu commented May 16, 2024 via email

jzhang533 commented May 20, 2024

ming1753 commented May 20, 2024

jzhang533 commented May 20, 2024

[Inference]add blha_get_max_len op & modify block_multihead_attention op #64246

[Inference]add blha_get_max_len op & modify block_multihead_attention op #64246

Conversation

ming1753 commented May 13, 2024 • edited

PR Category

PR Types

Description

paddle-bot bot commented May 13, 2024

vivienfanghuagood May 16, 2024

Choose a reason for hiding this comment

ming1753 May 16, 2024

Choose a reason for hiding this comment

carryyu commented May 16, 2024 via email

jzhang533 commented May 20, 2024

ming1753 commented May 20, 2024

jzhang533 commented May 20, 2024

ming1753 commented May 13, 2024 •

edited