【Hackathon4 No.39】为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能 #496

zeroRains · 2023-03-31T12:40:27Z

为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能
任务：PaddlePaddle/Paddle#50657 (comment)

paddle-bot · 2023-03-31T12:40:32Z

你的PR提交成功，感谢你对开源项目的贡献!
请检查PR提交格式和内容是否完备，具体请参考示例和模版。
Your PR has been submitted. Thanks for your contribution!
Please check its format and content. For this, you can refer to Template and Demo.

zeroRains · 2023-04-18T02:48:34Z

呜呜呜，老师这个也抽空看看吧，已经三周了，(:з」∠) @JamesLim-sy

zeroRains · 2023-04-26T01:15:06Z

麻烦老师抽空看看吧， @JamesLim-sy

JamesLim-sy · 2023-04-27T05:51:40Z

rfcs/OPs-Perf/20230331_p_norm_grad_op_optimization.md

+
+## 2.1 关键模块与性能提升点
+
+`p_norm_grad`算子的性能瓶颈在于Eigen实现了整个计算过程，在查阅了相关源码之后，确定可以使用`ElementWiseKernel`和`BroadcastKernel`对Eigen的实现进行替换，并结合一些计算融合的方法，减少`Kernel`的调用，提高`p_norm_grad`算子在GPU的计算性能。


Ele和Bc确实能够提升OP的整体性能，那是否可以实现单个Kernel解决全部问题的方案

额，这个方案不可行么，那我研究研究融合进一个kernel的方法

add 20230331_p_norm_grad_op_optimization.md

3d6551a

paddle-bot bot added contributor status: proposed labels Mar 31, 2023

fix the formula

d17cbdf

zeroRains mentioned this pull request Mar 31, 2023

【PaddlePaddle Hackathon 第四期】任务总览 PaddlePaddle/Paddle#51281

Closed

correct typos

3415df6

luotao1 assigned luotao1, Ligoml and JamesLim-sy Apr 4, 2023

JamesLim-sy reviewed Apr 27, 2023

View reviewed changes

Ligoml removed the status: proposed label Aug 29, 2023

luotao1 closed this Oct 19, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【Hackathon4 No.39】为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能 #496

【Hackathon4 No.39】为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能 #496

zeroRains commented Mar 31, 2023

paddle-bot bot commented Mar 31, 2023

zeroRains commented Apr 18, 2023

zeroRains commented Apr 26, 2023

JamesLim-sy Apr 27, 2023

zeroRains Apr 28, 2023


		## 2.1 关键模块与性能提升点

		`p_norm_grad`算子的性能瓶颈在于Eigen实现了整个计算过程，在查阅了相关源码之后，确定可以使用`ElementWiseKernel`和`BroadcastKernel`对Eigen的实现进行替换，并结合一些计算融合的方法，减少`Kernel`的调用，提高`p_norm_grad`算子在GPU的计算性能。

【Hackathon4 No.39】为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能 #496

【Hackathon4 No.39】为 Paddle 优化 p_norm_grad op 在 GPU 上的计算性能 #496

Conversation

zeroRains commented Mar 31, 2023

paddle-bot bot commented Mar 31, 2023

zeroRains commented Apr 18, 2023

zeroRains commented Apr 26, 2023

JamesLim-sy Apr 27, 2023

Choose a reason for hiding this comment

zeroRains Apr 28, 2023

Choose a reason for hiding this comment