From 6a76ea897d297223e22affc216e6811d4dd51f1f Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Sat, 20 Sep 2025 15:48:09 +0800 Subject: [PATCH 1/6] fix doc bugs lu_solve_cn --- docs/api/paddle/linalg/lu_solve_cn.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/api/paddle/linalg/lu_solve_cn.rst b/docs/api/paddle/linalg/lu_solve_cn.rst index 5419c168ecf..0ed1af8eb79 100644 --- a/docs/api/paddle/linalg/lu_solve_cn.rst +++ b/docs/api/paddle/linalg/lu_solve_cn.rst @@ -43,4 +43,4 @@ lu_solve 代码示例 :::::::::: -COPY-FROM: paddle.linalg.lu_solve +COPY-FROM: paddle.tensor.linalg.lu_solve From 5ccff24ce9958af7225b770f05ea065dc3e1d14b Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Sat, 20 Sep 2025 18:35:31 +0800 Subject: [PATCH 2/6] chore: trigger CI From 0fb8c893d7edfe476cb7be0eb44b8afe35955550 Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Sun, 21 Sep 2025 13:57:41 +0800 Subject: [PATCH 3/6] fix doc BuildStrategy_cn --- docs/api/paddle/static/BuildStrategy_cn.rst | 100 +++++++++++++++++++- 1 file changed, 97 insertions(+), 3 deletions(-) diff --git a/docs/api/paddle/static/BuildStrategy_cn.rst b/docs/api/paddle/static/BuildStrategy_cn.rst index f519a0a494a..f566de324b0 100644 --- a/docs/api/paddle/static/BuildStrategy_cn.rst +++ b/docs/api/paddle/static/BuildStrategy_cn.rst @@ -18,6 +18,15 @@ COPY-FROM: paddle.static.BuildStrategy 属性 :::::::::::: +build_cinn_pass +''''''''' + +str 类型。表示是否将计算图中的一些算子降级(lowering)为 CINN 算子来执行,这可以加速执行过程。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.build_cinn_pass + debug_graphviz_path ''''''''' @@ -28,14 +37,41 @@ str 类型。表示以 graphviz 格式向文件中写入计算图的路径,有 COPY-FROM: paddle.static.BuildStrategy.debug_graphviz_path -enable_sequential_execution +enable_auto_fusion +''''''''' + +bool 类型。是否将子图(subgraph)融合成一个融合组(fusion_group)。目前我们仅支持融合由逐元素类(elementwise-like)算子组成的子图,例如无广播(broadcast)机制的 elementwise_add/mul 以及激活函数(activations)。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.enable_auto_fusion + +fuse_adamw +''''''''' + +bool 类型。表示是否将所有的 adamw 优化器与 multi_tensor_adam 进行融合,该操作可能会提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fuse_adamw + +fuse_bn_act_ops +''''''''' + +bool 类型。表示是否融合批量归一化(batch_norm)和激活算子(activation_op),该操作可提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fuse_bn_act_ops + +fuse_bn_add_act_ops ''''''''' -bool 类型。如果设置为 True,则算子的执行顺序将与算子定义的执行顺序相同。默认为 False。 +bool 类型。表示是否融合批量归一化(batch_norm)、逐元素加法(elementwise_add)和激活算子(activation_op),该操作可提升执行速度。默认值为 True。 **代码示例** -COPY-FROM: paddle.static.BuildStrategy.enable_sequential_execution +COPY-FROM: paddle.static.BuildStrategy.fuse_bn_add_act_ops fuse_broadcast_ops ''''''''' @@ -46,6 +82,15 @@ bool 类型。表明是否融合(fuse) broadcast ops。该选项指在 Reduce COPY-FROM: paddle.static.BuildStrategy.fuse_broadcast_ops +fuse_dot_product_attention +''''''''' + +bool 类型。表示是否融合点积注意力(dot product attention),该操作可以提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fuse_dot_product_attention + fuse_elewise_add_act_ops ''''''''' @@ -55,6 +100,15 @@ bool 类型。表明是否融合(fuse) elementwise_add_op 和 activation_op。 COPY-FROM: paddle.static.BuildStrategy.fuse_elewise_add_act_ops +fuse_gemm_epilogue +''''''''' + +bool 类型。表示是否融合矩阵乘法算子(matmul_op)、逐元素加法算子(elementwise_add_op)和激活算子(activation_op),该操作可提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fuse_gemm_epilogue + fuse_relu_depthwise_conv ''''''''' @@ -64,11 +118,42 @@ bool 类型。表明是否融合(fuse) relu 和 depthwise_conv2d,节省 GPU COPY-FROM: paddle.static.BuildStrategy.fuse_relu_depthwise_conv +fuse_resunit +''''''''' + +bool 类型。默认为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fuse_resunit + +fused_attention +''''''''' + +bool 类型。表示是否将整个多头注意力(multi-head attention)部分融合成一个算子(op),该操作可提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fused_attention + +fused_feedforward +''''''''' + +bool 类型。表示是否将整个前馈网络(feed_forward)部分融合成一个算子(op),该操作可提升执行速度。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.fused_feedforward + memory_optimize ''''''''' bool 类型或 None。设为 True 时可用于减少总内存消耗,False 表示不使用,None 表示框架会自动选择使用或者不使用优化策略。当前,None 意味着当 GC 不能使用时,优化策略将被使用。默认为 None。 +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.memory_optimize + reduce_strategy ''''''''' @@ -79,6 +164,15 @@ reduce_strategy COPY-FROM: paddle.static.BuildStrategy.reduce_strategy +sequential_run +''''''''' + +bool 类型。该参数用于控制 StandaloneExecutor 是否按照 ProgramDesc 中定义的顺序来执行算子(ops)。默认值为 False。 + +**代码示例** + +COPY-FROM: paddle.static.BuildStrategy.sequential_run + sync_batch_norm ''''''''' From 8ad66cc3c72228a4fa0bc3c79daf8ecbc69adaf8 Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Mon, 22 Sep 2025 18:56:34 +0800 Subject: [PATCH 4/6] Revert "fix doc bugs lu_solve_cn" This reverts commit 6a76ea897d297223e22affc216e6811d4dd51f1f. --- docs/api/paddle/linalg/lu_solve_cn.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/api/paddle/linalg/lu_solve_cn.rst b/docs/api/paddle/linalg/lu_solve_cn.rst index 0ed1af8eb79..5419c168ecf 100644 --- a/docs/api/paddle/linalg/lu_solve_cn.rst +++ b/docs/api/paddle/linalg/lu_solve_cn.rst @@ -43,4 +43,4 @@ lu_solve 代码示例 :::::::::: -COPY-FROM: paddle.tensor.linalg.lu_solve +COPY-FROM: paddle.linalg.lu_solve From f005cdc583b863ecdfd4e9edb1c86fe963828057 Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Mon, 22 Sep 2025 22:57:29 +0800 Subject: [PATCH 5/6] fix doc BuildStrategy_cn format --- docs/api/paddle/static/BuildStrategy_cn.rst | 3 +-- 1 file changed, 1 insertion(+), 2 deletions(-) diff --git a/docs/api/paddle/static/BuildStrategy_cn.rst b/docs/api/paddle/static/BuildStrategy_cn.rst index 321321da2ee..415c8c00754 100644 --- a/docs/api/paddle/static/BuildStrategy_cn.rst +++ b/docs/api/paddle/static/BuildStrategy_cn.rst @@ -157,8 +157,7 @@ COPY-FROM: paddle.static.BuildStrategy.memory_optimize reduce_strategy ''''''''' - ``static.BuildStrategy.ReduceStrategy`` 类型。在 ``ParallelExecutor`` 中,存在两种参数梯度聚合策略,即 ``AllReduce`` 和 ``Reduce`` 。如果用户需要在所有执行设备上独立地进行参数更新,可以使用 ``AllReduce`` 。如果使用 ``Reduce`` 策略,所有参数的优化将均匀地分配给不同的执行设备,随之将优化后的参数广播给其他执行设备。 -默认值为 ``AllReduce`` 。 +``static.BuildStrategy.ReduceStrategy`` 类型。在 ``ParallelExecutor`` 中,存在两种参数梯度聚合策略,即 ``AllReduce`` 和 ``Reduce`` 。如果用户需要在所有执行设备上独立地进行参数更新,可以使用 ``AllReduce`` 。如果使用 ``Reduce`` 策略,所有参数的优化将均匀地分配给不同的执行设备,随之将优化后的参数广播给其他执行设备。默认值为 ``AllReduce`` 。 **代码示例** From 5c2ff085f1d54b0634505c1f22ef196ca9ad69c3 Mon Sep 17 00:00:00 2001 From: wanglezz <2655541965@qq.com> Date: Thu, 25 Sep 2025 16:43:15 +0800 Subject: [PATCH 6/6] fix doc format BuildStrategy_cn --- docs/api/paddle/static/BuildStrategy_cn.rst | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/api/paddle/static/BuildStrategy_cn.rst b/docs/api/paddle/static/BuildStrategy_cn.rst index 415c8c00754..acce8188a33 100644 --- a/docs/api/paddle/static/BuildStrategy_cn.rst +++ b/docs/api/paddle/static/BuildStrategy_cn.rst @@ -175,7 +175,7 @@ COPY-FROM: paddle.static.BuildStrategy.sequential_run sync_batch_norm ''''''''' -bool 类型。表示是否使用同步的批正则化,即在训练阶段通过多个设备同步均值和方差。当前的实现不支持 FP16 训练和 CPU。并且目前**仅支持**仅在一台机器上进行同步式批正则。默认为 False。 +bool 类型。表示是否使用同步的批正则化,即在训练阶段通过多个设备同步均值和方差。当前的实现不支持 FP16 训练和 CPU。并且目前 **仅支持** 仅在一台机器上进行同步式批正则。默认为 False。 **代码示例**