[CUDA][ADD] add logsoftmax operator & unittest #1728

sjfeng1999 · 2022-07-17T05:37:01Z

1.实现logsoftmax的cuda kernel和添加对应的trt plugin layer
2.添加logsoftmax算子在DEVICE_CUDA的单测

Signed-off-by: sjfeng1999 <j514681085@icloud.com>

source/tnn/network/tensorrt/layer_builder/log_softmax_layer_builder.cc

Signed-off-by: sjfeng1999 <j514681085@icloud.com>

sjfeng1999 · 2022-07-19T07:42:18Z

@Maosquerade 把logsoftmax拆分成了softmax layer和unarg layer

* master: (59 commits) [CUDA][ADD] add logsoftmax operator & unittest (#1728) return error when mat.data_ == nullptr (#1733) [METAL] fix metal binary op (#1729) [BUG]fix reduce op convert with wrong axes (#1724) Hotfix m1 build (#1715) [DRQ][BUG]1. fix bug for max_values; (#1716) [UPD]update merge logic for swish groupnorm deconv (#1708) [BUG]fix coreml error of slicev2、padv2 and matmul; (#1703) [iOS][UPD]1. add missing file for xcode project; (#1705) [mac] 1. FIX X86 and ARM conflict; 2. ADD ARM arch on intel cpu (You can use ARM if rosetta-X86 crash). 3. Use ios project build/profile M1-Mac. (#1700) [METAL] fix stride slice crach when dims is 2 (#1701) Fix windows x86 build (#1697) Optimize dynamic range quantize (#1699) [FIX] fix compile macos framework (#1687) [UPD][DRQ] support quantizing matmul's const weight (#1698) Dev metal ngray (#1693) [UPD][TOOLS] 1.increase subs_length 2.align model support bool and int32 input 3. fix gather and onehot convert 4. gather_nd support indices_shape[-1] < r (#1686) avoid nullptr in IsSupport (#1685) [ARM] fix arm cross compile error caused by float-abi (#1678) Dev x86 layer adapter (#1683) ... # Conflicts: # platforms/ios/tnn.xcodeproj/project.pbxproj # source/tnn/device/x86/CMakeLists.txt

* add logsoftmax kernel and trt layer builder Signed-off-by: sjfeng1999 <j514681085@icloud.com> * add logsoftmax unittest Signed-off-by: sjfeng1999 <j514681085@icloud.com> * [CUDA][TRT] unpack logsoftmaxPlugin to SoftmaxLayer and UnargLayer Signed-off-by: sjfeng1999 <j514681085@icloud.com>

sjfeng1999 added 2 commits July 15, 2022 21:21

add logsoftmax kernel and trt layer builder

2e00247

Signed-off-by: sjfeng1999 <j514681085@icloud.com>

add logsoftmax unittest

54eeae0

Signed-off-by: sjfeng1999 <j514681085@icloud.com>

darrenyao87 requested a review from Maosquerade July 18, 2022 12:39

Maosquerade reviewed Jul 19, 2022

View reviewed changes

source/tnn/network/tensorrt/layer_builder/log_softmax_layer_builder.cc Show resolved Hide resolved

sjfeng1999 added 2 commits July 19, 2022 15:38

[CUDA][TRT] unpack logsoftmaxPlugin to SoftmaxLayer and UnargLayer

63dc358

Signed-off-by: sjfeng1999 <j514681085@icloud.com>

Merge branch 'master' into master

ea7c9e5

Maosquerade approved these changes Jul 19, 2022

View reviewed changes

Merge branch 'master' into master

a670afb

Maosquerade merged commit 6253ce4 into Tencent:master Jul 19, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[CUDA][ADD] add logsoftmax operator & unittest #1728

[CUDA][ADD] add logsoftmax operator & unittest #1728

sjfeng1999 commented Jul 17, 2022

sjfeng1999 commented Jul 19, 2022

[CUDA][ADD] add logsoftmax operator & unittest #1728

[CUDA][ADD] add logsoftmax operator & unittest #1728

Conversation

sjfeng1999 commented Jul 17, 2022

sjfeng1999 commented Jul 19, 2022