Dev scalar op #5778

MARD1NO · 2021-08-07T03:13:38Z

增加logical scalar系列op

并去除原始实现中不必要的Tensor构造

oneflow/user/ops/scalar_logical_op.cpp

oneflow/core/functional/functional_api.yaml

oneflow/user/ops/scalar_logical_op.cpp

oneflow/user/kernels/scalar_logical_kernels.cpp

oneflow/user/kernels/scalar_logical_kernels.h

Ldpe2G · 2021-08-08T08:50:20Z

oneflow/user/kernels/scalar_logical_kernels.h

+      .SetIsMatchedHob(                                                                          \
+          (user_op::HobDeviceTag() == device)                                                    \
+          & (user_op::HobDataType("in", 0) == GetDataType<input_dtype>::value));
+


下面这些宏，还可以再合并一下，参考

oneflow/oneflow/user/ops/math_binary_broadcast_seq.h

Line 33 in 00b43eb

#define MATH_BINARY_BROADCAST_LOGICAL_FUNC_SEQ \

oneflow/oneflow/user/kernels/math_binary_broadcast_kernels.cpp

Line 68 in 120a7f8

#define REGISTER_MATH_BINARY_BROADCAST_LOGICAL_KERNEL(math_type_pair, device, data_type_pair) \

我觉得用这些宏，观感太不清晰了。

hjchen2

后向算子也要支持一下

oneflow/user/kernels/scalar_logical_kernels.h

MARD1NO · 2021-08-08T10:59:18Z

后向算子也要支持一下

logical算子我们和pytorch都没有后向

github-actions · 2021-08-15T00:29:12Z

CI failed, removing label automerge

github-actions · 2021-08-15T02:27:52Z

CI failed, removing label automerge

…into dev_scalar_op

github-actions · 2021-08-15T04:02:37Z

Speed stats:

GPU Name: GeForce GTX 1080 

PyTorch resnet50 time: 140.6ms (= 7029.9ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 128.1ms (= 6404.7ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
Relative speed: 1.10 (= 140.6ms / 128.1ms)

PyTorch resnet50 time: 84.1ms (= 4206.4ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 74.6ms (= 3727.6ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
Relative speed: 1.13 (= 84.1ms / 74.6ms)

PyTorch resnet50 time: 58.1ms (= 2906.2ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 48.2ms (= 2411.5ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
Relative speed: 1.21 (= 58.1ms / 48.2ms)

PyTorch resnet50 time: 49.5ms (= 2472.8ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 42.3ms (= 2117.3ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
Relative speed: 1.17 (= 49.5ms / 42.3ms)

PyTorch resnet50 time: 45.4ms (= 2271.1ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 42.4ms (= 2121.8ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
Relative speed: 1.07 (= 45.4ms / 42.4ms)

github-actions · 2021-08-15T04:33:56Z

Speed stats:

GPU Name: GeForce GTX 1080 

PyTorch resnet50 time: 138.1ms (= 6904.0ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 128.1ms (= 6405.6ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
Relative speed: 1.08 (= 138.1ms / 128.1ms)

PyTorch resnet50 time: 84.5ms (= 4224.9ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 74.5ms (= 3726.0ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
Relative speed: 1.13 (= 84.5ms / 74.5ms)

PyTorch resnet50 time: 56.6ms (= 2829.1ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 47.6ms (= 2380.7ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
Relative speed: 1.19 (= 56.6ms / 47.6ms)

PyTorch resnet50 time: 47.6ms (= 2382.0ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 39.8ms (= 1987.5ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
Relative speed: 1.20 (= 47.6ms / 39.8ms)

PyTorch resnet50 time: 44.4ms (= 2218.3ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 37.9ms (= 1894.0ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
Relative speed: 1.17 (= 44.4ms / 37.9ms)

chengtbf · 2021-08-15T04:42:25Z

python/oneflow/test/modules/test_module.py

-        test_case.assertEqual(m.training, True)
-        m.eval()
-        test_case.assertEqual(m.training, False)
+    # def test_nested_module(test_case):


这里为什么要都注释掉呢？

MARD1NO added 4 commits August 7, 2021 11:12

add logical scalar kernel

86c7f34

add logical scalar op register

be02f4e

add functional api yaml

7b4ad8e

modify math functor

f8a23bc

Ldpe2G reviewed Aug 7, 2021

View reviewed changes

oneflow/user/ops/scalar_logical_op.cpp Outdated Show resolved Hide resolved

MARD1NO added 12 commits August 7, 2021 13:53

fix

460348b

reuse functor

dde46ce

fix

3e1a778

modify equal

41874d9

modify greater

1f65f61

modify greater equal

72ed00d

modify less equal

7021121

modify less than

f0f6c68

add not equal

af2edb1

modify not equal

6443025

fix format

ac29ca8

remove partial sum

685982d

MARD1NO added enhancement op labels Aug 7, 2021

add newline

ce35587

MARD1NO requested a review from Ldpe2G August 7, 2021 06:22

MARD1NO and others added 2 commits August 8, 2021 10:16

Merge branch 'master' into dev_scalar_op

551aaf7

reuse base class

63a0e45

hjchen2 reviewed Aug 8, 2021

View reviewed changes

Ldpe2G reviewed Aug 8, 2021

View reviewed changes

fix bin_op to binary_op

00a2ea9

hjchen2 reviewed Aug 8, 2021

View reviewed changes

oneflow/user/kernels/scalar_logical_kernels.h Outdated Show resolved Hide resolved

MARD1NO added 2 commits August 8, 2021 19:19

modify to Scalar

5f1dd97

first restruct and anotate cuda

f9a03a8

github-actions bot removed the automerge label Aug 15, 2021

oneflow-ci-bot removed their request for review August 15, 2021 00:31

MARD1NO requested a review from oneflow-ci-bot August 15, 2021 00:39

MARD1NO and others added 2 commits August 15, 2021 09:16

skip free eager test

353fa85

Merge branch 'master' into dev_scalar_op

7f67ae4

MARD1NO requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 15, 2021 01:17

MARD1NO added the automerge label Aug 15, 2021

Merge branch 'master' into dev_scalar_op

bb2a615

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 15, 2021 01:50

github-actions bot removed the automerge label Aug 15, 2021

oneflow-ci-bot removed their request for review August 15, 2021 02:30

MARD1NO added 2 commits August 15, 2021 10:31

fix to use is not none

5679757

Merge branch 'dev_scalar_op' of https://github.com/Oneflow-Inc/oneflow …

1a51a38

…into dev_scalar_op

MARD1NO requested a review from oneflow-ci-bot August 15, 2021 02:34

MARD1NO added the automerge label Aug 15, 2021

MARD1NO and others added 2 commits August 15, 2021 11:13

merge graph test

b1ff78c

Merge branch 'master' into dev_scalar_op

4866bc3

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 15, 2021 03:13

MARD1NO requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 15, 2021 03:13

oneflow-ci-bot merged commit b2005c8 into master Aug 15, 2021

oneflow-ci-bot deleted the dev_scalar_op branch August 15, 2021 04:40

chengtbf reviewed Aug 15, 2021

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Dev scalar op #5778

Dev scalar op #5778

MARD1NO commented Aug 7, 2021 •

edited

Ldpe2G Aug 8, 2021

MARD1NO Aug 8, 2021

hjchen2 left a comment

MARD1NO commented Aug 8, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

chengtbf Aug 15, 2021

Dev scalar op #5778

Dev scalar op #5778

Conversation

MARD1NO commented Aug 7, 2021 • edited

Ldpe2G Aug 8, 2021

Choose a reason for hiding this comment

MARD1NO Aug 8, 2021

Choose a reason for hiding this comment

hjchen2 left a comment

Choose a reason for hiding this comment

MARD1NO commented Aug 8, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

github-actions bot commented Aug 15, 2021

chengtbf Aug 15, 2021

Choose a reason for hiding this comment

MARD1NO commented Aug 7, 2021 •

edited