Dev ccl kernel support bool #7366

hjchen2 · 2022-01-25T13:26:33Z

No description provided.

github-actions · 2022-01-25T22:05:14Z

Speed stats:

GPU Name: GeForce GTX 1080 

OneFlow resnet50 time: 136.5ms (= 13653.1ms / 100, input_shape=[16, 3, 224, 224])
PyTorch resnet50 time: 140.3ms (= 14029.9ms / 100, input_shape=[16, 3, 224, 224])
✔️ Relative speed: 1.03 (= 140.3ms / 136.5ms)

OneFlow resnet50 time: 78.5ms (= 7848.8ms / 100, input_shape=[8, 3, 224, 224])
PyTorch resnet50 time: 85.4ms (= 8543.6ms / 100, input_shape=[8, 3, 224, 224])
✔️ Relative speed: 1.09 (= 85.4ms / 78.5ms)

OneFlow resnet50 time: 54.7ms (= 10948.3ms / 200, input_shape=[4, 3, 224, 224])
PyTorch resnet50 time: 52.9ms (= 10582.8ms / 200, input_shape=[4, 3, 224, 224])
❌ Relative speed: 0.97 (= 52.9ms / 54.7ms)

OneFlow resnet50 time: 37.6ms (= 7514.5ms / 200, input_shape=[2, 3, 224, 224])
PyTorch resnet50 time: 47.9ms (= 9573.8ms / 200, input_shape=[2, 3, 224, 224])
✔️ Relative speed: 1.27 (= 47.9ms / 37.6ms)

OneFlow resnet50 time: 37.6ms (= 7515.1ms / 200, input_shape=[1, 3, 224, 224])
PyTorch resnet50 time: 41.2ms (= 8237.0ms / 200, input_shape=[1, 3, 224, 224])
✔️ Relative speed: 1.10 (= 41.2ms / 37.6ms)

OneFlow resnet50 time: 147.1ms (= 14706.1ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 154.3ms (= 15430.9ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.05 (= 154.3ms / 147.1ms)

OneFlow resnet50 time: 89.4ms (= 8936.8ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 98.5ms (= 9846.2ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.10 (= 98.5ms / 89.4ms)

OneFlow resnet50 time: 66.1ms (= 13221.9ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 78.2ms (= 15641.0ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.18 (= 78.2ms / 66.1ms)

OneFlow resnet50 time: 54.9ms (= 10975.9ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 66.7ms (= 13334.3ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.21 (= 66.7ms / 54.9ms)

OneFlow resnet50 time: 61.7ms (= 12333.1ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 62.4ms (= 12479.2ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.01 (= 62.4ms / 61.7ms)

github-actions · 2022-01-25T22:05:15Z

CI failed when running job: cuda-speed-test. PR label automerge has been removed

github-actions · 2022-01-26T00:43:20Z

Speed stats:

GPU Name: GeForce GTX 1080 

OneFlow resnet50 time: 136.4ms (= 13642.2ms / 100, input_shape=[16, 3, 224, 224])
PyTorch resnet50 time: 141.1ms (= 14108.9ms / 100, input_shape=[16, 3, 224, 224])
✔️ Relative speed: 1.03 (= 141.1ms / 136.4ms)

OneFlow resnet50 time: 78.3ms (= 7828.7ms / 100, input_shape=[8, 3, 224, 224])
PyTorch resnet50 time: 84.1ms (= 8405.2ms / 100, input_shape=[8, 3, 224, 224])
✔️ Relative speed: 1.07 (= 84.1ms / 78.3ms)

OneFlow resnet50 time: 55.6ms (= 11117.2ms / 200, input_shape=[4, 3, 224, 224])
PyTorch resnet50 time: 56.8ms (= 11354.9ms / 200, input_shape=[4, 3, 224, 224])
✔️ Relative speed: 1.02 (= 56.8ms / 55.6ms)

OneFlow resnet50 time: 41.4ms (= 8270.3ms / 200, input_shape=[2, 3, 224, 224])
PyTorch resnet50 time: 46.3ms (= 9267.6ms / 200, input_shape=[2, 3, 224, 224])
✔️ Relative speed: 1.12 (= 46.3ms / 41.4ms)

OneFlow resnet50 time: 40.6ms (= 8121.0ms / 200, input_shape=[1, 3, 224, 224])
PyTorch resnet50 time: 40.2ms (= 8048.8ms / 200, input_shape=[1, 3, 224, 224])
✔️ Relative speed: 0.99 (= 40.2ms / 40.6ms)

OneFlow resnet50 time: 146.8ms (= 14683.2ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 157.5ms (= 15753.3ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.07 (= 157.5ms / 146.8ms)

OneFlow resnet50 time: 89.2ms (= 8924.8ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 96.8ms (= 9682.8ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.08 (= 96.8ms / 89.2ms)

OneFlow resnet50 time: 65.5ms (= 13107.0ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 69.4ms (= 13888.8ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.06 (= 69.4ms / 65.5ms)

OneFlow resnet50 time: 50.7ms (= 10140.8ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 61.6ms (= 12322.5ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.22 (= 61.6ms / 50.7ms)

OneFlow resnet50 time: 59.7ms (= 11931.3ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 56.7ms (= 11349.5ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 0.95 (= 56.7ms / 59.7ms)

jackalcooper · 2022-01-26T03:29:34Z

~~好像从这个pr开始多机超时的几率变大了~~
发现之前也有

hjchen2 added 2 commits January 25, 2022 21:25

support bool type in nccl/ccl except for reduce operations

b652a14

add consistent greater unittest

2dd540d

hjchen2 requested review from daquexian, guo-ran, jackalcooper, liujuncheng and MARD1NO as code owners January 25, 2022 13:26

hjchen2 requested a review from oneflow-ci-bot January 25, 2022 13:28

hjchen2 added automerge enhancement system labels Jan 25, 2022

liujuncheng approved these changes Jan 25, 2022

View reviewed changes

hjchen2 enabled auto-merge (squash) January 25, 2022 13:31

fix unittest

73cd314

hjchen2 requested review from oneflow-ci-bot and removed request for oneflow-ci-bot January 25, 2022 13:36

guo-ran approved these changes Jan 25, 2022

View reviewed changes

oneflow-ci-bot removed their request for review January 25, 2022 14:57

Merge branch 'master' into dev_ccl_kernel_support_bool

1fdd401

oneflow-ci-bot self-requested a review January 25, 2022 14:57

Merge branch 'master' into dev_ccl_kernel_support_bool

e1ee0c6

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot January 25, 2022 17:22

Merge branch 'master' into dev_ccl_kernel_support_bool

f03573e

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot January 25, 2022 18:17

Merge branch 'master' into dev_ccl_kernel_support_bool

6bacc91

oneflow-ci-bot self-requested a review January 25, 2022 20:43

github-actions bot removed the automerge label Jan 25, 2022

oneflow-ci-bot removed their request for review January 25, 2022 22:07

Merge branch 'master' into dev_ccl_kernel_support_bool

c7b5d4e

hjchen2 requested a review from oneflow-ci-bot January 25, 2022 23:55

hjchen2 added the automerge label Jan 25, 2022

hjchen2 merged commit 98b79ac into master Jan 26, 2022

hjchen2 deleted the dev_ccl_kernel_support_bool branch January 26, 2022 00:50

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Dev ccl kernel support bool #7366

Dev ccl kernel support bool #7366

hjchen2 commented Jan 25, 2022

github-actions bot commented Jan 25, 2022

github-actions bot commented Jan 25, 2022

github-actions bot commented Jan 26, 2022

jackalcooper commented Jan 26, 2022 •

edited

Loading

Dev ccl kernel support bool #7366

Dev ccl kernel support bool #7366

Conversation

hjchen2 commented Jan 25, 2022

github-actions bot commented Jan 25, 2022

github-actions bot commented Jan 25, 2022

github-actions bot commented Jan 26, 2022

jackalcooper commented Jan 26, 2022 • edited Loading

jackalcooper commented Jan 26, 2022 •

edited

Loading