[OpPerf] Consolidate array manipulation related operators #17487

ChaiBapchya · 2020-01-30T20:37:10Z

Description

Rename array_rearrange.py file to array_manipulation_operators because there are 4 categories that we identified

Array Rearrange
Array Shape Manipulation
Array Expansion
Array Rounding
Array Join & Split

Accordingly operators that didn't fall in previous existing categories (unary/binary/etc) have been allocated to these 4 categories as found meaningful.

These are the groupings

Array Rearrange Operators

transpose
swapaxes (alias SwapAxis)
flip (alias reverse)
depth_to_space
space_to_depth

Array Shape Manipulation Operators

split (alias SliceChannel)
diag
reshape
reshape_like
size_array
shape_array

Array Expanding Operators

broadcast_axes (alias broadcast_axis)
broadcast_to
broadcast_like
repeat
tile
pad
expand_dims

Array Rounding Operators

round
rint
fix
floor
ceil
trunc

Array Join & Split Operators

concat
split
stack

Checklist

Essentials

Please feel free to remove inapplicable items for your PR.

Changes are complete (i.e. I finished coding on this PR)
All changes have test coverage:
Code is well-documented:
To the best of my knowledge, examples are either not affected by this change, or have been fixed to be compatible with this change

Changes

   deleted:    benchmark/opperf/nd_operations/array_rearrange.py
    modified:   benchmark/opperf/opperf.py
    modified:   benchmark/opperf/utils/op_registry_utils.py
   added:       benchmark/opperf/nd_operations/array_manipulation_operators.py

ChaiBapchya · 2020-02-04T21:27:42Z

All 5 categories

>>> from benchmark.opperf.nd_operations.array_manipulation_operators import run_rearrange_operators_benchmarks, run_shape_operators_benchmarks, run_expanding_operators_benchmarks, run_rounding_operators_benchmarks

Results

run_expanding_operators_benchmarks()
INFO:root:Begin Benchmark - broadcast_axes
INFO:root:Complete Benchmark - broadcast_axes
INFO:root:Begin Benchmark - broadcast_axis
INFO:root:Complete Benchmark - broadcast_axis
INFO:root:Begin Benchmark - broadcast_like
INFO:root:Complete Benchmark - broadcast_like
INFO:root:Begin Benchmark - broadcast_to
INFO:root:Complete Benchmark - broadcast_to
INFO:root:Begin Benchmark - expand_dims
INFO:root:Complete Benchmark - expand_dims
INFO:root:Begin Benchmark - pad
INFO:root:Complete Benchmark - pad
INFO:root:Begin Benchmark - repeat
INFO:root:Complete Benchmark - repeat
INFO:root:Begin Benchmark - tile
INFO:root:Complete Benchmark - tile
{'broadcast_axis': [{'avg_time_forward_broadcast_axis': 0.0342, 'max_storage_mem_alloc_cpu/0': 4.096, 'inputs': {'data': (1, 1024), 'axis': 0, 'size': 2}}, {'avg_time_forward_broadcast_axis': 0.0302, 'max_storage_mem_alloc_cpu/0': 0.008, 'inputs': {'data': (1, 1), 'axis': 0, 'size': 2}}, {'avg_time_forward_broadcast_axis': 0.024, 'max_storage_mem_alloc_cpu/0': 0.8, 'inputs': {'data': (1, 100), 'axis': 0, 'size': 2}}], 'broadcast_like': [{'avg_time_forward_broadcast_like': 1.5138, 'max_
storage_mem_alloc_cpu/0': 4194.3042, 'inputs': {'lhs': (1024, 1024), 'rhs': (1024, 1024)}}, {'avg_time_forward_broadcast_like': 0.1705, 'max_storage_mem_alloc_cpu/0': 400.0, 'inputs': {'lhs': (10000, 10), 'rhs': (10000, 10)}}, {'avg_time_forward_broadcast_like': 0.0446, 'max_storage_mem_alloc_cpu/0': 20.0, 'inputs': {'lhs': (10000, 1), 'rhs': (10000, 1)}}], 'pad': [{'max_storage_mem_alloc_cpu/0': 0.192, 'inputs': {'data': (1, 4, 2, 4), 'mode': 'constant', 'pad_width': (0, 0, 0, 0, 1, 1
, 1, 1)}}, {'max_storage_mem_alloc_cpu/0': 612.0, 'inputs': {'data': (10, 25, 10, 100), 'mode': 'constant', 'pad_width': (0, 0, 0, 0, 1, 1, 1, 1)}}], 'repeat': [{'avg_time_forward_repeat': 7.5347, 'avg_time_backward_repeat': 10.3592, 'max_storage_mem_alloc_cpu/0': 4194.3042, 'inputs': {'data': (1024, 1024), 'repeats': 2, 'axis': 0}}, {'avg_time_forward_repeat': 0.0664, 'avg_time_backward_repeat': 0.0716, 'max_storage_mem_alloc_cpu/0': 40.0, 'inputs': {'data': (10000, 1), 'repeats': 2,
'axis': 0}}, {'avg_time_forward_repeat': 6.0047, 'avg_time_backward_repeat': 8.3208, 'max_storage_mem_alloc_cpu/0': 4000.0, 'inputs': {'data': (10000, 100), 'repeats': 2, 'axis': 0}}], 'tile': [{'avg_time_backward_tile': 7.2161, 'max_storage_mem_alloc_cpu/0': 4194.3042, 'avg_time_forward_tile': 5.2652, 'inputs': {'data': (1024, 1024), 'reps': 2}}, {'avg_time_backward_tile': 0.0631, 'max_storage_mem_alloc_cpu/0': 40.0, 'avg_time_forward_tile': 0.1274, 'inputs': {'data': (10000, 1), 'rep
s': 2}}, {'avg_time_backward_tile': 6.7835, 'max_storage_mem_alloc_cpu/0': 4000.0, 'avg_time_forward_tile': 4.8181, 'inputs': {'data': (10000, 100), 'reps': 2}}], 'broadcast_to': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_broadcast_to': 1.4573, 'inputs': {'data': (1, 1024), 'shape': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 40.0, 'avg_time_forward_broadcast_to': 0.0741, 'inputs': {'data': (1, 1), 'shape': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'a
vg_time_forward_broadcast_to': 1.5039, 'inputs': {'data': (1, 100), 'shape': (10000, 100)}}], 'expand_dims': [{'avg_time_forward_expand_dims': 0.15, 'max_storage_mem_alloc_cpu/0': 2097.1521, 'inputs': {'data': (1024, 1024), 'axis': 0}}, {'avg_time_forward_expand_dims': 0.029, 'max_storage_mem_alloc_cpu/0': 20.0, 'inputs': {'data': (10000, 1), 'axis': 0}}, {'avg_time_forward_expand_dims': 0.0524, 'max_storage_mem_alloc_cpu/0': 2000.0, 'inputs': {'data': (10000, 100), 'axis': 0}}], 'broa
dcast_axes': [{'avg_time_forward_broadcast_axes': 0.0416, 'max_storage_mem_alloc_cpu/0': 4.096, 'inputs': {'data': (1, 1024), 'axis': 0, 'size': 2}}, {'avg_time_forward_broadcast_axes': 0.0341, 'max_storage_mem_alloc_cpu/0': 0.004, 'inputs': {'data': (1, 1), 'axis': 0, 'size': 2}}, {'avg_time_forward_broadcast_axes': 0.0354, 'max_storage_mem_alloc_cpu/0': 0.4, 'inputs': {'data': (1, 100), 'axis': 0, 'size': 2}}]}

run_rearrange_operators_benchmarks()
INFO:root:Begin Benchmark - SwapAxis
INFO:root:Complete Benchmark - SwapAxis
INFO:root:Begin Benchmark - depth_to_space
INFO:root:Complete Benchmark - depth_to_space
INFO:root:Begin Benchmark - flip
INFO:root:Complete Benchmark - flip
INFO:root:Begin Benchmark - reverse
INFO:root:Complete Benchmark - reverse
INFO:root:Begin Benchmark - space_to_depth
INFO:root:Complete Benchmark - space_to_depth
INFO:root:Begin Benchmark - swapaxes
INFO:root:Complete Benchmark - swapaxes
INFO:root:Begin Benchmark - transpose
INFO:root:Complete Benchmark - transpose
{'transpose': [{'max_storage_mem_alloc_cpu/0': 4194.3042, 'avg_time_forward_transpose': 0.2103, 'inputs': {'data': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 40.0, 'avg_time_forward_transpose': 0.0465, 'inputs': {'data': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 4000.0, 'avg_time_forward_transpose': 0.266, 'inputs': {'data': (10000, 100)}}], 'depth_to_space': [{'max_storage_mem_alloc_cpu/0': 0.128, 'avg_time_forward_depth_to_space': 0.2052, 'inputs': {'data': (1, 4, 2, 4), 'block_size': 2}}, {'max_storage_mem_alloc_cpu/0': 1000.0, 'avg_time_forward_depth_to_space': 1.2413, 'inputs': {'data': (10, 25, 10, 100), 'block_size': 5}}], 'SwapAxis': [{'max_storage_mem_alloc_cpu/0': 4194.3042, 'avg_time_forward_SwapAxis': 3.3261, 'avg_time_backward_SwapAxis': 3.2804, 'inputs': {'data': (1024, 1024), 'dim1': 0, 'dim2': 1}}, {'max_storage_mem_alloc_cpu/0': 40.0, 'avg_time_forward_SwapAxis': 0.0658, 'avg_time_backward_SwapAxis': 0.0532, 'inputs': {'data': (10000, 1), 'dim1': 0, 'dim2': 1}}, {'max_storage_mem_alloc_cpu/0': 4000.0, 'avg_time_forward_SwapAxis': 2.7984, 'avg_time_backward_SwapAxis': 3.0327, 'inputs': {'data': (10000, 100), 'dim1': 0, 'dim2': 1}}], 'reverse': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_reverse': 0.8368, 'avg_time_backward_reverse': 0.774, 'inputs': {'data': (1024, 1024), 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_reverse': 0.0405, 'avg_time_backward_reverse': 0.0369, 'inputs': {'data': (10000, 1), 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_reverse': 0.9559, 'avg_time_backward_reverse': 0.9159, 'inputs': {'data': (10000, 100), 'axis': 0}}], 'flip': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_flip': 0.7658, 'inputs': {'data': (1024, 1024), 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_flip': 0.0343, 'inputs': {'data': (10000, 1), 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_flip': 0.7287, 'inputs': {'data': (10000, 100), 'axis': 0}}], 'space_to_depth': [{'max_storage_mem_alloc_cpu/0': 0.064, 'avg_time_forward_space_to_depth': 0.0444, 'inputs': {'data': (1, 4, 2, 4), 'block_size': 2}}, {'max_storage_mem_alloc_cpu/0': 500.0, 'avg_time_forward_space_to_depth': 1.11, 'inputs': {'data': (10, 25, 10, 100), 'block_size': 5}}], 'swapaxes': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_swapaxes': 2.4288, 'inputs': {'data': (1024, 1024), 'dim1': 0, 'dim2': 1}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_swapaxes': 0.0526, 'inputs': {'data': (10000, 1), 'dim1': 0, 'dim2': 1}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_swapaxes': 2.5499, 'inputs': {'data': (10000, 100), 'dim1': 0, 'dim2': 1}}]}
>>>

>>> run_shape_operators_benchmarks()
INFO:root:Begin Benchmark - diag
INFO:root:Complete Benchmark - diag
INFO:root:Begin Benchmark - reshape
INFO:root:Complete Benchmark - reshape
INFO:root:Begin Benchmark - reshape_like
INFO:root:Complete Benchmark - reshape_like
INFO:root:Begin Benchmark - shape_array
INFO:root:Complete Benchmark - shape_array
INFO:root:Begin Benchmark - size_array
INFO:root:Complete Benchmark - size_array
INFO:root:Begin Benchmark - split
INFO:root:Complete Benchmark - split
{'reshape_like': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_reshape_like': 0.4931, 'inputs': {'lhs': (1024, 1024), 'rhs': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 200.0, 'avg_time_forward_reshape_like': 0.2905, 'inputs': {'lhs': (10000, 10), 'rhs': (10000, 10)}}, {'max_storage_mem_alloc_cpu/0': 40.0, 'avg_time_forward_reshape_like': 0.0685, 'inputs': {'lhs': (10000, 1), 'rhs': (10000, 1)}}], 'shape_array': [{'max_storage_mem_alloc_cpu/0': 0.016, 'avg_time_forw
ard_shape_array': 0.014, 'inputs': {'data': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 0.016, 'avg_time_forward_shape_array': 0.0138, 'inputs': {'data': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 0.016, 'avg_time_forward_shape_array': 0.0133, 'inputs': {'data': (10000, 100)}}], 'size_array': [{'avg_time_forward_size_array': 0.0138, 'max_storage_mem_alloc_cpu/0': 0.008, 'inputs': {'data': (1024, 1024)}}, {'avg_time_forward_size_array': 0.014, 'max_storage_mem_alloc_cpu/0': 0.008
, 'inputs': {'data': (10000, 1)}}, {'avg_time_forward_size_array': 0.0138, 'max_storage_mem_alloc_cpu/0': 0.008, 'inputs': {'data': (10000, 100)}}], 'reshape': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_reshape': 0.1507, 'inputs': {'data': (1024, 1024), 'shape': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_reshape': 0.0371, 'inputs': {'data': (10000, 1), 'shape': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_reshap
e': 0.1779, 'inputs': {'data': (10000, 100), 'shape': (10000, 100)}}], 'split': [{'max_storage_mem_alloc_cpu/0': 4194.3042, 'inputs': {'data': (1024, 1024), 'num_outputs': 1, 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 40.0, 'inputs': {'data': (10000, 1), 'num_outputs': 1, 'axis': 0}}, {'max_storage_mem_alloc_cpu/0': 4000.0, 'inputs': {'data': (10000, 100), 'num_outputs': 1, 'axis': 0}}], 'diag': [{'avg_time_forward_diag': 0.0346, 'max_storage_mem_alloc_cpu/0': 2.046, 'avg_time_backwa
rd_diag': 0.4403, 'inputs': {'data': (1024, 1024), 'k': 1}}, {'avg_time_forward_diag': 0.0311, 'avg_time_backward_diag': 0.0445, 'inputs': {'data': (10000, 1), 'k': 1}}, {'avg_time_forward_diag': 0.0317, 'max_storage_mem_alloc_cpu/0': 0.198, 'avg_time_backward_diag': 0.4408, 'inputs': {'data': (10000, 100), 'k': 1}}]}

>>> run_rounding_operators_benchmarks()
INFO:root:Begin Benchmark - ceil
INFO:root:Complete Benchmark - ceil
INFO:root:Begin Benchmark - fix
INFO:root:Complete Benchmark - fix
INFO:root:Begin Benchmark - floor
INFO:root:Complete Benchmark - floor
INFO:root:Begin Benchmark - rint
INFO:root:Complete Benchmark - rint
INFO:root:Begin Benchmark - round
INFO:root:Complete Benchmark - round
INFO:root:Begin Benchmark - trunc
INFO:root:Complete Benchmark - trunc
{'floor': [{'max_storage_mem_alloc_cpu/0': 2097.1521, 'avg_time_forward_floor': 0.1889, 'inputs': {'data': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_floor': 0.0483, 'inputs': {'data': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_floor': 0.1466, 'inputs': {'data': (10000, 100)}}], 'round': [{'avg_time_forward_round': 0.2401, 'max_storage_mem_alloc_cpu/0': 2097.1521, 'inputs': {'data': (1024, 1024)}}, {'avg_time_forward_round': 0.0
343, 'max_storage_mem_alloc_cpu/0': 20.0, 'inputs': {'data': (10000, 1)}}, {'avg_time_forward_round': 0.2264, 'max_storage_mem_alloc_cpu/0': 2000.0, 'inputs': {'data': (10000, 100)}}], 'trunc': [{'avg_time_forward_trunc': 0.2686, 'max_storage_mem_alloc_cpu/0': 4194.3042, 'inputs': {'data': (1024, 1024)}}, {'avg_time_forward_trunc': 0.0877, 'max_storage_mem_alloc_cpu/0': 20.0, 'inputs': {'data': (10000, 1)}}, {'avg_time_forward_trunc': 0.2895, 'max_storage_mem_alloc_cpu/0': 2000.0, 'inp
uts': {'data': (10000, 100)}}], 'fix': [{'avg_time_forward_fix': 0.4471, 'max_storage_mem_alloc_cpu/0': 2097.1521, 'inputs': {'data': (1024, 1024)}}, {'avg_time_forward_fix': 0.0372, 'max_storage_mem_alloc_cpu/0': 20.0, 'inputs': {'data': (10000, 1)}}, {'avg_time_forward_fix': 0.3923, 'max_storage_mem_alloc_cpu/0': 2000.0, 'inputs': {'data': (10000, 100)}}], 'rint': [{'avg_time_forward_rint': 0.2299, 'max_storage_mem_alloc_cpu/0': 2097.1521, 'inputs': {'data': (1024, 1024)}}, {'avg_tim
e_forward_rint': 0.0354, 'max_storage_mem_alloc_cpu/0': 40.0, 'inputs': {'data': (10000, 1)}}, {'avg_time_forward_rint': 0.2015, 'max_storage_mem_alloc_cpu/0': 2000.0, 'inputs': {'data': (10000, 100)}}], 'ceil': [{'max_storage_mem_alloc_cpu/0': 4194.3042, 'avg_time_forward_ceil': 0.3486, 'inputs': {'data': (1024, 1024)}}, {'max_storage_mem_alloc_cpu/0': 20.0, 'avg_time_forward_ceil': 0.0395, 'inputs': {'data': (10000, 1)}}, {'max_storage_mem_alloc_cpu/0': 2000.0, 'avg_time_forward_ceil
': 0.4362, 'inputs': {'data': (10000, 100)}}]}

>>> run_join_split_operators_benchmarks()
INFO:root:Begin Benchmark - concat
INFO:root:Complete Benchmark - concat
INFO:root:Begin Benchmark - split
INFO:root:Complete Benchmark - split
INFO:root:Begin Benchmark - stack
INFO:root:Complete Benchmark - stack
{'concat': [{'inputs': {'args0': '<NDArray 100x100 @cpu(0)>', 'args1': '<NDArray 100x100 @cpu(0)>', 'args2': '<NDArray 100x100 @cpu(0)>'}, 'max_storage_mem_alloc_cpu/0': 120.0}], 'split': [{'inputs': {'data': (1024, 1024), 'num_outputs': 2}, 'max_storage_mem_alloc_cpu/0': 4194.3042}, {'inputs': {'data': (10000, 1), 'num_outputs': 1}, 'max_storage_mem_alloc_cpu/0': 20.0}, {'inputs': {'data': (10000, 100), 'num_outputs': 10}, 'max_storage_mem_alloc_cpu/0': 3800.0}], 'stack': [{'inputs': {'args0': '<NDArray 100x100 @cpu(0)>', 'args1': '<NDArray 100x100 @cpu(0)>', 'args2': '<NDArray 100x100 @cpu(0)>'}, 'max_storage_mem_alloc_cpu/0': 60.0, 'avg_time_forward_stack': 0.0653}]}

ChaiBapchya · 2020-02-04T21:38:48Z

@mxnet-label-bot add [pr-awaiting-review]

ChaiBapchya · 2020-02-04T21:39:47Z

Entire OpPerf for CPU : https://gist.github.com/ChaiBapchya/f2d6879b8ca7634773fb8c5b93367dae#file-mxnet_operator_benchmark_results_array_manipulation_cpu-md

ChaiBapchya · 2020-02-04T22:20:28Z

OpPerf for GPU : https://gist.github.com/ChaiBapchya/f2d6879b8ca7634773fb8c5b93367dae#file-mxnet_operator_benchmark_results_array_manipulation_gpu-md

…perf readme

apeforest · 2020-02-05T18:42:55Z

benchmark/opperf/README.md

@@ -72,6 +73,8 @@ python incubator-mxnet/benchmark/opperf/opperf.py --output-format json --output-

 3. **dtype** : By default, `float32`. You can override and set the global dtype for all operator benchmarks. Example: --dtype float64.

+4. **profiler** : By default, 'native'. You can override and set the global profiler for all operator benchmarks. Example: --profiler 'python'.


What does native mean? Could you be more specific

Native profiler uses the MXNet's default profiler function
Python uses python's time-it function

I know what it means. Could you provide more information to first time users?

Added a line. @apeforest

apeforest · 2020-02-05T18:44:33Z

A small comment. Otherwise LGTM. Please rebase as well.

ChaiBapchya

Few notes about changes I made.

benchmark/opperf/rules/default_params.py

benchmark/opperf/utils/op_registry_utils.py

sandeep-krishnamurthy

Can you please this list - https://github.com/apache/incubator-mxnet/tree/master/benchmark/opperf/nd_operations

… missed in previous PR

ChaiBapchya · 2020-02-27T19:24:30Z

Can you please this list - https://github.com/apache/incubator-mxnet/tree/master/benchmark/opperf/nd_operations

@sandeep-krishnamurthy updated
Thanks for pointing out.

ChaiBapchya · 2020-03-01T01:14:47Z

CPU : Entire OpPerf suite
https://gist.github.com/ChaiBapchya/5b5365563b12d5156515ebc62c3032c0

* add shape manipulation, array expanding ops * split as alias of SliceChannel * add rounding ops * add profiler param to function description * add params, improve readability of prepare op input logic, improve opperf readme * fix index merge issue * add join,split ops * minor fixes in join,split * fix if else logic issue, lint * add comment on profiler, remove all completed ops, add res of 2 ops i missed in previous PR * remove unreachable if statements

This was referenced Jan 31, 2020

[mxnet 2.0] [item 2.4] Turning on large tensor support by default #17331

Open

flaky test: test_gluon_data_vision.test_random_transforms #17369

Open

ChaiBapchya force-pushed the rearrange_ops branch from d8cac88 to f5ab204 Compare February 3, 2020 21:04

lanking520 added the pr-awaiting-review PR is waiting for code review label Feb 4, 2020

ChaiBapchya requested review from sandeep-krishnamurthy and apeforest February 4, 2020 21:38

ChaiBapchya added 5 commits February 4, 2020 22:23

add shape manipulation, array expanding ops

eb59775

split as alias of SliceChannel

3a438ce

add rounding ops

feb57e8

add profiler param to function description

8ea9bee

add params, improve readability of prepare op input logic, improve op…

abcfa09

…perf readme

ChaiBapchya force-pushed the rearrange_ops branch from 4228baa to abcfa09 Compare February 4, 2020 22:24

apeforest reviewed Feb 5, 2020

View reviewed changes

ChaiBapchya added 4 commits February 5, 2020 11:00

Merge branch 'master' into rearrange_ops

435d2ac

Merge branch 'master' into rearrange_ops

6724b23

Merge branch 'master' into rearrange_ops

98910e2

Merge branch 'master' into rearrange_ops

cb0861e

ChaiBapchya mentioned this pull request Feb 12, 2020

Scala flaky test: testObjectDetectionExample and GanExampleSuite #17067

Open

ChaiBapchya added 3 commits February 13, 2020 01:17

Merge branch 'master' into rearrange_ops

f1a88f7

fix index merge issue

342b4a4

Merge branch 'master' into rearrange_ops

1a8f211

ChaiBapchya commented Feb 14, 2020

View reviewed changes

ChaiBapchya added 3 commits February 24, 2020 17:03

Merge branch 'master' into rearrange_ops

893d8bf

add join,split ops

a376b50

minor fixes in join,split

23cb1bc

Merge branch 'master' into rearrange_ops

a602b79

sandeep-krishnamurthy reviewed Feb 26, 2020

View reviewed changes

ChaiBapchya added 3 commits February 27, 2020 19:08

fix if else logic issue, lint

0ced040

Merge branch 'master' into rearrange_ops

315feb8

add comment on profiler, remove all completed ops, add res of 2 ops i…

a6b2ef2

… missed in previous PR

remove unreachable if statements

9b0824d

This was referenced Feb 27, 2020

Flaky test: test_lstm_clip #14994

Closed

[CI] illegal memory access #15925

Open

CUDA: unspecified launch failure on CI Windows #17616

Closed

resolved merge conflict

ef14bef

ChaiBapchya requested review from sandeep-krishnamurthy and apeforest March 10, 2020 08:59

apeforest approved these changes Mar 10, 2020

View reviewed changes

apeforest merged commit a5d55de into apache:master Mar 10, 2020

ChaiBapchya deleted the rearrange_ops branch March 10, 2020 21:40

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[OpPerf] Consolidate array manipulation related operators #17487

[OpPerf] Consolidate array manipulation related operators #17487

ChaiBapchya commented Jan 30, 2020 •

edited

ChaiBapchya commented Feb 4, 2020 •

edited

ChaiBapchya commented Feb 4, 2020

ChaiBapchya commented Feb 4, 2020

ChaiBapchya commented Feb 4, 2020

apeforest Feb 5, 2020

ChaiBapchya Feb 5, 2020

apeforest Feb 14, 2020

ChaiBapchya Feb 27, 2020

apeforest commented Feb 5, 2020

ChaiBapchya left a comment

sandeep-krishnamurthy left a comment

ChaiBapchya commented Feb 27, 2020

ChaiBapchya commented Mar 1, 2020

		@@ -72,6 +73,8 @@ python incubator-mxnet/benchmark/opperf/opperf.py --output-format json --output-

		3. dtype : By default, `float32`. You can override and set the global dtype for all operator benchmarks. Example: --dtype float64.

		4. profiler : By default, 'native'. You can override and set the global profiler for all operator benchmarks. Example: --profiler 'python'.

[OpPerf] Consolidate array manipulation related operators #17487

[OpPerf] Consolidate array manipulation related operators #17487

Conversation

ChaiBapchya commented Jan 30, 2020 • edited

Description

Checklist

Essentials

Changes

ChaiBapchya commented Feb 4, 2020 • edited

ChaiBapchya commented Feb 4, 2020

ChaiBapchya commented Feb 4, 2020

ChaiBapchya commented Feb 4, 2020

apeforest Feb 5, 2020

Choose a reason for hiding this comment

ChaiBapchya Feb 5, 2020

Choose a reason for hiding this comment

apeforest Feb 14, 2020

Choose a reason for hiding this comment

ChaiBapchya Feb 27, 2020

Choose a reason for hiding this comment

apeforest commented Feb 5, 2020

ChaiBapchya left a comment

Choose a reason for hiding this comment

sandeep-krishnamurthy left a comment

Choose a reason for hiding this comment

ChaiBapchya commented Feb 27, 2020

ChaiBapchya commented Mar 1, 2020

ChaiBapchya commented Jan 30, 2020 •

edited

ChaiBapchya commented Feb 4, 2020 •

edited