PERF: Allow groupby transform with numba engine to be fully parallelizable #36240

mroeschke · 2020-09-09T04:03:17Z

tests added / passed
passes black pandas
passes git diff upstream/master -u -- "*.py" | flake8 --diff
whatsnew entry

New performance comparison with 10k groups

In [1]: df_g = pd.DataFrame({'a': range(10**4), 'b': range(10**4), 'c': range(10**4)})

In [2]: df_g.groupby('a').transform(lambda x: x + 1)
Out[2]:
          b      c
0         1      1
1         2      2
2         3      3
3         4      4
4         5      5
...     ...    ...
9995   9996   9996
9996   9997   9997
9997   9998   9998
9998   9999   9999
9999  10000  10000

[10000 rows x 2 columns]

In [3]: %timeit df_g.groupby('a').transform(lambda x: x + 1)
9.48 s ± 885 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

In [4]: def f(values, index):
   ...:     return values + 1
   ...:

In [5]: df_g.groupby('a').transform(f, engine='numba', engine_kwargs={'parallel': True})
Out[5]:
            b        c
0         1.0      1.0
1         2.0      2.0
2         3.0      3.0
3         4.0      4.0
4         5.0      5.0
...       ...      ...
9995   9996.0   9996.0
9996   9997.0   9997.0
9997   9998.0   9998.0
9998   9999.0   9999.0
9999  10000.0  10000.0

[10000 rows x 2 columns]

In [6]: %timeit df_g.groupby('a').transform(f, engine='numba', engine_kwargs={'parallel': True})
4.41 ms ± 34.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

…y_transform

jbrockmendel · 2020-09-09T16:28:15Z

How does this compare to non-parallel numba?

mroeschke · 2020-09-09T16:32:49Z

How does this compare to non-parallel numba?

In [1]: df_g = pd.DataFrame({'a': range(10**4), 'b': range(10**4), 'c': range(10**4)})

In [2]: In [4]: def f(values, index):
   ...:    ...:     return values + 1
   ...:

In [3]: df_g.groupby('a').transform(f, engine='numba')
Out[3]:
            b        c
0         1.0      1.0
1         2.0      2.0
2         3.0      3.0
3         4.0      4.0
4         5.0      5.0
...       ...      ...
9995   9996.0   9996.0
9996   9997.0   9997.0
9997   9998.0   9998.0
9998   9999.0   9999.0
9999  10000.0  10000.0

[10000 rows x 2 columns]

In [4]: %timeit df_g.groupby('a').transform(f, engine='numba')
5.46 ms ± 38.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

jreback · 2020-09-09T16:35:50Z

so a little better :)

…y_transform

jreback

can you add an asv which covers this (or do we have an existing one)?

jreback · 2020-09-11T13:13:35Z

pandas/core/groupby/generic.py

@@ -1362,13 +1358,23 @@ def _transform_general(
    @Appender(_transform_template)
    def transform(self, func, *args, engine=None, engine_kwargs=None, **kwargs):

+        if maybe_use_numba(engine):
+            if not callable(func):


maybe this check should actually be in _transform_with_numba to keep DRY (you have it above as well)

pandas/tests/groupby/transform/test_numba.py

…y_transform

jreback · 2020-09-13T13:13:58Z

thanks @mroeschke

…zable (pandas-dev#36240)

Matt Roeschke added 7 commits September 7, 2020 15:51

Add pathway for groupby transform

f112fc0

Merge remote-tracking branch 'upstream/master' into perf/numba_groupb…

e27a6d9

…y_transform

Add path for groupby transform series

edda97d

Roll back old groupby transform implementation

b108480

Fix docstring and add whatsnew

d92d2ad

Fix resulting data, add test for multiple functions

4679501

Update issue number

944e8e0

mroeschke added Apply Apply, Aggregate, Transform Groupby Performance Memory or execution speed performance labels Sep 9, 2020

mroeschke added this to the 1.2 milestone Sep 9, 2020

Matt Roeschke added 2 commits September 8, 2020 21:25

Merge remote-tracking branch 'upstream/master' into perf/numba_groupb…

d23f354

…y_transform

Fix linting error

f8e6fdb

Merge remote-tracking branch 'upstream/master' into perf/numba_groupb…

30d4835

…y_transform

jreback requested changes Sep 11, 2020

View reviewed changes

Matt Roeschke added 3 commits September 12, 2020 18:10

Merge remote-tracking branch 'upstream/master' into perf/numba_groupb…

e5f4db0

…y_transform

Move callable check to private method

97fc5c9

enhance benchmarks for cython engine

0ae6101

jreback approved these changes Sep 13, 2020

View reviewed changes

jreback merged commit 65074db into pandas-dev:master Sep 13, 2020

mroeschke deleted the perf/numba_groupby_transform branch September 13, 2020 17:25

mroeschke mentioned this pull request Sep 15, 2020

CLN: Numba internal routines #36376

Merged

3 tasks

kesmit13 pushed a commit to kesmit13/pandas that referenced this pull request Nov 2, 2020

PERF: Allow groupby transform with numba engine to be fully paralleli…

ef57808

…zable (pandas-dev#36240)

jorisvandenbossche mentioned this pull request Dec 20, 2020

PERF: performance regressions in 1.2.0rc #38591

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PERF: Allow groupby transform with numba engine to be fully parallelizable #36240

PERF: Allow groupby transform with numba engine to be fully parallelizable #36240

mroeschke commented Sep 9, 2020 •

edited

Loading

jbrockmendel commented Sep 9, 2020

mroeschke commented Sep 9, 2020

jreback commented Sep 9, 2020

jreback left a comment

jreback Sep 11, 2020

jreback commented Sep 13, 2020

PERF: Allow groupby transform with numba engine to be fully parallelizable #36240

PERF: Allow groupby transform with numba engine to be fully parallelizable #36240

Conversation

mroeschke commented Sep 9, 2020 • edited Loading

jbrockmendel commented Sep 9, 2020

mroeschke commented Sep 9, 2020

jreback commented Sep 9, 2020

jreback left a comment

Choose a reason for hiding this comment

jreback Sep 11, 2020

Choose a reason for hiding this comment

jreback commented Sep 13, 2020

mroeschke commented Sep 9, 2020 •

edited

Loading