PERF: perf improvements in drop_duplicates for integer dtyped arrays #10917

jreback · 2015-08-28T03:14:24Z

no need to factorize integers when dropping duplicates.

master

In [1]: np.random.seed(1234)

In [2]: df = DataFrame({'A' : np.random.randint(0,10000,size=1000000)})                

In [3]: %timeit df.drop_duplicates()
10 loops, best of 3: 36.9 ms per loop

PR

In [2]: df = DataFrame({'A' : np.random.randint(0,10000,size=1000000)})

In [3]: %timeit df.drop_duplicates()
10 loops, best of 3: 21.6 ms per loop

PERF: perf improvements in drop_duplicates for integer dtyped arrays

jreback added the Performance Memory or execution speed performance label Aug 28, 2015

jreback added this to the 0.17.0 milestone Aug 28, 2015

jreback mentioned this pull request Aug 28, 2015

PERF: additonal GIL releasing #10213

Closed

12 tasks

jreback force-pushed the drop_duplicates branch from 0d7a550 to 83fe1ac Compare August 28, 2015 03:16

PERF: perf improvements in drop_duplicates for integer dtyped arrays

a00c7ea

jreback force-pushed the drop_duplicates branch from 83fe1ac to a00c7ea Compare August 28, 2015 12:32

jreback added a commit that referenced this pull request Aug 28, 2015

Merge pull request #10917 from jreback/drop_duplicates

027817b

PERF: perf improvements in drop_duplicates for integer dtyped arrays

jreback merged commit 027817b into pandas-dev:master Aug 28, 2015

This was referenced Oct 21, 2015

drop_duplicates destroys non-duplicated data under 0.17 #11376

Closed

BUG: drop_duplicates drops non-duplicate rows in the presence of integer columns #11403

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PERF: perf improvements in drop_duplicates for integer dtyped arrays #10917

PERF: perf improvements in drop_duplicates for integer dtyped arrays #10917

jreback commented Aug 28, 2015

PERF: perf improvements in drop_duplicates for integer dtyped arrays #10917

PERF: perf improvements in drop_duplicates for integer dtyped arrays #10917

Conversation

jreback commented Aug 28, 2015