Implemented light Elkan version of clustering #27

Arkoniak · 2020-03-16T13:37:38Z

Usage

using PyCall
using Clustering
using ParallelKMeans
using Plots

data = pyimport("sklearn.datasets")
X, y = data.make_blobs(n_samples=1_000_000, n_features=30, centers=3, cluster_std=0.9, random_state=80)
X = permutedims(X)
@time a = [Clustering.kmeans(X, i, tol=1e-4, maxiter=300).totalcost for i = 2:10]
@time b = [ParallelKMeans.kmeans(X, i, ParallelKMeans.SingleThread(), tol=1e-6, max_iters=300, verbose=false).totalcost for i = 2:10]
@time c = [ParallelKMeans.kmeans(X, i, ParallelKMeans.MultiThread(), tol=1e-6, max_iters=300, verbose=false).totalcost for i = 2:10]
@time d = [ParallelKMeans.kmeans(ParallelKMeans.LightElkan(), X, i, ParallelKMeans.MultiThread(), tol=1e-6, max_iters=300, verbose=false).totalcost for i = 2:10]

plot(a, label="Clustering")
plot!(b, label="SingleThread")
plot!(c, label="MultiThread")
plot!(d, label="LightElkan")

Warning: requires heavy refactoring, now it's ugly copy paste.

PyDataBlog · 2020-03-16T14:41:35Z

Merging for further testing and re-factoring

Implemented light Elkan version of clustering

c0eed3f

PyDataBlog merged commit f5599fd into PyDataBlog:experimental Mar 16, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Implemented light Elkan version of clustering #27

Implemented light Elkan version of clustering #27

Uh oh!

Arkoniak commented Mar 16, 2020 •

edited

Loading

Uh oh!

PyDataBlog commented Mar 16, 2020

Uh oh!

Uh oh!

Implemented light Elkan version of clustering #27

Implemented light Elkan version of clustering #27

Uh oh!

Conversation

Arkoniak commented Mar 16, 2020 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

PyDataBlog commented Mar 16, 2020

Uh oh!

Uh oh!

Arkoniak commented Mar 16, 2020 •

edited

Loading