In [1]:
import numpy as np
from sklearn.cluster import KMeans
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline

def SpectralGraphPartitioning(W, K):
    W_rowsum = W.sum(axis=1)
    Z = W / np.sqrt(np.outer(W_rowsum, W_rowsum)) # Step 1, Compute Z
    eigen_value, eigen_vector = np.linalg.eig(Z)
    top_index = eigen_value.argsort()[::-1][0:K]
    out_matrix = eigen_vector[:, top_index]       # Step 2, Extract the top K eigenvectors of Z
    out_matrix = np.real(out_matrix)
    out_matrix = out_matrix / np.c_[np.linalg.norm(out_matrix, axis=1)] # Step 3, Renormalize each row of the resulting n * K matrix

    kmeans = KMeans(n_clusters=2, random_state=0).fit(out_matrix) # Step 4, Apply K-means to the row vector
    return kmeans.labels_

In [2]:
N_half = 5
bandwidth = 0.03
horizontal_data = np.array([
                        np.arange(-1.0, 1.0, 2/N_half) + np.random.uniform(-bandwidth, bandwidth, N_half),
                        np.zeros(N_half) + np.random.uniform(-bandwidth, bandwidth, N_half)
                        ]).T
vertical_data = np.array([
                        np.zeros(N_half) + np.random.uniform(-bandwidth, bandwidth, N_half),
                        np.arange(-1.0, 1.0, 2/N_half) + np.random.uniform(-bandwidth, bandwidth, N_half)
                        ]).T

sample_data = np.concatenate([horizontal_data, vertical_data], axis=0)
#np.random.shuffle(sample_data)
n = 2 * N_half
rnd_idx = np.random.choice(n, n,replace=False)
sample_data = sample_data[rnd_idx, :]


W = np.zeros([n, n])
W[:N_half, :N_half] = 1
W[N_half:, N_half:] = 1
W = W[rnd_idx, :][:, rnd_idx]
W

array([[1., 1., 0., 1., 0., 1., 0., 1., 0., 0.],
       [1., 1., 0., 1., 0., 1., 0., 1., 0., 0.],
       [0., 0., 1., 0., 1., 0., 1., 0., 1., 1.],
       [1., 1., 0., 1., 0., 1., 0., 1., 0., 0.],
       [0., 0., 1., 0., 1., 0., 1., 0., 1., 1.],
       [1., 1., 0., 1., 0., 1., 0., 1., 0., 0.],
       [0., 0., 1., 0., 1., 0., 1., 0., 1., 1.],
       [1., 1., 0., 1., 0., 1., 0., 1., 0., 0.],
       [0., 0., 1., 0., 1., 0., 1., 0., 1., 1.],
       [0., 0., 1., 0., 1., 0., 1., 0., 1., 1.]])

In [3]:
SpectralGraphPartitioning(W=W, K=2)

array([0, 0, 1, 0, 1, 0, 1, 0, 1, 1])