# Lab14

---

## Task

Построить кластеризации (для одинаковых N и k), используя несколько разных «расстояний» и разные начальные центры (например, рандомные, крайние (≈ max/min по координатам, первые в списке, т.п.)

Результат — на рисунке (точки разных кластеров изобразить разными цветами; отметить центры кластеров). Т.е. в итоге — не менее 4-х рисунков. Выводить также количество итераций, потребовавшихся для стабилизации кластеров в каждом из случаев.

# Solution

---

In [None]:
import math
import numpy as np
import scipy.linalg as la

import matplotlib.pyplot as plt
import matplotlib.cm as cm

In [None]:
def euclidian(a, b):
    return np.sum(np.abs(a - b))

def manhattan(a, b):
    return np.sum(np.abs(a - b), axis=1)

def clustering(points, centers, metric):
    if metric == "manhattan":
        return np.array([np.argmin(manhattan(x,centers)) for x in points])
    else:
        return np.array([np.argmin(la.norm(x-centers, axis=1)) for x in points])

def kmeans(points, centers, metric="euclid", max_iter=100):
    iter = 0
    
    while iter < max_iter:
        clusters = clustering(points, centers, metric)
        centers = compute_centers(points, clusters)

        iter +=1

        if all(clusters == clustering(points, centers, metric)):
            if metric == "manhattan":
                diams = np.array([round(np.max(manhattan(centers[i],points[clusters == i])),3) for i in range(len(centers))])
            else:
                diams = np.array([round(np.max(la.norm(X[clusters == i]-centers[i],axis=1)),3)for i in range(len(centers))])
            return clusters, centers, iter

def first_k_centers(points, k):
    return [points[i] for i in range(k)]

def random_centers(points, k):
    return points[np.random.choice(len(points), k)]

def compute_centers(points, clusters):
    ans = []
    for i in np.unique(clusters):
        cluster = points[clusters == i] 
        if cluster is not None:
            ans.append(np.mean(cluster, axis = 0))
    return np.array(ans)

def get_random_points(number_of_points):
    return list(map(tuple, np.random.rand(number_of_points, 2)))

## Experimental reseach

In [None]:
def experiment(points, k, metric, center):
    fig, axes = plt.subplots(1, 2,figsize=(13,13))

    for i in range(2):
        clusters, cent, k = kmeans(points, centers[i], metric[i])
        axes[0, i].scatter(points[:,0], points[:,1], c=clusters)
        axes[0, i].scatter(cent[:][0],cent[:,1], c="bladk", s=30, marker="D")
        # axes[0, i].set_title("Metrics: {}; Centers choice: {}; \n Iters: {} \n diams: {}".format(metrics[i],centers_name[j],k,diams))

In [None]:
n = 1000
k = 4

X = np.random.uniform(low=-40,high=40,size=(80,2))
centers = [
    random_centers(X , k),
    random_centers(X , k)
]
metric = ["euclid", "manhattan"]

experiment(X, k, "manhattan", centers)