In [None]:
from sklearn.datasets import load_digits
from sklearn.datasets import load_iris
from sklearn.datasets import load_wine
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans, MeanShift, AffinityPropagation, DBSCAN, OPTICS
from sklearn import metrics
from sklearn.preprocessing import StandardScaler
from sklearn.metrics.pairwise import cosine_similarity
import warnings
import numpy as np

In [None]:

warnings.filterwarnings("ignore")

digits = load_digits()
canser = load_breast_cancer()
iris = load_iris()
wine = load_wine()
datasets = [digits, canser, iris, wine]
dss = ["Цифры", "Рак", "Ирисы", "Вино"]
mts = ['euclidean', 'manhattan', 'cosine']

for ds in range(4):
  print("\n\nDataset: ", dss[ds])
  X = datasets[ds].data
  y = datasets[ds].target
  scaler = StandardScaler()
  X = scaler.fit_transform(X)
  for metric in mts:
    print("\nМетрика: ", metric)
    for n in range(2, 5):
      model = KMeans(n_clusters = n)
      model.fit(X)
      y_pred = model.predict(X)
      adj = metrics.adjusted_rand_score(y, y_pred)
      sil = metrics.silhouette_score(X, y_pred, metric = metric)
      print("---------------------------------------")
      print(f"Метод KMeans, Кол-во кластеров: {n}")
      print(f"Cкорректированный индекс Рэнда: {adj}")
      print(f"Силуэт: {sil}")

    model = MeanShift()
    model.fit(X)
    y_pred = model.predict(X)
    adj = metrics.adjusted_rand_score(y, y_pred)
    sil = metrics.silhouette_score(X, y_pred, metric = metric)
    print("---------------------------------------")
    print(f"Метод MeanShift")
    print(f"Cкорректированный индекс Рэнда: {adj:.3f}")
    print(f"Силуэт: {sil}")

    if metric == 'cosine':
        model = AffinityPropagation(affinity = 'precomputed')
        similarity_matrix = cosine_similarity(X)
        model.fit(similarity_matrix)
    else:
        model = AffinityPropagation(affinity = 'euclidean')
        model.fit(X)
    y_pred = model.labels_
    adj = metrics.adjusted_rand_score(y, y_pred)
    sil = metrics.silhouette_score(X, y_pred, metric = metric)
    print("---------------------------------------")
    print(f"Метод AffinityPropagation, Метрика: {metric}")
    print(f"Cкорректированный индекс Рэнда: {adj:.3f}")
    print(f"Силуэт: {sil}")



    model = DBSCAN(metric = metric)
    model.fit(X)
    y_pred = model.labels_
    num_labels = len(np.unique(y_pred))
    if num_labels >= 2:
      adj = metrics.adjusted_rand_score(y, y_pred)
      sil = metrics.silhouette_score(X, y_pred, metric = metric)
      print("---------------------------------------")
      print(f"Метод MeanShift")
      print(f"Cкорректированный индекс Рэнда: {adj:.3f}")
      print(f"Силуэт: {sil}")



    model = OPTICS(metric = metric)
    model.fit(X)
    y_pred = model.labels_
    adj = metrics.adjusted_rand_score(y, y_pred)
    sil = metrics.silhouette_score(X, y_pred, metric = metric)
    print("---------------------------------------")
    print(f"Метод MeanShift")
    print(f"Cкорректированный индекс Рэнда: {adj:.3f}")
    print(f"Силуэт: {sil}")













Dataset:  Цифры
Метрика:  euclidean
---------------------------------------
Метод KMeans, Кол-во кластеров: 2
Cкорректированный индекс Рэнда: 0.1264026069539568
Силуэт: 0.10564011752045978
---------------------------------------
Метод KMeans, Кол-во кластеров: 3
Cкорректированный индекс Рэнда: 0.24671048356318925
Силуэт: 0.10445567448142226
---------------------------------------
Метод KMeans, Кол-во кластеров: 4
Cкорректированный индекс Рэнда: 0.2902814581050722
Силуэт: 0.09540834891837935
---------------------------------------
Метод MeanShift
Cкорректированный индекс Рэнда: 0.000
Силуэт: 0.3128806756982816
---------------------------------------
Метод AffinityPropagation, Метрика: euclidean
Cкорректированный индекс Рэнда: 0.154
Силуэт: 0.10534489509840632
---------------------------------------
Метод MeanShift
Cкорректированный индекс Рэнда: 0.004
Силуэт: -0.2593179267967185
Метрика:  manhattan
---------------------------------------
Метод KMeans, Кол-во кластеров: 2
Cкорректирова