**Импорт**

In [91]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

**Загрузка данных**

In [92]:
iris = load_iris()
X = iris.data  
print(f'Кол-во признаков: {len(X[0])}')

#scaler = StandardScaler()
#X = scaler.fit_transform(X)

Кол-во признаков: 4


**Расстояние**

In [93]:
def euclidean_distance(x, y):
    return np.sqrt(np.sum((x - y) ** 2))

def pairwise_distances1(obj, objs):
    return np.array([euclidean_distance(obj, x) for x in objs])

## Кластеризация

In [94]:
def maximin_clustering(X, threshold=1.0):
    # Начальные значения
    n_samples = X.shape[0]
    clusters = []
    labels = np.zeros(X.shape[0], dtype=int)
    cluster_centers = []
    last = 0

    # Выбираем первый случайный центр
    first_center = X[0]
    cluster_centers.append(first_center)
    labels[0] = last
    last += 1
    clusters.append([0])  # Объект 0 входит в первый кластер

    # Найдем второй центр - объект, который дальше всего от первого
    distances = pairwise_distances1(first_center, X)
    second_center_index = np.argmax(distances)
    second_center = X[second_center_index]
    labels[second_center_index] = last
    last += 1
    cluster_centers.append(second_center)
    clusters.append([int(second_center_index)])

    # Кластеризация оставшихся объектов
    for i in range(1, n_samples):
        if i == second_center_index:
            continue  # Пропускаем уже выбранный центр

        # Считаем расстояния до всех центров кластеров
        distances_to_centers = pairwise_distances1(X[i], cluster_centers)

        # Найдем минимальное расстояние до центра
        min_distance = np.min(distances_to_centers)
        nearest_cluster = np.argmin(distances_to_centers)

        # Если расстояние до ближайшего кластера больше порога, создаем новый кластер
        if min_distance > threshold:
            cluster_centers.append(X[i])
            clusters.append([i])
            labels[i] = last
            last += 1
        else:
            clusters[nearest_cluster].append(i)
            labels[i] = nearest_cluster

    return clusters, cluster_centers, labels


In [95]:
# Пороговое значение (можно поэкспериментировать с его изменением)
threshold = 3

# Применение метода максимина
clusters, cluster_centers, labels = maximin_clustering(X, threshold)

# Вывод результатов кластеризации
print(f'Количество кластеров: {len(clusters)}')
for i, cluster in enumerate(clusters):
    print(f'Кластер {i + 1}: {cluster}')

print(f'Метки:\n{labels}')

Количество кластеров: 3
Кластер 1: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
Кластер 2: [118, 50, 51, 52, 100, 102, 104, 105, 107, 108, 109, 112, 116, 117, 120, 122, 124, 125, 128, 129, 130, 131, 132, 135, 136, 139, 140, 141, 143, 144, 145]
Кластер 3: [53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 101, 103, 106, 110, 111, 113, 114, 115, 119, 121, 123, 126, 127, 133, 134, 137, 138, 142, 146, 147, 148, 149]
Метки:
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 2 1 1 2 1 1 1 2
 2 1 2 2 2 1 1 1 2 1 2 1 2 1 1 2 2 1 1 1 1 1 2 2 1 1 2 2 1 1 1 2 1 1