In [2]:
import numpy as np

class KMeans:
    def __init__(self, n_clusters, data):
        self.n_clusters = n_clusters
        self.data = np.array(data)
        self.centroids = self.initialize_centroids()
        self.cluster_assignments = None

    def initialize_centroids(self):
        # Initialiser les centroïdes de manière aléatoire
        indices = np.random.choice(len(self.data), self.n_clusters, replace=False)
        return self.data[indices]

    def find_nearest_centroid(self, point):
        # Trouver l'indice du centroïde le plus proche pour un point donné
        distances = np.linalg.norm(self.centroids - point, axis=1)
        return np.argmin(distances)

    def fit(self, n_iterations):
        for iteration in range(n_iterations):
            # Affecter chaque point au centroïde le plus proche
            self.cluster_assignments = np.array([self.find_nearest_centroid(point) for point in self.data])

            # Mettre à jour les centroïdes en calculant la moyenne des points attribués à chaque cluster
            for cluster in range(self.n_clusters):
                points_in_cluster = self.data[self.cluster_assignments == cluster]
                if len(points_in_cluster) > 0:
                    self.centroids[cluster] = np.mean(points_in_cluster, axis=0)





Test

In [5]:
# Exemple d'utilisation
data_points = [[1, 2], [5, 8], [3, 4], [8, 7], [2, 6], [7, 3]]
kmeans = KMeans(n_clusters=3, data=data_points)
kmeans.fit(n_iterations=100)

# Afficher les résultats
print("Centroides finaux :", kmeans.centroids)
print("Affectation des points :", kmeans.cluster_assignments)

Centroides finaux : [[6 7]
 [7 3]
 [2 4]]
Affectation des points : [2 0 2 0 2 1]
