In [None]:
import numpy as np

# Fonction pour initialiser les centres des clusters aléatoirement
def initialize_centroids(X, k):
    np.random.seed(42)  # pour la reproductibilité
    random_indices = np.random.choice(X.shape[0], size=k, replace=False)
    return X[random_indices]

# Fonction pour attribuer chaque point au centre de cluster le plus proche
def assign_clusters(X, centroids):
    distances = np.linalg.norm(X[:, np.newaxis] - centroids, axis=2)
    return np.argmin(distances, axis=1)

# Fonction pour recalculer les centres des clusters
def update_centroids(X, labels, k):
    new_centroids = np.array([X[labels == i].mean(axis=0) for i in range(k)])
    return new_centroids

# Fonction principale du K-means
def kmeans(X, k, max_iters=100):
    centroids = initialize_centroids(X, k)
    for i in range(max_iters):
        labels = assign_clusters(X, centroids)
        new_centroids = update_centroids(X, labels, k)
        
        # Vérifier si les centroids ont changé
        if np.all(centroids == new_centroids):
            break
        
        centroids = new_centroids
    return centroids, labels

# Exemple d'utilisation
if __name__ == "__main__":
    # Générer des données aléatoires pour l'exemple
    X = np.random.rand(100, 2)  # 100 points avec 2 caractéristiques

    k = 3  # Nombre de clusters
    centroids, labels = kmeans(X, k)

    print("Centroids:\n", centroids)
    print("Labels:\n", labels)
