# 🤖 Apprentissage non supervisé – K-means Clustering

## 🎯 Problème : Regrouper des clients selon leurs dépenses mensuelles (€)

In [None]:
import numpy as np
import matplotlib.pyplot as plt

## 💶 Données clients

In [None]:
depenses = np.array([200, 220, 250, 1000, 1050, 1100])

## 📌 Étape 1 : Initialiser 2 centres (k=2)

In [None]:
centres = np.array([220.0, 1050.0])  # centre initial

## 🔁 Étape 2 : Répéter jusqu’à stabilité

In [None]:
def assigner_clusters(data, centres):
    distances = np.abs(data[:, np.newaxis] - centres)
    return np.argmin(distances, axis=1)

def recalculer_centres(data, clusters, k):
    return np.array([data[clusters == i].mean() for i in range(k)])

k = 2
for iteration in range(10):
    clusters = assigner_clusters(depenses, centres)
    nouveaux_centres = recalculer_centres(depenses, clusters, k)
    if np.allclose(centres, nouveaux_centres):
        break
    centres = nouveaux_centres

## 📊 Résultat final

In [None]:
for i in range(k):
    print(f"Cluster {i+1} :", depenses[clusters == i])
print("Centres finaux :", centres)

## 📈 Visualisation

In [None]:
colors = ['red', 'blue']
for i in range(k):
    plt.scatter(depenses[clusters == i], [0]*len(depenses[clusters == i]), color=colors[i], label=f"Cluster {i+1}")
    plt.scatter(centres[i], 0, color=colors[i], edgecolor='black', s=200, marker='x')
plt.title("Regroupement des clients par K-means")
plt.yticks([])
plt.xlabel("Dépenses mensuelles (€)")
plt.legend()
plt.grid(True)
plt.show()