In [1]:
import numpy as np
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score

# 假设你有三张散点图，分别对应三组2D坐标数据：X1, X2, X3
# 这里仅用随机数据做示例，实际中请替换为你的真实数据
np.random.seed(42)
X1 = np.random.rand(100, 2)  # 100个点，每个点2维坐标
X2 = np.random.rand(120, 2)
X3 = np.random.rand(80, 2)

def compute_silhouette_score(X, n_clusters=3):
    """
    对给定的数据 X (形状: [n_samples, n_features]) 进行 k-means 聚类
    并计算 silhouette_score。
    
    参数:
    - X: ndarray, shape = [n_samples, n_features]
    - n_clusters: 聚类的类别数（可根据数据或先验知识调整）
    
    返回:
    - score: 该数据在聚类下的轮廓系数
    """
    kmeans = KMeans(n_clusters=n_clusters, random_state=42)
    labels = kmeans.fit_predict(X)
    score = silhouette_score(X, labels)
    return score

# 分别计算三组数据的 Silhouette Score
for i, X in enumerate([X1, X2, X3], start=1):
    score = compute_silhouette_score(X, n_clusters=3)
    print(f"数据集{i}的 Silhouette Score: {score:.4f}")


数据集1的 Silhouette Score: 0.4297
数据集2的 Silhouette Score: 0.4145
数据集3的 Silhouette Score: 0.3324


