In [None]:
from sklearn.cluster import KMeans         # 匯入 KMeans 分群模型
from sklearn.datasets import load_iris     # 匯入鳶尾花資料集
from sklearn.metrics import accuracy_score # 匯入計算準確率的函式

# 讀入鳶尾花資料集
iris = load_iris()
iris_data = iris.data       # 特徵資料（花萼長度、花萼寬度、花瓣長度、花瓣寬度）
iris_label = iris.target    # 真實標籤（0=setosa, 1=versicolor, 2=virginica）

# 建立 KMeans 分群模型，設定分成 3 群（因為鳶尾花有三種品種）
clf = KMeans(n_clusters=3)
iris_clf = clf.fit(iris_data)   # 對資料進行分群訓練

# 取得分群後的標籤（模型預測的群集編號）
cluster_labels = iris_clf.labels_
print("分群結果：")
print(cluster_labels)

# 印出原始資料的真實標籤
print("真實品種：")
print(iris_label)

# 計算預測群集與真實標籤之間的準確率
# ⚠️ 注意：KMeans 分群不一定會對應正確標籤順序，可能需重新對應群集與標籤
print(accuracy_score(cluster_labels, iris_label))