In [None]:
# 匯入所需的函式庫
from sklearn.cluster import KMeans        # 用於 KMeans 分群演算法
from sklearn.datasets import load_iris      # 提供鳶尾花 (Iris) 資料集
from sklearn.metrics import accuracy_score    # 用來評估分群結果與真實標籤的準確度

# 讀入鳶尾花資料
iris = load_iris()        # 載入鳶尾花資料集（含資料與標籤）
iris_data = iris.data       # 取得特徵資料（花萼長度、花萼寬度、花瓣長度、花瓣寬度）
iris_label = iris.target      # 取得真實的分類標籤（0=setosa, 1=versicolor, 2=virginica）

# 建立分類器
clf = KMeans(3)
iris_clf = clf.fit(iris_data)   # 使用 iris 資料訓練分群模型

# 取得模型分群後的標籤（即每筆資料被分配到哪一群）
cluster_labels = iris_clf.labels_
print("分群結果：")
print(cluster_labels)     # 輸出分群後的結果

# 印出品種看看
print("真實品種：")
print(iris_label)       # 輸出原始資料的標籤

# 計算模型分群結果與實際標籤的準確率
# 注意：KMeans 分群不一定與真實標籤順序對應，這樣比較準確率其實不完全合理
print(accuracy_score(cluster_labels, iris_label))

分群結果：
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 1 1 1 2 1 1 1 1
 1 1 2 2 1 1 1 1 2 1 2 1 2 1 1 2 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 1 2 1
 1 2]
真實品種：
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
0.44666666666666666
