In [10]:
# 匯入所需模組
from sklearn.cluster import KMeans  # 匯入 KMeans 分群演算法
from sklearn.datasets import load_iris  # 匯入 Iris 資料集
from sklearn.metrics import accuracy_score  # 匯入正確率評估函數

# 讀入鳶尾花資料集
iris = load_iris()
iris_data = iris.data     # 特徵資料（如花萼與花瓣的長度與寬度）
iris_label = iris.target  # 真實標籤（0=setosa, 1=versicolor, 2=virginica）

# 建立 KMeans 分群模型，指定要分成 3 群（因為 Iris 資料有 3 種花）
clf = KMeans(n_clusters=3)

# 使用 KMeans 模型對資料進行訓練（分群）
iris_clf = clf.fit(iris_data)

# 取得分群結果（每筆資料被分配到哪一群）
cluster_labels = iris_clf.labels_

# 印出分群結果（每筆資料被分到的群編號）
print("分群結果：")
print(cluster_labels)

# 印出原本的真實品種標籤
print("真實品種：")
print(iris_label)

# 計算並印出分群結果與真實標籤的「正確率」
print(accuracy_score(cluster_labels, iris_label))

分群結果：
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 2 2 2 2 0 2 2 2 2
 2 2 0 0 2 2 2 2 0 2 0 2 0 2 2 0 0 2 2 2 2 2 0 2 2 2 2 0 2 2 2 0 2 2 2 0 2
 2 0]
真實品種：
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
0.24
