In [1]:
# 導入所需的函式庫
from sklearn.datasets import load_iris
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 導入鳶尾花資料集
iris = load_iris()

# 將iris資料集的原是資料轉換成dataframe，並設定欄位名稱為其特徵名稱，同時載入
df = pd.DataFrame(iris['data'], columns=iris['feature_names'])

# 加入預測的目標(其中的0、1、2分別代表了花的三個不同屬種)
df['target'] = iris['target']

# 將特徵(x)、目標(y)各自需要的欄位抓出來
x_col = df[['sepal length (cm)', 'petal length (cm)', 'petal width (cm)']]
y_col = df['target']

# 將資料切割成訓練集、測試集
X_train, X_test, Y_train, Y_test = train_test_split(x_col, y_col, test_size=0.33, random_state=42) 

# 初始模型：將匯入的羅吉斯回歸模型放進自己設定的變數中
mod = LogisticRegression()

# 訓練模型
mod.fit(X_train, Y_train)

# 模型預測
pred = mod.predict(X_test)

In [2]:
from sklearn.metrics import accuracy_score

# 正確率：比較預測出來的結果跟正確答案的正確率
print("正確率：", accuracy_score(Y_test, pred).round(2))

正確率： 1.0


In [3]:
from sklearn.metrics import confusion_matrix

# 混淆矩陣
cf = confusion_matrix(Y_test, pred)

# 把矩陣結果加上行列的標題後，打印出來
print(pd.DataFrame(cf, columns=['預測1', '預測2', '預測3'], index=['實際1','實際2','實際3']))

     預測1  預測2  預測3
實際1   19    0    0
實際2    0   15    0
實際3    0    0   16


In [4]:
from sklearn.metrics import classification_report

# 印出綜合報告
print(classification_report(Y_test, pred))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        15
           2       1.00      1.00      1.00        16

    accuracy                           1.00        50
   macro avg       1.00      1.00      1.00        50
weighted avg       1.00      1.00      1.00        50

