# Linear discriminant analysis(LDA)線性判別分析
LDA 和 PCA 之間的一個主要區別是它們有不同的應用。 PCA 使用線性代數技術來尋找使資料集變異數最大化的子空間。這意味著 PCA 基本上找到了最適合線性迴歸問題的子空間。另一方面，LDA 使用線性代數技術來尋找最適合分類問題的子空間。

In [1]:
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris

# 載入 Iris 資料集
iris = load_iris()  
X = iris.data  # 特徵矩陣，包含花卉的不同測量數據（例如：花萼長度、花萼寬度等）
y = iris.target  # 目標變數，對應花卉的種類，包含 3 類 (setosa, versicolor, virginica)

# 將資料集分割為訓練集和測試集，30% 作為測試集，70% 作為訓練集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 初始化並應用線性判別分析 (LDA) 模型
lda = LinearDiscriminantAnalysis()

# 使用訓練集來擬合 LDA 模型
lda.fit(X_train, y_train)

# 使用訓練好的 LDA 模型來對測試集進行預測
y_pred = lda.predict(X_test)

# 評估 LDA 模型在測試集上的準確度
accuracy = lda.score(X_test, y_test)  # 計算模型的準確度，將預測結果與真實標籤進行比較
print(f"Accuracy: {accuracy}")  # 輸出準確度

Accuracy: 1.0


In [2]:
import datetime

current_date = datetime.datetime.now().strftime("%Y年%m月%d日")
print(f"更新日期: {current_date}")

更新日期: 2024年12月01日
