## フィッシャーの判別分析について

フィッシャーの判別分析（Fisher's Linear Discriminant Analysis, LDA）は、統計学と機械学習において、2つ以上のグループにデータを分類するための線形手法です。主に、特徴量空間をグループ間の分離を最大化する方向に変換し、新しい観測データのグループを予測するために使用されます。

### 基本概念

1. **目標**: 異なるクラス間の分離を最大化し、同一クラス内のデータのばらつきを最小化する線形判別関数を求める。
2. **線形判別関数**: データポイント $\mathbf{x}$ を分類するための線形関数 $y = \mathbf{w}^T \mathbf{x} + b$ を求めます。ここで、$\mathbf{w}$ は重みベクトル、$b$ はバイアス項です。

### ステップ

1. **データの準備**: まず、各クラスに属するサンプルデータを集めます。
2. **平均ベクトルの計算**: 各クラス $i$ について、平均ベクトル $\mathbf{m}_i$ を計算します。
   $$
   \mathbf{m}_i = \frac{1}{N_i} \sum_{k=1}^{N_i} \mathbf{x}_k
   $$
   ここで、$N_i$ はクラス $i$ のサンプル数、$\mathbf{x}_k$ はクラス $i$ に属するサンプルデータです。

3. **クラス内分散行列の計算**: 各クラス内のばらつきを表す分散行列 $S_i$ を計算します。
   $$
   S_i = \sum_{k=1}^{N_i} (\mathbf{x}_k - \mathbf{m}_i)(\mathbf{x}_k - \mathbf{m}_i)^T
   $$

4. **総クラス内分散行列の計算**: 全クラスのクラス内分散行列を合計します。
   $$
   S_W = \sum_{i} S_i
   $$

5. **クラス間分散行列の計算**: クラスの平均ベクトル間のばらつきを表すクラス間分散行列 $S_B$ を計算します。
   $$
   S_B = \sum_{i} N_i (\mathbf{m}_i - \mathbf{m})(\mathbf{m}_i - \mathbf{m})^T
   $$
   ここで、$\mathbf{m}$ は全データの平均ベクトルです。

6. **最適な変換ベクトル $\mathbf{w}$ の計算**: 
   $$
   \mathbf{w} = S_W^{-1} (\mathbf{m}_1 - \mathbf{m}_2)
   $$
   このベクトル $\mathbf{w}$ によって、データを1次元に射影し、クラス間の分離を最大化します。

### 実装例

以下は、Pythonでフィッシャーの判別分析を実装する例です。`scikit-learn`ライブラリを使用します。


このコードでは、Irisデータセットを使用してLDAを適用し、2次元空間に射影した結果をプロットしています。

In [None]:
import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
import matplotlib.pyplot as plt

# サンプルデータの作成
np.random.seed(0)
class_1 = np.random.randn(20, 2) + np.array([0, 0])
class_2 = np.random.randn(20, 2) + np.array([5, 5])

X = np.vstack((class_1, class_2))
y = np.hstack((np.zeros(20), np.ones(20)))

# LDAモデルの作成と適用
lda = LDA()
lda.fit(X, y)
X_lda = lda.transform(X)

# プロット
plt.scatter(X_lda[y == 0], np.zeros(20), label='Class 1')
plt.scatter(X_lda[y == 1], np.zeros(20), label='Class 2')
plt.xlabel('LD1')
plt.ylabel('LD2')
plt.legend()
plt.title('Fisher\'s Linear Discriminant Analysis')
plt.show()

## フィッシャーの判別分析の具体的な計算過程

具体的な例を用いて、フィッシャーの判別分析の計算過程を示します。ここでは、簡単な2クラスのデータセットを使用します。

### データセット
以下のような2クラスのデータを考えます：
- クラス0: $(2, 3), (3, 3), (2, 2)$
- クラス1: $(6, 8), (7, 9), (8, 8)$

### ステップ1: クラスごとの平均ベクトルの計算

クラス0の平均ベクトル $\mu_0$ とクラス1の平均ベクトル $\mu_1$ を計算します。
$$
\mu_0 = \frac{1}{3} \left( \begin{array}{c}
2 + 3 + 2 \\
3 + 3 + 2 \\
\end{array} \right)
= \left( \begin{array}{c}
2.33 \\
2.67 \\
\end{array} \right)
$$

$$
\mu_1 = \frac{1}{3} \left( \begin{array}{c}
6 + 7 + 8 \\
8 + 9 + 8 \\
\end{array} \right)
= \left( \begin{array}{c}
7.00 \\
8.33 \\
\end{array} \right)
$$

### ステップ2: クラス内散布行列 $S_W$ の計算

各クラスの散布行列を計算し、それらを合計します。

クラス0の散布行列 $S_0$：
$$
S_0 = \sum_{i=1}^{3} (x_i - \mu_0)(x_i - \mu_0)^T
= \left( \begin{array}{cc}
0.22 & 0.22 \\
0.22 & 0.67 \\
\end{array} \right)
$$

クラス1の散布行列 $S_1$：
$$
S_1 = \sum_{i=1}^{3} (x_i - \mu_1)(x_i - \mu_1)^T
= \left( \begin{array}{cc}
2.00 & 1.00 \\
1.00 & 0.67 \\
\end{array} \right)
$$

クラス内散布行列 $S_W$：
$$
S_W = S_0 + S_1 = \left( \begin{array}{cc}
2.22 & 1.22 \\
1.22 & 1.34 \\
\end{array} \right)
$$

### ステップ3: クラス間散布行列 $S_B$ の計算

クラス間散布行列 $S_B$ を計算します。
$$
S_B = N_0 (\mu_0 - \mu)(\mu_0 - \mu)^T + N_1 (\mu_1 - \mu)(\mu_1 - \mu)^T
$$

ここで、全体の平均ベクトル $\mu$ は次のように計算されます：
$$
\mu = \frac{N_0 \mu_0 + N_1 \mu_1}{N_0 + N_1} = \left( \begin{array}{c}
4.67 \\
5.50 \\
\end{array} \right)
$$

したがって、
$$
S_B = \left( \begin{array}{cc}
18.67 & 21.00 \\
21.00 & 23.67 \\
\end{array} \right)
$$

### ステップ4: 判別関数の計算

固有値問題 $S_W^{-1} S_B w = \lambda w$ を解きます。

逆行列 $S_W^{-1}$ を計算します：
$$
S_W^{-1} = \left( \begin{array}{cc}
6.0 & -5.5 \\
-5.5 & 10.0 \\
\end{array} \right)
$$

次に、$S_W^{-1} S_B$ を計算します：
$$
S_W^{-1} S_B = \left( \begin{array}{cc}
48.0 & 54.0 \\
-24.5 & -27.0 \\
\end{array} \right)
$$

この行列の固有値と固有ベクトルを計算すると、最大の固有値に対応する固有ベクトル $w$ は次のようになります：
$$
w = \left( \begin{array}{c}
0.70 \\
0.71 \\
\end{array} \right)
$$

このベクトル $w$ が判別関数の係数となり、データを次元削減するために使用されます。