## 24. フィッシャーの線形判別分析法 (LDA : Linear Discriminant Analysis)

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

### <font color = blue>**1.** </font> 実装 : 自動生成した2クラスデータをLDA

#### <font color = green> **1.1.** </font> データの準備

In [None]:
# ライブラリのインポート
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# 各クラスのデータ数を設定
num = 100

In [None]:
# データの次元数を設定
DIM = 2

In [None]:
# 共分散を設定
cov = [[3, 1], [1, 3]]

In [None]:
## ２次元データを生成

# クラス１ : (-5,-5)を中心に共分散covで散らばったnum個の(x,y)データ
class1 = np.random.multivariate_normal([-5, -5], cov, num)

# クラス２ : (5,5)を中心に共分散covで散らばったnum個の(x,y)データ
class2 = np.random.multivariate_normal([5, 5], cov, num)

In [None]:
# 生成したデータを図示
# クラス１は青
plt.plot(class1[:,0], class1[:,1], 'bo', ms=3)

# クラス２は赤
plt.plot(class2[:,0], class2[:,1], 'ro', ms=3)

plt.show()

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

In [None]:
# listからnp.arrayに変換（行列の転置や逆行列を扱うため）
cls1 = np.array(class1)
cls2 = np.array(class2)

In [None]:
# 各クラスの平均値を算出
mean1 = np.mean(cls1, axis=0)
mean2 = np.mean(cls2, axis=0)

In [None]:
# m1=
mean1

In [None]:
# m2=
mean2

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

#### <font color = green> ☆ </font> numpy による行列計算の復習

In [None]:
# データ点の1つ1つは "配列" の状態
x = cls1[0]
x

In [None]:
# .T で転置しても配列は配列
x.T

In [None]:
# 行列積を計算してくれる numpy.dot()
np.dot(x, x.T)

In [None]:
# x == x.T なので...
np.dot(x,x)

In [None]:
# "配列" 同士の行列積なので、これと同じことになる
x[0]**2 + x[1]**2

In [None]:
# 行列の乗算のための演算子　@ が存在する
# 式の見た目の通りに記述できてわかりやすい
x @ x.T

In [None]:
# やっぱり x == x.T なので...
x @ x

In [None]:
# 配列同士の乗算なので交換法則が成立
x.T @ x

In [None]:
# 2次元配列にすることで行列（2行1列の行列 : 縦ベクトル）の状態になる
A = x.reshape(DIM,1)
A

In [None]:
# 転置すると横ベクトル（1行2列の行列）になる
A.T

In [None]:
# これは横ベクトルと縦ベクトルの行列積なので...
A.T @ A

In [None]:
# これは縦ベクトルと横ベクトルの行列積なので...
A @ A.T

#### <font color = green> **1.2.** </font> 計算実行

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

In [None]:
## 総クラス内共分散行列を算出
# 計算結果の受け皿としての零行列を用意
Sw = np.zeros((DIM, DIM))

In [None]:
# Swの状態を確認
Sw

In [None]:
# クラス１の中だけでの共分散行列を算出

for Xn in cls1:
  # データ点の"配列"を1次元縦ベクトルに直す
  Xn = Xn.reshape(DIM, 1)
  
  # クラスの平均座標も"配列"から1次元縦ベクトルに直す
  mean1 = mean1.reshape(DIM, 1)
  
  # 共分散行列を計算して結果を格納
  Sw += (Xn - mean1) @ (Xn - mean1).T

In [None]:
# Swの状態を確認
Sw

In [None]:
# クラス2についてもクラス1と同様の計算を実行
for Xn in cls2:
  Xn = Xn.reshape(DIM, 1)
  mean2 = mean2.reshape(DIM, 1)
  Sw += (Xn - mean2) @ (Xn - mean2).T

In [None]:
# Swの状態を確認
Sw

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

In [None]:
# Swの逆行列を求める
Sw_inv = np.linalg.inv(Sw)

In [None]:
# Sw_inv を確認
Sw

In [None]:
# 本当に逆行列になっているか実際に積を計算してみる
Sw @ Sw_inv

In [None]:
# 重みパラメータw を求める
w = Sw_inv @ (mean2 - mean1)

In [None]:
print('w = [{}, {}]'.format(w[0], w[1]))

#### <font color = green> **1.3.** </font> 決定境界の可視化

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

In [None]:
# 各クラスの平均値　の中点の座標を算出
mean = (mean1 + mean2)/2

In [None]:
# 直線を引くためのデータ点を生成
x = np.linspace(-10, 10, 1000)

In [None]:
## フィッシャーの基準に従って求めた射影先の軸
y_proj = (w[1]/w[0]) * (x - mean[0]) + mean[1]

In [None]:
## 決定境界直線
# クラス内平均値 の中点を通りwと直交

y_disc = (-w[0]/w[1]) * (x - mean[0]) + mean[1]

In [None]:
# クラス１のデータの座標点listを取得
x1, y1 = cls1.T

In [None]:
## 上記で取得できる理由
cls1[0:5]

In [None]:
# 転置すると [ [x座標のlist], [y座標のlist] ] という構造になる
cls1[0:5].T

In [None]:
# クラス2のデータの座標点listを取得
x2, y2 = cls2.T

In [None]:
## 図示
plt.figure(figsize=(6, 6))

# クラス１は青
plt.plot(x1, y1, 'bo', ms=3)

# クラス２は赤
plt.plot(x2, y2, 'ro', ms=3)

# 射影先の軸
plt.plot(x, y_proj, 'g-')

# 決定境界直線
plt.plot(x, y_disc, 'k--')

plt.xlim(-12, 12)
plt.ylim(-12, 12)
plt.show()

重みパラメータ $w$ :\
$w \propto S^{-1}_{w}(m_2 - m_1)$

\
総クラス内共分散行列 $S_{w}$ :\
$\displaystyle S_{w} = \sum_{n \in C_1}(x_n - m_1)(x_n - m_1)^{T} + \sum_{n \in C_2}(x_n - m_2)(x_n - m_2)^{T}$

### <font color = blue>**2.** </font> 3クラス以上への拡張

ライブラリ : sklearn.discriminant_analysis.LinearDiscriminantAnalysis

In [None]:
# ライブラリのインポート
import matplotlib.pyplot as plt

from sklearn import datasets
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

In [None]:
# データの準備
iris = datasets.load_iris()
X = iris.data
y = iris.target
target_names = iris.target_names

In [None]:
# PCAと比較する
pca = PCA(n_components=2)
X_r = pca.fit(X).transform(X)

In [None]:
# Percentage of variance explained for each components
print('explained variance ratio (first two components): %s'
      % str(pca.explained_variance_ratio_))

In [None]:
# LDAの実行
lda = LinearDiscriminantAnalysis(n_components=2)
X_r2 = lda.fit(X, y).transform(X)

In [None]:
# 色の設定
colors = ['navy', 'turquoise', 'darkorange']

In [None]:
# 図示
plt.figure(figsize=(13,6))

plt.subplot(1, 2, 1)
for color, i, target_name in zip(colors, [0, 1, 2], target_names):
  plt.scatter(X_r[y == i, 0], X_r[y == i, 1], color=color, alpha=.8, label=target_name)
plt.legend(loc='best', shadow=False, scatterpoints=1)
plt.title('PCA of IRIS dataset')

plt.subplot(1, 2, 2)
for color, i, target_name in zip(colors, [0, 1, 2], target_names):
  plt.scatter(X_r2[y == i, 0], X_r2[y == i, 1], color=color, alpha=.8, label=target_name)
plt.legend(loc='best', shadow=False, scatterpoints=1)
plt.title('LDA of IRIS dataset')

plt.show()

## 25. kernel PCA

### <font color = blue>**1.** </font> 公式サンプルコード

ライブラリ : sklearn.decomposition.KernelPCA

$\downarrow \downarrow$ 公式リファレンス $\downarrow \downarrow$\
https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.KernelPCA.html

引数 | 概要 | 選択肢 | デフォルト
----------- | ------------ | ----------- | ------------
n_components | ターゲットの次元数 | int | None(そのまま)
kernel | カーネルタイプ | “linear”, “poly”, “rbf”, “sigmoid”, “cosine”	 | "linear"
gamma | rbfとpolyのカーネル係数 | float | 1/n_features
degree | polyの係数 | int | 3
coef0 | polyとsigmoidの独立係数 | float | 1
kernel_params | カーネルのパラメターの名前 | Stringからのmapping | None
alpha | リッジ回帰 |  | 1.0
eigen_solver | 固有値の選択 | "auto", "dense", "arpack" | "auto"
tol | arpackの収束 | float | 0
max_iter | arpackの最大反復回数 | int | None
remove_zeros | 固有値０の削除 | bool | False
random_state | arpackでのrandom_state | RandomState Instance or None | None
n_jobs | 並列作業 | int/None | None

https://scikit-learn.org/stable/auto_examples/decomposition/plot_kernel_pca.html

- Authors:
  - Mathieu Blondel
  - Andreas Mueller
- License: BSD 3 clause

In [None]:
import numpy as np
import matplotlib.pyplot as plt

from sklearn.decomposition import PCA, KernelPCA
from sklearn.datasets import make_circles

np.random.seed(0)

X, y = make_circles(n_samples=400, factor=.3, noise=.05)

kpca = KernelPCA(kernel="rbf", fit_inverse_transform=True, gamma=10)
X_kpca = kpca.fit_transform(X)
X_back = kpca.inverse_transform(X_kpca)
pca = PCA()
X_pca = pca.fit_transform(X)

# Plot results

plt.figure(figsize=(10, 10)) ### 見やすくするために figsize=(10, 10) を加筆した
plt.subplot(2, 2, 1, aspect='equal')
plt.title("Original space")
reds = y == 0
blues = y == 1

plt.scatter(X[reds, 0], X[reds, 1], c="red",
            s=20, edgecolor='k')
plt.scatter(X[blues, 0], X[blues, 1], c="blue",
            s=20, edgecolor='k')
plt.xlabel("$x_1$")
plt.ylabel("$x_2$")

X1, X2 = np.meshgrid(np.linspace(-1.5, 1.5, 50), np.linspace(-1.5, 1.5, 50))
X_grid = np.array([np.ravel(X1), np.ravel(X2)]).T
# projection on the first principal component (in the phi space)
Z_grid = kpca.transform(X_grid)[:, 0].reshape(X1.shape)
plt.contour(X1, X2, Z_grid, colors='grey', linewidths=1, origin='lower')

plt.subplot(2, 2, 2, aspect='equal')
plt.scatter(X_pca[reds, 0], X_pca[reds, 1], c="red",
            s=20, edgecolor='k')
plt.scatter(X_pca[blues, 0], X_pca[blues, 1], c="blue",
            s=20, edgecolor='k')
plt.title("Projection by PCA")
plt.xlabel("1st principal component")
plt.ylabel("2nd component")

plt.subplot(2, 2, 3, aspect='equal')
plt.scatter(X_kpca[reds, 0], X_kpca[reds, 1], c="red",
            s=20, edgecolor='k')
plt.scatter(X_kpca[blues, 0], X_kpca[blues, 1], c="blue",
            s=20, edgecolor='k')
plt.title("Projection by KPCA")
plt.xlabel(r"1st principal component in space induced by $\phi$")
plt.ylabel("2nd component")

plt.subplot(2, 2, 4, aspect='equal')
plt.scatter(X_back[reds, 0], X_back[reds, 1], c="red",
            s=20, edgecolor='k')
plt.scatter(X_back[blues, 0], X_back[blues, 1], c="blue",
            s=20, edgecolor='k')
plt.title("Original space after inverse transform")
plt.xlabel("$x_1$")
plt.ylabel("$x_2$")

plt.tight_layout()
plt.show()

### <font color=red> task : </font> 上記の公式サンプルコードに対して以下の2点を行う
- 最終実行結果（2×2のグラフの出力＆その内容）が変わらない範囲で可能な限りブロックごとに実行セルを分割する
- セル毎/行毎に、何をしているか / 何をしたいか の説明をコメントで加筆する

### <font color = blue>**2.** </font> 主成分分析からカーネル主成分分析へ

In [None]:
# ライブラリのインポート
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

#### <font color = green> **2.1.** </font> irisのデータをPCA

In [None]:
# ライブラリのインポート
from sklearn.decomposition import PCA

In [None]:
## データの準備
# seaborn から irisを呼び出してみる
iris = sns.load_dataset('iris')

In [None]:
# 中身を確認
iris

In [None]:
# ラベルの取り出し
species = iris.pop("species")

In [None]:
# 中身を確認
iris

In [None]:
# 中身を確認
species

In [None]:
# 2次元にPCA
pca = PCA(n_components=2)
pca.fit(iris)
iris_pca = pca.transform(iris)

In [None]:
## グラフ描画の準備 
iris_pca_pd = pd.DataFrame(iris_pca)
iris_pca_pd["species"]= species
iris_pca_pd.columns = ["x0","x1", "species"]

In [None]:
plt.title("PCA with iris data")
sns.scatterplot(x="x0", y= "x1", hue="species", data=iris_pca_pd)

#### <font color = green> **2.2.** </font> irisのデータをkernelPCA

In [None]:
# ライブラリのインポート
from sklearn.decomposition import KernelPCA

In [None]:
## データは 1.1. で準備した iris, species を変数そのまま使用

# ハイパーパラメータをとりあえず３通り設定してグリッドサーチっぽく実行
Gam =[0.01, 0.1, 1]

In [None]:
# kernelPCAの実行&結果図示
plt.figure(figsize=(18,6))
for i,c in enumerate(Gam):
  plt.subplot(1, 3, i+1)
  pca = KernelPCA(n_components=2,
                  kernel="rbf",
                  gamma=c)
  iris_pca = pca.fit_transform(iris)
    
  iris_pca_pd = pd.DataFrame(iris_pca)
  iris_pca_pd["species"] = species
  iris_pca_pd.columns = ["x0", "x1", "species"]
  plt.title("Kernel PCA gamma={}".format(c))
  sns.scatterplot(x="x0", y= "x1", hue="species", data=iris_pca_pd)

### <font color=red> task : </font> 以下の2点を追加してirisのデータをkernelPCAする
1. gamma引数についてグリッドサーチを行いirisデータに対する最適値を推定する

2. kernel引数を “rbf” 以外にして 1. を行う（以下の４種が設定可能）
  - “linear”
  - “poly”
  - “sigmoid”
  - “cosine”

## 26. サポートベクトルマシン（Support Vector Machine）

### <font color = blue>**1.** </font> irisデータをサポートベクトルで分類

ライブラリ : sklearn.svm.SVC

$\downarrow \downarrow$ 公式リファレンス $\downarrow \downarrow$\
https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

#### <font color=green> **1.1.** </font> irisデータの準備

In [None]:
# データの読み込み
from sklearn.datasets import load_iris
iris = load_iris()

In [None]:
# データフレーム化
import pandas as pd
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target

In [None]:
# 目的変数を[0, 1, 2]からラベル名へ変更
for i in range(iris.target_names.size):
  df.loc[df['target'] == i, 'target'] = iris.target_names[i]

In [None]:
# 元データのペアプロット
import seaborn as sns
sns.pairplot(df, hue='target')

#### <font color=green> **1.2.** </font> 分類結果を図示するための下準備

In [None]:
# 可視化のためのライブラリをインポート
import numpy as np
import matplotlib.pyplot as plt

In [None]:
## 軸データの用意
# 方眼の幅
h = .02  

In [None]:
## グラフのx軸, y軸にどの説明変数を使うかを指定

# x軸を 'sepal length'(=iris.feature_names[0])にする場合
xlabel_index = 0

# y軸を 'sepal width'(=iris.feature_names[1])にする場合
ylabel_index = 1

In [None]:
## 説明変数と目的変数を分離

# 説明変数は使用するものだけ切り出す
X = iris.data[:, [xlabel_index, ylabel_index]]

y = iris.target

In [None]:
# x軸の定義域を指定（無駄に広がらないよう 最小値-0.5 〜 最大値+0.5）
x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5

# y軸の定義域を指定（無駄に広がらないよう 最小値-0.5 〜 最大値+0.5）
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5

In [None]:
# 分類結果を各クラスの領域ごとに色分け表示したいので2次元格子にする
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

#### <font color=green> **1.3.** </font> 学習と結果の図示

In [None]:
## 決定境界の表示および各クラスの領域を色分けするための関数を作成

def decision_boundary(clf,  # 分類モデルのインスタンス
                      X,  # 説明変数のデータ
                      y,  # 目的変数のデータ
                      ax, # グラフの軸を制御するインスタンス
                      title # グラフのタイトル
                      ):
  # 学習実行
  clf.fit(X, y)
  
  # 分類モデルの予測結果を取得
  Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])

  # 各クラスの領域を色分け
  Z = Z.reshape(xx.shape)
  ax.pcolormesh(xx, yy, Z, cmap=plt.cm.Wistia, alpha=0.3)

  # 学習データも一緒にプロット
  ax.scatter(X[:, xlabel_index], X[:, ylabel_index], c=y, edgecolors='k', cmap=plt.cm.Wistia)

  # タイトル設定
  ax.set_title(title)

  # x軸ラベル表示
  ax.set_xlabel(iris.feature_names[xlabel_index])

  # y軸ラベル表示
  ax.set_ylabel(iris.feature_names[ylabel_index])

In [None]:
# ライブラリをインポート
from sklearn.svm import SVC

In [None]:
# サポートベクトル分類を実行&図示

fig, axes = plt.subplots(3, 3, figsize=(13, 15))
for ax_row, C in zip(axes, [0.01, 1, 100]):
  for ax, gamma in zip(ax_row, [0.1, 1, 10]):
    title = 'C = {}, gamma = {}'.format(C, gamma)
    clf = SVC(C=C, gamma=gamma, max_iter=1e6)
    decision_boundary(clf, X, y, ax, title)

### <font color=red> task : </font> 上記のコードについて、ハイパーパラメータ C, gamma についてグリッドサーチを行いirisデータに対する最適値を推定する

