In [None]:
%%HTML
<link rel="stylesheet" type="text/css" href="../custom.css">

# 応用計量分析２（第4回）

線形代数





### 担当教員: 梶野 洸（かじの ひろし）


# 本日の目標

- 線形代数を思い出す
- Python で線形代数の数値計算をやる
- 主成分分析（PCA）を実装する

# 線形代数で使うオブジェクト

- ベクトル $x = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$

In [None]:
import numpy as np # 
x = np.array([1.0, 0.0])
print(x)

# なぜ `numpy` を使うか？
- それぞれリストでも書けるがリストだと演算が定義されていない。
    - ベクトルの足し算
    - 行列の掛け算など
- `numpy` では `array` の間の演算として定義されている。

# ベクトル
$x=\begin{bmatrix}1 \\ 0 \end{bmatrix}$, $y=\begin{bmatrix}0 \\ 1\end{bmatrix}$ とする

In [None]:
x = np.array([1.0, 0])
y = np.array([0, 1.0])
print(x, y)

- ベクトルのスカラー倍: $3x$

In [None]:
print(3 * x)

- ベクトル同士の足し算・引き算: $x + y$, $x - y$
- より一般的に線形結合: $3x - 10y$

In [None]:
print(x + y)
print(x - y)
print(3 * x - 10 * y)

- 内積: $x \cdot y$, $(3x - y) \cdot (x+2y)$

In [None]:
print(x @ y)
print((3 * x - y) @ (x + 2 * y))

print(np.dot(x, y)) # 関数の形で書くこともできる

※内積は、2つベクトルを受け取って、1つのスカラーを返す**関数**としても書ける

- ノルム: $\|2x - y\|_2$

In [None]:
print(((2 * x - y) @ (2 * x - y)) ** (0.5)) # 内積を使って計算した場合
print(np.linalg.norm(2 * x - y)) # numpyの関数を使って計算した場合

- 要素積（アダマール積）: $x\circ y$

各次元で積を取る演算

In [None]:
print(x * y)

# ここまでのまとめ
- ベクトルはnumpyの `array` というオブジェクトで定義する
- 普通の数値と同じような演算ができる
- 内積やノルムなど、線形代数特有の計算は**関数**を用いて計算する
    - 内積: `np.dot`
    - ノルム: `np.linalg.norm`

# 想定QA

Q. 欲しい関数があるかどうか調べたい

A. ググるかライブラリのAPIを見る（numpyは[ここ](https://docs.scipy.org/doc/numpy/reference/)）

Q. `np.dot` とか `np.linalg.norm` とかなんやねん

A. ライブラリは階層構造になっている。
- `np.dot` は、`numpy` (`np`と書いてる)直下に定義された `dot` という関数、
- `np.linalg.norm` は、`numpy` の下の `linalg` (linear algebra; 線形代数)という線形代数の関数をまとめた集まりのなかの `norm` という関数
と解釈する

Q. じゃあ `np.array` は？

A. オブジェクトを作る関数と言ってもいいかも。

リストを受け取って `array` を返す

# 行列
$A = \begin{bmatrix} 1 & 1 \\ 0 & 2 \end{bmatrix}$

In [None]:
# np.array にリストのリストを渡すと行列
A = np.array([[1.0, 1.0],
              [0.0, 2.0]])
print(A)

# 行列とベクトルの積
$Ax$

$x^\top A$

In [None]:
print(A @ x)
print(x @ A)

In [None]:
print(A @ np.array([1,2,3,4])) # 2x2の行列に4次元のベクトルは掛けられない

# 行列と行列の積
$A = \begin{bmatrix} 1 & 1 \\ 0 & 2 \end{bmatrix}$, $B = \begin{bmatrix} 0 & 1 \\ 1 & 2 \end{bmatrix}$

In [None]:
A = np.array([[1.0, 1.0],
              [0.0, 2.0]])
B = np.array([[0.0, 1.0],
              [1.0, 2.0]])
print(A @ B)
print(B @ A)

# 演習

- $A = \begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}$ の絶対値が最大の固有値とそれに対応する固有ベクトルを計算せよ

# 指針

1. 手計算
1. `numpy` で実装されているのをつかう
1. べき乗法

In [None]:
np.linalg.eigvals(np.array([[2,1],[1,2]]))

# 手計算

- 固有値、固有ベクトルの定義: $A v = \lambda v$ を満たす $\lambda$, $v (\neq 0)$
- 線形方程式 $(A - \lambda I)v = 0$ が非自明な解（つまり$v\neq 0$）を持つような $\lambda$ を見つければよい
- 特性方程式 $\mathrm{det}(A-\lambda I)=0$ の解が固有値
- $\mathrm{det}(A-\lambda I) = (2-\lambda)(2-\lambda)-1 \\= \lambda^2 - 4\lambda + 3 = (\lambda-3)(\lambda - 1)=0$
- 絶対値が最大の固有値は $3$
- $(A - \lambda I)v = \begin{bmatrix} -1 & 1\\1 & -1 \end{bmatrix}\begin{bmatrix}v_1\\ v_2 \end{bmatrix}=0$
- $v_1 = v_2$ を満たせばよいので、例えば $\begin{bmatrix} 1 \\ 1 \end{bmatrix}$ が固有ベクトル。

# `numpy` で実装されているのを使う


In [None]:
A = np.array([[2, 1], [1, 2]])
np.linalg.eig(A)

絶対値最大の固有値は $3$、対応する固有ベクトルは $\begin{bmatrix}0.70710678\\ 0.70710678 \end{bmatrix}$

（返り値の解釈は、[API](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.eig.html)を見ましょう）

# べき乗法

- $A\in\mathbb{R}^{N\times N}$ の固有値と対応する固有ベクトルを $\lambda_1,\dots,\lambda_N$, $v_1,\dots,v_N$ とする。
- $|\lambda_1| > |\lambda_2| > \cdots > |\lambda_N|$ とする。

任意のベクトル $x\in\mathbb{R}^N$ は、固有ベクトルで展開できる（固有ベクトルは基底を成す）:

$\begin{eqnarray}
x = \sum_{n=1}^{N}c_n v_n
\end{eqnarray}$

$A$ を掛け続けると絶対値最大の固有値に対応する固有ベクトルが（相対的に）強調される:

$\begin{eqnarray}
A^k x &= \sum_{n=1}^{N}c_n A^k v_n = \sum_{n=1}^N c_n \lambda_n^k v_n\\
&= \lambda_1^k \sum_{n=1}^N c_n \left(\frac{\lambda_n}{\lambda_1}\right)^k v_n\\
&\approx \lambda_1^k c_1 v_1
\end{eqnarray}$



- 適当なベクトルに行列 $A$ を掛け続けると $v_1$ が求まる
- $\lambda_1 = \dfrac{v_1^\top A v_1}{v_1^\top v_1}$

In [None]:
A = np.array([[2, 1], [1, 2]])
x = np.array([1, 2])
for _ in range(100):
    x = A @ x
    x = x / np.linalg.norm(x) # ベクトルを正規化しないと数値誤差が乗る
print(x@A@x / (x@x), x)

# 線形方程式

$A\in\mathbb{R}^{N\times N}$, $b\in\mathbb{R}^N$ としたとき、
$Ax=b$ を満たす $x\in\mathbb{R}^N$ を求める。

$A$ が正則行列（＝逆行列を持つ）のとき、 $x = A^{-1}b$ が解。

二通りの実装方法がある
- 逆行列を求めるアルゴリズム(Gauss-Jordanなど)を利用
- 直接線形方程式を解くアルゴリズム(LU分解)を利用

<div style="text-align: center;">
__なるべく直接線形方程式を解くアルゴリズムを利用すべき__
</div>

- LU 分解の方がそもそも速い
    - $A$ の形によっては更に速くなる
- `numpy` では逆行列を求めるのに$AX=I$を解いている（＝線形方程式を解くのと同じ計算時間がここで必要）
    - さらに $A^{-1}b$ を計算しないといけないので計算時間的に損

（参考）伊理正夫, 藤野和建: 数値計算の常識

# 主成分分析, PCA

データ $x_1,\dots,x_N\in \mathbb{R}^D$ があったとき、その"特性"を保ったまま低次元表現を得たい。
- データを目で見たい（100次元だと見られないけど2次元なら）
- 同じ情報量ならば低次元の方が学習しやすい
- 特性の定義によって様々な手法がある
- $p~(<D)$次元表現を得る≒ $p$本のいい感じの基底を選ぶ

- $X = \begin{bmatrix} x_1 & x_2 & \dots & x_N \end{bmatrix}^\top$
- 平均$0$であるとする: $\sum_{n=1}^N x_n = 0$
- PCA は、なるべく分散が大きくなるような基底を選ぶ

### 1次元表現を得る場合
<div style="text-align: center;">
$\max_{\|w\|=1} \|Xw\|^2$
</div>
を解けばよい。

$\|Xw\|^2 = w^\top (X^\top X) w$ である。

- $X^\top X$ は実対称行列なので、固有値はすべて実数