In [20]:
import sys
sys.path.append('..')

from vec import Vec
from mat import Mat
from vecutil import list2vec

In [2]:
def project_along(b, v):
    '''
    bのｖに沿った射影を返す
    '''
    sigma = b*v/(v*v) if v*v > 1e-20 else 0
    return sigma*v

In [3]:
def project_orthogonal(b, vlist):
    for v in vlist:
        b = b - project_along(b, v)
    return b

In [4]:
D = {0,1}

vlist = [Vec(D, {0: 1, 1: 0}), Vec(D, {0: 1.414/2, 1: 1.414/2})]
b = Vec(D, {0: 1, 1: 1})

b2 = project_orthogonal(b, vlist)

print(b2)

print(b2*vlist[0])

print(b2*vlist[1])


    0   1
---------
 -0.5 0.5
-0.5
0.0


In [5]:
# problem 9.2.2

D = {0,1,2}

vlist = [Vec(D, {0: 0, 1: 2, 2: 2}), Vec(D, {0: 0, 1: 1, 2: -1})]
b = Vec(D, {0: 1, 1: 1, 2: 1})

b2 = project_orthogonal(b, vlist)

print(b2)

print(b2*vlist[0])

print(b2*vlist[1])


 0 1 2
------
 1 0 0
0.0
0.0


problem 9.2.2

project_orthogonal に $b=[1, 1, 1]、vlist= [v_1 , v_2 ](v_1 = [0, 2, 2]、 v_2 =[0,1,−1])$を入力した場合、実行されるステップを手計算で示せ。

$b_1 = b - \sigma v_1$

$ = [1,1,1] - \frac{[1,1,1]\cdot[0,2,2]}{[0,2,2]\cdot [0,2,2]} [0,2,2]$

$ = [1,1,1] - \frac{4}{8} [0,2,2]$

$ = [1,1,1] - [0,1,1]$

$ = [1,0,0]$

$b_2 = b_1 - \sigma v_2$

$ = [1,0,0] - \frac{[1,0,0]\cdot[0,1,-1]}{[0,1,-1]\cdot [0,1,-1]} [0,1,-1]$

$ = [1,0,0] - [0,0,0]$

$ = [1,0,0] $

In [6]:
def classical_project_orthogonal(b, vlist):
    w = Vec(b.D, {})
    for v in vlist:
        w = w + project_along(b, v)
    return b - w

b2 = classical_project_orthogonal(b, vlist)

print(b2)

print(b2*vlist[0])

print(b2*vlist[1])


 0 1 2
------
 1 0 0
0
0


problem 9.2.5

i = 0,1,2,...に対し、

$b_i = b - w_i$

となる$b_i$が$vlist = [v_1, ..., v_k]$と直交し$b-b_i$(つまり$w_i$)が$\mathrm{Span}\ \mathrm{vlist}$に属することを証明する。

i = 0のとき、$w_0 = 0, b_0 = b$。よって$b_0$は最初の０個の（すべての）ベクトルと直交し、$w_0$はゼロベクトルなので線形包に属する。

i-1のときに不変条件が成り立つと仮定する。

$w_i = w_{i - 1} - \sigma v_i $

$b_i = b - w_i$

$j \lt i$なjに対し、

$\langle b_i, v_j \rangle = \langle b - w_i, v_j \rangle$

$ = \langle b - w_{i - 1} - \sigma v_i, v_j \rangle$

$ = \langle b - w_{i - 1}, v_j \rangle - \sigma\langle v_i, v_j \rangle$

$ = \langle b_{i - 1}, v_j \rangle - \sigma\langle v_i, v_j \rangle$

$ = 0$

よって$b_i$はvlistに直交する。

$w_{i-1}$は最初のi-1個のベクトルの線形包に属するので、

$w_i = w_{i - 1} - \sigma v_i$

$w_i$はi個のベクトルの線形包に属する。

In [7]:
# 9.2.2

def aug_project_orthogonal(b, vlist):
    sigmadict = {len(vlist): 1}
    for i, v in enumerate(vlist):
        sigma = (b*v)/(v*v) if v*v > 1e-20 else 0
        sigmadict[i] = sigma
        b = b - sigma*v
    return (b, sigmadict)

D = {0,1,2}

vlist = [Vec(D, {0: 0, 1: 2, 2: 2}), Vec(D, {0: 0, 1: 1, 2: -1})]
b = Vec(D, {0: 1, 1: 1, 2: 1})

b2, sigmadict = aug_project_orthogonal(b, vlist)

print(b2)

print(sigmadict)

print(b2*vlist[0])

print(b2*vlist[1])


 0 1 2
------
 1 0 0
{0: 0.5, 1: 0.0, 2: 1}
0.0
0.0


In [8]:
def orthogonalize(vlist):
    vstarlist = []
    for v in vlist:
        vstarlist.append(project_orthogonal(v, vstarlist))
    return vstarlist

In [11]:
# example 9.3.2

D = {0,1,2}

vlist = [Vec(D, {0: 2, 1: 0, 2: 0}), Vec(D, {0: 1, 1: 2, 2: 2}), Vec(D, {0: 1, 1: 0, 2: 2})]

vstarlist = orthogonalize(vlist)

for vstar in vstarlist:
    print(vstar)


 0 1 2
------
 2 0 0

 0 1 2
------
 0 2 2

 0  1 2
-------
 0 -1 1


In [12]:
# example 9.3.3

D = {0,1,2}

vlist = [Vec(D, {0: 8, 1: -2, 2: 2}), Vec(D, {0: 4, 1: 2, 2: 4})]

vstarlist = orthogonalize(vlist)

for vstar in vstarlist:
    print(vstar)


 0  1 2
-------
 8 -2 2

 0 1 2
------
 0 3 3


problem 9.3.4

orthogonalize に、v1 = [1, 0, 2]、v2 = [1, 0, 2]、v3 = [2, 0, 0] から成るリスト [v1, v2, v3] を入力したとき、実行されるステップを手計算で示せ。

$v_1^* = v_1 = [1, 0, 2]$

$v_2^* = v_2 - \alpha_2 v_1^*$

$ = v_2 - \frac{\langle v_2, v_1^* \rangle}{\langle v_1^*, v_1^* \rangle} v_1^*$

$ = [1,0,2] - \frac{[1,0,2]\cdot[1,0,2]}{[1,0,2]\cdot[1,0,2]} [1,0,2]$

$ = [0,0,0]$

$v_3^{1*} = v_3 - \alpha_2 v_1^*$

$ = v_3 - \frac{\langle v_3, v_1^* \rangle}{\langle v_1^*, v_1^* \rangle} v_1^*$

$ = [2, 0, 0] - \frac{[2, 0, 0]\cdot[1,0,2]}{[1,0,2]\cdot[1,0,2]} [1,0,2]$

$ = [2,0,0] - \frac{2}{5}[1,0,2]$

$ = [\frac{8}{5},0,-\frac{4}{5}]$

$v_3^* = v_3^{1*} - \alpha_2 v_2^*$

$ = v_3^{1*} - \frac{\langle v_3^{1*}, v_2^* \rangle}{\langle v_2^*, v_2^* \rangle} v_2^*$

$ = [\frac{8}{5},0,-\frac{4}{5}] - 0 [0,0,0]$

$ = [\frac{8}{5},0,-\frac{4}{5}]$

In [14]:
# problem 9.3.4

D = {0,1,2}

vlist = [Vec(D, {0: 1, 1: 0, 2: 2}), Vec(D, {0: 1, 1: 0, 2: 2}), Vec(D, {0: 2, 1: 0, 2: 0})]

vstarlist = orthogonalize(vlist)

for vstar in vstarlist:
    print(vstar)


 0 1 2
------
 1 0 2

 0 1 2
------
 0 0 0

   0 1    2
-----------
 1.6 0 -0.8


In [16]:
# example 9.4.1

D = {0,1,2}

vlist = [Vec(D, {0: 8, 1: -2, 2: 2}), Vec(D, {0: 4, 1: 2, 2: 4})]

vstarlist = orthogonalize(vlist)

b = Vec(D, {0: 5, 1: -5, 2: 2})

v_vertical = project_orthogonal(b, vstarlist)

print(v_vertical)


  0  1 2
--------
 -1 -2 2


In [19]:
# 9.5.3

def aug_orthogonalize(vlist):
    vstarlist = []
    sigma_vecs = []
    D = set(range(len(vlist)))
    for v in vlist:
        (vstar, sigmadict) = aug_project_orthogonal(v, vstarlist)
        vstarlist.append(vstar)
        sigma_vecs.append(Vec(D, sigmadict))
    return vstarlist, sigma_vecs

In [18]:
D = {0,1,2}

vlist = [Vec(D, {0: 8, 1: -2, 2: 2}), Vec(D, {0: 4, 1: 2, 2: 4})]

vstarlist, sigma_vecs = aug_orthogonalize(vlist)

for vstar in vstarlist:
    print(vstar)

print(sigma_vecs)


 0  1 2
-------
 8 -2 2

 0 1 2
------
 0 3 3
[Vec({0, 1},{0: 1}), Vec({0, 1},{0: 0.5, 1: 1})]


In [22]:
# example 9.6.7

L = [list2vec(v) for v in [[8,-2,2], [0,3,3], [1,0,0], [0,1,0], [0,0,1]]]
Lstar = orthogonalize(L)

for lstar in Lstar:
    print(lstar)


 0  1 2
-------
 8 -2 2

 0 1 2
------
 0 3 3

     0     1      2
-------------------
 0.111 0.222 -0.222

         0        1        2
----------------------------
 -8.33E-17 1.67E-16 5.55E-17

        0        1        2
---------------------------
 8.33E-17 5.55E-17 1.67E-16


9.10

### ベクトルの正規化とは何か?

ノルムが１になるように、各要素をノルムで割ること

### ベクトルが互いに直交するとはどういう意味か?

ベクトルu, vの内積が０であるとき、u, vは直交しているという。

u, vが直交しているとき、三平方の定理が成り立つはずである。

$\|u + v\|^2 = \langle u+v, u+v \rangle$

$ = \langle u, u \rangle + \langle u, v \rangle + \langle v, u \rangle + \langle v, v \rangle$

$ = \|u\|^2 + 2\langle u, v \rangle + \|v\|^2 $

$\langle u, v \rangle = 0$のとき、三平方の定理が成り立つ。

直交の定義はベクトルとベクトルの集合の直交性へ拡張できる。

ベクトルvとベクトルの集合Sのすべてのベクトルが直交するとき、vとSは直交するという。またこのときvは$\mathrm{Span}\ S$とも直交する。

### ベクトルが互いに正規直交しているといえるのはどのようなときか? また、正規直交基底とは何か?

互いに直交するベクトルで、各ベクトルのノルムが１であるとき、ベクトルは正規直交しているという。

基底が正規直交しているとき、正規直交基底という。

### Span {v1 , . . . , vn } から b に最も近いベクトルを見つけるにはどうすればよいか?

$\mathcal{V} = \mathrm{Span} \{v_1 , . . . , v_n \} $とする。$b = b^{\parallel \mathcal{V}}+ b^{\perp \mathcal{V}}$のとき$ b^{\parallel \mathcal{V}}$が$\mathcal{V}$にもっとも近くなり、その距離は$b^{\perp \mathcal{V}}$である。



bと$b^{\parallel \mathcal{V}}$の距離は$\| b - b^{\parallel \mathcal{V}}\|$で、これは$\|b^{\perp \mathcal{V}}\|$である。

pを$\mathcal{V}$上の任意の点とすると、

$b - p = (b - b^{\parallel \mathcal{V}}) + (b^{\parallel \mathcal{V}} - p)$

$ = b^{\perp \mathcal{V}} + (b^{\parallel \mathcal{V}} - p)$

$b^{\parallel \mathcal{V}}$は$\mathcal{V}$のベクトルなので、$b^{\parallel \mathcal{V}} - p$も$\mathcal{V}$のベクトルである。よって$b^{\perp \mathcal{V}}$と$b^{\parallel \mathcal{V}} - p$は直交する。

三平方の定理より、

$\|b - p\|^2 = \|b - b^{\parallel \mathcal{V}}\|^2 + \|b^{\parallel \mathcal{V}} - p\|^2$

$\|b - p\| \ge \|b - b^{\parallel \mathcal{V}}\|$で等号が成り立つのは$p = b^{\parallel \mathcal{V}}$

### 互いに直交するベクトル v1 , . . . , vn に直交する b の射影を見つけるにはどうすればよいか?

i = 0,1,...,nに対し以下のプロシージャを行う。

$b_i = b_{i-1} - b_{i-1}^{\parallel v_i}$

$b_i$が$v_1,...,v_i$と直交することを示す。

$b_i$と$v_i$が直交するように

$b_i = b_{i-1} - \alpha_i v_i$

と書くことができる。

$j \lt i$となる任意のjに対し、

$\langle b_i, v_j \rangle = \langle b_{i-1} - \alpha_i v_i , v_j \rangle$

$ = \langle b_{i-1}, v_j \rangle - \langle \alpha_i v_i , v_j \rangle$

$ = 0 - 0 = 0$

### (i)v1, . . . , vn と同じ空間を張り、(ii)互いに直交するベクトルを見つけるにはどうすればよいか?

この問題を直交化という。

直交化によってベクトルの集合$[v_1, ..., v_n]$から、$\mathrm{Span}\{ v_1^*, ..., v_n^* \} = \mathrm{Span}\{ v_1, ..., v_n \}$を満たす互いに直交するベクトルの集合$[v_1^*, ..., v_n^*]$を得る。

直交化のアルゴリズムを以下に示す。このプロセスはグラム・シュミットの直交化と呼ばれる。

```python
def orthogonalize(vlist):
    vstarlist = []
    for v in vlist:
        vstarlist.append(project_orthogonal(v, vstarlist))
    return vstarlist
```

### 列直交行列とは何か? 直交行列とは何か?

列直交行列：　行列の各列ベクトルが正規直交している行列。Qを列直交行列とすると、$Q^\top Q$は単位行列となる。

直交行列：　正方列直交行列のこと。Qが直交行列の場合、その逆行列は$Q^\top$となる。

### Q が列直交行列であるとき、関数 x 􏰀→ Qx が、ドット積を保存するのはなぜか? また、ノルムを保存するのはなぜか?

内積の保存：　任意のベクトルu, vに対し、$\langle Qu, Qv \rangle = \langle u, v \rangle$ が成り立つ。

$\langle Qu, Qv \rangle = (Qu)^\top Qv$

$ = u^\top Q^\top Qv$

$ = u^\top v$

$ = \langle u, v \rangle$

ノルムの保存：　任意のベクトルvに対し、$\|Qv\| = \|v\|$ が成り立つ。

$\|Qv\|^2 =  \langle Qv, Qv \rangle$

$ = \langle v, v \rangle$

$ = \|v\|^2$

### 直交行列の逆行列とは何か?

直交行列Qの逆行列は$Q^\top$である。

Qのi番目の列ベクトルを$q_i$とする。

$(Q^\top Q)[:, i] = Q^\top q_i$

$ = \left(\begin{array}{c}q_1\cdot q_i \\ \vdots \\ q_n \cdot q_i \end{array}\right)$

$\langle q_i, q_j \rangle = 0\ i\ne j$なので、

$(Q^\top Q)[:,i] = \left(\begin{array}{c}0\\ \vdots \\ q_i \cdot q_i \\ \vdots \\ 0\end{array}\right)$

$\langle q_i, q_i \rangle = 1$なので、

$(Q^\top Q)[:, i] = \left(\begin{array}{c}0\\ \vdots \\ 1\\ \vdots \\ 0\end{array}\right)$

よって$Q^\top Q$は単位行列となる。

Qは正方行列なので、$Q^\top$も正方行列で、$Q^\top Q = QQ^\top = \mathbb{1}$

Qの列ベクトルは線形独立で、行と列の数が一致するので可逆である。$Q^\top Q = \mathbb{1}$より、Qの逆行列は$Q^\top$となる。

### 行列とベクトルの積を使ってベクトルの列直交行列の列ベクトルについての座標表現を見つけるにはどうすればよいか?

Qを列直交行列、$\mathcal{V} = \mathrm{Col}\ Q$とする。このときQの行ラベル集合と同じ定義域をもつベクトルbに対し、$Q^\top b$はQの列ベクトルについての$b^{\parallel \mathcal{V}}$の座標表現である。

$b = b^{\perp \mathcal{V}} + b^{\parallel \mathcal{V}}$

$b^{\parallel \mathcal{V}}$は$\mathcal{V}$のベクトルなので、Qの列$q_1, \dots, q_n$の線形結合で表せる。

$b^{\parallel \mathcal{V}} = \alpha_1q_1 + \dots + \alpha_n q_n$

$\alpha_1, \dots , \alpha_n$は$b^{\parallel \mathcal{V}}$のQの列に対する座標表現である。この座標表現が$(Q^\top b)$と等しいことを示す。

$(Q^\top b)[j] = q_j \cdot b$

$ = \langle q_j, b^{\perp\mathcal{V}} + b^{\parallel\mathcal{V}} \rangle$

$ = \langle q_j, b^{\perp\mathcal{V}} \rangle + \langle q_j, b^{\parallel\mathcal{V}} \rangle$

$ = 0 + \langle q_j, \alpha_1q_1 + \dots + \alpha_n q_n \rangle$

$ = \langle q_j, \alpha_j q_j \rangle$

$ = \alpha_j$

### 行列の QR 分解とは何か?

Qを列直交行列、Rを三角行列とすると、$A = QR$と書くことができる。

### QR 分解をどのように用いれば行列の方程式を解くことができるか?

$Ax = b$

$QRx = b$

$Q^\top QRx = Q^\top b$

$Rx = Q^\top b$

Rは上三角行列なので、後退代入を用いて解くことができる。

### QR 分解はどのように計算できるか?

Aの列ベクトルに対し、直交化を行う。直交化を行うと互いに直交したベクトルと対応する係数が得られる。

直交化で得られた互いに直交するベクトルを正規化してQを得る。

直交化で得られた係数行列を、Qの正規化を打ち消すようスケーリングしてRを得る。

### QR 分解をどのように用いれば最小二乗問題を解くことができるか?

最小二乗問題とは、$R \times C$行列A、Rベクトルbに対し、余剰ベクトル$b - Ax$のノルム$\|b - Ax\|$を最小にするxを求める問題である。

$b - Ax$を最小にするxを$\hat{x}$とする。$A\hat{x}$はAの列ベクトル空間$\mathcal{V}$への射影$b^{\parallel \mathcal{V}}$と等しい。

QR分解の解が$\hat{x}$と等しいと仮定する。

$A\hat{x} = b$

$QR\hat{x} = b$

$Q^\top QR\hat{x} = Q^\top b$

$R\hat{x} = Q^\top b$

$Q^\top b$は$b^{\parallel \mathcal{V}}$のQの列に対する座標表現なので、

$b^{\parallel \mathcal{V}} = Q(Q^\top b)$

よって、

$QR\hat{x} = QQ^\top b$

$A\hat{x} = b^{\parallel \mathcal{V}}$

よって仮定は成り立ち、QR分解を用いれば最小二乗問題の解$\hat{x}$が得られることになる。

### 最小二乗問題を解くことは、データを直線や放物線へフィッティングする際にどのように役に立つか?

直線$f(x) = u_0 + u_1x$の場合は以下のノルムを最小にする最小二乗問題、

$\left\| 
\left[ \begin{array}{ccc} 1 & x_1 \\ \vdots \\ 1 & x_n \end{array}\right] 
\left[ \begin{array}{cc} u_0 \\ u_1 \end{array}\right]
- \left[ \begin{array}{ccc} y_1 \\ \vdots \\ y_n \end{array}\right]
\right\|$

放物線$f(x, y) = a + bx + cy + dxy + ex^2 + fy^2$の場合は以下のノルムを最小にする最小二乗問題を解くことでフィッティングできる。

$\left\| \left[ \begin{array}{cccccc} 1 & x_1 & x_1y_1 & x_1^2 & y_1^2\\
 & & \vdots & & \\
1 & x_n & x_ny_n & x_n^2 & y_n^2 \end{array}\right] 
\left[ \begin{array}{cccccc} a\\b\\c\\d\\e\\f \end{array}\right] - 
\left[ \begin{array}{cccccc} z_1\\\vdots\\z_n \end{array}\right]
 \right\|$


### 最小二乗問題を解くことで、より正確な出力を得るにはどのようにすればよいか?

観測項目（列）を増やすか、観測数（行）を増やす。

### 直交補空間とは何か?

$\mathcal{U}$を$\mathcal{W}$の部分空間とする。$\mathcal{W}$における$\mathcal{U}$の直交補空間$\mathcal{V}$は以下のように定義される。

$\mathcal{V} = \{w \in \mathcal{W}: $wは$\mathcal{U}$のすべてのベクトルと直交する$\}$

### 直交補空間と直和の間の関係はどんなものか?

$\mathcal{V}$が$\mathcal{W}$における$\mathcal{U}$の直交補空間のとき、以下が成り立つ。

$\mathcal{W} = \mathcal{U} \oplus \mathcal{V}$
