# 四大基礎子空間

![Creative Commons License](https://i.creativecommons.org/l/by/4.0/88x31.png)  
This work by Jephian Lin is licensed under a [Creative Commons Attribution 4.0 International License](http://creativecommons.org/licenses/by/4.0/).

In [None]:
from lingeo import random_good_matrix, random_int_list

## Main idea

Recall that if $V$ is a subspace in $\mathbb{R}^n$, then its orthogonal complement is  
$$V^\perp = \{{\bf w}\in\mathbb{R}^n : \langle{\bf w},{\bf v}\rangle = 0 \text{ for all }{\bf v}\in V\}.$$  

Suppose $V = \operatorname{span}(S)$ for some finite set $S$.  
(We will show in the next chapter that in fact every subspace in $\mathbb{R}^n$ can be generated by a finite set.)  
Then every matrix ${\bf b}$ can be written as a unique representation  
$${\bf b} = {\bf w} + {\bf h}$$
such that ${\bf w}\in V$ and ${\bf h}\in V^\perp$.  
Also, $(V^\perp)^\perp = V$.

Let $A$ be an $m\times n$ matrix.  
Let $R$ be the reduced echelon form of $A$ and $r$ the number of its pivots.  
Consider the augmented matrix $\left[\begin{array}{c|c} A & I_m \end{array}\right]$.  
Let $\left[\begin{array}{c|c} R & B \end{array}\right]$ be its reduced echelon form.

Then $\operatorname{Row}(A)$ and $\operatorname{ker}(A)$ are subspaces in $\mathbb{R}^n$ and they are the orthogonal complement of each other.   

Let $\beta_R = \{{\bf r}_1,\ldots,{\bf r}_r\}$ be the set of nonzero rows in $R$.  
Then $\operatorname{Row}(A) = \operatorname{span}(\beta_R)$.

Let $\beta_K = \{{\bf h}_1, \ldots, {\bf h}_{n-r}\}$ be the set of homogeneous solutions solved by setting one free variable as $1$ and others as $0$.  
Then $\operatorname{ker}(A) = \operatorname{span}(\beta_K)$.  

On the other hand, $\operatorname{Col}(A)$ and $\operatorname{ker}(A^\top)$ are subspaces in $\mathbb{R}^m$ and they are the orthogonal complement of each other.  
The subspace $\operatorname{ker}(A^\top)$ is called the **left kernel** of $A$.  

Let $\beta_C = \{ {\bf u}_1,\ldots, {\bf u}_r \}$ be the set of columns of $A$ corresponding to the pivots of $R$.  
Then $\operatorname{Col}(A) = \operatorname{span}(\beta_C)$.  

Let $\beta_L = \{ {\bf b}_1,\ldots,{\bf b}_{m-r} \}$ be the last $m-r$ rows in $B$.  
Then $\operatorname{ker}(A^\top) = \operatorname{span}(\beta_L)$.  

We call each of $\beta_R$, $\beta_K$, $\beta_C$, $\beta_L$ the **standard basis** of the corresponding subspace.  
(We have not yet mentioned what is a basis, so you may view them as standard generating sets of the corresponding subspaces.  
But we will prove they are really a basis in the future.)

## Side stories
- generator of $V^\perp$

## Experiments

##### Exercise 1

執行下方程式碼。  
矩陣 $\left[\begin{array}{c|c} R & B \end{array}\right]$ 是 $\left[\begin{array}{c|c} A & I \end{array}\right]$ 的最簡階梯形式矩陣。  

In [None]:
### code
set_random_seed(0)
print_ans = False
m,n,r = 3,5,2
A, R, pivots = random_good_matrix(m,n,r, return_answer=True)

AI = A.augment(identity_matrix(3), subdivide=True)
RB = AI.rref()
B = RB[:,n:]
print("[ A | I ] =")
show(AI)
print("[ R | B ] =")
show(RB)

if print_ans:
    Rp = R[:r,:] ### r x n
    H = zero_matrix(Rp.base_ring(), n, n-r) ### n x (n-r)
    free = [i for i in range(n) if i not in pivots]
    H[pivots] = -Rp[:, free]
    H[free] = identity_matrix(n-r)
    C = A[:, pivots] ### m x r
    Bp = B[r:,:] ### (m-r) x m
    print("beta R = rows of")
    show(Rp)
    print("beta K = columns of")
    show(H)
    print("beta C = columns of")
    show(C)
    print("beta L = rows of")
    show(Bp)

##### Exercise 1(a)

求 $\beta_R$。  

##### Exercise 1(b)

求 $\beta_K$。  

##### Exercise 1(c)

求 $\beta_C$。  

##### Exercise 1(d)

求 $\beta_L$。  

## Exercises

##### Exercise 2

執行以下程式碼。  
令 $S = \{ {\bf r}_1, {\bf r}_2, {\bf r}_3 \}$ 為矩陣 $A$ 的各列向量  
且 $V = \operatorname{span}(S)$。  
求 $T$ 使得 $V^\perp = \operatorname{span}(T)$。

In [None]:
### code
set_random_seed(0)
print_ans = False
m,n,r = 3,5,2
A, R, pivots = random_good_matrix(m,n,r, return_answer=True)
print("A =")
show(A)

if print_ans:
    H = zero_matrix(R.base_ring(), n, n-r)
    free = [i for i in range(n) if i not in pivots]
    H[pivots,:] = R[:r,free]
    H[free,:] = identity_matrix(n-r)
    print("T = the set of columns of")
    show(H)

##### Exercise 3

執行以下程式碼。  
令 $S = \{ {\bf u}_1, {\bf u}_2 \}$ 為矩陣 $A$ 的各行向量  
且 $V = \operatorname{span}(S)$。  
求 ${\bf b}$ 在 $V$ 上的投影。  

In [None]:
### code
set_random_seed(0)
print_ans = False
A = random_good_matrix(5,2,2)
print("A =")
show(A)

b = vector(random_int_list(5))
print("b =", b)

if print_ans:
    ATAinv = (A.transpose() * A).inverse()
    w = A * ATAinv * A.transpose() * b
    print("projection =", w)

##### Exercise 4

執行以下程式碼。  
令 $S = \{ {\bf u}_1, {\bf u}_2, {\bf u}_3 \}$ 為矩陣 $A$ 的各行向量  
且 $V = \operatorname{span}(S)$。  
求 ${\bf b}$ 在 $V$ 上的投影。  
（如果你發覺 $A^\top A$ 不可逆的話﹐  
記得把一些不重要的向量拿掉。  
只要生成出來是 $V$，  
不一定要把全部向量放進去。）

In [None]:
### code
set_random_seed(0)
print_ans = False
A = random_good_matrix(5,3,2)
print("A =")
show(A)

b = vector(random_int_list(5))
print("b =", b)

if print_ans:
    Ap = A[:,pivots]
    ATAinv = (Ap.transpose() * Ap).inverse()
    w = Ap * ATAinv * Ap.transpose() * b
    print("projection =", w)

##### Exercise 5

令 $A$ 為一 $m\times n$ 矩陣。  
我們知道高斯消去法不會影響列空間，  
因此自然地 $\operatorname{Row}(A) = \operatorname{span}(\beta_R)$。  

以下我們說明為什麼 $\operatorname{ker}(A) = \operatorname{span}(\beta_K)$。  

##### Exercise 5(a)

令 $R$ 為 $A$ 的最簡階梯形式矩陣。  
我們把領導變數拉到左邊、自由變數拉到右邊  
（最後求完解以後再把變數順序拉回來就好），  
因此我們可以假設 $R$ 的非零列長得像 $R' = \begin{bmatrix} I_r & Y \end{bmatrix}$。  
我們把每個 $\mathbb{R}^n$ 的向量都寫成 $({\bf v}_1, {\bf v}_2)$ 使得 ${\bf v}_1\in\mathbb{R}^r$ 而 ${\bf v}_2\in\mathbb{R}^{n-r}$。  
說明 
$$\operatorname{ker}(A) = \operatorname{ker}(R') = \{(-Y{\bf v}_2, {\bf v}_2): {\bf v}_2\in\mathbb{R}^{n-r}\}.$$

##### Exercise 5(b)

令 $H$ 為一 $n\times (n-r)$ 的矩陣﹐  
其各行向量是由 $\beta_K$ 中的向量組成。  
觀察到  $H = \begin{bmatrix} -Y \\ I_{n-r} \end{bmatrix}$。  

說明 $H{\bf v}_2 = (-Y{\bf v}_2, {\bf v}_2)$、  
因此 $\operatorname{ker}(A) = \operatorname{Col}(H) = \operatorname{span}(\beta_K)$。  

##### Exercise 5(c)

藉由 $H^\top$ 和 $R'$ 的形式的相似性，  
說明 $\operatorname{ker}(H^\top) = \operatorname{Col}(R'^\top)$。  

##### Exercise 5(d)

若 $S\subseteq\mathbb{R}^n$ 是一群有限個數的向量而 $V = \operatorname{span}(S)$。  
證明 $(V^\perp)^\perp = V$。  

##### Exercise 6

令 $A$ 為一 $m\times n$ 矩陣。  
令 ${\bf u}_1,\ldots,{\bf u}_n$ 為 $A$ 的各行向量。  
接下來我們說明 $\operatorname{Col}(A) = \operatorname{span}(\beta_C)$ 及 $\operatorname{ker}(A^\top) = \operatorname{span}(\beta_L)$。  
令 $\left[\begin{array}{c|c} R & B \end{array}\right]$ 為 $\left[\begin{array}{c|c} A & I_m \end{array}\right]$ 的最簡階梯形式矩陣。   

##### Exercise 6(a)

令 $\beta_K = \{{\bf h}_1,\ldots,{\bf h}_{n-r}\}$。  
令 $j$ 為 $R$ 的第 $i$ 個軸。  
藉由 $A{\bf h}_i = {\bf 0}$ 來說明 ${\bf u}_j\in\operatorname{span}(\beta_C)$、  
並證明 $\operatorname{Col}(A) = \operatorname{span}(\beta_C)$。  

##### Exercise 6(b)

令 $\hat{R}$ 為 $R$ 中對應到軸的那幾個行向量所組成的 $m\times r$ 矩陣。  
令 $\hat{A}$ 為 $A$ 中對應到 $R$ 的軸的那幾個行向量所組成的 $m\times r$ 矩陣。  
藉由 $\operatorname{ker}(\hat{R}) = \{{\bf 0}\}$ 來說明 $\operatorname{ker}(\hat{A}) = \{{\bf 0}\}$。  

##### Exercise 6(c)

接著我們說明 $\beta_C$ 和 $\beta_L$ 中的向量互相垂直。  

令 ${\bf e}_1,\ldots,{\bf e}_n$ 為 $I_n$ 中的行向量。  
觀察到  
$$\left[\begin{array}{c|c} A & I_m \end{array}\right] \begin{bmatrix} {\bf e}_i \\ -{\bf u}_i \end{bmatrix} = {\bf 0}.$$
利用這個性質推得 $R{\bf e}_i = B{\bf u}_i$ 並說明 ${\bf u}_i$ 和 $\beta_L$ 中的各向量垂直。  

##### Exercise 6(d)

由前一題我們已知 $\operatorname{Col}(A)^\perp \supseteq \operatorname{span}(\beta_L)$。  
接著我們證明 $\operatorname{Col}(A)^\perp \subseteq \operatorname{span}(\beta_L)$。  
令 ${\bf b}\in\operatorname{Col}(A)^\perp$ 則 ${\bf b}^\top A = {\bf 0}$。  
考慮 ${\bf v}^\top = {\bf b}^\top \left[\begin{array}{c|c} A & I_m \end{array}\right] = 
\left[\begin{array}{c|c} {\bf 0}^\top & {\bf b}^\top\end{array}\right]$。  
說明 ${\bf v}^\top$ 也落在 $\left[\begin{array}{c|c} R & B \end{array}\right]$ 的列空間中﹐進而說明 ${\bf b}\in\operatorname{span}(\beta_L)$。  

因為 $\operatorname{Col}(A)^\perp = \operatorname{ker}(A^\top)$﹐  
所以 $\operatorname{ker}(A^\top) = \operatorname{span}(\beta_L)$。  

##### Exercise 6(e)

其實我們也可以證明 $\operatorname{ker}(A^\top)^\perp = \operatorname{Col}(A)$。  
如此一來可以再次說明 $(V^\perp)^\perp = V$。  

因為我已知 $\operatorname{ker}(A^\top)^\perp \supseteq \operatorname{Col}(A)$。  
接著我們證明 $\operatorname{ker}(A^\top)^\perp \subseteq \operatorname{Col}(A)$。  
令 ${\bf b}\in\operatorname{ker}(A^\top)^\perp$ 因此 $B{\bf b}$ 的最後 $m-r$ 項都是 $0$。  
說明存在 ${\bf v}\in\mathbb{R}^n$ 使得  
$$\left[\begin{array}{c|c} R & B \end{array}\right] \begin{bmatrix} {\bf v} \\ {\bf b} \end{bmatrix} = {\bf 0}.$$  
因此 $A{\bf v} + I_m{\bf b} = {\bf 0}$﹐得到 ${\bf b}\in\operatorname{Col}(A)$。  

##### Exercise 7

若 $S\subseteq\mathbb{R}^n$ 是一群有限個數的向量而 $V = \operatorname{span}(S)$。  
依照以下步驟證明：  
任何向量 ${\bf b}\in\mathbb{R}^n$ 都可以寫成 ${\bf b} = {\bf w} + {\bf h}$  
使得 ${\bf w}\in V$ 且 ${\bf h}\in V^\perp$。

##### Exercise 7(a)

令 $A_S$ 為一矩陣其各行向量由 $S$ 的各向量組成﹐  
並算出其 $\beta_C$。  
令 $A$ 為 $A_S$ 中只留 $\beta_C$ 中向量的子矩陣。  
由前一題我們知道 $\operatorname{Col}(A_S) = \operatorname{Col}(A) = V$  
且 $\operatorname{ker}(A) = \{{\bf 0}\}$。

##### Exercise 7(b)

說明 $A^\top A$ 可逆。  
同時驗證  
$$\begin{aligned}  
 {\bf w} &= A(A^\top A)^{-1}A^\top {\bf b}, \\
 {\bf h} &= {\bf b} - {\bf w}
\end{aligned}$$
符合我們要的條件。  

##### Exercise 7(c)

證明 ${\bf b}$ 寫成 ${\bf w} + {\bf h}$ 的方法唯一。  
也就是說﹐如果 ${\bf b} = {\bf w}_1 + {\bf h}_1 = {\bf w}_2 + {\bf h}_2$  
使得 ${\bf h}_1,{\bf h}_2\in V$ 且 ${\bf w}_1,{\bf w}_2\in V^\perp$﹐  
則 ${\bf h}_1 = {\bf h}_2$ 且 ${\bf w}_1 = {\bf w}_2$。  