# 投影與鏡射

![Creative Commons License](https://i.creativecommons.org/l/by/4.0/88x31.png)  
This work by Jephian Lin is licensed under a [Creative Commons Attribution 4.0 International License](http://creativecommons.org/licenses/by/4.0/).

In [None]:
from lingeo import random_int_list

## Main idea

##### Matrix-matrix multiplication (by entry)
Let  
$$ A = \begin{bmatrix}  
 a_{11} & \cdots & a_{1n} \\ 
 \vdots & ~ & \vdots \\
 a_{m1} & \cdots & a_{mn} \\
\end{bmatrix} \text{ and } 
B = \begin{bmatrix}  
 b_{11} & \cdots & b_{1\ell} \\ 
 \vdots & ~ & \vdots \\
 b_{n1} & \cdots & b_{n\ell} \\
\end{bmatrix}$$
be $m\times n$ and $n\times \ell$ matrices, respectively.  
Then the $ij$-entry of $AB$ is  
$$(AB)_{ij} = \sum_{k = 1}^n a_{ik}b_{k\ell}.$$

Let $A$ be an $m\times n$ matrix.  
The **transpose** of $A$ is the $n\times m$ matrix $A^\top$ whose $ij$-entry is the $ji$-entry of $A$.  

The $n\times n$ **identity matrix** is the matrix whose diagonal entries are one and other entries are zero, usually denoted as  $I_n$.  
The $m\times n$ **zero matrix** is the matrix whose entries are zero, usually denoted as $O_{m,n}$.  
If $A$ is an $n\times n$ matrix and there is a matrix $B$ such that $AB = BA = I_n$,  
then $B$ is called the **inverse** of $A$, denoted as $A^{-1} = B$.  
A matrix with an inverse is **invertible**.  

Suppose $A$ is an $n\times k$ matrix with $\operatorname{ker}(A) = \{{\bf 0}\}$.  
Then every vector ${\bf b}\in\mathbb{R}^n$ can be written as  
$${\bf b} = {\bf w} + {\bf h}$$
where ${\bf w}\in\operatorname{Col}(A)$ and ${\bf h}\in\operatorname{Col}(A)^\perp$.  
Moreover,  
$$\begin{aligned}  
 {\bf w} &= A(A^\top A)^{-1}A^\top {\bf b}, \\
 {\bf h} &= {\bf b} - {\bf w}.
\end{aligned}$$

We say ${\bf w}$ is the **projection** of ${\bf b}$ onto the subspace $\operatorname{Col}(A)$, and  
${\bf w} - {\bf h}$ the **reflection** of ${\bf b}$ along the subspace $\operatorname{Col}(A)$.  
Both action can be done by matrices.  
That is,  
$$\begin{aligned}
 {\bf w} &= A(A^\top A)^{-1}A^\top {\bf b}, \\
 {\bf w} - {\bf h} &= 2{\bf w} - {\bf b} = (2A(A^\top A)^{-1}A^\top - I_n){\bf b}.
\end{aligned}$$

## Side stories
- $\langle{\bf x},{\bf y}\rangle = {\bf y}^\top{\bf x}$
- matrix algbra

## Experiments

##### Exercise 1
執行下方程式碼。  
依照步驟求出 ${\bf b}$ 在 $\operatorname{Col}(A)$ 上的投影。

In [None]:
### code
set_random_seed(0)
print_ans = False
while True:
    A = matrix(2, random_int_list(8)).transpose()
    if (A.transpose() * A).is_invertible():
        break
b = vector(random_int_list(4))
        
print("A =")
print(A)
print("b =", b)

if print_ans:
    AT = A.transpose()
    ATA = AT * A
    w = A * ATA.inverse() * AT * b
    print("The projection is %s."%w)

##### Exercise 1(a)
假設 ${\bf b} = {\bf w} + {\bf h}$ 使得  
${\bf w}\in\operatorname{Col}(A)$（也就是有某一個 ${\bf v}$ 使得 ${\bf w} = A{\bf v}$）、  
${\bf h}\in\operatorname{Col}(A)^\perp = \operatorname{Row}(A^\top)^\perp = \operatorname{ker}(A^\top)$（也就是 $A^\top{\bf h} = {\bf 0}$）。  

將 ${\bf b} = {\bf w} + {\bf h}$ 兩邊前乘 ${\bf A}^\top$﹐  
並用 $A$、${\bf b}$、和 ${\bf v}$ 表示出來。

##### Exercise 1(b)
將 $A$ 和 ${\bf b}$ 的數字代入並解方程式求出 ${\bf v}$。  

（如果 $A^\top A$ 可逆﹐  
則可以把上一題的式子寫成 ${\bf v} = (A^\top A)^{-1} A^\top {\bf b}$。）  

##### Exercise 1(c)
因此我們知道  
$$\begin{aligned}  
 {\bf w} &= A{\bf v}, \\
 {\bf h} &= {\bf b} - {\bf w}.
\end{aligned}$$

以題目給的 $A$ 和 ${\bf b}$ 將 ${\bf w}$ 和 ${\bf h}$ 求出來﹐  
並確認 $A^\top{\bf h} = {\bf 0}$。  

## Exercises

##### Exercise 2
以下小題說明為何 $A^\top A$ 可逆。

##### Exercise 2(a)
若 ${\bf x}$ 和 ${\bf y}$ 為 $\mathbb{R}^n$ 中的兩向量。  
驗證 $\langle{\bf x},{\bf y}\rangle = {\bf y}^\top{\bf x}$。  
（這裡的右式把 ${\bf x}$ 和 ${\bf y}$ 都當成 $n\times 1$ 的矩陣  
而算出來的 $1\times 1$ 的矩陣 ${\bf y}^\top{\bf x}$ 被當成一個數字。）

##### Exercise 2(b)
若 $A$ 和 $B$ 分別為 $m\times n$ 和 $n\times \ell$ 的兩矩陣。  
驗證 $(AB)^\top = B^\top A^\top$。  

##### Exercise 2(c)
驗證 $\langle A{\bf x}, {\bf y}\rangle = {\bf y}^\top A{\bf x} = \langle {\bf x}, A^\top{\bf y}\rangle$。  

##### Exercise 2(d)
證明 $\operatorname{ker}(A) = \operatorname{ker}(A^\top A)$。  

因為 $A^\top A$ 是一個方陣，  
後面會證明一個方陣 $M$ 可逆的等價條件就是 $\ker(M) = \{{\bf 0}\}$。  
因此 $\operatorname{ker}(A) = \{{\bf 0}\}$ 足以保證 $A^\top A$ 可逆。  

另一方面，  
如果 $\operatorname{ker}(A) \neq \{{\bf 0}\}$，  
表示 $A$ 中的行向量有一些可以去掉並不會影響到行空間。  
重覆這個步驟直到沒有任何多餘的行向量時  
（這時行空間都還是同一個）  
就保證有 $\operatorname{ker}(A)$。  
（參考【矩陣的行向量】中的練習。）

##### Exercise 3(a)
想像矩陣乘法就是一個動作（像是投影、或是鏡射）  
若 $A$ 是一個投影矩陣、  
${\bf b}$ 是一個向量。  
猜看看 $A^2{\bf b} $會是什麼？  
猜看看 $A^2$ 會是什麼？  
（下方程式碼中的矩陣是一個投影矩陣。  
可以試試看。）

In [None]:
### code
set_random_seed(0)
a = vector(random_int_list(3))
A = a.outer_product(a) / a.norm()**2
b = vector(random_int_list(3))

print("A =")
show(A)
print("b =", b)

##### Exercise 3(b)
想像矩陣乘法就是一個動作（像是投影、或是鏡射）  
若 $A$ 是一個鏡射矩陣、  
${\bf b}$ 是一個向量。  
猜看看 $A^2{\bf b} $會是什麼？  
猜看看 $A^2$ 會是什麼？  
（下方程式碼中的矩陣是一個投影矩陣。  
可以試試看。）

In [None]:
### code
set_random_seed(0)
a = vector(random_int_list(3))
A = 2*a.outer_product(a) / a.norm()**2 - identity_matrix(3)
b = vector(random_int_list(3))

print("A =")
show(A)
print("b =", b)

##### Exercise 4

令 $A$、$B$、$C$ 為矩陣  
${\bf x}$ 和 ${\bf y}$ 為向量、$k$ 為純量。  
驗證以下的矩陣運算等式。

##### Exercise 4(a)
1. $(AB)C = A(BC)$.
2. $A(B + C) = AB + AC$.
3. $A(kB) = k(AB)$.  
4. $A({\bf x} + {\bf y}) = A{\bf x} + A{\bf y}$.  
5. $A(k{\bf x}) = k(A{\bf x})$.

##### Exercise 4(b)

給一組例子使得 $AB \neq BA$。  

##### Exercise 4(c)
若 $A$、$B$、$C$ 皆為可逆矩陣。  
則 $(AB)^{-1} = B^{-1}A^{-1}$。  

##### Exercise 4(d)
定義一個方陣 $M$ 的**跡數**（trace）為其對角線上的所有元素相加，記作 $\operatorname{tr}(M)$。  
則 $\operatorname{tr}(A +B) = \operatorname{tr}(A) + \operatorname{tr}(B)$。  

##### Exercise 4(e)
若 $A$ 是一個 $2\times 2$ 的方陣。  
則 $\operatorname{det}(AB) = \operatorname{det}(A) \cdot \operatorname{det}(B)$。  

（實際上 $n\times n$ 都對，但我們還沒學到 $n\times n$ 方陣的行列式值怎麼算。）