# 西爾維斯特矩陣、結式

![Creative Commons License](https://i.creativecommons.org/l/by/4.0/88x31.png)  
This work by Jephian Lin is licensed under a [Creative Commons Attribution 4.0 International License](http://creativecommons.org/licenses/by/4.0/).

In [None]:
from lingeo import random_int_list

## Main idea

Let $A$ be an $n\times n$ matrix and  
$f_A : \mathbb{R}^n\rightarrow\mathbb{R}^n$ the corresponding linear function defined by $f({\bf v}) = A{\bf v}$. Let $\mathcal{E}_n$ be the standard basis of $\mathbb{R}^n$.  
Then $[f_A] = [f_A]_{\mathcal{E}_n}^{\mathcal{E}_n} = A$.  

Let $\beta$ be another basis of $\mathcal{R}^n$ and $Q = [\operatorname{id}]_\beta^{\mathcal{E}_n}$.  
Then $[f_A]_\beta^\beta = Q^{-1}AQ$.  

##### Spectral theorem (vector version)

Let $A$ be an $n\times n$ symmetric matrix.  
Then there is an orthonormal basis $\beta$ of $\mathbb{R}^n$ such that $[f_A]_\beta^\beta = D$ is a diagonal matrix.  
That is, there is an orthogonal matrix $Q$ such that $Q^\top AQ = D$ is a diagonal matrix.  

Let $\beta = \{ {\bf v}_1, \ldots, {\bf v}_n \}$ be the basis in the spectral theorem.  
Then $Q$ is the matrix whose columns are vectors in $\beta$.  
Since $\beta$ is orthonormal, $Q$ is orthogonal and $Q^{-1} = Q^\top$.  

Suppose the $D$ matrix in the spectral theorem is 
$$\begin{bmatrix}  
 \lambda_1 & ~ & ~ \\ 
 ~ & \ddots & ~ \\ 
 ~ & ~ & \lambda_n \\ 
\end{bmatrix}.$$  
By examining $AQ = QD$, we have  
$$AQ = 
A\begin{bmatrix}
 | & ~ & | \\
 {\bf v}_1 & \cdots & {\bf v}_n \\
 | & ~ & | 
\end{bmatrix} = 
\begin{bmatrix}
 | & ~ & | \\
 \lambda_1{\bf v}_1 & \cdots & \lambda_n{\bf v}_n \\
 | & ~ & | 
\end{bmatrix} = 
\begin{bmatrix}
 | & ~ & | \\
 {\bf v}_1 & \cdots & {\bf v}_n \\
 | & ~ & | 
\end{bmatrix}
\begin{bmatrix}
 \lambda_1 & ~ & ~ \\
 ~ & \ddots & ~ \\
 ~ & ~ & \lambda_n 
\end{bmatrix} = 
QD.$$ 
Therefore, $A{\bf v}_i = \lambda_i {\bf v}_i$ for $i = 1,\ldots, n$.  

If a nonzero vector ${\bf v}$ satisfies $A{\bf v} = \lambda{\bf v}$ for some scalar $\lambda$, then ${\bf v}$ is called an **eigenvector** of $A$ and $\lambda$ is called an **eigenvalue** of $A$.  

On the other hand, we may write $A = QDQ^\top$.  
Thus,  
$$A = QDQ^\top = 
\begin{bmatrix}
 | & ~ & | \\
 {\bf v}_1 & \cdots & {\bf v}_n \\
 | & ~ & | 
\end{bmatrix}
\begin{bmatrix}  
 \lambda_1 & ~ & ~ \\ 
 ~ & \ddots & ~ \\ 
 ~ & ~ & \lambda_n \\ 
\end{bmatrix}
\begin{bmatrix}
 - & {\bf v}_1^\top & - \\
 ~ & \vdots & ~\\
 - & {\bf v}_n^\top & - 
\end{bmatrix} = 
\sum_{i = 1}^n \lambda_i {\bf v}_i{\bf v}_i^\top.$$

Suppose $\{\lambda_1,\ldots,\lambda_n\}$ only has $q$ distinct values $\{\mu_1,\ldots, \mu_q\}$.  
For each $j = 1,\ldots, q$, we may let $\displaystyle P_j = \sum_{\lambda_i = \mu_j} {\bf v}_i{\bf v}_i^\top$.  
Thus, we have the following.  

##### Spectral theorem (projection version)

Let $A$ be an $n\times n$ symmetric matrix.  
Then there are $q$ distinct values $\mu_1,\ldots, \mu_q$ and $q$ projection matrices $P_1,\ldots, P_q$ such that  
- $A = \sum_{j=1}^q \mu_j P_j$,   
- $P_iP_j = P_jP_i$ for any $i$ and $j$, and 
- $\sum_{j=1}^q P_j = I_n$.

## Side stories
- quadratic form
- differential equation
- diagonalization for general matrices

## Experiments

##### Exercise 1

執行以下程式碼。  

In [None]:
### code
set_random_seed(0)
print_ans = False
n = 3
Q = matrix([
    [1 / sqrt(3), 1 / sqrt(2), 1 / sqrt(6)],
    [1 / sqrt(3), -1 / sqrt(2), 1 / sqrt(6)],
    [1 / sqrt(3), 0, -2 / sqrt(6)]
])
v = random_int_list(n)
D = diagonal_matrix(v)
A = Q * D * Q.transpose()

cs = random_int_list(n)

print("A =")
show(A)
for i in range(n):
    print("v%s ="%(i+1), Q.column(i))
print("b = " + " + ".join("%s v%s"%(cs[i], i+1) for i in range(n))) 

if print_ans:
    for i in range(n):
        print("A v%s = %s v%s"%(i+1, v[i], i+1))
    print("A b = " + " + ".join("%s v%s"%(cs[i]*v[i], i+1) for i in range(n))) 
    print("Q =")
    show(Q)
    print("D =")
    show(D)

##### Exercise 1(a)

驗證 ${\bf v}_1, \ldots, {\bf v}_3$ 是 $A$ 的特徵向量﹐並找出相對應的特徵值。  

##### Exercise 1(b)

把 $A{\bf b}$ 寫成 $\{{\bf v}_1, \ldots, {\bf v}_3\}$的線性組合。  

##### Exercise 1(c)

找出一個垂直矩陣 $A$ 和一個對角矩陣使得 $D = Q^\top AQ$。  

## Exercises

##### Exercise 2

令 $A$ 為一 $3\times 3$ 矩陣而  
$\beta = \{ {\bf v}_1,\ldots,{\bf v}_3 \}$ 為 $\mathbb{R}^3$ 的一組基底。  
已知  
$$[f_A]_\beta^\beta = \begin{bmatrix}  
 3 & 0 & 0 \\
 0 & 4 & 0 \\
 0 & 0 & 5 \\
\end{bmatrix}.$$  
將 $A{\bf v}_1$、$A{\bf v}_2$、$A{\bf v}_3$、及 $A({\bf v}_1 + {\bf v}_2 + {\bf v}_3)$ 分別寫成 $\beta$ 的線性組合。  

##### Exercise 3

令 
$$A = \begin{bmatrix}  
 0 & 1 & 1 \\
 1 & 0 & 1 \\
 1 & 1 & 0 \\
\end{bmatrix}$$ 
且 $\beta = \{ {\bf v}_1, \ldots, {\bf v}_3 \}$ 為  
$$\begin{bmatrix}
 \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} \\
 \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} \\
 \frac{1}{\sqrt{3}} & 0 & -\frac{2}{\sqrt{6}} \\
\end{bmatrix}$$
的行向量集合。  

##### Exercise 3(a)

寫出 $[f_A]_\beta^\beta$ 並說明 $f_A$ 的作用。  

##### Exercise 3(b)

找出一個垂直矩陣 $A$ 和一個對角矩陣使得 $D = Q^\top AQ$。  

##### Exercise 3(c)

令 $P_1$ 為投影到 $\operatorname{span}(\{{\bf v}_1\})$ 的投影矩陣、  
$P_2$ 為投影到 $\operatorname{span}(\{{\bf v}_2, {\bf v}_3\})$ 的投影矩陣。  
說明 $P_1 = {\bf v}_1{\bf v}_1^\top$ 且 $P_2 = {\bf v}_2{\bf v}_2^\top + {\bf v}_3{\bf v}_3^\top$。  

##### Exercise 3(d)

將 $A$ 寫成一些投影矩陣的線性組合﹐並再次說明 $f_A$ 的作用﹐看看是否和第一小題一致。  

##### Exercise 4

令  
$$A = \begin{bmatrix} 
 1 & 2 \\
 2 & 4 \\
\end{bmatrix}.$$

##### Exercise 4(a)

說明要找一個非零向量 ${\bf v}$ 使得 $A{\bf v} = \lambda{\bf v}$﹐  
等同於在 $(A - \lambda I){\bf v} = {\bf 0}$ 中找非零解。  

##### Exercise 4(b)

方程式 $(A - \lambda I){\bf v} = {\bf 0}$ 有非零解只會發生在 $\det(A - \lambda I) = 0$ 的時候。  
利用這個性質找出所有可能的 $\lambda$。  

##### Exercise 4(c)

對每一個 $\lambda$ 解出相對應的 ${\bf v}$。  
向量 ${\bf v}$ 的選擇可能很多﹐把它的長度縮為 $1$。  

##### Exercise 4(d)

找出一個垂直矩陣 $A$ 和一個對角矩陣使得 $D = Q^\top AQ$。  

##### Exercise 5

令  
$$A = \begin{bmatrix} 
 1 & 2 \\ 
 2 & 1 \\
\end{bmatrix}, 
Q = \begin{bmatrix}
 \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\
 \frac{1}{\sqrt{2}} & - \frac{1}{\sqrt{2}} \\
\end{bmatrix}, 
D = \begin{bmatrix} 
 3 & 0 \\
 0 & -1 \\
\end{bmatrix}.$$

##### Exercise 5(a)

驗證 $Q^\top AQ = D$。  

##### Exercise 5(a)

令 $p(x,y) = x^2 + 4xy + y^2$。  
找一些係數 $a,b,c,d$ 並令  
$\hat{x} = a x + b y$、  
$\hat{y} = c x + D y$﹐  
使得 $p(x,y) = 3\hat{x}^2 - \hat{y}^2$。  
藉此說明 $p(x,y) = 1$ 的圖形是雙曲線。  

##### Exercise 5(b)

令 $x(t), y(t)$ 為以 $t$ 為變數的函數。  
令 $x'(t), y'(t)$ 為其對 $t$ 的微分。  
考慮微分方程  
$x' = x + 2y$、  
$y' = 2x + y$。  
找一些係數 $a,b,c,d$ 並令  
$\hat{x} = a x + b y$、  
$\hat{y} = c x + D y$﹐  
使得原方程可以改寫為  
$\hat{x}' = 3\hat{x}$、  
$\hat{y}' = -\hat{y}$。  
（此方程的解為  
$\hat{x} = C_1e^{3t}$、  
$\hat{y} = C_2e^{-t}$﹐  
其中 $C_1$ 和 $C_2$ 是任意常數。）  
解原方程。  

##### Exercise 6

以下例題說明並非對稱矩陣才能表示成對角矩陣。  
然而其所用的基底不再是垂直的﹐同時基底也不見得存在。  
令  
$$A = \begin{bmatrix} 
 1 & 2 \\
 1 & 2 \\
\end{bmatrix}.$$

##### Exercise 6(a)

說明要找一個非零向量 ${\bf v}$ 使得 $A{\bf v} = \lambda{\bf v}$﹐  
等同於在 $(A - \lambda I){\bf v} = {\bf 0}$ 中找非零解。  

##### Exercise 6(b)

方程式 $(A - \lambda I){\bf v} = {\bf 0}$ 有非零解只會發生在 $\det(A - \lambda I) = 0$ 的時候。  
利用這個性質找出所有可能的 $\lambda$。  

##### Exercise 6(c)

對每一個 $\lambda$ 解出相對應的 ${\bf v}$。  
向量 ${\bf v}$ 的選擇可能很多﹐把它的長度縮為 $1$。  

##### Exercise 6(d)

找出一個垂直矩陣 $A$ 和一個對角矩陣使得 $D = Q^{-1} AQ$。  