本节介绍了解线性方程组的直接法

本文用到python的sympy库进行符号运算，
可以到第一章进行了解。

原创内容,如需转载需征得作者同意。

Copyright©2020 lizhemin
***

1.设$A\in\mathbb{R}^{n\times n}$为对称正定阵，且经过高斯消去法这一步，$A$约化为
$$\left[\begin{array}{ll}
a_{11} & a_{1}^{T} \\
0 & A_{2}
\end{array}\right]$$
求证：$A_2$也是对称正定阵。

**证明：**

不妨假设$LA = \left[\begin{array}{ll}
a_{11} & a_{1}^{T} \\
0 & A_{2}
\end{array}\right]$,那么$LAL^T = \left[\begin{array}{ll}
a_{11} & 0 \\
0 & A_{2}
\end{array}\right]$.

由于$A$对称正定,则$A=BB^T$,那么$LAL^T=LBB^TL^T=LB(LB)^T$,必为对称正定.
***

2.设$A$为严格对角占优阵，即$|a_{ii}|>\sum_{j=1,j\neq i}^n|a_{ij}|(i=1,2,\ldots,n),$且经过一步高斯消去法化为
$$\left[\begin{array}{cc}
a_{11} & a_{1}^{T} \\
0 & A_{2}
\end{array}\right]$$
求证：$A_2$也是严格对角占优阵。

由归纳法易得,写出$a_{22}'=a_{22}-\frac{a_{21}}{a_{11}}\cdot a_{12}>0$
***

3.设$L_k$是指标为$k$的初等下三角阵，且
$$\tilde{\boldsymbol{L}}_{k}=\boldsymbol{I}_{i j} \boldsymbol{L}_{k} \boldsymbol{I}_{i, j}(i, j, k)$$
其中$\boldsymbol{I}_{ij}$为初等置换阵，求证：$\tilde{L}_k$也是指标为$k$的初等下三角阵。

**分析:**用置换矩阵的性质，显然.

或回到定义出发进行证明,$I_{ij}=I-(e_i-e_j)(e_i-e_j)^T$,$L_k=I-l_ke_k^T$
***

4.用选主元三角分解法求解
$$
\left(
\begin{array}{lllllll}
1&1&1&1&1&1&1\\
2&1&1&1&1&1&1\\
3&2&1&1&1&1&1\\
4&3&2&1&1&1&1\\
5&4&3&2&1&1&1\\
6&5&4&3&2&1&1\\
7&6&5&4&3&2&1\\
\end{array}
\right)
\left(
\begin{array}{l}
x_1\\x_2\\x_3\\x_4\\x_5\\x_6\\x_7\\
\end{array}
\right)=
\left(
\begin{array}{l}
7\\8\\10\\13\\17\\22\\28\\
\end{array}
\right)
$$

In [34]:
import numpy as np
import copy

def swap(a,b):
    mid = copy.copy(a)
    a = copy.copy(b)
    b = copy.copy(mid)
    return a,b

def choose_max(A,b,i):
    index = np.argmax(A[i:,i])+i
    A[index,:],A[i,:] = swap(A[index,:],A[i,:])
    b[index,:],b[i,:] = swap(b[index,:],b[i,:])
    return A,b

def minus(A,b,i):
    m = A.shape[0]
    
    for j in range(i+1,m):
        scale = A[j,i]/A[i,i]
        #print(scale)
        #print(A[j,:])
        A[j,:] = A[j,:]-A[i,:]*scale
        #print(A[j,:])
        b[j,:] = b[j,:]-b[i,:]*scale
    return A,b

def solve_Ab(A,b):
    n = A.shape[1]
    x = np.zeros((n,1))
    for i in range(n):
        i = n-i-1
        sum_ax = 0
        for j in range(i,n):
            sum_ax += A[i,j]*x[j]
        x[i] = (b[i]-sum_ax)/A[i,i]
    return x

def main_solve(A,b):
    # A:[m,n],b:[m,1] m>=n
    if A.shape[0] != b.shape[0]:
        raise('shape of A,b is not equal!')
    m = A.shape[0]
    n = A.shape[1]
    for i in range(m-1):
        A,b = choose_max(A,b,i)
        A,b = minus(A,b,i)
        #print(A)
    #return A,b
    return solve_Ab(A,b)
    
    

A = np.ones((7,7))
for i in range(7):
    for j in range(7):
        if i-j>0:
            A[i,j] = i-j+1
b = np.array([7,8,10,13,17,22,28]).reshape(-1,1)
x = main_solve(A,b)

b_cal = np.dot(A,x)
print('real b:',b,'b_calculate:',b_cal)

real b: [[28]
 [ 3]
 [14]
 [ 9]
 [ 5]
 [ 1]
 [ 0]] b_calculate: [[28.]
 [ 3.]
 [14.]
 [ 9.]
 [ 5.]
 [ 1.]
 [ 0.]]


5.求证：

(a)$\|x\|_\infty\leq\|x\|_1\leq n\|x\|_\infty$

(b)$\frac{1}{\sqrt{n}}\|A\|_F\leq \|A\|_2\leq \|A\|_F$

**证明：**

(a)由定义显然

(b)$\left\|A\right\|_F^2=\sum_{i,j=1}^na_{ij}^2,\left\|A\right\|_2^2=\lambda_{max}(A^TA)$

而$tr(A^TA)=\sum_{i=1}^na_{ii}^2=\sum_{i=1}^n\lambda_i$,剩下的显然.
***

6.设$A$为非奇异阵，求证：
$$
\frac{1}{\|A^{-1}\|_\infty}=
min_{y\neq 0}\frac{\|A y\|_\infty}{\|y\|_\infty}
$$

**引理：**若$A^{-1}$存在,则$\left\|A\right\|_v=\max\frac{\left\|Ax\right\|_v}{\left\|x\right\|_v}=\max\frac{\left\|AA^{-1}x\right\|_v}{\left\|A^{-1}x\right\|_v}=\max\frac{\left\|x\right\|_v}{\left\|A^{-1}x\right\|_v}$
***

7.设$A$为$n$阶非奇异阵，求证：

(a)$\|x\|_\infty\leq\|x\|_2\leq n\|x\|_\infty$

(b)$\frac{1}{\sqrt{n}}\|A\|_2\leq \|A\|_\infty\leq \|A\|_2$

(c)$\frac{1}{n}\leq\frac{cond(A)_\infty}{cond(A)_2}\leq n$

前两个无需多言

(c)$cond(A)_{\infty}=\left\|A\right\|_{\infty}\left\|A^{-1}\right\|_{\infty}$
结合(b),$\frac{1}{n}\left\|A\right\|_2\left\|A^{-1}\right\|_2\leq cond(A)_{\infty}\leq\left\|A\right\|_2\left\|A^{-1}\right\|_2$
***

8.设$A\in\mathbb{R}^{n\times n}$非奇异矩阵，求证：

(a)$cond(A^TA)_2=[cond(A)_2]^2$

(b)$\lambda(A^TA)=\lambda(AA^T)$

**证明：**

(a)$B=A^TA=B^T,cond(B)_2=\sqrt{\frac{\lambda_{max}(B^TB)}{\lambda_{min}(B^TB)}}=\sqrt{\frac{\lambda_{max}(B^2)}{\lambda_{min}(B^2)}}=\frac{\lambda_{max}(B)}{\lambda_{min}(B)}$

(b)构造分块矩阵
$$
\left(
\begin{array}{cc}
\lambda I_n&A\\
A^T& I_n
\end{array}
\right)
$$
用两种方式把矩阵变成分块对角,计算行列式.
***

9.设$A\in\mathbb{R}^{n\times n}$为严格对角占优阵，求证$A$有唯一三角分解：$A=LU$，其中$L$为单位下三角阵，$U$为上三角阵。

**证明：**由于$A$严格对角占优,那么$L,U$均可逆,不妨假设不唯一,则$A=L_1U_1=L_2U_2$.

$L_2^{-1}L_1=U_2U_1^{-1}$,由于单位下三角的逆和乘积还是单位下三角,上三角的逆和乘积也还是上三角,则$L_2^{-1}L_1=U_2U_1^{-1}=I$.
***

10.设$A\in\mathbb{R}^{n\times n}$为非奇异矩阵，则存在正交阵$P_1,P_2,\ldots,P_{n-1}$使
$$
P_{n-1}\ldots P_2P_1A=L \text{(为下三角阵)}
$$
且$A$有分解式：$A=QL$，其中$Q$为正交阵，$L$为下三角矩阵。

**分析：**豪斯荷尔德变换能够把能量逐渐集中在一个地方,然后使用归纳法即可.

11.计算希尔伯特矩阵$H_4$的条件数$cond(H_4)_\infty$

In [37]:
import numpy as np

def infty_norm(A):
    return np.max(np.sum(A,axis=0))

H = np.zeros((4,4))
for i in range(4):
    for j in range(4):
        H[i,j] = 1/(i+j+1)
        
H_inv = np.linalg.inv(H)
print(infty_norm(H))
print(infty_norm(H_inv))
cond = infty_norm(H)*infty_norm(H_inv)
print('cond:',cond)

2.083333333333333
140.00000000000955
cond: 291.6666666666865


12.设$A$为非奇异矩阵，且$\|A^{-1}\|\|\delta A\|<1$，求证$(A+\delta A)^{-1}$存在，且有估计
$$\frac{\| A^{-1}-(A+\delta A)^{-1}\|}{\left\|A^{-1}\right\|} \leqslant \frac{\operatorname{cond}(A) \frac{\|\delta A\|}{\|A\|}}{1-\operatorname{cond}(A) \frac{\|\delta A\|}{\|A\|}}$$

**证明：**$\|A^{-1}\delta A\|\leq\|A^{-1}\|\|\delta A\|<1$,
$(A+\delta A)^{-1}=A^{-1}(I+A^{-1}\delta A)^{-1}$,
而$\rho(A^{-1}\delta A)^{-1})\leq\|A^{-1}\delta A\|< 1$,故可逆.

左右都稍微凑凑很容易的,上面那个变形比较关键,最后一步用到逆的估计式(P178).