## 一、理论部分：Cholesky分解法

<font face="黑体"> Cholesky分解法 </font>又称为<font face="黑体">平方根法</font>，是求解对称正定线性方程组最常用的方法之一。<font face="黑体">Cholesky分解定理</font>如下：

若$A \in R^ {n \times n}$对称正定，则存在一个对角元均为正数的下三角阵$L \in R^ {n \times n}$，使得
$$A=LL^T.$$


因此，我们可按如下步骤求解方程组$Ax=b$：
(1)计算$A$的Cholesky分解：$A=LL^T$;
(2)求解$Ly=b$得$y$;
(3)求解$L^Tx=y$得$x$.

### 1. Cholesky分解实用算法

通常简单而实用的Cholesky分解方法是通过直接比较$A=LL^T$两边的对应元素来计算$L$。设
$$L= \left[\begin{matrix}l_{11} \\ l_{21}& l_{22}\\ \vdots & \vdots & \ddots\\l_{n1}& l_{n2} & \cdots & l_{nn}  \end{matrix}\right].$$
则$LL^T$的元素为
$$LL^T= \left[\begin{matrix}l_{11} \\ l_{21}& l_{22}\\ \vdots&\vdots&\ddots\\l_{n1}& l_{n2} & \cdots & l_{nn}  \end{matrix}\right]
      \left[\begin{matrix}l_{11}&l_{21}& \cdots&l_{n1} \\ & l_{22} & \cdots & l_{n2}\\ & & \ddots&\vdots\\&  & & l_{nn}  \end{matrix}\right] =\left[\begin{matrix}a_{11}& a_{12}&\cdots &a_{1n} \\ a_{21}& a_{22} & \cdots& a_{2n}\\ \vdots & \vdots & \ddots\\a_{n1}& a_{n2} & \cdots & a_{nn}  \end{matrix}\right].$$
比较两边元素，有关系式：
$$a_{ij}=\sum_{p=1}^j l_{ip}l_{jp}， \ 1 \leq j \leq i \leq n.$$
可直接计算$L$的第一列元素：
$$l_{11}=\sqrt{a_{11}},$$
$$l_{i1}=a_{i1}/l_{11}，i=2,…,n.$$
进一步地，假定已算出$L$的前$k-1$列元素。由
$$a_{kk}=\sum_{p=1}^k l_{kp}^2,$$
则可得
$$l_{kk}=(a_{kk}-\sum_{p=1}^{k-1} l_{kp}^2)^\frac{1}{2}.$$
再由
$$a_{ik}=\sum_{p=1}^{k-1} l_{ip}l_{kp} + l_{ik}l_{kk}, \ i = k+1,…,n,$$
得
$$l_{ik}=(a_{ik}-\sum_{p=1}^{k-1} l_{ip}l_{kp})/l_{kk}, \ i=k+1,…,n.$$
由此便可求出矩阵$L$。


以上介绍可能过于数学化，下面以一个三阶方阵为例进行说明。设
$$L= \left[\begin{matrix}l_{11}&0&0 \\ l_{21}& l_{22}&0\\ l_{31}&l_{32}&l_{33}  \end{matrix}\right].$$
则$M_1=LL^T$的元素为
$$M_1= \left[\begin{matrix}l_{11}&0&0 \\ l_{21}& l_{22}&0\\ l_{31}&l_{32}&l_{33} \end{matrix}\right]
    \left[\begin{matrix}l_{11}&l_{21}&l_{31} \\ 0& l_{22}&l_{32}\\ 0&0&l_{33}\end{matrix}\right]$$
$$= \left[\begin{matrix}l_{11}^2&l_{11}l_{21}&l_{11}l_{31} \\ l_{11}l_{21}& l_{21}^2+l_{22}^2&l_{21}l_{31}+l_{22}l_{32}\\ l_{11}l_{31}&l_{31}l_{21}+l_{32}l_{22}&l_{31}^2+l_{32}^2+l_{33}^2 \end{matrix}\right]$$


可以以列为单位求解$L$的元素。根据之前的叙述，$L$的第一列元素可以很容易计算得到。另外，注意到$M_1$删去第一行和第一列后余下的$2 \times 2$矩阵（记为$M_{12}$）的每一个分量的第一项为
$$ \left[\begin{matrix} l_{21}^2 & l_{21}l_{31} \\ l_{31}l_{21} & l_{31}^2 \end{matrix}\right]
=\left[\begin{matrix} l_{21} & l_{31} \end{matrix}\right] 
\left[\begin{matrix} l_{21}\\ l_{31}  \end{matrix}\right] $$
因此，在计算出$L$的第一列元素后，从$M_{12}$中减去上述矩阵，得到$M_2$：
$$M_{2}= \left[\begin{matrix} l_{22}^2 & l_{22}l_{32} \\ l_{32}l_{22} & l_{32}^2+l_{33}^2 \end{matrix}\right].$$
注意到这与$M_1$的形式完全一致，可以继续计算$L$的第二列，进而求出$L$.

### 2. 前/回代法（Forward/Backward Substitution）

对于方程组$Lx=b$和$Ux=b$（其中$L$和$U$分别是下三角矩阵和上三角矩阵），可以分别采用前代法和回代法求解。此处以下三角矩阵的前代法为例。

设方程组$Lx=b$的$L$是已知的非奇异下三角阵（则其主对角线元素非零），则方程组的矩阵形式为：
$$\left[\begin{matrix}l_{11} \\ l_{21}& l_{22}\\ \vdots & \vdots & \ddots\\l_{n1}& l_{n2} & \cdots & l_{nn}  \end{matrix}\right]
\left[\begin{matrix}x_1 \\ x_2 \\ \vdots\\ x_n  \end{matrix}\right]
=\left[\begin{matrix}b_1 \\ b_2 \\ \vdots\\ b_n  \end{matrix}\right].$$
则由方程组的第一个方程可得：
$$x_1=b_1/l_{11};$$
进一步地，如果已求出$x_1,…,x_{i-1}$，就可以根据方程组的第$i$个方程
$$l_{i1}x_1+l_{i2}x_2+…+l_{i,i-1}x_{i-1}+l_{ii}x_{i}=b_{i}$$
求出
$$x_i=(b_i-\sum_{j=1}^{i-1} l_{ij}x_j)/l_{ii}$$
从而可以求出方程组的解。
求解上三角方程组的回代法的做法类似。

## 二、实现代码

### 1.Cholesky分解

mchol函数能够实现对对称正定矩阵的Cholesky分解。它以一个对称正定方阵为参数，返回其Cholesky因子。

In [1]:
mchol <- function(x)
{
  mn <- dim(x)
  m <- mn[1]
  n <- mn[2]
    
  #检验传入参数是否符合要求
  if(m != n) 
  {
    return ("Wrong dimensions of matrix!")
  }
  if(sum(t(x) != x) > 0) 
  {
    return ("Input matrix is not symmetrical!")
  }

  L <- matrix(0, m, m)
  
  for(i in 1:m)  #以列为单位求解L
  {
    L[i,i] <- sqrt(x[i,i])
    if(i < m)
    {
      L[(i+1):m,i] <- x[(i+1):m,i]/L[i,i]

      #更新矩阵，便于下一次同样方法计算
      TLV <- L[(i+1):m,i]
      TLM <- matrix(TLV, m-i, m-i)
      TLM <- sweep(TLM, 2, TLV, "*")
      x[(i+1):m,(i+1):m] <- x[(i+1):m,(i+1):m] - TLM
    }
  }
  L  
}

下面是这个函数使用的一个例子。

In [4]:
y=matrix(rnorm(20),5)
x=t(y)%*%y  #构造对称正定矩阵
mchol(x)

0,1,2,3
2.865024,0.0,0.0,0.0
1.0861545,1.7429808,0.0,0.0
-1.682735,-0.3398935,0.3400365,0.0
-0.1910819,1.0886682,1.2720375,1.736708


### 2.前/回代法求解

#### a.前代法

mforward()以方程组的系数矩阵（下三角矩阵）和右端常数项为参数，使用前代法求解方程组，返回方程组的解。

In [5]:
mforwardsolve=function(L,b){
  mn=dim(L); m=mn[1]; n=mn[2]
  if(m!=n) return ("Wrong dimensions of matrix L!")
  if(m!=length(b)) return ("Wrong dimensions of matrix L or vector b!") #检查输入参数是否符合要求
  x=rep(0,m)
  for(i in 1:m){
    x[i]=b[i]/L[i,i]
    if(i<m) b[(i+1):m]=b[(i+1):m]-x[i]*L[(i+1):m,i]   #更新右端项，逐步减去已求出的未知量对右端项的贡献   
  }
  x  
}

下面是使用mforward()的一个例子。

In [6]:
y=matrix(rnorm(20),5)
x=t(y)%*%y
L=mchol(x); b=1:4
mforwardsolve(L,b)
forwardsolve(L,b) #R语言中自带函数的求解结果

#### b.回代法

mbacksolve()以方程组的系数矩阵（上三角矩阵）和右端常数项为参数，使用回代法求解方程组，返回方程组的解。

In [8]:
mbacksolve=function(L,b){
  mn=dim(L); m=mn[1]; n=mn[2]
  if(m!=n) return ("Wrong dimensions of matrix L!")
  if(m!=length(b)) return ("Wrong dimensions of matrix L or vector b!") #检查输入参数是否符合要求
  x=rep(0,m)
  for(i in m:1){
    x[i]=b[i]/L[i,i]
    if(i>1) b[(i-1):1]=b[(i-1):1]-x[i]*L[(i-1):1,i]   #更新右端项   
  }
  x  
}

下面是使用mbacksolved()的一个例子

In [9]:
y=matrix(rnorm(20),5)
x=t(y)%*%y
L=mchol(x); b=1:4
mforwardsolve(L,b)
forwardsolve(L,b)  #R语言自带函数的求解结果

注：理论部分参考：徐树方, 高立, 张平文. 数值线性代数.第2版[M]. 北京大学出版社, 2013.