# Juliaで固有値問題を精度保証付き数値計算したい


## 固有値問題とは

固有値問題は与えられた行列の固有値および固有ベクトルを求めること。つまり、
$
\newcommand{\C}{\mathbb{C}}
\newcommand{\IC}{\mathbb{IC}}
\newcommand{\bX}{\bar{X}}
$

$$
Ax=\lambda x,\quad A\in \C^{n\times n}
$$

を満たす$\lambda\in \C$, $x\in \C^{n\times n}$ ($x\neq 0$) を求める問題を指す。

Juliaで固有値と固有ベクトルを求める際には、`LinearAlgebra`パッケージに含まれている関数`eigen`・`eigvals`・`eigvecs`で求めることができる。

|関数| 役割 |
|:-----------|:----------|
| eigen()    | 固有値・固有ベクトル両方  |
| eigvals()    | 固有値  |
| eigvecs()  | 固有ベクトル |

多分、Lapackの何かを呼び足してるはず。

In [1]:
using LinearAlgebra
val, vec  = eigen([1 2; 2 1])

Eigen{Float64,Float64,Array{Float64,2},Array{Float64,1}}
values:
2-element Array{Float64,1}:
 -1.0
  3.0
vectors:
2×2 Array{Float64,2}:
 -0.707107  0.707107
  0.707107  0.707107

In [2]:
val#固有値

2-element Array{Float64,1}:
 -1.0
  3.0

In [3]:
vec#固有ベクトル

2×2 Array{Float64,2}:
 -0.707107  0.707107
  0.707107  0.707107

In [4]:
eigvals([1 2; 2 1])#固有値

2-element Array{Float64,1}:
 -1.0
  3.0

In [5]:
eigvecs([1 2; 2 1])#固有ベクトル

2×2 Array{Float64,2}:
 -0.707107  0.707107
  0.707107  0.707107

## 密行列の固有値問題に対する精度保証

密行列とは、行列内のほとんどの要素が0でない行列のことを指す。

ここでは、$A\in\C^{n\times n}$ $(i=1,2,\cdots,n)$ の全ての固有値に対する精度保証アルゴリズムを考える。 $A\in\C^{n\times n}$ $(i=1,2,\cdots,n)$ が対角化可能であるとするとき、$\lambda_i$ に対する固有ベクトル$x^{(i)}\in\C^{n}$ $(i=1,2,\cdots,n)$ を並べた行列

$$
X :=[x^{(1)},x^{(2)},\cdots,x^{(n)}]\in\C^{n\times n}
$$

によって、$A$ は

$$
X^{-1}AX = D = \rm{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)
$$

と対角化される。

In [42]:
using LinearAlgebra

n =100;
A = randn(n,n);

λ, X = eigen(A);

In [7]:
λ #固有値

1000-element Array{Complex{Float64},1}:
 -31.868640126423493 - 5.450802467825307im
 -31.868640126423493 + 5.450802467825307im
 -31.250662671974432 - 2.75132351709385im
 -31.250662671974432 + 2.75132351709385im
 -30.782975035711754 + 0.0im
 -30.334467460644653 + 0.0im
  -30.08574653502795 - 6.304530921377505im
  -30.08574653502795 + 6.304530921377505im
 -29.913674684078146 - 4.690613922539894im
 -29.913674684078146 + 4.690613922539894im
 -29.557195983835953 - 2.5681322786781515im
 -29.557195983835953 + 2.5681322786781515im
 -28.998780317691455 - 10.015201676527923im
                     ⋮
  29.310203923905725 + 5.803782131670605im
   29.45341440058414 - 7.268895713419115im
   29.45341440058414 + 7.268895713419115im
  29.609770093298536 + 0.0im
  29.795172960498338 - 1.7667865357849561im
  29.795172960498338 + 1.7667865357849561im
   29.99879220331391 - 5.888310732058667im
   29.99879220331391 + 5.888310732058667im
  30.420863691434388 + 0.0im
   31.02424574948339 - 4.865477625482017im
 

In [8]:
X #固有ベクトル

1000×1000 Array{Complex{Float64},2}:
  -0.0227615-0.0252456im     -0.0227615+0.0252456im    …    -0.0250935+0.0im
   -0.015367+0.00145606im     -0.015367-0.00145606im         0.0369837+0.0im
  -0.0338425+0.0190005im     -0.0338425-0.0190005im       -0.000849358+0.0im
   0.0293867-0.0122455im      0.0293867+0.0122455im         -0.0365244+0.0im
   0.0458508+0.00926779im     0.0458508-0.00926779im        -0.0233102+0.0im
  0.00375355-0.00554782im    0.00375355+0.00554782im   …    -0.0195326+0.0im
  -0.0193358+0.00672237im    -0.0193358-0.00672237im        -0.0302525+0.0im
 -0.00460875+0.000184644im  -0.00460875-0.000184644im        0.0383023+0.0im
   0.0209501+0.0135699im      0.0209501-0.0135699im          -0.029467+0.0im
  7.77229e-6-0.0197333im     7.77229e-6+0.0197333im          0.0267163+0.0im
 -4.43395e-5-0.0271135im    -4.43395e-5+0.0271135im    …    -0.0163116+0.0im
   0.0118441-0.00448818im     0.0118441+0.00448818im        -0.0206739+0.0im
  0.00769983+0.0275175im     0.00769983

しかし、実際のところ上記の数値計算で得られる固有ベクトル $X$ は近似の値 $\bX\in \C^{n\times n}$ (以下、近似固有ベクトルという) である。しかし、近似固有ベクトルを並べた行列を使って、対角化したものについては、対優位性が期待できる。この行列を $G$ とすると、

$$
G := \bX^{-1}A\bX
$$

となり、行列 $G$ の対角成分は行列 $A$ の固有値の近似となる。

ちなみに対角優位性とは...

In [43]:
G = inv(X)*A*X; #G
norm(diag(G) - λ,Inf) # Gの対角成分は固有値λにほぼ一致する

8.215650382226158e-14

### 精度保証付き数値計算の方法

まず、行列積 $A\cdot\bX$ の包含 $C\in \IC^{n\times n}$ を区間演算で求める。

In [93]:
using BenchmarkTools
include("int_num_linalg.jl"); # mm_ufpを使用する
# function mm_real_interval(A,B) # A, B: real matrices
#     C_mid, C_rad = imm_ufp(mid.(A),radius.(A),mid.(B),radius.(B));
#     return C_mid .± C_rad
# end
# function mm_comp_interval(A,B) # A, B: complex matrices
# #     (Ar + Ai)*(Br + Bi) = (Ar*Br - Ai*Bi) + im()
#     Ar = real(A); Ai = imag(A);
#     Br = real(B); Bi = imag(B);
#     Cr = mm_real_interval(Ar, Br) - mm_real_interval(Ai, Bi);
#     Ci = mm_real_interval(Ar, Bi) + mm_real_interval(Ai, Br);
#     return Cr + im*Ci;
# end
function mm_comp_interval(A,B) # A, B: complex matrices (not interval)
    C_mid, C_rad = mm_ufp(A,B);
    return (real(C_mid) .± C_rad) + im*(imag(C_mid) .± C_rad)
end

using IntervalArithmetic

iA = map(Interval, A);
iX = map(Interval, X);

@btime C1 = $iA * $iX;
# @btime C = mm_comp_interval(iA,iX);
@btime C = mm_comp_interval(A,X); # A, X: complex matrices (not interval)

  78.318 ms (8 allocations: 312.91 KiB)
  32.655 ms (60028 allocations: 2.75 MiB)


上記のようなエラーが出てしまった(ynが原因…？)。

In [92]:
@show max(maximum(radius.(real(C1[:]))),maximum(radius.(imag(C1[:]))))
@show max(maximum(radius.(real(C[:]))),maximum(radius.(imag(C[:]))))

max(maximum(radius.(real(C1[:]))), maximum(radius.(imag(C1[:])))) = 3.83026943495679e-15
max(maximum(radius.(real(C[:]))), maximum(radius.(imag(C[:])))) = 9.14823772291129e-14


9.14823772291129e-14

In [85]:
X[1:3,1:3]

3×3 Array{Complex{Float64},2}:
  0.064792-0.0652338im   0.064792+0.0652338im    0.107158+0.0im
 -0.165187-0.0968135im  -0.165187+0.0968135im   0.0976717+0.0im
 0.0103834+0.0306873im  0.0103834-0.0306873im  -0.0492567+0.0im

区間連立1次方程式$\hat XG=C$の解集合の包含$G\supset\hat X^{-1}\cdot C$を求める。

$G$に対してゲルシュゴリンの定理を適用することを考える。

## ゲルシュゴリンの包含定理
行列 $A=(A_{ij})\in \C^{n\times n}$について、$A$の全ての固有値$\lambda_i$は、$\bigcup_{1\le i \le n}  U_i$の内部に存在する。

$$
A = \bigcup_{1\le i \le n}  U_i
$$

ただし、

$$
U_i = \{z\in\mathbb{C}:|z-a_{ii}|\le \sum_{j\neq i}|a_{ij}|\}
$$

である。

円盤領域$U_i$をゲルシュゴリン円板といい、Aが強い優対角性を持つとき、Aの対角成分がAの固有値の良い近似となる。

今回の場合、$G=(g_{ij})$の対角成分$[g_{ii}]$を$c_i$、半径を$\rm{rad(g_{ii})}$とすると、

$$
\begin{array}{ll}
\mbox{ゲルシュゴリン円の中心:}&c_i\\
\mbox{ゲルシュゴリン円の半径:}&r_i=\sum_{j\neq i}\rm{mag}(g_{ij})+\rm{rad}(g_{ii})\\
\end{array}
$$

となる。