# Newton-Kantorovich 型定理を利用した有限次元非線形方程式の精度保証付き数値解法

まず、Newton-Kantorovich 型定理について説明する。

**定理** 　有界線型作用素 $A^{\dagger} \in \mathcal{L}(X, Y), A \in \mathcal{L}(Y, X)$ を考え、作用素 $F: X \rightarrow Y$ が $C^{1}$ -Fréchet微分可能とする。また $A$ が単射で $AF : X \rightarrow X$ とする。今、$\bar{x} \in X$に対して、

$$
\begin{aligned}
\|A F(\bar{x})\|_{X} & \leq Y_{0} \\
\left\|I-A A^{\dagger}\right\|_{\mathcal{L}(X)} & \leq Z_{0} \\
\left\|A\left(D F(\bar{x})-A^{\dagger}\right)\right\|_{\mathcal{L}(X)} & \leq Z_{1} \\
\|A(D F(b)-D F(\bar{x}))\|_{\mathcal{L}(X)} & \leq Z_{2}(r) r, \quad \text { for all } b \in \overline{B(\bar{x}, r)}
\end{aligned}
$$

が成り立つとする。このとき、radii polynomialを以下で定義する。

$$
p(r) := Z_{2}(r)r^2-(1-Z_1-Z_0)r+Y_0
$$

これに対し、 $p(r_0)<0$ となる $r_0>0$ が存在すれば、 $F(\tilde{x})=0$ をみたす解 $\tilde{x}$ が $b \in \overline{B(\bar{x}, r)}$ 内に一意存在する。

ここで、 $DF(\bar{x})$ を $F$ の$\bar{x}$ におけるFréchet微分、 $A^{\dagger}$ を $DF(\bar{x})$の近似、 $A$を $A^{\dagger}$ の近似左逆作用素とする。（ $AA^{\dagger} \approx I$ とするのが一般的である。） 

この定理を考えるにあたり、簡易ニュートン写像、有界線形作用素、Fréchet微分を用いている。以下では、これらの定義を説明する。

## 簡易ニュートン写像

**定義**　 $X,Y$ をBanach空間とし、写像 $F:X\rightarrow Y$ に対して、

$$
F(x)=0 \quad \text{in}  Y
$$

という（非線形）作用素方程式を考える。
このとき写像 $T:X\rightarrow X$ を

$$
T(x):=x-AF(x)
$$

と定義したとき、これを簡易ニュートン写像という。

### Banach空間

**定義** Banach空間とは、完備なノルム空間のことをいう。

## 有界線形作用素

Banach空間 $X$ から $Y$への有界線形作用素全体を

$$
 \mathcal{L}(X, Y):=\{E:X\rightarrow Y:E\text{が線形},\|E\|_{ \mathcal{L}(X, Y)}<\infty \}
$$

とする。ここで $\|\cdot\|_{ \mathcal{L}(X, Y)}$ は作用素ノルム

$$
\|E\|_{\mathcal{L}(X, Y)}:=\sup _{\|x\|_{X}=1}\|E x\|_{Y}
$$

を表す。そして空間 $\left\langle\mathcal{L}(X, Y),\|\cdot\|_{\mathcal{L}(X, Y)}\right\rangle$ はBanach空間となる。

## Fréchet微分

**定義**  作用素 $F:X\rightarrow Y$が $x_0 \in X$ でFréchet微分可能であるとは、ある有界線形作用素 $E:X \rightarrow Y$ が存在して、

$$
\lim _{\|h\|_{X} \rightarrow 0} \frac{\left\|F\left(x_{0}+h\right) F\left(x_{0}\right)-E h\right\|_{Y}}{\|h\|_{X}}=0
$$

が成り立つことをいう。このとき、 $E$ は作用素 $F$ の $x_0$ におけるFréchet微分といい、 $E=DF(x_0)$ とかく。　もしも作用素 $F:X\rightarrow Y$ がすべての $x\in X$ に対してFréchet微分可能ならば、 $F$ は $X$ において $C^1$ -Fréchet微分可能という。

### Root finding

関数 $x^2-2=0$の解 $\tilde{x}=\pm \sqrt{2}$ を求めることを考える。

In [2]:
F(x) = x^2-2
Df(x) = 2*x

count =0
tol = 1e-12
x_0 =1.0
x = x_0
Fx = F(x)
DF = Df(x)

#ニュートン法を計算する
while count ≤10
    dx = -F(x)/Df(x) 
    x = x + dx
    count += 1
end
println(x)

1.4142135623730951


上記のソースコードで、 $f(\bar{x}) \approx 0$ となる近似解が得られる。この $\bar{x}$ について $Df(\bar{x})=2\bar{x}$ より、 $A^{\dagger}=Df(\bar{x}),A=Df(\bar{x})^{-1}=1/(2\bar{x})$とすると、 

$$
|A f(\bar{x})|=\left|\frac{f(\bar{x})}{2 \bar{x}}\right|=: Y_{0}, \quad\left|1-A A^{\dagger}\right|=: Z_{0}(=0), \quad\left|A\left(D f(\bar{x})-A^{\dagger}\right)\right|=: Z_{1}(=0)
$$

任意の $b \in \overline{B(\bar{x}, r)}$ について

$$
|A(D f(b)-D f(\bar{x}))|=\left|\frac{1}{2 \bar{x}}(2 b-2 \bar{x})\right|=\frac{|b-\bar{x}|}{|\bar{x}|} \leq \frac{r}{|\bar{x}|}=: Z_{2} r
$$

よって、Newton-Kantorovich 型定理における $p(r)$ は

$$
p(r)=:Z_{2}r^2-(1-Z_{1}-Z{0})r+Y_{0}
$$

で定義される。ここで、 $a=Z_{2},\quad b=-(1-Z_{1}-Z{0}),\quad c=Y_{0}$ とすると、 $b^2-4ac<0$ ならばp(r_0)<0を満たすr_0>0は存在しない。逆に、 $b^2-4ac>0$ ならば

$$
\frac{-b-\sqrt{b^{2}-4 a c}}{2 a} \leq r_{0} \leq \frac{-b+\sqrt{b^{2}-4 a c}}{2 a}
$$

を満たすr_0で検証が成功する。以下は各boundを計算した結果である。

In [3]:
using IntervalArithmetic
ix = map(Interval,x)

#Y0 bound 区間演算 ver.
Y0 = abs(F(ix))/2/abs(ix)

#Z0 bound 区間演算
Z0 = abs(1 - (1/ix)*ix)

#Z1 bound
Z1 = 0

#Z2 bound 区間演算
Z2 = 1/abs(ix)

#p(r)を求める
a =Z2
b = -(1-Z1-Z0)
c = Y0

if b^2-4*a*c < 0
    println("error: connot find root of radii polynomial")
else
    r_min = (-b - sqrt(b^2-4*a*c))/2/a
    r_max = (-b + sqrt(b^2-4*a*c))/2/a
end

sup(r_min), inf(r_max)

(3.9252311467094383e-16, 1.4142135623730943)

### Logistic map の 3 周期解

変数 $x$ に対して

$$
x \mapsto \lambda x(1-x), \quad \lambda \in \mathbb{R}
$$

という写像をロジスティック写像という. この写像が $x_{1} \rightarrow x_{2} \rightarrow x_{3} \rightarrow x_{1}$ という値で変化する3周期解を計算する

#### 問題1.1.

与えられた $\lambda \in \mathbb{R}$ に対して、次をみたす $x=(x_1,x_2,x_3)^T\in \mathbb{R}$ を求めよ

$$
\left\{\begin{array}{l}
x_{1}-\lambda x_{3}\left(1-x_{3}\right)=0 \\
x_{2}-\lambda x_{1}\left(1-x_{1}\right)=0 \\
x_{3}-\lambda x_{2}\left(1-x_{2}\right)=0
\end{array}\right.
$$

写像 $F:\mathbb{R}^3 \rightarrow \mathbb{R}^3$は以下のようにおくことができる

$$
F(x):=\left[\begin{array}{l}
x_{1}-\lambda x_{3}\left(1-x_{3}\right) \\
x_{2}-\lambda x_{1}\left(1-x_{1}\right) \\
x_{3}-\lambda x_{2}\left(1-x_{2}\right)
\end{array}\right]
$$

ある $x\in \mathbb{R}^3$におけるJacobi行列は以下ようにおくことができる

$$
DF(x)=\left[\begin{array}{ccc}
1 & 0 & -\lambda\left(1-2 x_{3}\right) \\
-\lambda\left(1-2 x_{1}\right) & 1 & 0 \\
0 & -\lambda\left(1-2 x_{2}\right) & 1
\end{array}\right]
$$

はじめに、パラメータ値 $\lambda = 3.82843,4$として、初期値を$x_0=(1,-1,1)^T$とすると、次のコードで近似解 $\bar{x}$ が得られる。

In [4]:
using LinearAlgebra
#初期値を設定
lam = 3.82843
#lam = 4

#写像Fを定義する
f(x, y, z) = x - lam*z*(1-z) 
g(x, y, z) = y - lam*x*(1-x)
h(x, y, z) = z - lam*y*(1-y)
F((x, y, z)) = [f(x, y, z); g(x, y, z); h(x, y, z)]

#ヤコビ行列DFを定義
Df((x, y, z)) = [1 0 -lam*(1-2*z); -lam*(1-2*x) 1 0; 0 -lam*(1-2*y) 1]

#初期値を設定
tol = 1e-12
p = Inf
X0 = [1;-1;1]
X = X0

count = 0
while count ≤100
    dx = -Df(X)\F(X)
    X = X+dx
    count += 1
    if norm(F(X),p) < tol
        break
    end
end
println(X)

[0.9562724718522855, 0.16008745214881528, 0.5147686297331594]


次に、 radii polynomial $p(r)$を計算する。上記の計算によって得られた近似解 $\bar{x}$ について、$A^{\dagger}=Df(\bar{x}), A \approx Df(\bar{x})^{-1}$とする。

よって、 $Y_0,Z_0,Z_1,Z_2$ boundは以下のようになる。

$$
\|A F(\bar{x})\| \leq Y_{0}, \quad\left\|I-A A^{\dagger}\right\|=\|I-A D F(\bar{x})\| \leq Z_{0}, \quad\left\|A\left(D F(\bar{x})-A^{\dagger}\right)\right\|=Z_{1}(=0)
$$

また、任意の $b \in \overline{B(\bar{x}, r)}:=\{b\mid \|b-\bar{x}\|\le r\}$ について,

$$
\begin{aligned}
\|A(D F(b)-D F(\bar{x}))\| &=\| A\left[\begin{array}{ccc}
0 & 0 & 2 \lambda\left(x_{3}-\bar{x}_{3}\right) \\
2 \lambda\left(x_{2}-\bar{x}_{2}\right) & 0 & 0 \\
0 & 2 \lambda\left(x_{1}-\bar{x}_{1}\right) & 0
\end{array}\right] \\
& \leq 2|\lambda|\|A\|\|b-\bar{x}\| \\
& \leq 2|\lambda|\|A\| r=: Z_{2} r .
\end{aligned}
$$

よって、radii polynomial $p(r)$は、 $p(r):=Z_{2}r^2-(1-Z_{1}-Z_{0})r+Y_0$ で定義される。Root finding と同様に、 $a=Z_{2},\quad b=-(1-Z_{1}-Z{0}),\quad c=Y_{0}$ とすると、もし $b^2-4ac>0$ ならば

$$
\frac{-b-\sqrt{b^{2}-4 a c}}{2 a} \leq r_{0} \leq \frac{-b+\sqrt{b^{2}-4 a c}}{2 a}
$$

を満たすr_0で検証が成功する。以下は、これらの検証を行ったソースコードである。

In [6]:
using IntervalArithmetic
iX = map(Interval,X)
A = inv(Df(X))

Y0 = norm(A*F(iX),p)
Z0 = opnorm(Matrix{Float64}(I,size(A)) - A*Df(iX),p)
Z1 = 0
Z2 = 2*lam*opnorm(map(Interval,A),p)

# p(r) = Z2*rˆ2 - (1-Z1-Z0)*r + Y0
a = Z2
b = -(1-Z1-Z0)
c = Y0

if b^2-4*a*c < 0
    println("error: cannot find root of radii polynomial")
else
    r_min = (-b - sqrt(b^2-4*a*c))/2/a
    r_max = (-b + sqrt(b^2-4*a*c))/2/a
end

(sup(r_min),inf(r_max))

(1.4120746319646334e-10, 0.00029025423568418093)

次に、パラメータ $\lambda$ もわからない場合を考えていく。上記の計算では, パラメータ値 $\lambda$ を事前に与えたが, パラメータ値自体も分からない場合はそれ自身も未知数として  $x = (\lambda, x1, x2, x3)^T \in \mathbb{R}^4$ を計算することを考える。

#### 問題1.2.

与えられた $\lambda \in \mathbb{R}$ に対して、次をみたす $x \in \mathbb{R}^4$ を求めよ

$$
\left\{\begin{array}{l}
x_{1}-\lambda x_{3}\left(1-x_{3}\right)=0 \\
x_{2}-\lambda x_{1}\left(1-x_{1}\right)=0 \\
x_{3}-\lambda x_{2}\left(1-x_{2}\right)=0
\end{array}\right.
$$

ただし、問題1.2.は未知数4つに対して、方程式が3つしかないため正確な解を導くのが困難である。このため位相条件と呼ばれる式を追加する。

$$
\eta(x):=x_{1}+x_{2}+x_{3}-\eta_{0}, \quad \eta_{0} \in \mathbb{R}
$$

これにより写像$F:\mathbb{R}^4 \rightarrow \mathbb{R}^4$を

$$
F(x):=\left[\begin{array}{l}
x_{1}+x_{2}+x_{3}-\eta_{0} \\
x_{1}-\lambda x_{3}\left(1-x_{3}\right) \\
x_{2}-\lambda x_{1}\left(1-x_{1}\right) \\
x_{3}-\lambda x_{2}\left(1-x_{2}\right)
\end{array}\right]
$$

と定義する。ある$x \in \mathbb{R}^4$おけるJacobi行列は

$$
D F(x)=\left[\begin{array}{cccc}
0 & 1 & 1 & 1 \\
-x_{3}\left(1-x_{3}\right) & 1 & 0 & -\lambda\left(1-2 x_{3}\right) \\
-x_{1}\left(1-x_{1}\right) & -\lambda\left(1-2 x_{1}\right) & 1 & 0 \\
-x_{2}\left(1-x_{2}\right) & 0 & -\lambda\left(1-2 x_{2}\right) & 1
\end{array}\right]
$$



いま  $\eta= 1.6311, 1.75$ として, 初期値を $x_0 = (3, 1, −1, 1)^T$ とすると近似解 $X$ が得られる。

In [9]:
eta = 1.6311

#写像 F を定義する
t((lam, x, y, z)) = x + y + z - eta
f((lam, x, y, z)) = x - lam*z*(1-z) 
g((lam, x, y, z)) = y - lam*x*(1-x)
h((lam, x, y, z)) = z - lam*y*(1-y)
F((lam, x, y, z)) = [t(lam, x, y, z); f(lam, x, y, z); g(lam, x, y, z); h(lam, x, y, z)]
# F(lam, x, y, z) = [x + y + z - eta
#     x - lam*z*(1-z)
#     y - lam*x*(1-x)
#     z - lam*y*(1-y)]


#ヤコビ行列DFを定義
Df((lam, x, y, z)) = [0 1 1 1;
    -z*(1-z ) 1 0 -lam*(1-2*z);
    -x*(1-x) -lam*(1-2*x) 1 0;
    -y*(1-y) 0 -lam*(1-2*y) 1]

#初期値を設定
tol = 1e-12
p = 1
X0 = [3.;1.;-1.;1.]
X = X0

count = 0
while count ≤500
    dx = -Df(X)\F(X)
    X = X+dx
    count += 1
    if norm(dx,p) < tol
        break
    end
end
println(X)

MethodError: MethodError: no method matching t(::Float64, ::Float64, ::Float64, ::Float64)
Closest candidates are:
  t(::Any) at In[9]:4

上記の計算により、近似解が得られる。近似解 $\bar{x}$ について、$A^{\dagger}=Df(\bar{x}), A \approx Df(\bar{x})^{-1}$とする。

よって、 $Y_0,Z_0,Z_1,Z_2$ boundは以下のようになる。

$$
\|A F(\bar{x})\| \leq Y_{0}, \quad\left\|I-A A^{\dagger}\right\|=\|I-A D F(\bar{x})\| \leq Z_{0}, \quad\left\|A\left(D F(\bar{x})-A^{\dagger}\right)\right\|=Z_{1}(=0)
$$

また、任意の $b \in \overline{B(\bar{x}, r)}$ について,

$$
\begin{aligned}
&\|A(D F(b)-D F(\bar{x}))\|\\
&=\left\|A\left[\begin{array}{cccc}
0 & 0 & 0 & 0 \\
-\left(x_{3}-\bar{x}_{3}\right)\left(1-\left(x_{3}+\bar{x}_{3}\right)\right) & 0 & 0 & c_{3} \\
-\left(x_{1}-\bar{x}_{1}\right)\left(1-\left(x_{1}+\bar{x}_{1}\right)\right) & c_{1} & 0 & 0 \\
-\left(x_{2}-\bar{x}_{2}\right)\left(1-\left(x_{2}+\bar{x}_{2}\right)\right) & 0 & c_{2} & 0
\end{array}\right]\right\|\\
&\leq\|A\|\left\|\left[\begin{array}{cccc}
0 & 0 & 0 & 0 \\
1+2\left|\bar{x}_{3}\right|+r & 0 & 0 & \left(1+\left(\left|\bar{x}_{3}\right|+r\right)\right)+|\bar{\lambda}|+r \\
1+2\left|\bar{x}_{1}\right|+r & \left.\left(1+\left(\left|\bar{x}_{1}\right|+r\right)\right)+|\bar{\lambda}|+r\right) & 0 & 0 \\
1+2\left|\bar{x}_{2}\right|+r & 0 & \left(1+\left(\left|\bar{x}_{2}\right|+r\right)\right)+|\bar{\lambda}|+r & 0
\end{array}\right]\right\| \|b-\bar{x} \|\\
&\leq\|A\| \|B(r)\| r=: Z_{2}(r) r
\end{aligned}
$$

ただし、

$$
\begin{array}{c}
c_{i}=-(\lambda-\bar{\lambda})\left(1-x_{i}\right)+\bar{\lambda}\left(x_{i}-\bar{x}_{i}\right) \quad(i=1,2,3) \\
{\left[\begin{array}{cccc}
0 & 0 & 0 & 0 \\
1+2\left|\bar{x}_{3}\right|+r & 0 & 0 & \left(1+\left(\left|\bar{x}_{3}\right|+r\right)\right)+|\bar{\lambda}|+r \\
1+2\left|\bar{x}_{1}\right|+r & \left.\left(1+\left(\left|\bar{x}_{1}\right|+r\right)\right)+|\bar{\lambda}|+r\right) & 0 & 0 \\
1+2\left|\bar{x}_{2}\right|+r & 0 & \left(1+\left(\left|\bar{x}_{2}\right|+r\right)\right)+|\bar{\lambda}|+r & 0
\end{array}\right]}
\end{array}
$$

とした。

**上の式変形が理解できていない**

\begin{align}
|-(x_3-\bar{x}_3)(1-(x_3+\bar{x}_3))| &\le |-(x_3-\bar{x}_3)(1-(x_3-\bar{x}_3+2\bar{x}_3))|\\
&\le |x_3-\bar{x}_3|(1+|x_3-\bar{x}_3|+2|\bar{x}_3|))\\
&\le \|b-\bar{x}\|(1+\|b-\bar{x}\|+2|\bar{x}_3|))\\
&\le \|b-\bar{x}\|(1+r+2|\bar{x}_3|))
\end{align}

In [None]:
using IntervalArithmetic
iX = map(Interval,X)
A = inv(Df(X))

Y0 = norm(A*F(iX),p)
Z0 = opnorm(Matrix{Float64}(I,size(A)) - A*Df(iX),p)
Z1 = 0
