# 凸関数の最適化の下界

参考：
* [Introductory Lectures on Convex Optimization](https://pages.cs.wisc.edu/~yliang/cs839_spring22/material/Introductory-Lectures-on-Convex-Programming-Yurii-Nesterov-2004.pdf)の2.1章

次の問題設定を考えましょう．

$$
\min _{x \in R^n} f(x), \quad f \in \mathcal{F}_L^{1,1}\left(R^n\right)
$$

* ここで，任意の$f \in C^{k, p}_L(Q)$は，$Q$上で$k$回連続微分可能です．
* さらに，$p$-次微分は，$Q$において$L$-リプシッツ連続とします：$\left\|f^{(p)}(x)-f^{(p)}(y)\right\| \leq L\|x-y\|$ for all $x, y \in Q$．
* 特に$\mathcal{F}_L^{1, 1}(R^n)$は，勾配について$L$-リプシッツ連続な凸関数のクラスとします．
* $\bar{x} \in R^n, f(\bar{x})-f^* \leq \epsilon$を，$\epsilon$-最適解と呼ぶことにします．

この問題に対して，$f$の１次微分を与えるオラクルが存在するとしましょう．
そして，勾配を使って逐次的に解を更新するアルゴリズムがあるとします：

---

**仮定**
$\mathcal{M}$は，次のように勾配情報の線形和を使って解$\{x_k\}$を更新していきます．

$$
x_k \in x_0+\operatorname{Lin}\left\{f^{\prime}\left(x_0\right), \ldots, f^{\prime}\left(x_{k-1}\right)\right\}, \quad k \geq 1 .
$$

---


この$\mathcal{M}$に対して下界を出します．
固定された$L > 0$に対して，次の関数を考えましょう．ここで，$k=1\dots n$です：

$$
f_k(x)=\frac{L}{4}\left\{\frac{1}{2}\left[\left(x^{(1)}\right)^2+\sum_{i=1}^{k-1}\left(x^{(i)}-x^{(i+1)}\right)^2+\left(x^{(k)}\right)^2\right]-x^{(1)}\right\}
$$

すると，任意の$s \in \mathcal{R}^n$について，

$$
\left\langle f_k^{\prime \prime}(x) s, s\right\rangle=\frac{L}{4}\left[\left(s^{(1)}\right)^2+\sum_{i=1}^{k-1}\left(s^{(i)}-s^{(i+1)}\right)^2+\left(s^{(k)}\right)^2\right] \geq 0
$$
と
$$
\begin{aligned}
\left\langle f_k^{\prime \prime}(x) s, s\right\rangle & \leq \frac{L}{4}\left[\left(s^{(1)}\right)^2+\sum_{i=1}^{k-1} 2\left(\left(s^{(i)}\right)^2+\left(s^{(i+1)}\right)^2\right)+\left(s^{(k)}\right)^2\right] \\
& \leq L \sum_{i=1}^n\left(s^{(i)}\right)^2
\end{aligned}
$$
が成り立ってます．よって，
$$
0 \preceq f_k^{\prime \prime}(x) \preceq L I_n
$$
が成り立ち，$f_k(x) \in \mathcal{F}_L^{\infty, 1}\left(R^n\right), 1 \leq k \leq n$を満たします（定数関数は無限回微分可能です）．

ここで，二回導関数について，$f_k^{\prime \prime}(x)=\frac{L}{4} A_k$の形であることに注意しましょう．

![](figs/CVX-lowerbound-matrix.png)

であり，$0_{k, p}$は$k\times p$のゼロ行列です．よって，$f_k^{\prime}(x)=A_k x-e_1=0$は
$$
\bar{x}_k^{(i)}=\left\{\begin{array}{cl}
1-\frac{i}{k+1}, & i=1 \ldots k \\
0, & k+1 \leq i \leq n
\end{array}\right.
$$
なる唯一の解を持ちます．そして，$f_k$の最適値は
$$
\begin{aligned}
f_k^* & =\frac{L}{4}\left[\frac{1}{2}\left\langle A_k \bar{x}_k, \bar{x}_k\right\rangle-\left\langle e_1, \bar{x}_k\right\rangle\right]=-\frac{L}{8}\left\langle e_1, \bar{x}_k\right\rangle \\
& =\frac{L}{8}\left(-1+\frac{1}{k+1}\right) .
\end{aligned}
$$
になります．さらに，$\sum_{i=1}^k i^2=\frac{k(k+1)(2 k+1)}{6} \leq \frac{(k+1)^3}{3}$なので，
$$
\begin{aligned}
\left\|\bar{x}_k\right\|^2 & =\sum_{i=1}^n\left(\bar{x}_k^{(i)}\right)^2=\sum_{i=1}^k\left(1-\frac{i}{k+1}\right)^2 \\
& =k-\frac{2}{k+1} \sum_{i=1}^k i+\frac{1}{(k+1)^2} \sum_{i=1}^k i^2 \\
& \leq k-\frac{2}{k+1} \cdot \frac{k(k+1)}{2}+\frac{1}{(k+1)^2} \cdot \frac{(k+1)^3}{3}=\frac{1}{3}(k+1) .
\end{aligned}
$$
が成り立ちます．

ここで，$R^{k, n}=\left\{x \in R^n \mid x^{(i)}=0, k+1 \leq i \leq n\right\} ;$を，最初の$k$要素だけゼロではないような$R^n$の部分空間としましょう．
このとき，$\{f_k\}$の解析解から，任意の$x \in R^{k, n}$について，

$$
f_p(x)=f_k(x), \quad p=k \ldots n
$$

です．ここで，$1 \leq p \leq n$なる$p$を固定しましょう．このとき，次が成立します（証明略）

$x_0=0$とすると，任意の$x_k \in \mathcal{L}_k=\operatorname{Lin}\left\{f_p^{\prime}\left(x_0\right), \ldots, f_p^{\prime}\left(x_{k-1}\right)\right\}$を満たす$\{x_k\}_{k=0}^p$に対して，$\mathcal{L}_k \subseteq R^{k, n}$が成立します．

ここから，任意の$x_0=0$かつ$x_k \in \mathcal{L}_k$を満たす$\{x_k\}_{k=0}^p$に対して，$f_p\left(x_k\right) \geq f_k^*$も直ちに成立します．

---



### 下界の本番

次が成立します．

任意の$1 \leq k \leq \frac{1}{2} (n-1)$と，任意の$x_0 \in R^n$に対して，次を満たす関数$f \in \mathcal{F}_L^{\infty, 1}\left(R^n\right)$ が存在します．１次オーダーのアルゴリズム$\mathcal{M}$が，
$$
\begin{aligned}
& f\left(x_k\right)-f^* \geq \frac{3 L\left\|x_0-x^*\right\|^2}{32(k+1)^2} \\
& \left\|x_k-x^*\right\|^2 \geq \frac{1}{8}\left\|x_0-x^*\right\|^2
\end{aligned}
$$
を満たす．

**ポイント**
- ２つ目の不等式から，解については収束が言えません．最適値についての収束は言えます．

---

**証明**

任意の$x_0 \in R^n$から始めても，結局$\bar{f}(x)=f\left(x+x_0\right)$とすれば変わらないので，以降は$x_0=0$としても一般性を失いません．

まず，最初の不等式を示しましょう．固定された$k$に対して，$\mathcal{M}$を使って$f(x) = f_{2k+1}(x)$を最小化することを考えます．
このとき，$x^*=\bar{x}_{2 k+1}$ and $f^*=f_{2 k+1}^*$です（$x^*$は上でやった議論から成立）．

上の補題から，
$$
f\left(x_k\right) \equiv f_{2 k+1}\left(x_k\right)=f_k\left(x_k\right) \geq f_k^*
$$
が成立します．$x_0=0$なので，
$$
\frac{f\left(x_k\right)-f^*}{\left\|x_0-x^*\right\|^2} \geq \frac{\frac{L}{8}\left(-1+\frac{1}{k+1}+1-\frac{1}{2 k+2}\right)}{\frac{1}{3}(2 k+2)}=\frac{3}{8} L \cdot \frac{1}{4(k+1)^2}
$$
が成立します．証明終わりです．


続いて，２つ目の不等式を示しましょう．$x_k \in R^{k, n}$かつ$x_0=0$なので，
$$
\begin{aligned}
\left\|x_k-x^*\right\|^2 & \geq \sum_{i=k+1}^{2 k+1}\left(\bar{x}_{2 k+1}^{(i)}\right)^2=\sum_{i=k+1}^{2 k+1}\left(1-\frac{i}{2 k+2}\right)^2 \\
& =k+1-\frac{1}{k+1} \sum_{i=k+1}^{2 k+1} i+\frac{1}{4(k+1)^2} \sum_{i=k+1}^{2 k+1} i^2
\end{aligned}
$$
です．そして，
$$
\begin{aligned}
\sum_{i=k+1}^{2 k+1} i^2 & =\frac{1}{6}[(2 k+1)(2 k+2)(4 k+3)-k(k+1)(2 k+1)] \\
& =\frac{1}{6}(k+1)(2 k+1)(7 k+6)
\end{aligned}
$$
も成り立ちます．よって，
$$
\begin{aligned}
\left\|x_k-x^*\right\|^2 & \geq k+1-\frac{1}{k+1} \cdot \frac{(3 k+2)(k+1)}{2}+\frac{(2 k+1)(7 k+6)}{24(k+1)} \\
& =\frac{(2 k+1)(7 k+6)}{24(k+1)}-\frac{k}{2}=\frac{2 k^2+7 k+6}{24(k+1)} \\
& \geq \frac{2 k^2+7 k+6}{16(k+1)^2}\left\|x_0-\bar{x}_{2 k+1}\right\|^2 \geq \frac{1}{8}\left\|x_0-x^*\right\|^2 .
\end{aligned}
$$
が成立します．証明終わり．