# Distributionally Robust Optimizationのメモ

参考：
* [Distributionally Robust Optimization](https://www.arxiv.org/abs/2411.02549)


今回は分布的ロバスト最適化の話です．
次の違いがあります：
* 古典的な最適化：$\inf _{x \in \mathcal{X}} \ell(x)$
    * 17世紀から，ニュートンやライプニッツらによって考えられてきました．
    * 基本的に**すべてのデータがわかっており，決定的な問題**を考えます
    * 実践的な問題では，決定的な最適化はほぼでてきません．我々はデータから何かを近似する必要があります．しかし，平均的なアプローチは一般にあまり良くないです（[これとか読んでみよう](https://www.amazon.com/Flaw-Averages-Underestimate-Risk-Uncertainty-ebook/dp/B0096CT4VY/ref=tmm_kin_swatch_0?_encoding=UTF8&qid=&sr=)）．
* 確率的最適化：$\inf _{x \in \mathcal{X}} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]$  
    * $Z$は$\mathbb{P}$に従う確率変数です．
    * 経験リスク最小化の理論的な基盤になってます．
    * $\mathbb{P}$が間違っている場合に大きな誤差がでます
    * また，期待値を計算するのが結構大変です．一般に$Z$の次元に対して次元の呪いを受けます
* ロバスト最適化：$\inf _{x \in \mathcal{X}} \sup _{z \in \mathcal{Z}} \ell(x, z)$
    * $\mathcal{Z}$を不確実集合と呼びます
    * $\sup$は期待値より計算しやすい場合があります．積分を取らないので．
    * しかし，一般にかなり保守的になる場合が多いです．
  * 分布的ロバスト最適化：$\inf _{x \in \mathcal{X}} \sup _{\mathbb{P} \in \mathcal{P}} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]$
    * ここで，$\mathcal{P}$は曖昧集合（ambiguity set）と呼びます．（これの日本語訳知らない…）

## １章：Ambiguity Sets

Ambiguity setにもいろいろな種類があります．

### Moment Ambiguity set

Moment Ambiguity Setでは次の集合を考えます：

$$
\text{（一般系）}\quad \mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}(\mathcal{Z}): \mathbb{E}_{\mathbb{P}}[f(Z)] \in \mathcal{F}\right\},
$$

ここで，$f: \mathcal{Z} \to \mathbb{R}^m$はボレル可測なモーメント関数であり，$\mathcal{F}$は不確実集合です．
この形式は様々なAmbiguity setを一般化可能です：

---

**Support-only Ambiguity Set**

一番簡単なのは$f(z)=1$かつ$\mathcal{F}=\{1\}$の，確率変数のサポートを考える状況です．これは次のようにロバスト最適化と同じです：

$$
\inf _{x \in \mathcal{X}} \sup _{\mathbb{P} \in \mathcal{P}(\mathcal{Z})} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]=\inf _{x \in \mathcal{X}} \sup _{z \in \mathcal{Z}} \ell(x, z) .
$$

---

**Markov Ambiguity Set**

Markovの不等式は次のように，確率変数が一定値以上を取る確率を上から抑えることができます：
$$
\mathbb{P}(Z \geq \tau) \leq \mu / \tau
$$
ここで，$\mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}\left(\mathbb{R}_{+}\right): \mathbb{E}_{\mathbb{P}}[Z]=\mu\right\}$なる不確実集合において，$Z$についての任意の分布で，上の不等式が成り立っていることに注意しましょう．

また，$\mu \leq \tau$ならば，上の不等式はタイトです．
実際，$P^\star \in \mathcal{P}$を満たす確率分布が存在します．
すなわち，$\mu \leq \tau$のとき，
$$
\sup _{\mathbb{P} \in \mathcal{P}} \mathbb{P}(Z \geq \tau)=\mu / \tau
$$
であり，$P^\star$がそのSupを与えます．よって，マルコフの不等式におけるバウンドは，分布的ロバスト最適化問題の最適値を与えているとみなせます．

この点で，$\mathcal{P}$をMarkov Ambiguity Setと呼びます．正式には，$\mathcal{Z}\subseteq \mathbb{R}^d$を使って，
$$
\mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}(\mathcal{Z}): \mathbb{E}_{\mathbb{P}}[Z]=\mu\right\}
$$
として表記されます．

---

**Chebyshev Ambiguity Set**

TODO: 分散（二次モーメント）も考える不確実集合なだけです．

---

**最適輸送 Ambiguity Set**

---







## ４章：Worst-case 期待問題についての双対性

TODO: 期待値ベースの話もまとめておこう

## 5章：Worst-case risk問題についての双対性

TODO: 双対性の話書く

普通の分布的ロバスト最適化では，意思決定者は次の２つの性質を持ちます
* risk-neutral：分布の形が既知ならば，期待値を比較する
* ambiguity averse：分布の形がわからなければ，ambiguity setの中から最も最悪な状況を考えて動く

ここで，小さな確率でも絶対に起きてほしくないイベントがあれば，例え分布が既知だとしても，期待値を使って評価するのは適切ではありません．
変わりに，law-invariantなリスク評価をするのが望ましいです．

---

**law-invariant risk measure**

$\varrho$は損失の分布（$\in \mathcal{P}(\mathbb{R}$)）に対してリスクを割り振る測度です．

* 損失関数$\ell(Z)$
    * $\ell: \mathbb{R}^d\to \mathbb{R}$がボレル関数
    * $Z$は$d$次元確率ベクトル（$\mathbb{P}$に従う）
    * このとき，LOTUSを考えると，$\ell(Z)$の従う分布は押し出し測度$\mathbb{P}\circ \ell^{-1}$で与えられます．
* $\varrho_{\mathbb{P}}[\ell(Z)]$を，その損失の分布に対するリスク$\varrho\left(\mathbb{P} \circ \ell^{-1}\right)$と表記します．
* Law-invariant risk measure：$\varrho: \mathcal{P}(\mathbb{R}) \to \bar{\mathbb{R}}$なる関数

$\varrho$は，$\mathbb{P}_1 \circ \ell_1^{-1}=\mathbb{P}_2 \circ \ell_2^{-}$であれば，$\ell_{1, 2}$や$\mathbb{P}_{1, 2}$の違いによらず，
$$\varrho_{\mathbb{P}_1}\left[\ell_1\left(Z_1\right)\right]=\varrho_{\mathbb{P}_2}\left[\ell_2\left(Z_2\right)\right]$$
が成立します．
よってlaw-invariantです．

$$\mathbb{E}_\mathbb{P}[\ell(Z)] = \sum_{\ell(z)}\ell(z) (\mathbb{P} \circ \ell^{-1})(z)$$
を$\varrho$とすれば，law-invariant risk measureは期待損失と同じです．
よって，いろいろなリスク評価方法を一般化できます．
一番基本的なのは次のValue at riskでしょう：

---

**Value at Risk**

$$
\beta-\operatorname{VaR}_{\mathbb{P}}[\ell(Z)]=\inf \{\tau \in \mathbb{R}: \mathbb{P}(\ell(Z) \leq \tau) \geq 1-\beta\}
$$

を，損失$\ell(Z)$と$Z\sim \mathbb{P}$についてのレベル$\beta\in(0, 1)$のVaRと呼ぶ，

これは$\mathbb{P}(\ell(Z) \leq \tau)=F(\tau)$が$\ell$と$\mathbb{P}$について，押し出し測度$\mathbb{P} \circ \ell^{-1}$だけに依存してることから，law-invariantです．

---


### VaRの性質


Definition 5.3も読んでおこう．

このlaw-invariant risk measure $\varrho$を使うと，次のrisk-averseな分布的ロバスト最適化問題が考えられます：

$$
\inf _{x \in \mathcal{X}} \sup _{\mathbb{P} \in \mathcal{D}} \varrho_{\mathbb{P}}[\ell(x, Z)]
$$


実は，Risk-averseな問題の多くは，risk-neutralな分布的ロバスト最適化問題に直すことができます．つまり，risk-averseな分布的ロバスト最適化を解くために，risk-neutralな手法が活用できます．

便利なので，次のdisutility関数を導入します：

* Disutility関数 $g: \mathbb{R}\to \mathbb{R}$は $g(0)=0$かつ$g(\tau) > \tau$を全ての$\tau \neq 0$で満たす凸関数

Disutility関数を使うとlaw-invariantなrisk measureを作ることができます．特に次は**Optimized certainty equivalent**と呼ばれるrisk measureです：

$$
\varrho_{\mathbb{P}}[\ell(Z)]=\inf _{\tau \in \mathbb{R}} \tau+\mathbb{E}_{\mathbb{P}}[g(\ell(Z)-\tau)]
$$

---

**メモ：uncertainty equivalence （確率同値性）について**

参考：
* https://wiis.info/economics/microeconomics/choice-under-uncertainty/certainty-equivalent/
* **このサイトのクジの確実同値額の説明がわかりやすいので見ておこう**

何らかの行動を選択した場合、実際に起こり得る結果として複数の候補が存在し、なおかつ、その中のどの結果が実際に起こるかが完全に予測できない状況を考えましょう．つまり，ランダムに結果が変わります．

そのような状況において意思決定主体が直面する個々の選択肢がクジとして定式化されているものとします．
特に結果が有限集合である場合を考えましょう．また，その結果$x\in X$が起こる確率を$L(x)$とします．２つのクジ$L, L'\in \mathcal{L}$の比較を次で表現することにします．

$$
L \succsim L^{\prime} \Leftrightarrow \text { 主体は } L \text { を } L^{\prime} \text { 以上に好む }
$$

このとき，ある関数$U: \mathcal{L} \to \mathbb{R}$が存在して，任意のクジ$L, L'$に対して
$$
U(L) \geq U\left(L^{\prime}\right) \Leftrightarrow L \succsim L^{\prime}
$$
が成り立つとき，$U$を効用関数と呼びます．特に$U$が$u: X\to \mathbb{R}$を使って

$$
\begin{aligned}
U(L) & =L\left(x_1\right) \cdot u\left(x_1\right)+\cdots+L\left(x_N\right) \cdot u\left(x_N\right) \\
& =\sum_{n=1}^N\left[L\left(x_n\right) \cdot u\left(x_n\right)\right]
\end{aligned}
$$
と表されるとき，$U$を期待効用関数，$u$をベルヌーイ効用関数などと呼びます．

さて，このとき意思決定の主体がクジ$L\in \mathcal{L}$を選択した場合に直面する期待効用は$U(L)$ですが，実際に起こる結果はランダムネスによって支配されているため，$U(L)$が確実に得られるわけではありません．一方で，結果$x\in X$が確実に実現する場合に主体が得る効用は$u(x)$です．特に，クジ$L$に対して，結果$x$が
$$
u(x)=U(L)
$$
を満たす場合，主体にとってクジ$L$を選択することと結果$x$を確実に得ることは等価です．このような結果$x$をクジ$L$の確実同値額(certainty equivalent)と呼び，これを$c(L,u) \in X$で表記します．
すなわち，ベルヌーイ関数$u$を持つ主体にとってのクジ$L$の確実同値額は
$$
u(c(L, u)) = U(L)
$$
を満たす結果$c(L, u)$として定義されます．つまり，クジ$L$を金銭換算したものが確実同値額です．
例えば「クジ$L$に挑戦することは，いくら稼ぐことと等価であるか？」といった問題に答えることができます．

---

さて，Optimized uncertainty equivalentを改めて見てみましょう．

$$
\varrho_{\mathbb{P}}[\ell(Z)]=\inf _{\tau \in \mathbb{R}} \tau+\mathbb{E}_{\mathbb{P}}[g(\ell(Z)-\tau)]
$$

* $\tau=0$を考えると，右辺は$\mathbb{E}_{\mathbb{P}}[g(\ell(Z))]$と同じです．これは上で紹介した期待効用$U(L)$に相当します
* カッコの内側に注目して，$\ell(Z)=\tau$と考えれば，$\tau$は確定した結果における効用に相当します．
* すなわち，これは期待される効用（現在）と，不確かな結果における効用（未来）のバランスをとっているとみなせます．
* TODO: これは$\phi$-divergenceとも関わりが深いらしい．要確認．
* TODO: これはMean-variance risk measureとか色々一般化してるみたい．要確認

