# Distributionally Robust Optimizationのメモ

参考：
* [Distributionally Robust Optimization](https://www.arxiv.org/abs/2411.02549)


今回は分布的ロバスト最適化の話です．
次の違いがあります：
* 古典的な最適化：$\inf _{x \in \mathcal{X}} \ell(x)$
    * 17世紀から，ニュートンやライプニッツらによって考えられてきました．
    * 基本的に**すべてのデータがわかっており，決定的な問題**を考えます
    * 実践的な問題では，決定的な最適化はほぼでてきません．我々はデータから何かを近似する必要があります．しかし，平均的なアプローチは一般にあまり良くないです（[これとか読んでみよう](https://www.amazon.com/Flaw-Averages-Underestimate-Risk-Uncertainty-ebook/dp/B0096CT4VY/ref=tmm_kin_swatch_0?_encoding=UTF8&qid=&sr=)）．
* 確率的最適化：$\inf _{x \in \mathcal{X}} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]$  
    * $Z$は$\mathbb{P}$に従う確率変数です．
    * 経験リスク最小化の理論的な基盤になってます．
    * $\mathbb{P}$が間違っている場合に大きな誤差がでます
    * また，期待値を計算するのが結構大変です．一般に$Z$の次元に対して次元の呪いを受けます
* ロバスト最適化：$\inf _{x \in \mathcal{X}} \sup _{z \in \mathcal{Z}} \ell(x, z)$
    * $\mathcal{Z}$を不確実集合と呼びます
    * $\sup$は期待値より計算しやすい場合があります．積分を取らないので．
    * しかし，一般にかなり保守的になる場合が多いです．
  * 分布的ロバスト最適化：$\inf _{x \in \mathcal{X}} \sup _{\mathbb{P} \in \mathcal{P}} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]$
    * ここで，$\mathcal{P}$は曖昧集合（ambiguity set）と呼びます．（これの日本語訳知らない…）

## Ambiguity Sets

Ambiguity setにもいろいろな種類があります．

### Moment Ambiguity set

Moment Ambiguity Setでは次の集合を考えます：

$$
\text{（一般系）}\quad \mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}(\mathcal{Z}): \mathbb{E}_{\mathbb{P}}[f(Z)] \in \mathcal{F}\right\},
$$

ここで，$f: \mathcal{Z} \to \mathbb{R}^m$はボレル可測なモーメント関数であり，$\mathcal{F}$は不確実集合です．
この形式は様々なAmbiguity setを一般化可能です：

---

**Support-only Ambiguity Set**

一番簡単なのは$f(z)=1$かつ$\mathcal{F}=\{1\}$の，確率変数のサポートを考える状況です．これは次のようにロバスト最適化と同じです：

$$
\inf _{x \in \mathcal{X}} \sup _{\mathbb{P} \in \mathcal{P}(\mathcal{Z})} \mathbb{E}_{\mathbb{P}}[\ell(x, Z)]=\inf _{x \in \mathcal{X}} \sup _{z \in \mathcal{Z}} \ell(x, z) .
$$

---

**Markov Ambiguity Set**

Markovの不等式は次のように，確率変数が一定値以上を取る確率を上から抑えることができます：
$$
\mathbb{P}(Z \geq \tau) \leq \mu / \tau
$$
ここで，$\mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}\left(\mathbb{R}_{+}\right): \mathbb{E}_{\mathbb{P}}[Z]=\mu\right\}$なる不確実集合において，$Z$についての任意の分布で，上の不等式が成り立っていることに注意しましょう．

また，$\mu \leq \tau$ならば，上の不等式はタイトです．
実際，$P^\star \in \mathcal{P}$を満たす確率分布が存在します．
すなわち，$\mu \leq \tau$のとき，
$$
\sup _{\mathbb{P} \in \mathcal{P}} \mathbb{P}(Z \geq \tau)=\mu / \tau
$$
であり，$P^\star$がそのSupを与えます．よって，マルコフの不等式におけるバウンドは，分布的ロバスト最適化問題の最適値を与えているとみなせます．

この点で，$\mathcal{P}$をMarkov Ambiguity Setと呼びます．正式には，$\mathcal{Z}\subseteq \mathbb{R}^d$を使って，
$$
\mathcal{P}=\left\{\mathbb{P} \in \mathcal{P}(\mathcal{Z}): \mathbb{E}_{\mathbb{P}}[Z]=\mu\right\}
$$
として表記されます．

---

**Chebyshev Ambiguity Set**

TODO: 分散（二次モーメント）も考える不確実集合なだけです．

---

**最適輸送 Ambiguity Set**

---





