## どういった研究か
オラクルからの応答にノイズが含まれる状況で，$[0,1]$区間内の未知の点$X^*$をいい感じに探索する確率的二分探索アルゴリズム(PBA)を理論的に解析した研究です．

普通の二分探索は，探索範囲を半分に絞っていく手法です．一方で，応答にノイズがあり，オラクルが情報を間違える可能性があると，間違った情報に基づいて探索範囲を絞ってしまい，真の値にたどり着けない場合があります．PBAはノイズに対応するため，「$X^*$がどこにあるか」という信念を，確率分布として表現します．オラクルから応答が得られるたびに，この確率分布をベイズの定理に基づいて更新し，信念を更新させます．そして，オラクルにクエリする点は，現在の確率分布の中央値を選びます．「オラクルからの応答確率が均等になる点＝どちらを選べばいいかわからない点＝情報理論的な意味で情報量最大となる点＝中央値」という直感です．

PBAは古くから知られており実用的ですが，特に連続空間におけるPBAの理論的な性質については，離散化PBAほど解析が進んでいませんでした．この研究は，連続版PBAに対して数学的な性能保証を与えます．

## 準備

PBAが最適であることを示します．そのための定義や補題などの準備をおこないます．
* $f_n$：確率密度関数
* $F_n$：累積分布関数 
* $\gamma(x)$：オラクル応答の確率(クエリ点$x$と$f_n$が与えられたもとで，オラクルからの応答が$+1$になる確率)
$$
\gamma(x) = \mathbb{P}(Z_n(x)=+1 \mid X_n=x, f_n) = (1-F_n(x))p + F_n(x)(1-p)
$$
* $H(f)$：エントロピー
$$
H(f) = \mathbb{E}[-\log_2 f(Y)]
$$
* 価値関数：$V_n(f_n)$
* 関数：$g(y) = y \log_2 y + (1-y) \log_2 (1-y)$
	* 狭義凸関数
	* エントロピーで使う

## 命題4.2
定理4.1を示すために，命題4.2を示す必要があります．

> 任意の自然数$N$に対して，以下が成り立ちます．
>
> 1.  残り1回のクエリーで期待事後エントロピーを最小にするクエリ点$X_{N-1}$を選ぶとき，その最小値は以下のように与えられます．
>    $\inf _{x \in[0,1]} \mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right] = H\left(f_{N-1}\right)-p \log _{2} p-(1-p) \log _{2}(1-p)-1$
>
> 2.  上記の最小値を達成する$X_{N-1}$は，$f_{N-1}$の中央値です．

もしオラクルにあと1回だけ質問できるとしたら，どこの点を質問するのが最適であるか？という状況を扱っています．「最適さ」の尺度は，質問後の$f_N$が持つエントロピー$H(f_N)$が，**平均的にどれだけ小さくなるか**，です．命題 4.2は，この状況で最もエントロピーを小さくできるのは，現在の信念の中央値で質問することであるということです．

## 命題 4.2 の証明

### 証明の目標:
$\mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right]$を$x$について最小化する．

### 1：期待事後エントロピーの定義の展開

エントロピーの定義から，期待事後エントロピーは，以下のようになります．
$$
\mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right] = \mathbb{E}\left[-\log_2 f_N(X^*) \mid X_{N-1}=x, f_{N-1}\right]
$$

### 2：$-\log_2 f_N(X^*)$の表現

$Z_{N-1}(x)$の値に応じて，$-\log_2 f_N(X^*)$の値を表現します．
$$
\gamma(x) = \mathbb{P}(Z_{N-1}(x)=+1 \mid X_{N-1}=x, f_{N-1}) = (1-F_{N-1}(x))p + F_{N-1}(x)(1-p)
$$
**if $Z_{N-1}(x) = +1$**
* $f_N(y) = \gamma(x)^{-1} p f_{N-1}(y)$ (if $y \ge x$)
* $f_N(y) = \gamma(x)^{-1} (1-p) f_{N-1}(y)$(if $y < x$)

$$
-\log_2 f_N(X^*) = -\log_2 f_{N-1}(X^*) + \log_2 \gamma(x) - (\text{if } X^* \ge x \text{,then } \log_2 p \text{, if  } X^* < x \text{ ,then } \log_2 (1-p))
$$

**if $Z_{N-1}(x) = -1$**
* $f_N(y) = (1-\gamma(x))^{-1} (1-p) f_{N-1}(y)$(if $y \ge x$)
* $f_N(y) = (1-\gamma(x))^{-1} p f_{N-1}(y)$(if $y < x$)

$$
-\log_2 f_N(X^*) = -\log_2 f_{N-1}(X^*) + \log_2 (1-\gamma(x)) - (\text{if } X^* \ge x \text{ ,then} \log_2 (1-p) \text{, if } X^* < x \text{ ,then  } \log_2 p)
$$

### ３：期待値計算
以下の式たちの期待値を計算します．
$$
-\log_2 f_N(X^*) = -\log_2 f_{N-1}(X^*) + \log_2 \gamma(x) - (\text{if } X^* \ge x \text{,then } \log_2 p \text{, if  } X^* < x \text{ ,then } \log_2 (1-p))
$$
$$
-\log_2 f_N(X^*) = -\log_2 f_{N-1}(X^*) + \log_2 (1-\gamma(x)) - (\text{if } X^* \ge x \text{ ,then} \log_2 (1-p) \text{, if } X^* < x \text{ ,then  } \log_2 p)
$$

**第1項:$-\log_2 f_{N-1}(X^*)$の期待値**
現在の信念$f_{N-1}$のもとでの期待値をとるので，
$$
\mathbb{E}\left[-\log_2 f_{N-1}(X^*) \mid f_{N-1}\right] = \int_0^1 (-\log_2 f_{N-1}(y)) f_{N-1}(y) dy = H(f_{N-1})
$$

**第2項:$\log_2 \gamma(x)$ or $\log_2 (1-\gamma(x))$の期待値**
オラクルの応答が$+1$となるのは確率$\gamma(x)$で，そのときこの項は$\log_2 \gamma(x)$となります．オラクルの応答が$-1$となるのは確率$1-\gamma(x)$で，そのときこの項は$\log_2 (1-\gamma(x))$となります．したがって，この項の期待値は，
$$
\gamma(x) \cdot \log_2 \gamma(x) + (1-\gamma(x)) \cdot \log_2 (1-\gamma(x))
$$

**第3項:$-\log_2 p$ or $-\log_2 (1-p)$の期待値**
オラクルの応答が正しい場合$p$は$-\log_2 p$となり，間違いの場合$1-p$は$-\log_2 (1-p)$となります．オラクルの応答が正しいか間違いかは，真の$X^*$の位置とオラクルの応答の組み合わせによって決まりますが，重要なのは，$f_{N-1}$や$x$にかかわらず，オラクルが正しい応答をする確率は$p$であり，間違った応答をする確率は$1-p$であるという点です．したがって，この項の期待値は，
$$
p \cdot (-\log_2 p) + (1-p) \cdot (-\log_2 (1-p)) = -p \log_2 p - (1-p) \log_2 (1-p)
$$

上記1, 2, 3の項を合計すると，期待事後エントロピーは以下のようになります．
$$
\mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right] = H(f_{N-1}) + \left[\gamma(x) \log_2 \gamma(x) + (1-\gamma(x)) \log_2 (1-\gamma(x))\right] - \left[p \log_2 p + (1-p) \log_2 (1-p)\right]
$$

### ４：最小化
$$
\mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right] = H(f_{N-1}) + \left[\gamma(x) \log_2 \gamma(x) + (1-\gamma(x)) \log_2 (1-\gamma(x))\right] - \left[p \log_2 p + (1-p) \log_2 (1-p)\right]
$$
この式を$x \in [0,1]$について最小化します．定数項とみなせる部分を考えると，最小化すべきは
$$
\left[\gamma(x) \log_2 \gamma(x) + (1-\gamma(x)) \log_2 (1-\gamma(x))\right]
$$
の部分です．ここで，
$$
g(y) = y \log_2 y + (1-y) \log_2 (1-y)
$$
を考えます．この関数は，定義域$y \in (0,1)$において狭義凸関数であり，その最小値は$y=1/2$のときです．したがって，期待事後エントロピーを最小にするためには，$\gamma(x) = 1/2$となるような$x$を選ぶ必要があります．
$$
\gamma(x) = (1-F_{N-1}(x))p + F_{N-1}(x)(1-p) = 1/2
$$
この方程式を$F_{N-1}(x)$について解くと，
$$
F_{N-1}(x) = 1/2
$$
となります．これは，$x$が$f_{N-1}$の中央値であることを意味します．

### ５：最後に

最適な$x$は$f_{N-1}$の中央値であり，このとき$\gamma(x)=1/2$です．この値を期待事後エントロピーの式に代入すると，最小値は以下のようになります．
$$
\begin{aligned}
\inf _{x \in[0,1]} \mathbb{E}\left[H\left(f_{N}\right) \mid X_{N-1}=x, f_{N-1}\right] &= H(f_{N-1}) + (-1) - \left[p \log_2 p + (1-p) \log_2 (1-p)\right] \\
&= H(f_{N-1}) - p \log_2 p - (1-p) \log_2 (1-p) - 1
\end{aligned}
$$
これで証明完了です．

## 定理4.1
