# ハイパーパラメータの探索

> <b>ハイパーパラメータとは</b> <br>
> 機械学習では２種類のパラメータがある。学習によって更新されるものと、試行毎にユーザが渡すものである。後者はハイパーパラメータ(Hyperparameter)と呼ばれる。

機械学習の学習では、このHyperparameterの最適解をどのように得るかが重要。

<u>どのくらい大変そうか？</u>

(Deep Learningであると層数、学習係数、バッチサイズ,などパラメータいっぱい) x (一回の学習にかかる時間) = ＼(^o^)／

<u>どうするのか？</u>

1. 学習を並列で行って時間短縮を図る
2. ハイパーパラメータを工夫して選ぶ

### ベイズ最適化


すでに判明しているパラメータセットから次に探索すべきパラメータセットを導く。<br>
だけどパラメータがどんな分布を持つかはわからない。そこで関数が何かしらの確率分布に従うと仮定する(ここではガウス分布)。

<img src="./img/bo1.jpg" width="500">

またパラメータの選択の基準は「獲得関数」で測られる。

<img src="./img/bo2.jpg" width="500">

この獲得関数はいくつかあって、何を選ぶかが重要。

|獲得関数                       |説明                                                                  |
|:------------------------------|:---------------------------------------------------------------------|
|Probability of Improvement (PI)|これまで得られた中でもっとも良いものを上回る確率が高いものを選ぶ      |
|Expected Improvement (EI)      |これまで得られた中でもっとも良いものを上回る幅の期待値が高いものを選ぶ|
|Upper Confidence Bound (UCB)   |信頼区間の上限が高いものを選ぶ                                        |

### 参考

* [A Tutorial on Bayesian Optimization of Expensive Cost Functions, with Application to Active User Modeling and Hierarchical Reinforcement Learning](https://arxiv.org/pdf/1012.2599.pdf)
* [ベイズ的最適化の入門と応用 機械学習による機械学習の実験計画](https://www.youtube.com/watch?v=pQHWew4YYao)
* [機械学習のためのベイズ最適化](https://book.mynavi.jp/manatee/detail/id=59393)