# サポートベクター回帰 (Support Vector Regression, SVR)

# 概要
* サポートベクトルのみを参照した回帰分析

# 詳細
* サポートベクトルマシン
    * サポートベクトル＝決定境界から最も近い正のサンプルと負のサンプル
    * 正の超平面,負の超平面＝サポートベクトルを通る超平面
    * マージン(＝2つの超平面の間隔)2/|w|を最大化する
    * 関数L=|w|^2/2を最小化する問題に置き換える
* 直線で分けることが出来ない場合(1)? ソフトマージン分類
    * 境界からはみ出ることを許可する＆ペナルティを与える
    * スラック変数ξ＝どれだけはみ出したかの度合
    * 関数L=|w|^2/2+C*(Σ_i ξ(i)) を最小化する問題に置き換える
    * 実際には、等価な双対問題を導出して2次計画法を用いて最小化問題を解く
* 直線で分けることが出来ない場合(2)? 非線形SVM
    * 変数x→非線形写像Φ(x)でより高い次元に拡張した空間においてSVMを適用する
    * RBFカーネルは、実質無限次元への拡張
    * 表現力が高い（過学習しやすいとも言う）
* サポートベクトル回帰
    * 回帰の誤差がεを超えたときにペナルティを与える
    * ξやLを同様に考えてSVMを適用する

# ハイパーパラメータの高速最適化
* SVRのハイパーパラメータ
    * C の候補: $2^{-5}, 2^{-4}, …, 2^{9}, 2^{10}$ (16通り)
    * ε (イプシロン) の候補: $2^{-10}, 2^{-9}, …, 2^{-1}, 2^{0}$ (11通り)
    * γ (ガンマ) の候補: $2^{-20}, 2^{-19}, …, 2^{9}, 2^{10}$ (31通り)
    * グリッドサーチだと$16 \times 11 \times 31=5456$回も必要
* 高速で最適化する方法
    1. γ = グラム行列の分散が最大になるもの、と仮定
    2. C = 目的変数yの平均＋/-標準偏差×3、あたりがいいので、データが標準化済みなら、C=3、と仮定
    3. 1と2の、γとCを用いて、εのみを最適化（ε決定）
    4. 1と3の、γとεを用いて、Cのみを最適化（C決定）
    5. 3と4の、εとCを用いて、γのみを最適化（γ決定）
    6. パラメータ１つずつ最適化するので、$11+16+31=56$回で済む

# 参考文献
* サポートベクター回帰(Support Vector Regression, SVR)～サンプル数10000以下ならこれを使うべし！～  
    https://datachemeng.com/supportvectorregression/
* 第9回 サポートベクターマシンで非線形な競馬予測に挑む　（AlphaImpact）  
    https://alphaimpact.jp/2017/03/16/svm/
* [Pythonコードあり] サポートベクター回帰(Support Vector Regression, SVR)のハイパーパラメータを高速に最適化する方法  
    https://datachemeng.com/fastoptsvrhyperparams/
