# 局所部分的最小二乗回帰(Locally-Weighted Partial Least Squares, LWPLS)

# 概要
非線形性に対応したＰＬＳ

# 詳細
* Just-In-Time (JIT) モデリングの一つ
* 目的変数の値を推定したいサンプルごとにモデリングする
* 目的変数の値を推定したいサンプルに近いトレーニングデータほど大きい重みを付けてモデリングする
* 時系列データなど、説明変数と目的変数のデータセットのサンプルが増えていく場合に特に効果を発揮する

# 定式化
$n$次元のトレーニングデータ$m$個の入力と出力を$X$と$y$、出力を推定したい$n$次元のサンプル（クエリ）1個を$x_q$とする。

* トレーニングデータとクエリの類似度$u_q$を計算。
    * $u_q: exp(-|x(i)-x_q|^2/λ s(i))$
        * $x(i):i$番目のトレーニングデータ
        * $s(i):|x(i)-x_q|$の標準偏差
        * λ:類似度調整用ハイパーパラメータ
    * $U$: 対角成分が$u_q$、他はゼロの行列

* トレーニングデータの平均化
* $X_0 = X - X_w$
    * $X_w =  [1,1,1,...]^T [x_{w,1},x_{w,2},x_{w,3},...,x_{w,n}]$
    * $x_{w,j} = \sum_{i=1}^m u_q(i) x_j(i)/\sum_{i=1}^m u_q(i)$
* $y_0 = y - y_w$
    * $y_w = \sum_{i=1}^m u_q(i) y(i)/\sum_{i=1}^m u_q(i)$

* 出力の第一成分$y_1$について、以下の順番で計算。
    * $w_1 = X_0 ^T U y_0 / ||X_0^T y_0||$
    * $t_1 = X_0 w_1$
    * $p_1 = X_0^T U t_1/t_1^T U t_1$
    * $q_1 = y_0^T U t_1/t_1^T U t_1$
    * $X_1 = X_0 - t_1 p_1^T$
    * $y_1 = y_0 - t_1 q_1$
* 出力の第二成分$y_2$についても、上の式で$1→2、0→1$として、同様の計算を行う。
* 以降、$y_3,y4,...$についても繰り返し。
* ポイント：予測したいサンプル1個 $x_q$を基に$U$で重みを付けている

# 補足
* 非線形っぽく見えない？
* ここは多分共通
    * $X =\sum t(主成分ベクトル)*p(ローディングベクトル)^T + E(残差ベクトル)$
    * $y = \sum t(主成分ベクトル)*q(係数) + f(残差ベクトル)$
* PLS:
    * $w_1 = X^T y / ||X^T y||$
    * $t_1 = X w1$
    * $p_1 = X^T t_1/t_1^T t_1$
    * $q_1 = y^T t_1/t_1^T t_1$
    * $t_1$はXの線形変換、$p_1,q_1$は一定値のベクトル・スカラーなので、yもXに対して線形

* LWPLS:
    * $w_1 = X_0 ^T U y_0 / ||X_0^T y_0||$
    * $t_1 = X_0 w_1$
    * $p_1 = X_0^T U t_1/t_1^T U t_1$
    * $q_1 = y_0^T U t_1/t_1^T U t_1$
    * $U$は予測したいデータ(クエリ)に依存する数値を対角成分に持つ行列
* よって、「個々の」推定は線形モデルを元にしているが、その線形モデルの係数はクエリによって変わるため、「全体の」関数は非線形になる

* まとめ
    * LWPLSは、予測したいデータの近くの学習データをなるべく再現するよう線形モデルを組む
    * LWPLSは、小さい区間での線形補完を繰り返すようなもの

* 余談
    * なぜ一部のＸが大文字？
    * 多次元配列(行列)は大文字、 1次元配列(ベクトル)は小文字、という数学的な慣習に従った表記。

# 参考文献
* Locally-Weighted Partial Least Squares (LWPLS, 局所PLS)～あのPLSが非線形性に対応！～ [Python・MATLABコードあり]  
    https://datachemeng.com/locallyweightedpartialleastsquares/
* Locally-Weighted Partial Least Squares (LWPLS)  
    https://github.com/hkaneko1985/lwpls
* Pythonではじめる機械学習――scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
    https://www.oreilly.co.jp/books/9784873117980/
* scikit-learn - PyQ 1.0 ドキュメント
    https://docs.pyq.jp/python/machine_learning/tips/scikit-learn.html