<a href="https://colab.research.google.com/github/bayashi-cl/statistical-learning/blob/main/note/03_LinearRegression_appendix.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 最小二乗推定に関する補足

最小二乗推定量 $\hat{\beta}$ は正規方程式を利用して次のように求めていた。

$$\hat{\beta} = (X^\top X)X^\top y$$

しかし、この方法ではいくつかの問題点が存在する。
* $X$ が正則でない場合に $\hat{\beta}$ を求めることができない
* 時間計算量がパラメーター数を $p$ として $O(p^3)$ であるため、パラメーターが増えると計算が遅くなる。

これらの問題に対処するためのいくつかの手法を示す。

### 0. Xが（行・列）フルランクの場合：QR分解

$A$ が行、または列でフルランクの場合 $A=QR$ と分解できる。ここで、 $Q$ は直交行列であり、 $R$ は上三角行列である。よって、最小二乗推定量は

$$\hat{\beta} = R^{-1}Q^\top y$$

で求められる。

### 1. $X$ が正則でない場合：特異値分解(SVD)

$X$ の**Moore-Penrose一般逆行列**（擬似逆行列）$X^+$ を以下の条件を満たす行列と定義する。
1. $XX^+X = X$
1. $X^+XX^+=X$
1. $(X^+X)^\top = X^+X$
1. $(XX^+)^\top = XX^+$

任意の行列 $A$ は $A = U\Sigma V^\top$ と分解できる、ただし、 $U,V$ は
直交行列、 $\Sigma$ は $A$ の特異値からなる対角行列である。

また、 $A^+$ は $A^+ = U\Sigma^+V$ と分解でき、 $\Sigma^+$ は特異値の逆数からなる対角行列になる。

最小二乗推定量は

$$\hat\beta = X^+y$$

となる。この方法はQR分解より非効率的である。

### 2. 計算量が問題になる場合：勾配降下法

解析的に解くことを諦めて、**勾配降下法**を使う。




## 各ライブラリで利用可能な手法

|言語|ライブラリ|||
|:-:|:-:|:--|:--|
|R     |stats::lm|QR分解|[リンク](https://stat.ethz.ch/R-manual/R-devel/library/stats/html/lm.html)|
|Python|statsmodels.regression.linear_model.OLS|擬似逆行列/qr分解|[リンク](https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.fit.html#statsmodels.regression.linear_model.OLS.fit)|
|Python|mlxtend.regressor.LinearRegression|閉形式/QR分解/特異値分解/勾配降下法/確率的勾配降下法|[リンク](http://rasbt.github.io/mlxtend/user_guide/regressor/LinearRegression/)|
|Python|sklearn.linear_model.LinearRegression|不明(xGELSD?)|[リンク](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)|

### 参考
* ［第3版］Python機械学習プログラミング 達人データサイエンティストによる理論と実践
ISBN: 978-4295010074
* データ分析基礎線形代数の基礎知識 (増強版)
[リンク](http://ds.k.kyoto-u.ac.jp/e-learning_files/data_analysis_basic/slide-03a.pdf)
* mlxtend User Guide LinearRegression
[リンク](https://rasbt.github.io/mlxtend/user_guide/regressor/LinearRegression/)
* 【解説】 一般逆行列
[リンク](https://www.slideshare.net/wosugi/ss-79624897)