# 重回帰分析

## <u>Step 1. モデルを決める</u>
- 家賃 $y$　ー　広さ $x$,　駅からの距離 $x_1$　...　治安 $x_M$
    - *複数の条件を入力できる model を作成する*


- $M$　:　入力変数の数

- 下記の公式を使用して計算...
    - $\hat{y}$　:　予測値　＝ $x_1$ + $x_2$ + ... $x_M$
        - *普通に足し算して計算でき　... ない*


- *なぜか？*
    - $\hat{y}$　:　予測値　＝　$x_1$　:　$30m^2$(広さ) + $\omega_2x_2$　:　$500m$(距離) + ... $\omega_3x_M$　:　$0.03$(犯罪発生率)
        - **scaleが違いすぎて、個々の数字の値が考慮できない**

### `重みをつける`
- $\omega$　:　ウェイト(weight)　/ 重要であればある程　$\omega$　の値 (paramertor) は上昇していく
    - $b$　:　バイアス
        - $\hat{y}$　:　予測値　＝　$\omega_1x_1$ : $30m^2$(広さ)　+　$\omega_2x_2$ : $500m$(距離)　+　... $\omega_Mx_M$ : $0.03$(犯罪発生率)　+　$b$(バイアス)
        - $b$　->　$\omega_0x_0$ と置き換える


### `公式`


$$
\hat{y}　=　\omega_0x_0　+　\omega_1x_1　+　...　+\omega_Mx_M
$$


- <u>**1. 線形代数を利用する**</u>
$$
\hat{y}　=　
\left(
    \begin{array}{c}
      \omega_0 & \omega_1 & ... & \omega_M \\
    \end{array}
\right)
\left(
    \begin{array}{c}
      x_0 \\
      x_1 \\
      .   \\
      .   \\
      .   \\
      x_M \\
    \end{array}
\right)
$$


- <u>**2. ベクトルの演算なので**</u>
$$
\hat{y}　=　
\left(
    \begin{array}{c}
      \omega_0 & \omega_1 & ... & \omega_M \\
    \end{array}
\right)
\left(
    \begin{array}{c}
      x_0 \\
      x_1 \\
      .   \\
      .   \\
      .   \\
      x_M \\
    \end{array}
\right)
=　
\omega^Tx
$$


- <u>**3. 後々ベクトルで微分する時に厄介なので下記のようにする**</u>


$$
\hat{y}　=　
\left(
    \begin{array}{c}
      x_0 & x_1 & ... & x_M \\
    \end{array}
\right)
\left(
    \begin{array}{c}
      \omega_0 \\
      \omega_1 \\
      .   \\
      .   \\
      .   \\
      \omega_M \\
    \end{array}
\right)
=　
x^T\omega
$$


## <u>Step 2. 評価関数を決める</u>

- *paramertor*　:　$\omega, b$ = M + 1


- **単回帰分析**では...
    - $y$　:　実測値
    - $\hat{y}$　:　予測値
        - 2乗は - (マイナス)の値を　+ に帰るため
        - *二乗誤差*で評価を行なっていた
    

$$
(y - \hat{y})^2
$$

- **重回帰分析**
    - *評価関数*

$$
L　=　(y_1 - \hat{y_1})^2　+　(y_2 - \hat{y_2})^2　+　...　+　(y_N - \hat{y_N})^2
$$


- **線形代数を利用して記述した場合**
    - *ベクトルの表現で表す事ができる*

$$
L　=　
\left(
    \begin{array}{c}
    y_1 - \hat{y_1} & y_2 - \hat{y_2} & ... & y_N - \hat{y_N}
    \end{array}
\right)
\left(
    \begin{array}{c}
    y_1 - \hat{y_1} \\
    y_2 - \hat{y_2} \\
    . \\
    . \\
    . \\
    y_N - \hat{y_N} \\
    \end{array}
\right)
$$


- **転置( T )でまとめる**


$$
(y - \hat{y})^T(y - \hat{y})
$$

## <u>Step3.　評価関数を「 最小化 」する</u>
- 評価関数が一番小さくなる　=　誤差が一番小さくなる paramertor を求める
    - *paramertor*　:　$\omega, b$ = M + 1

### <u>Step3-1.　式変形を行う</u>


$$
L　=　(y - \hat{y})^T(y-\hat{y})
$$


$$
\hat{y}　=　
\left(
    \begin{array}{c}
    \hat{y_1} \\
    \hat{y_2} \\
    . \\
    . \\
    . \\
    \hat{y_N} \\
    \end{array}
\right)
　=　　
\left(
    \begin{array}{c}
      x_0 & x_1 & ... & x_M \\
    \end{array}
\right)
\left(
    \begin{array}{c}
      \omega_0 \\
      \omega_1 \\
      .   \\
      .   \\
      .   \\
      \omega_M \\
    \end{array}
\right)
　=　
x^T\omega
$$

$$
\hat{y}　=　
\left(
    \begin{array}{c}
    \hat{y_1} \\
    \hat{y_2} \\
    . \\
    . \\
    . \\
    \hat{y_N} \\
    \end{array}
\right)
　=　　
\left(
    \begin{array}{c}
      x_1^T\omega \\
      x_2^T\omega \\
      .   \\
      .   \\
      .   \\
      x_N^T\omega \\
    \end{array}
\right)
　=　
\left(
    \begin{array}{c}
      x_1^T \\
      x_2^T \\
      .   \\
      .   \\
      .   \\
      x_N^T \\
    \end{array}
\right)
　\omega
$$


$$=　\left(
    \begin{array}{cc}
      x_{10} & x_{11} & x_{12} & \ldots & x_{1M} \\
      x_{20} & x_{21} & x_{22} & \ldots & x_{2M} \\
      \vdots & \vdots & \vdots & \ddots & \vdots \\
      x_{N0} & x_{N1} & x_{N2} & \ldots & x_{NM} \\
    \end{array}
\right)
　=　
\omega
$$


### <u>上記の式のまとめ</u>
$$
\hat{y}　=　X\omega
$$

### 縦横の関係が重要
- `縦軸　:　sample数`
- `横軸　:　入力変数`　=　X
- `1　:　ダミーでもうけた変数(0番目)


|件目|1|広さ|距離|・・・|治安|
|:---:|:---|:---|:---|:---:|:---|
|1|$x_{10}$|$x_{11}$|$x_{12}$|...|$x_{1M}$|
|2|$x_{20}$|$x_{21}$|$x_{22}$|...|$x_{2M}$|
|N|$x_{N0}$|$x_{N1}$|$x_{N2}$|...|$x_{NM}$|

### <u>評価関数</u>

$$
L　=　(y - \hat{y})^T(y-\hat{y})　=　(y - X\omega)^T(y - X\omega)
$$


#### `転置の公式`
1. 転置の転置　=　元に戻る

$$
(A^T)^T　=　A
$$


2. ABが逆に向く

$$
(AB)^T　=　B^TA^T
$$

3. ABCが逆に向いていく

$$
(ABC)^T　=　C^T
B^TA^T
$$


- **ABが逆に向く**

$$
(AB)^T　=　B^TA^T
$$


$$
(y^T - (X\omega)^T)(y - X\omega)　=　(y^T - \omega^TX^T)(y - X\omega)
$$


- **分配法則**

$$
=　y^Ty - y^TX\omega - \omega^TX^Ty + \omega^TX^TX\omega
$$


- **size感**
    - `file　:　01_linear_algebara`
    
$$
=　y^Ty - y^TX\omega - \omega^TX^Ty + \omega^TX^TX\omega
$$


- **スカラー, ベクトル, 行列?**
    - `scalar: スカラー`
        - (vector)(vector) = scalar:(s)


$$
 \left(
    \begin{array}{c}
      1 & 2 \\
    \end{array}
  \right)
   \left(
    \begin{array}{c}
      3 \\
      4 \\
    \end{array}
  \right)
  =
   \left(
    \begin{array}{c}
      11 \\
    \end{array}
  \right)
$$


- $y^TX\omega$　＝　スカラー


- $\omega X^Ty$　＝　スカラー


- **2つの転置の公式を用いる**
1. 転置の転置　=　スカラーは転置しても同じ

$$
(A^T)^T　=　A　=　(A^T)^T
$$


3. ABCが逆に向いていく

$$
(ABC)^T　=　C^T
B^TA^T
$$


#### **そうすると**
- $\omega X^Ty$　＝　$(\omega)^TX^Ty$　　＝　スカラー

$$
(\omega)^TX^Ty　=　\omega^TX^Ty
$$


    
- $y^TX\omega$　＝　スカラー

$$
y^TX\omega　=　(y^TX\omega)^T　=　\omega^TX^Ty
$$


- **という事は...　$\omega^TX^Ty$　をハブにして**

$$
\omega X^Ty　=　\omega^TX^Ty　=　y^TX\omega
$$


- $\omega X^Ty$　＝　$y^TX\omega$ は同じ値である

$$
\omega^TX^Ty
$$

#### 上記のsize感と転置の公式を踏まえて


$$ 
y^Ty　-　y^TX\omega　-　\omega^TX^Ty　+　\omega^TX^TX\omega
$$


$$
y^Ty　-　\omega^TX^Ty　-　\omega^TX^Ty　+　\omega^TX^TX\omega
$$


### <u>評価関数は</u>
$$
L　=　y^Ty　-　2y^TX\omega　+　\omega^TX^TX\omega
$$


#### 上記のままで完成でも良いが...
- 後々微分する事を考えて
    - paramertor $\omega$ を基準に微分をしていくので下記のように処理をする
    

- *paramertor*　:　$\omega, b$ = M + 1


- **単回帰分析**では...
    - $y$　:　実測値
    - $\hat{y}$　:　予測値
        - 2乗は - (マイナス)の値を　+ に帰るため
        - *二乗誤差*で評価を行なっていた
    

$$
(y - \hat{y})^2
$$

#### paramertor　$\omega$　を基準に微分をしていくので下記のように処理をする
1. 　$y^Ty$　=　C　定数に置き換える　=　実測値
2. 　$y^TX$　=　$(X^Ty)^T$　=　ベクトル　: b　=　$2(b)^T$
    - 転置の転置　=　スカラーは転置しても同じ
    - ABCが逆に向いていく
$$
(A^T)^T　=　A　=　(A^T)^T
$$

$$
(ABC)^T　=　C^T
B^TA^T
$$

3. 　$\omega^TX^TX\omega$　=　$(TX^TX)$　=　A　定数に置き換える　=　$\omega^TA\omega$


#### 上記を踏まえて
$$
L　=　y^Ty　-　2y^TX\omega　+　\omega^TA\omega
$$


### <u>評価関数は</u>


$$
L　=　C　+　b^T\omega　+　\omega^TA\omega
$$


### paramertor の最適化
- 行列で微分してあげる前には、基本的に **定数に**　する

$$
L　=　C　+　b^T\omega　+　\omega^TA\omega
$$

## <u>Step3-2.　最適な paramertor を求める</u>
- 最適な paramertor　$\omega$　を求める


$$
L　=　C　+　b^T\omega　+　\omega^T A \omega
$$


- *$\omega_1, \omega_2$* それぞれに関してみると **2次関数**　になっている
    - それぞれに関して見ていくを理解がし易い
        - <u>**接線の傾きが 0 を狙えば良い**</u>


- **$\omega_1$ に関して評価関数を微分してそれが 0 であれば良い**
- **$\omega_2$ に関して評価関数を微分してそれが 0 であれば良い**
    - *一番良い paramertor が見つかる*


- **それぞれ paramertor　$\omega$　が 0 になる所を求める**


$$
\left(
    \begin{array}{c}
    \frac{\partial}{\partial \omega_0}(l) \\
    \frac{\partial}{\partial \omega_1}(l) \\
    . \\
    \frac{\partial}{\partial \omega_M}(l) \\
    \end{array}
\right)
\left(
    \begin{array}{c}
    0 \\
    0 \\
    . \\
    0 \\
    \end{array}
\right)
$$


- *0 を縦に並べたものを　:　o (0ベクトル)*
- *微分を縦に並べたものを　:　ベクトルで微分*

$$
\frac{\partial}{\partial \omega}(l)　=　o
$$

- 最適な paramertor　$\omega$　を求める


$$
l　=　C　+　b^T\omega　+　\omega^T A \omega
$$


$$
\frac{\partial}{\partial \omega}(l)　=　o
$$


$$
\frac{\partial}{\partial \omega}(C　+　b^T\omega　+　\omega^T A \omega)　=　o
$$


$$
\frac{\partial}{\partial \omega}(C)　+　\frac{\partial}{\partial \omega}(b^T\omega)　+　\frac{\partial}{\partial \omega}(\omega^T A \omega)　=　o
$$


- **ベクトルで微分の公式を見てみる**


## `ベクトルで微分の公式`
- **超重要！！頻繁に使用する公式**


1. $$\frac{\partial}{\partial x}(c) = 0$$


2. $$
\frac{\partial}{\partial x_1}(a^Tx)　=　a
$$


3. $$
\frac{\partial}{\partial x}(x^TAx) = (A + A^T)x
$$

### <u>上記の公式を基に</u>
- **最適な paramertor　$\omega$　を求める**


$$
\frac{\partial}{\partial \omega}(C)　+　\frac{\partial}{\partial \omega}(b^T\omega)　+　\frac{\partial}{\partial \omega}(\omega^T A \omega)　=　o
$$

- **(1)　=　$\frac{\partial}{\partial \omega}(C)　=　0$**

- **(2)　=　$\frac{\partial}{\partial \omega}(b^T\omega)　=　b$**

- **(3)　=　$\frac{\partial}{\partial \omega}(\omega^T A \omega)　=　(A + A^T)\omega$**


$$
0　+　b　+　(A + A^T)\omega
$$


### <u>評価関数の基形</u>
$$
L　=　y^Ty　-　2y^TX\omega　+　\omega^TX^TX\omega
$$

- **paramertor　$\omega$　を基準に微分をしていくので下記のように処理をしている**
1. 　$y^Ty$　=　C　定数に置き換える　=　実測値
2. 　$y^TX$　=　$(X^Ty)^T$　=　ベクトル　: b　=　$2(b)^T$
    - 転置の転置　=　スカラーは転置しても同じ
    - ABCが逆に向いていく
$$
(A^T)^T　=　A　=　(A^T)^T
$$

$$
(ABC)^T　=　C^T
B^TA^T
$$

3. 　$\omega^TX^TX\omega$　=　$(TX^TX)$　=　A　定数に置き換える　=　$\omega^TA\omega$


### <u>評価関数の変換後</u>
- **微分をし易いように形を変換している**
$$
L　=　y^Ty　-　2y^TX\omega　+　\omega^TX^TX\omega
$$
$$
L　=　C　+　b^T\omega　+　\omega^T A \omega
$$


### <u>上記の内容を踏まえて</u>

$$
0　+　b　+　(A + A^T)\omega　=　o
$$


- 0は無視して良い。$　b　+　(A + A^T)\omega$ に元の公式を当てはめる


$$
-2X^Ty　+　(X^TX + (X^TX)^T)\omega　=　o
$$


- *転置の転置 = 転置しても同じ*
$$
-2X^Ty　+　(X^TX + X^TX)\omega　=　o
$$


$$
-2X^Ty　+ 2X^TX\omega　=　o
$$


$$
2X^TX\omega　=　2X^Ty
$$


$$
X^TX\omega　=　X^Ty
$$


- $\omega$　の paramertor を求めたいが
    - `線形代数では割り算が存在しないので...`


$$
\omega　=　\frac{X^Ty}{X^TX}
$$
- **上記のような計算は出来ない**


- <u>**両辺に左側から　$(X^TX)^-1$　の逆行列を掛ける**</u>
    - *両辺に掛けるのであれば問題はないので*


$$
(X^T)^-1(X^TX)\omega　=　(X^T)^-1X^Ty
$$


$$
(X^TX)^-1(X^TX)\omega　=　(X^TX)^-1X^Ty
$$


- **Aの逆行列**
    - *Aインバースと読む*
        - $I$ : 単位行列
        

$$
A　A^{-1}　=　I
$$

$$
A^{-1}　A　=　I
$$


- <u>条件</u>
- **A が `正方行列` である事（最低限）**
    - 縦横size（行, 列）


### **単位行列　=　I　になる**
- `I　はスカラーの 1 に対応するモノなので...`


$$
I\omega　=　(X^TX)^{-1}X^Ty
$$


### <u>重回帰分析の完成！！</u>
$$
\omega　=　(X^TX)^{-1}X^Ty
$$
