## 重回帰分析

### 1. モデルを決める

家賃$y$を予測する - 部屋の広さ$x_1$
広さだけでなく、距離$x_2$…治安$x_m$  
$M$：入力値の数とする

$\hat{y}$ は予測値を表す  
$\hat{y}=x_1+x_2+...+x_m$  
距離、治安、などスケールが違うので、それぞれのxごとに重み$w$を考慮してあげる。この$w$が求めるべきパラメータ  
$\hat{y}=w_1x_1+w_2x_2+...+w_mx_m$  
さらにバイアスがかかる$b$がある  
$\hat{y}=w_1x_1+w_2x_2+...+w_mx_m+b$  
  
この式の導出方法：例えば広さを重み$w_m$ x 表現変数$x_m$で求められるかどうかは、人間が設計する。場合によっては乗算だったりもする。  
バイアス$b$はこのままだと扱いづらいので、$b=w_0$という読み方にしてしまい、さらに$x_0$を１としてしまい、$x_0$をダミー変数（値は１）とすることで、扱い安くする→  $b = w_0x_0$　この部分は常に1が入る。  

線形代数の活用   
上の式を計算すると  
$=w_0x_0+w_1x_1+w_2x_2+...+w_mx_m$ となる。$\sum$も使えるが、ここで線形代数を用いる  
$
\begin{eqnarray}
\hat{y}
=
\left[
\begin{array}{cccc}
w_0 & w_1 & .. & w_m \\
\end{array}
\right]
\left[
\begin{array}{c}
x_0 \\
x_1 \\
x_2 \\
... \\
x_m \\
\end{array}
\right]
=
\bf{w^T}\bf{x}
\end{eqnarray}$ とも表現できることがわかる。

ベクトルは逆に描いても同じなので、  
$\begin{eqnarray}
\hat{y}
=
\left[
\begin{array}{c}
x_0 \\
x_1 \\
x_2 \\
... \\
x_m \\
\end{array}
\right]
\left[
\begin{array}{cccc}
w_0 & w_1 & .. & w_m \\
\end{array}
\right]
=
\bf{x^T
}\bf{w}
\end{eqnarray} $

このように書き直すとベクトルで微分の公式が使いやすくなる。

## 2. 評価関数を決める
良いか悪いかの判断軸、どのようにパラメータをかえていくかを決める

パラメータは $w$と$b$   
$w$は$M$個あり$b$は1個なので、パラメータは$M+1$個ある。  

評価関数  
重回帰の場合、問題設定が変わっているのか？  
単回帰のときは$(実測値*予測値)^2$=$(y-\hat{y})^2$でもとめ、実測値と予測値がどれだけ離れているか、離れていなければOKと考え、これを「二乗誤差」と呼んだ。  
重回帰の評価関数($\mathcal{L}$エル)は  

$\mathcal{L}=(y_1-\hat{y_1})^2+(y_2-\hat{y_2})^2+..+(y_n-\hat{y_n})^2$  
$\begin{eqnarray}
=
\left[
\begin{array}{cccc}
y_1-\hat{y_1} & y_2-\hat{y_2} & .. & y_n-\hat{y_n} \\
\end{array}
\right]
\left[
\begin{array}{c}
y_1-\hat{y_1} \\
y_2-\hat{y_2} \\
... \\
y_n-\hat{y_n} \\
\end{array}
\right]
\end{eqnarray}$  
とベクトルでも表現できる。  
右のベクトルは対応する項のそれぞれの左辺からそれぞれの右辺を引けば良いので、左辺全体を$y$ベクトル、右辺全体を$\hat{y}$ベクトルと考えられるので、これを１つにまとめて$(\bf{y}-\bf{\hat{y}})$と考えることができる。  
左のベクトルは右のベクトルを回転させただけなので、$(\bf{y}-\bf{\hat{y}})^T$と考えることができる。  

つまり評価関数は
$=(\bf{y}-\bf{\hat{y}})^T(\bf{y}-\bf{\hat{y}})$になる  

このように二乗誤差の総和を取るという問題設定は変えずに、線形代数のベクトル演算を用いてスッキリまとめることができた。