# 単回帰分析

### 問題設定
- 家賃の予測

y : 出力変数　（家賃）

x : 入力変数　（広さ、距離、治安...）

### 単回帰分析の制約
- x の入力変数は何か１つだけから計算すること
※ 複数の入力は認められていない
- 複数から data を算出したい場合は、重回帰分析を使用する

### 2つのフェーズがある
1. 学習
2. 推論

### 1. 学習
- 予測したいモノも含めて data を入れる

x : ２０m2 -> y : ５万円

上記のような data を複数 model(空box) に入れて、学習させる（訓練させる）

※ この時 　x と 　y は対応関係のある data を入れること

#### AI は上記のような data を１０万件くらい入力(学習・訓練)
- その後、学習済み　model として実用性がある(規則性を発見できる)ものとして使用できる

### 2. 推論
- 学習済み model を使用して予測する

#### 外挿の data は扱えない
- 学習をさせていない data は扱えない

# step1 : 「model」 を決める

### model を人間側の知見で直線でいけそうだと仮定する
$$
y=ax+b
$$

### 予測値
$$
\hat{y}=ax+b
$$

- a と　b をパラメータと呼ぶ

### ゴール
$$
data(x_{1},x_{2}...,y_{1},y_{2}...)
$$
- 上記の data に基づいて「適切」にパラメータ　a と b を決定する

### 単回帰分析には直線を利用する
直線の公式が非常に重要になってくる
$$
y=ax+b
$$


# data centering (データの中心化)

### 中心化のメリット
- 中心化をすることにより切片を無くす事ができる
    - +b （切片）を求めなくていい
    - 効率化ができる
$$
\hat{y_{c}}=ax_{c}
$$

- c = centering (中心化の意)

### 中心の表し方
$$
\bar{x}
$$
- x バー

$
\bar{x}:$　x の平均
$$
\bar{y}
$$
- y バー

$\bar{y}:$　yの平均

### centering (中心化)
$$
x_{c}=x-\bar{x}
$$
$$
y_{c}=y-\bar{y}
$$
- 実際の座標から,centeringした平均の値を引くだけ

### data が中心化済み
$$
\hat{y}=ax
$$
- ※ c を省略

# step2 : 評価関数を決める

### 「適切」を決める
- 『　評価関数　』を決める　: (損失関数)

### 2乗誤差を使用する
- ±(＋とー) は重要ではない。誤差が重要
$$
(y-\hat{y})^2
$$

$y:$ 実際の家賃

$\hat{y}:$ 予想家賃

### スケールは大丈夫なのか？
単回帰分析に限った話
- 絶対値は角度がキツイv型の式になる
    - 滑らかでない　-> 微分の計算ができない 
- 2乗型は放物線の型の式になる
    - 滑らか -> 微分で計算ができる

#### 数学的な取り扱いやすさでも2乗の方が扱いやすい

### 二乗誤差
$l:$ 評価関数

$$
l=(y_{1}-\hat{y_{1}})^2+　(y_{2}-\hat{y_{2}})^2　+　... + (y_{N}-\hat{y_{N}})^2　
$$

- 1件目、２件目、N件目
- N : サンプル数(N数)　よく使用される

### シグマ : n=1(一件目からstart) N=総和(N件目まで足す)
$$
\sum_{n=1}^{N}(y_{n}-\hat{y_{n}})^2 
$$


# step3 : 評価関数を「　最小化　」する
#### 「　傾き　0」 = 誤差が最小を求める

#### 傾き = 0 を求める -> 微分する

#### 微分の公式を利用する
$$
\frac{d}{dx}(y)=0\\
$$
- 何を何で微分してあげれば良いのか？
    - 評価関数は縦軸が微分される対象
    - 横軸は微分するモノ

### 傾き＝０を求める公式
$$
\frac{d}{da}(l)=0
$$

### 評価関数の公式
#### シグマ : n=1(一件目からstart) N=総和(N件目まで足す)
$$
l=\sum_{n=1}^{N}(y_{n}-\hat{y_{n}})^2 
$$
- 二乗誤差で表す事ができる

# step3-1 : 式変形を行う

### data 予測値(中心か済み)の式を二乗誤差に代入する
$$
\hat{y_{n}}=ax_{n}
$$

#### 代入後
$$
l=\sum_{n=1}^{N}(y_{n}-ax_{n})^2 
$$
#### ２乗を計算
$$
l=\sum_{n=1}^{N}(y_{n}^2-2y_{n}ax_{n}+a^2x^2_{n}) 
$$
$$
l=\sum_{n=1}^{N}y_{n}^2-2(\sum_{n=1}^{N}y_{n}x_{n})a+(\sum_{n=1}^{N}x^2_{n})a^2 
$$

### これから a　で微分する
#### 偏微分では a には関係ないものは外に出す。(０に置き換える)
#### 今回は　下記のように置き換える
$$
C_{0}-2C_{1}a+C_{2}a^2
$$

# step3-2 : 最適なパラメータ　a を求める

### 傾き＝０
$$
\frac{\partial}{\partial a}(l)=0
$$

$$
l=C_{0}-2C_{1}a+C_{2}a^2
$$

$$
\frac{\partial}{\partial a}(C_{0}-2C_{1}a+C_{2}a^2)=0
$$

### 計算

$$
\frac{\partial}{\partial a}(C_{0})-\frac{\partial}{\partial a}(2C_{1}a)+\frac{\partial}{\partial a}(C_{2}a^2)=0
$$


$$
0-2C_{1}\times1+C_{2}\times2a=0
$$

$$
-2C+2C_{2}a=0
$$
$$
2C_{2}a=2C_{1}
$$
$$
C_{2}a=C_{1}
$$

$$
a=\frac{C_{1}}{C_{2}}
$$

### 置き換えを戻す
$$
l=\sum_{n=1}^{N}y_{n}^2-2(\sum_{n=1}^{N}y_{n}x_{n})a+(\sum_{n=1}^{N}x^2_{n})a^2 
$$

$$
a = \dfrac{\displaystyle{\sum_{n=1}^{N}}x_{n}y_{n}}
{\displaystyle{\sum_{n=1}^{N}}x_{n}^{2}}
$$

## 最適なパラメータ　a を求める事ができる
### 最適 a　公式
$$
a = \dfrac{\displaystyle{\sum_{n=1}^{N}}x_{n}y_{n}}
{\displaystyle{\sum_{n=1}^{N}}x_{n}^{2}}
$$