# 生pythonで正規方程式(多数の特徴)

```
家を売った際の値段を予測する為
広さ(x1)と部屋数(x2)から売値(y)を予測する
```

In [6]:
%matplotlib inline
import numpy as np
from numpy.linalg import pinv
from matplotlib import pyplot as plot

### 予測の悪さを計算する関数

```
X = 広さと部屋数の2次元配列
y = 利益の1次元配列
thetaは y = ax + b のaとb
aとbはこのcompute_cost関数(予測の悪さを計算する関数)のフィードバックを受けて修正し
(学習するたびだんだんと)勝手に調整してくれる
```

In [7]:
def compute_cost(X, y, theta):
    m = y.size
    costs = (X.dot(theta) - y) ** 2
    return costs.sum() / (2.0 * m)

### 最急降下法

cost関数のフィードバックを受けて1次関数のaとbを修正する関数
要は学習を行う関数。
いろいろあるが、この例は最急降下法(gradient descent)というアルゴリズムを利用

alphaは学習率
学習率は高いと学習速度が早いが、発散と呼ばれるいきなり全く的外れな予測しかしないようになる。
学習率は高いと学習速度が遅い

学習率のような自分で調整しないといけないパラメータをハイパーパラメータという

In [8]:
def gradient_descent(X, y, theta, alpha, num_iters):
    m = y.size
    J_history = np.zeros(num_iters)
    for i in range(num_iters):
        h = X.dot(theta)
        errors = h - y
        delta = X.T.dot(errors)
        theta -= (alpha / m) * delta
        J_history[i] = compute_cost(X, y, theta)
    return (theta, J_history)

### 正規方程式

- 特徴数がだいたい10000以下なら早い
- 学習率が必要ない

In [11]:
def normal_equation(X, y):
    return pinv(X.T.dot(X)).dot(X.T).dot(y)

In [12]:
# データのロード、変数の初期化
data = np.loadtxt('./assets/data3.txt', delimiter=',')
X = data[:, 0:2]
y = data[:, 2]
m = X.shape[0]
X = np.concatenate((np.ones((m, 1)), X), axis=1)

In [13]:
# 正規方程式(Normal equation)の実行
theta = normal_equation(X, y)
size = 1650
rooms = 3
x = np.array([[1.0, size, rooms]])
price = x.dot(theta)[0]

In [14]:
# 予測値
print("広さ{size}で{rooms}部屋の家売値予測値は{price}です。".format(
    size=size,
    rooms=rooms,
    price=price
))

広さ1650で3部屋の家売値予測値は293081.46433497214です。
