# 線形回帰(Linear Regression)

## 線形回帰とは<a name="description"></a>

データの特徴から、正解の数値に近い数値を導き出すような線形のモデルを求める

## 使用例<a name="example"></a>

### データ準備<a name="data"></a>

scikit-learnに用意されているデータを使用する。

In [None]:
import numpy as np
from sklearn.datasets import load_diabetes
import pandas as pd

# データ読み込み
loader = load_diabetes()
X, y = loader.data, loader.target

# データフレーム作成
data = np.hstack((X, y[:, np.newaxis]))
columns = ['feature{i}'.format(i=i) for i in range(X.shape[1])] + ['Target']
df = pd.DataFrame(data=data, columns=columns)

# データ確認
df.tail()

In [None]:
df.describe()

In [None]:
# 特徴を1つだけ利用(feature2)
x = X[:, np.newaxis, 2]
x.shape

### 学習<a name="training"></a>

In [None]:
from sklearn.linear_model import LinearRegression

reg = LinearRegression()
reg.fit(x, y)

### 結果の可視化<a name="visualization"></a>

In [None]:
import matplotlib.pyplot as plt

plt.xlabel('feature')
plt.ylabel('target')

# 入力データの散布図
plt.scatter(x, y)
# 予測された回帰直線
x_min, x_max = x.min() - .01, x.max() + .01
line_x = np.array([x_min, x_max])[:, np.newaxis]
line_y = reg.predict(line_x)
plt.plot(line_x, line_y, color='green')

plt.xlim(x_min, x_max)

plt.show()

## 複数特徴の利用<a name="multiple_features"></a>

In [None]:
import numpy as np
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

loader = load_diabetes()
# 特徴を2つ利用(feature2, feature8)
X = loader.data[:, [2, 8]]
y = loader.target

# 学習
reg = LinearRegression()
reg.fit(X, y)

fig = plt.figure()
ax = Axes3D(fig, elev=5, azim=-45)

# 入力データの散布図
ax.scatter(X[:, 0], X[:, 1], y, c='blue', marker='o')

x_min, x_max = X[:, 0].min() - .01, X[:, 0].max() + .01
y_min, y_max = X[:, 1].min() - .01, X[:, 1].max() + .01

xx, yy = np.meshgrid([x_min, x_max], [y_min, y_max])
grid = np.c_[xx.ravel(), yy.ravel()]
zz = reg.predict(grid)
xx.shape = (2, 2)
yy.shape = (2, 2)
zz.shape = (2, 2)

ax.plot_surface(xx, yy, zz, color='red', alpha=.6)

ax.set_xlabel('feature 2')
ax.set_ylabel('feature 8')
ax.set_zlabel('target')
ax.set_xticklabels(())
ax.set_yticklabels(())
ax.set_zticklabels(())

plt.show()