<a href="https://colab.research.google.com/github/ShinAsakawa/ShinAsakawa.github.io/blob/master/notebooks/2020Sight_Visit_polynomilal_fittings_demo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 2020 サイトビジット 機械学習 04_07
## 多項式回帰によるアンダーフィッティング，オーバーフィッテイングのデモ
- 浅川伸一


In [None]:
%config InlineBackend.figure_format = 'retina'
import numpy as np
import sys
import matplotlib.pyplot as plt
try:
    import japanize_matplotlib
except ImportError:
    !pip install japanize_matplotlib
    import japanize_matplotlib

In [None]:
# データを作成します。ここではサイン曲線を用いることにします。
N_sample = 100   # データ数を定義
X = np.linspace(0, 6 * np.pi, N_sample)  # 0 から 6 π の範囲を  X 入力値とします
sinY = np.sin(X)  # X の範囲の正弦（サイン）関数の値を y とします

plt.figure(figsize=(8, 4))  # 表示サイズ，単位はインチ
plt.title('サイン曲線')
plt.plot(X, sinY); plt.show()  # X, y の値で図を描画
plt.show()

In [None]:
def make_poly(points, n_ord):
    # n_ord 次の多項式を定義 ここで n_ord = 1, 2, ... を指定する
    n_points = len(points)
    data = [np.ones(n_points)]
    for n in range(n_ord):
        data.append(points**(n+1))
    return np.vstack(data).T

In [None]:
def linfit(X, Y):
    # 多項回帰による近似解を返します
    return np.linalg.solve(np.dot(X.T,X), np.dot(X.T,Y))


In [None]:
n_samples = 10  # データから n_sample 個の点をサンプリングするために使います
n_data = len(X)

# 実際のサンプリング
# n_data 個のデータ点から n_samples 個のデータをランダムサンプリングして
# train_idx に保存します
train_idx = np.random.choice(n_data, n_samples)


X_train = X[train_idx]    # サンプリングされた X の値
y_train = sinY[train_idx] # サンプリングされた y の値


# 次行 in の後のカッコ内の数字の多項式を用いた回帰式を計算し描画する
for n in (1, 3, 5, 7, 9, 11):

    n_ord = n + 1  # プラス 1 するのはお約束です
    Xtrain_poly = make_poly(X_train, n_ord)  # 多項式回帰のための準備
    w = linfit(Xtrain_poly, y_train) # 実際の多項式に当てはめた時の回帰係数

    X_poly = make_poly(X, n_ord) # 真の値
    y_hat = np.dot(X_poly, w)    # 予測値を y_hat として計算し保存

    plt.figure(figsize=(8, 4))   # 横 8 インチ，縦 4 インチの図の枠組みを指定

    plt.plot(X, sinY)   # オリジナルのデータ曲線，サイン波の描画
    plt.plot(X, y_hat)  # 多項回帰に基づく曲線の描画
    plt.scatter(X_train, y_train)  # サンプリングされた点の描画
    plt.title(f"{n_ord} 次式回帰")  # 図のタイトルの表示

    plt.ylim(-1.5,2.5)  # y 軸の範囲を設定
    plt.show()