<a href="https://colab.research.google.com/github/ShinAsakawa/ShinAsakawa.github.io/blob/master/notebooks/2020Sight_Visit_polynomilal_fittings_demo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 2020 サイトビジット 機械学習 04_07
## 多項式回帰によるアンダーフィッティング，オーバーフィッテイングのデモ
- 浅川伸一


In [None]:
import numpy as np
import sys
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# データを作成します。ここではサイン曲線を用いることにします。
N_sample = 100   # データ数を定義
X_points = np.linspace(0, 6*np.pi, N_sample)  # 0 から 6 π の範囲を  X 入力値とします
sinY = np.sin(X_points)  # X の範囲の正弦（サイン）関数の値を y とします

plt.figure(figsize=(8, 4))  # 表示サイズ，単位はインチ
plt.plot(X_points, sinY); plt.show()  # X, y の値で図を描画

In [None]:
def make_poly(points, n_ord):
    # n 次の多項式を定義
    n_points = len(points)
    data = [np.ones(n_points)]
    for n in range(n_ord):
        data.append(points**(n+1))
    return np.vstack(data).T

In [None]:
def linfit(X, Y):
    # 多項回帰による近似解を返します
    return np.linalg.solve(np.dot(X.T,X),np.dot(X.T,Y))


In [None]:
n_samples = 10  # データから n_sample 個の点をサンプリングするために使います
N_data = len(X_points)
train_idx = np.random.choice(N_data, n_samples)  # 実際のサンプリング
X_train = X_points[train_idx]  # サンプリングされた X の値
y_train = sinY[train_idx]  # サンプリングされた y の値

for n in (1, 2, 3, 4, 5):
    n_ord = n + 1
    Xtrain_poly = make_poly(X_train, n_ord)
    w = linfit(Xtrain_poly, y_train)

    X_poly = make_poly(X_points, n_ord)
    y_hat = np.dot(X_poly, w)

    plt.figure(figsize=(8, 4))

    plt.plot(X_points, sinY)   # オリジナルのデータ曲線，サイン波の描画
    plt.plot(X_points, y_hat)  # 多項回帰に基づく曲線の描画
    plt.scatter(X_train, y_train)  # サンプリングされた点の描画
    plt.title("power(%d)" % n_ord)  # 図のタイトルの表示

    plt.ylim(-1.5,2.5)  # y 軸の範囲を設定
    plt.show()