## 動作確認

In [None]:
# # Colabでバージョンを変更するとき、コメントアウトして実行してください
# !pip install numpy==1.25.2
# !pip install matplotlib==3.7.1
# !pip install scikit-learn==1.2.2

In [None]:
# ライブラリのインポート
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures

In [None]:
# バージョンの確認
import matplotlib
import sklearn
print(np.__version__)
print(matplotlib.__version__)
print(sklearn.__version__)

In [None]:
# 特徴量の次数は1次、2次元配列を作成
X = [[2]]
# 特徴量の次数を6次に変換
poly = PolynomialFeatures(degree=6, include_bias=False)
poly.fit(X)
X_poly = poly.transform(X)

X_poly

## sin関数

In [None]:
# sin関数にノイズを追加して訓練データ(X,y)を作成
np.random.seed(seed=8) #乱数を固定
# 1次元配列を2次元配列に変換
X = np.random.uniform(0, 4, 15)[:, np.newaxis]
# 2次元配列を1次元配列に変換
y = np.sin(1/2 * np.pi * X ).flatten() + np.random.normal(0, 0.3, 15)

# 次数を指定
degree=6

# 特徴量の多項式変換
poly = PolynomialFeatures(degree=degree, include_bias=False)
poly.fit(X)
X_poly = poly.transform(X)

In [None]:
X[0]

In [None]:
X_poly[0]

In [None]:
from sklearn.linear_model import LinearRegression

# 線形回帰モデルを作成
model = LinearRegression()

# 多項式変換した特徴量と正解値で学習
model.fit(X_poly, y)

In [None]:
plt.figure(figsize=(8, 4)) #プロットのサイズ指定

# プロット用にデータX_pltを作成し2次元に変換
X_plt = np.arange(0, 4, 0.1)[:, np.newaxis]
# 正解値のプロット、1次元に変換
y_true = np.sin(1/2 * np.pi * X_plt).flatten()
# 予測値のプロット、1次元で出力
y_pred = model.predict(poly.transform(X_plt))

# 線形回帰の予測値
plt.scatter(X, y, color='blue', label='data')
plt.plot(X_plt, y_true, color='lime', linestyle='-', label='True sin(X)')
plt.plot(X_plt, y_pred, color='red', linestyle='-', label=f'LinearRegression (degree={degree})')
plt.legend(loc='upper right')

plt.show()

In [None]:
X_plt

In [None]:
y_true

In [None]:
y_pred

## Ridge回帰

In [None]:
from sklearn.linear_model import Ridge

# 正則化の強さを指定
alpha=0.1

model2 = Ridge(alpha=alpha)

# 多項式変換した特徴量と正解値で学習
model2.fit(X_poly, y)

In [None]:
plt.figure(figsize=(8, 4)) #プロットのサイズ指定

# プロット用にデータX_pltを作成し2次元に変換
X_plt = np.arange(0, 4, 0.1)[:, np.newaxis]
# 正解値のプロット、1次元に変換
y_true = np.sin(1/2 * np.pi * X_plt).flatten()
# 予測値のプロット、1次元で出力
y_pred = model.predict(poly.transform(X_plt))
# 予測値のプロット、1次元で出力
y_pred2 = model2.predict(poly.transform(X_plt))

# 線形回帰とRidge回帰の予測値の比較
plt.scatter(X, y, color='blue', label='data')
plt.plot(X_plt, y_true, color='lime', linestyle='-' ,label='True sin(X)')
plt.plot(X_plt, y_pred, color='red', linestyle='-' ,label=f'LinearRegression (degree={degree})')
plt.plot(X_plt, y_pred2, color='red', linestyle='--' ,label=f'Ridge alpha={alpha} (degree={degree})')
plt.legend(loc='upper right')

plt.show()