# 【自前AI講座】 LASSO / Ridge 回帰 / ElasticNet の理論／数式／コード実装

---

## 演習問題の解答

Q1. ワインデータセットについて，目的変数であるワインの等級を LASSO によって求めてください．

In [1]:
import numpy as np
from sklearn.datasets import load_wine
from sklearn.metrics import accuracy_score
from sklearn import linear_model
from sklearn.model_selection import train_test_split

# データ読み込み
df_x, df_y = load_wine(return_X_y=True, as_frame=True)

# データ分割
x_train, x_test, y_train, y_test = train_test_split(
    df_x, df_y, test_size=0.1, shuffle=True, random_state=0,
)

# 学習／推論
model = linear_model.Lasso()
model.fit(x_train, y_train)
pred = model.predict(df_x)

Q2. 上記で学習したモデルを用いて，df_x 全データについて推論を計算し，分類精度を計算しましょう．
LASSO を用いる場合，分類問題に無理やり回帰を用いていることから，推論結果は float となるため，例えば推論結果に .astype(np.uint8) としてカテゴリ変数に変換してください．

In [2]:
# float -> int
pred_cate = pred.astype(np.uint8)

# 分類精度算出
print(accuracy_score(y_true=df_y, y_pred=pred_cate))

0.6741573033707865


Q3. 上記の結果について，他の linear_model である　LinearRegression, Lasso, RidgeClassifier, ElasticNet で認識精度を比較してみましょう．注意として RidgeClassifier のみクラス分類できるモデルになっているため，Q2 で対応した .astype(np.uint8) とする処理は不要です．

In [12]:
for model in (
    linear_model.LinearRegression(),
    linear_model.Lasso(),
    linear_model.RidgeClassifier(),
    linear_model.ElasticNet(),
):
    # 学習／推論
    model.fit(x_train, y_train)
    pred = model.predict(df_x)
    # float -> int
    if isinstance(model, linear_model.RidgeClassifier):
        pred_cate = pred
    else:
        pred_cate = pred.astype(np.uint8)

    # 分類精度算出
    print(model, accuracy_score(y_true=df_y, y_pred=pred_cate))

LinearRegression() 0.6179775280898876
Lasso() 0.6741573033707865
RidgeClassifier() 1.0
ElasticNet() 0.6460674157303371


Q4. カリフォルニア住宅価格データセットについて，LASSO を用いて以下の手順で住宅価格を予測してみましょう．

In [13]:
from sklearn.datasets import fetch_california_housing
from sklearn.metrics import mean_absolute_error

# データ読み込み／分割
df_x, df_y = fetch_california_housing(return_X_y=True, as_frame=True)
x_train, x_test, y_train, y_test = train_test_split(
    df_x, df_y, test_size=0.25, shuffle=True, random_state=0,
)

# 学習／推論
model = linear_model.Lasso()
model.fit(x_train, y_train)
pred = model.predict(x_test)

print(mean_absolute_error(y_true=y_test, y_pred=pred))

0.7687270988960119


Q5. 上記の結果について，他の linear_model である　LinearRegression, Lasso, Ridge, ElasticNet で認識精度を比較してみましょう．今回は回帰問題で誤差を算出しているので，誤差が小さいほど良い精度で予測しています．

In [15]:
for model in (
    linear_model.LinearRegression(),
    linear_model.Lasso(),
    linear_model.Ridge(),
    linear_model.ElasticNet(),
):
    # 学習／推論
    model.fit(x_train, y_train)
    pred = model.predict(x_test)

    print(model, mean_absolute_error(y_true=y_test, y_pred=pred))

LinearRegression() 0.5368950735045219
Lasso() 0.7687270988960119
Ridge() 0.5369060034129463
ElasticNet() 0.6805978110367683
