

---

## 単回帰・重回帰・多項式回帰の問題点

---
---


#*   外れ値
影響を受けやすい
#*   多重共線性
相関の強い変数を両方とも説明変数 x に入れて重回帰分析を行うと、正しい回帰ができないこと
#*   過学習（過剰適合）
次数を上げてでも、学習データにフィット（過剰適合）させることに執着してしまうと、テストデータに対する予測精度が下がってしまう


これらに対応し、ロバストなモデルを作る
#正則化
というもの

正則化（せいそくか、英: regularization）とは、不良設定問題を解いたり過学習を防いだりするために、情報を追加する手法である。モデルの複雑さに罰則を科すために導入され、なめらかでないことに罰則をかけたり、パラメータのノルムの大きさに罰則をかけたりする。

# もっとざっくりに言うと...

重みの値が、極端に大きくなるのを制御すること


係数の暴走を抑えること


# 具体的には


> 残差平方和に「ある項 αR 」を加えること




R を　正則化項(罰則項、ペナルティ項、Regularizer)


また、α(アルファ)を　正則化パラメータ(正則化の強度)　と言い、

正則化項 R の影響力を調整する役割を担う


---
# ラッソ回帰とリッジ回帰
---
---
# L1 正則化最小二乗法(ラッソ回帰)


*   正則化項が各係数の絶対値の和


> つまり、　R = |a| + |b|



> これを　L1ノルム　という(幾何的にはマンハッタン距離)




*   残差平方和 + α ( |a| + |b| ) が最小になるような a, b を求める回帰


# L2 正規化最小二乗法(リッジ回帰)

*   正規化項が各係数の平方和


> つまり、　R = a^2 + b^2

> これを　L2ノルム　という(幾何的にはユークリッド距離)


*   残差平方和 + α ( a^2 + b^2 ) が最小になるような a, b を求める回帰





---
# 正規化の意義


---



---



*   外れ値の影響を小さくする。（ロバスト回帰）
*   過学習が起こらないようにする。



> 「回帰式の係数が大きいことに対するペナルティの項」＝正則化項




> 残差をできるだけ小さくしつつ、なおかつ回帰係数を大きくなり過ぎないようにできる





説明変数は独立していない。

説明変数の間で関数関係にあることもある。

それを多重共線性という。

ラッソもリッジも回帰式の係数を小さくして

その変数の影響を小さくしようとする効果がある。




*   スパース性(Sparsity)

データやモデル内の要素の中で

ほとんどがゼロ又は非常に小さい値の性質



> ラッソ回帰はあまり重要でない説明変数の重みをゼロに近づけ、スパース性を向上させるために使用される。


リッジ回帰は誤差関数を最小化する計算はラッソよりも簡単だが、回帰係数をゼロにすることはあまりない。予測性能はリッジ回帰の方が高い。






In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# 通常の単回帰

import numpy as np
from sklearn.linear_model import LinearRegression, Ridge, Lasso
import pandas as pd

df = pd.read_csv('maha_test.csv')
X = df['X'].to_numpy().reshape(-1,1)
y = df['y']

model = LinearRegression()
model.fit(X, y)

print(model.coef_) #傾き
print(model.intercept_) #切片

KeyError: ignored

In [None]:
# リッジ回帰

import numpy as np
from sklearn.linear_model import LinearRegression, Ridge, Lasso
import pandas as pd

df = pd.read_csv('maha_test.csv')
X = df['X'].to_numpy().reshape(-1,1)
y = df['y']

# αは正則化項の強度
# L1の係数
model = Ridge(alpha=10, max_iter=2000)
model.fit(X, y)

print(model.coef_) #傾き
print(model.intercept_) #切片

In [None]:
# ラッソ回帰

import numpy as np
from sklearn.linear_model import LinearRegression, Ridge, Lasso
import pandas as pd

df = pd.read_csv('maha_test.csv')
X = df['X'].to_numpy().reshape(-1,1)
y = df['y']

model = Lasso(alpha=10, max_iter=2000)
model.fit(X, y)

print(model.coef_) #傾き
print(model.intercept_) #切片