# カーネル回帰 (フルスクラッチ)

In [160]:
import numpy as np

# データの準備
X_fea0 = np.array([1 for i in range(200)]).reshape(-1,1)
X_fea1 = np.array([1*i*np.random.normal(1,0.1) for i in range(200)]).reshape(-1,1)
X_fea2 = np.array([2*i*np.random.normal(0,5) for i in range(200)]).reshape(-1,1)
X_fea3 = np.array([3*i*np.random.normal(10,1) for i in range(200)]).reshape(-1,1)
X_fea4 = np.array([4*i*np.random.normal(2,0.01) for i in range(200)]).reshape(-1,1)
X_fea5 = np.array([5*i*np.random.normal(0,0.1) for i in range(200)]).reshape(-1,1)
X_fea6 = np.array([6*i*np.random.normal(50,5) for i in range(200)]).reshape(-1,1)

# sklearn用と2つに分ける (切片を入れるか否か)
X = np.concatenate([X_fea0,X_fea1,X_fea2,X_fea3,X_fea4,X_fea5,X_fea6],axis=1)
X_sklearn = np.concatenate([X_fea1,X_fea2,X_fea3,X_fea4,X_fea5,X_fea6],axis=1)
y = np.array([2*(i) for i in range(200)]).reshape(-1,1)

# 標準化
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)
X_sklearn = scaler.fit_transform(X_sklearn)
y = scaler.fit_transform(y)

# カーネル関数およびグラム行列を定義
def kernel_gauss(a,b,beta):
    '''
    beta：ハイパラ
    a,b：ベクトル(1サンプル分)
    '''
    return np.exp( -beta*((a-b)**2).sum() )

def GramMatrix(X):
    '''
    グラム行列の作成
    ガウスカーネルを用いたグラム行列の作成
    '''
    GramMatrix_list = []
    for i in range(X.shape[0]):
        for j in range(X.shape[0]):
            gauss_temp = kernel_gauss(X[i],X[j],beta=1)
            GramMatrix_list.append(gauss_temp)
            
    GramMatrix_temp = np.array(GramMatrix_list).reshape(X.shape[0],X.shape[0])
    
    return GramMatrix_temp

# グラム行列
K = GramMatrix(X_sklearn)

# 正則化項を設定
penalty_i = 1
penalty = penalty_i*np.eye(K.shape[0])
# 重みを算出

omega = np.linalg.inv(K.T@K + penalty) @ K.T @ y
print(omega[0])

[-0.18102085]


# カーネル回帰 (Scikit-Learn)

In [161]:
from sklearn.kernel_ridge import KernelRidge

ridge = KernelRidge(kernel='rbf',gamma=beta, alpha=penalty_i)
model = ridge.fit(X_sklearn,y)

print('Coefficients',model.dual_coef_[1])

Coefficients [-0.24070741]


# 微妙の結果が異なるので、コサイン類似度

In [181]:
# コサイン類似度

L2_omega = np.sqrt( ((omega**2).sum()))
L2_model = np.sqrt( ((model.dual_coef_)**2).sum())
cos = omega.flatten() @ model.dual_coef_ / (L2_omega*L2_model)
print(f'コサイン類似度：{cos[0]:.4f}')

コサイン類似度：0.9695
