## 【問題2】最急降下法
最急降下法により学習させる実装を行なってください。以下の式で表されるパラメータの更新式のメソッド_gradient_descentを追加し、fitメソッドから呼び出すようにしてください。

$$\frac{\partial j(\theta)}{\partial\theta_j} = \frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}x_j^{(i)})+\frac{\lambda}{m}\theta_j$$

ただしバイアスに対しての更新式は
$$\frac{\partial j(\theta)}{\partial\theta_0} = \frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}x_j^{(i)})$$
とする。  
バイアスの重みにペナルティを与えない(正則化項の微分を加えない)理由としては、バイアスに関してはペナルティによらず自由に動いてほしいからという理由らしい...  
  
線形回帰とかの正則化項がないモデルとバイアスの値が大きく変わってしまうから？？  
仮にペナルティが大きいとバイアスがないのと同義になってしまうから？

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
def _linear_hypothesis(X, theta):
    """
    線形の仮定関数を計算する
    Parameters
    ----------
    X : 次の形のndarray, shape (n_samples, n_features)
    訓練データ
    theta : 次の形のndarray, shape (n_features, 1)
    重み
     
    Returns
    -------
      次の形のndarray, shape (n_samples, 1)
      線形の仮定関数による推定結果
    """
    
    h = 1 / (1 + np.exp(-(X @ theta)))
    
    return h

In [3]:
def _gradient_descent(X, y, theta, lr=0.1, lambd = 1.0 ):
    """
    傾きを計算する。
    Parameters
    ----------
    X : 次の形のndarray, shape (n_samples, n_features)
    訓練データ
    y : 次の形のndarray, shape (n_samples, 1)
    目的データ
    theta : 次の形のndarray, shape(n_features, 1)
    更新されていく重み
    lr : float
    学習率
    lambd : float
    ペナルティの重み
    Returns
    -------
    次の形のndarray, shape (n_samples, 1)
    更新後のtheta
    """
    for j in range(X.shape[1]):
        
        #
        #バイアス
        #
        if j == 0:
        
            sigma = (X[:, j].T @ (_linear_hypothesis(X, theta) - y))
            theta[j] = theta[j] - ((lr / X.shape[0]) * sigma)
        #
        # バイアス以外
        #
        else:
            
            sigma = (X[:, j].T @ (_linear_hypothesis(X, theta) - y))
            theta[j] = theta[j] - (1 / X.shape[0] * (sigma + lambd  * theta[j]))

    return theta

In [4]:
test_x = np.array([[1, 1, 1, 1, 1], [0, 1, 2, 3, 4]]).T
test_theta = np.array([[1, 1]]).T
test_y = np.array([[5, 5, 5, 5, 5]]).T

In [6]:
_gradient_descent(test_x, test_y, test_theta)

array([[ 1],
       [14]])