# Sprint 機械学習スクラッチ ロジスティック回帰

In [41]:
# ライブラリ等
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os # ファイルの読み込み先のpath指定する時に必要

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris # sklearn.datasets を load_iris という変数で取得

In [40]:
iris = load_iris() # load_iris を dataという変数に保存
class ScratchLogisticRegression():
    """
    ロジスティック回帰のスクラッチ実装

    Parameters
    ----------
    num_iter : int
      イテレーション数
    lr : float
      学習率
    no_bias : bool
      バイアス項を入れない場合はTrue
    verbose : bool
      学習過程を出力する場合はTrue

    Attributes
    ----------
    self.coef_ : 次の形のndarray, shape (n_features,)
      パラメータ
    self.loss : 次の形のndarray, shape (self.iter,)
      学習用データに対する損失の記録
    self.val_loss : 次の形のndarray, shape (self.iter,)
      検証用データに対する損失の記録

    """

    def __init__(self, num_iter, lr, bias, verbose):
        # ハイパーパラメータを属性として記録
        self.iter = num_iter
        self.lr = lr
        self.bias = verbose
        self.verbose = verbose
        # 損失を記録する配列を用意
        self.loss = np.zeros(self.iter)
        self.val_loss = np.zeros(self.iter)

    def fit(self, X, y, X_val=None, y_val=None):
        """
        ロジスティック回帰を学習する。検証用データが入力された場合はそれに対する損失と精度もイテレーションごとに計算する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            学習用データの特徴量
        y : 次の形のndarray, shape (n_samples, )
            学習用データの正解値
        X_val : 次の形のndarray, shape (n_samples, n_features)
            検証用データの特徴量
        y_val : 次の形のndarray, shape (n_samples, )
            検証用データの正解値
        """

        if self.verbose:
            #verboseをTrueにした際は学習過程を出力
            print()

        self.sigmoid(self.liner_regression(X))
        
        self._gradient_descent(X)

    def predict(self, X):
        """
        ロジスティック回帰を使いラベルを推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """

        pass
        return

    def predict_proba(self, X):
        """
        ロジスティック回帰を使い確率を推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """
        self.sigmoid(self.liner_regression(self._gradient_descent(X)))
        return

    def sigmoid(self, z):
        return (1/(1 + np.exp(-z)))
    
    def liner_regression(self, x):
        theta = np.array([[-1, 2, 3], [4, -5, 6], [7, 8, -9]])
        return theta.T@x

    def _gradient_descent(self, x):
        gd = 0
        # 内積使うとfor文不要
        for i in x.shape[0]: # m は（x.shape[0]）入力データの個数
            gd += (self.sigmoid(self.liner_regression(x)) - y[i])*x[i][j]
        gd = gd / x.shape[0]
        if x.shape[1] != 0: # j は 特徴量の入力値の列数を数えたい
            gd = gd + (ramda/x.shape[0])*theta[j]
        
        alpha = 0.01
        theta_j = theta_j - (alpha * gd)
        
        return gd


### 【問題1】仮定関数
ロジスティック回帰の仮定関数のメソッドをScratchLogisticRegressionクラスに実装してください。

ロジスティック回帰の仮定関数は、線形回帰の仮定関数を シグモイド関数 に通したものです。

In [17]:
# e = 1 # e は exp の事。exp は log の逆の事。対数と呼ぶ。 
z = 1
# gz = 1/(1 + e**(-z))　# これは違うweは対数だからそれに沿って計算する必要がある。
e = np.exp(-z)
gz = 1/(1 + e)
print(gz)

0.7310585786300049


In [19]:
shita = np.array([[-1, 2, 3], [4, -5, 6], [7, 8, -9]])
x = np.array([[-1, 2, 3], [4, -5, 6], [7, 8, -9]])
h0 = shita.T@x
print(h0)

[[ 66  34 -42]
 [ 34  93 -96]
 [-42 -96 126]]


In [22]:
hx = 1/(1 + np.exp(h0*(-1)))
print(hx)

[[1.00000000e+00 1.00000000e+00 5.74952226e-19]
 [1.00000000e+00 1.00000000e+00 2.03109266e-42]
 [5.74952226e-19 2.03109266e-42 1.00000000e+00]]


### 【問題2】最急降下法
最急降下法により学習させる実装を行なってください。
以下の式で表されるパラメータの更新式のメソッド_gradient_descentを追加し、fit
メソッドから呼び出すようにしてください。

In [None]:
j = 0
J = 1/m

for 