In [14]:
import numpy as np
import matplotlib.pyplot as plt

from matplotlib.colors import ListedColormap
import matplotlib.patches as mpatches

from sklearn.datasets import load_iris

from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import confusion_matrix

from sklearn.linear_model import LogisticRegression

from tempfile import TemporaryFile
class ScratchLogisticRegression():
    """
    ロジスティック回帰のスクラッチ実装

    Parameters
    ----------
    num_iter : int
      イテレーション数
    lr : float
      学習率
    no_bias : bool
      バイアス項を入れない場合はTrue
    verbose : bool
      学習過程を出力する場合はTrue

    Attributes
    ----------
    self.coef_ : 次の形のndarray, shape (n_features,)
      パラメータ
    self.loss : 次の形のndarray, shape (self.iter,)
      学習用データに対する損失の記録
    self.val_loss : 次の形のndarray, shape (self.iter,)
      検証用データに対する損失の記録

    """

    def __init__(self, num_iter, lr, no_bias, verbose, regularization=0.5):
        # ハイパーパラメータを属性として記録
        self.iter = num_iter
        self.lr = lr
        self.no_bias = no_bias
        self.verbose = verbose
        # 損失を記録する配列を用意
        self.loss = np.zeros(self.iter)
        self.val_loss = np.zeros(self.iter)
        
        self.regularization = regularization

    def fit(self, X, y, X_val=None, y_val=None):
        """
        ロジスティック回帰を学習する。検証用データが入力された場合はそれに対する損失と精度もイテレーションごとに計算する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            学習用データの特徴量
        y : 次の形のndarray, shape (n_samples, )
            学習用データの正解値
        X_val : 次の形のndarray, shape (n_samples, n_features)
            検証用データの特徴量
        y_val : 次の形のndarray, shape (n_samples, )
            検証用データの正解値
        """
        self.val_enable = False
        if X_val is not None:
            self.val_enable = True
        
        if not self.no_bias:
            X = np.concatenate([np.ones(X.shape[0]).reshape(-1,1), X], axis=1)
            if self.val_enable:
                X_val = np.concatenate([np.ones(X_val.shape[0]).reshape(-1,1), X_val], axis=1)
        
        n_features = X.shape[1]
        # パラメータ（重み）
        self.coef_ = np.random.rand(n_features)
        
        for i in range(self.iter):
            self._gradient_descent(X, self._logistic_hypothesis(X) - y)
            self.loss[i] = self._cost(y, self._logistic_hypothesis(X))
            if self.val_enable:
                self.val_loss[i] = self._cost(y_val, self._logistic_hypothesis(X_val))
        
        if self.verbose:
            self.learning_curve()
            print()
        pass


    def predict(self, X):
        """
        ロジスティック回帰を使いラベルを推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """
        
        threshold = 0.5
        return (self.predict_proba(X) > threshold).astype(int)

    def predict_proba(self, X):
        """
        ロジスティック回帰を使い確率を推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """
        if not self.no_bias:
            X = np.concatenate([np.ones(X.shape[0]).reshape(-1,1), X], axis=1)
        
        return self._logistic_hypothesis(X)
    
    def _logistic_hypothesis(self, X):
        """
        ロジスティック回帰の仮定関数を計算する

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
          学習データ

        Returns
        -------
          次の形のndarray, shape (n_samples, 1)
          線形の仮定関数による推定結果
        
        """
        h = X@self.coef_
        g = 1 / (1+np.exp(-h))
        return g
    
    def _gradient_descent(self, X, error):
        """
        最急降下法により学習させる（1回）
        
        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
          学習データ

        Returns
        -------
        returnはない
        
        """
        self.coef_ = self.coef_ - self.lr*(np.average(error*X.T, axis=1) + (self.regularization/X.shape[0])*np.concatenate([np.array([0]), self.coef_[1:]]))
        return
    
    def _cost(self, y_true, y_pred_proba):
        j = np.average(-y_true*np.log(y_pred_proba) -(1-y_true)*np.log(1-y_pred_proba)) + (self.regularization/(2*len(y_true)))*np.sum(self.coef_[1:])
        return j
    
    def learning_curve(self):
        plt.title("model loss")
        plt.xlabel("iter")
        plt.ylabel("loss")
        plt.plot(np.arange(self.iter), self.loss, label="loss")
        if self.val_enable:
            plt.plot(np.arange(self.iter), self.val_loss, label="val_loss")
        plt.legend()
        plt.show()
        
    class ScratchLogisticRegression():
 
        def __init__(self, num_iter, lr, no_bias, verbose, regularization=0.5):
            # ハイパーパラメータを属性として記録
            self.iter = num_iter
            self.lr = lr
            self.no_bias = no_bias
            self.verbose = verbose
            # 損失を記録する配列を用意
            self.loss = np.zeros(self.iter)
            self.val_loss = np.zeros(self.iter)

            self.regularization = regularization

        def fit(self, X, y, X_val=None, y_val=None):
            """
            ロジスティック回帰を学習する。検証用データが入力された場合はそれに対する損失と精度もイテレーションごとに計算する。

            Parameters
            ----------
            X : 次の形のndarray, shape (n_samples, n_features)
                学習用データの特徴量
            y : 次の形のndarray, shape (n_samples, )
                学習用データの正解値
            X_val : 次の形のndarray, shape (n_samples, n_features)
                検証用データの特徴量
            y_val : 次の形のndarray, shape (n_samples, )
                検証用データの正解値
            """
            self.val_enable = False
            if X_val is not None:
                self.val_enable = True

            if not self.no_bias:
                X = np.concatenate([np.ones(X.shape[0]).reshape(-1,1), X], axis=1)
                if self.val_enable:
                    X_val = np.concatenate([np.ones(X_val.shape[0]).reshape(-1,1), X_val], axis=1)

            n_features = X.shape[1]
            # パラメータ（重み）
            self.coef_ = np.random.rand(n_features)

            for i in range(self.iter):
                self._gradient_descent(X, self._logistic_hypothesis(X) - y)
                self.loss[i] = self._cost(y, self._logistic_hypothesis(X))
                if self.val_enable:
                    self.val_loss[i] = self._cost(y_val, self._logistic_hypothesis(X_val))

            if self.verbose:
                self.learning_curve()
                print()
            pass


        def predict(self, X):
            """
            ロジスティック回帰を使いラベルを推定する。

            Parameters
            ----------
            X : 次の形のndarray, shape (n_samples, n_features)
                サンプル

            Returns
            -------
                次の形のndarray, shape (n_samples, 1)
                ロジスティック回帰による推定結果
            """

            threshold = 0.5
            return (self.predict_proba(X) > threshold).astype(int)

        def predict_proba(self, X):
            """
            ロジスティック回帰を使い確率を推定する。

            Parameters
            ----------
            X : 次の形のndarray, shape (n_samples, n_features)
                サンプル

            Returns
            -------
                次の形のndarray, shape (n_samples, 1)
                ロジスティック回帰による推定結果
            """
            if not self.no_bias:
                X = np.concatenate([np.ones(X.shape[0]).reshape(-1,1), X], axis=1)

            return self._logistic_hypothesis(X)

        def _logistic_hypothesis(self, X):
            """
            ロジスティック回帰の仮定関数を計算する

            Parameters
            ----------
            X : 次の形のndarray, shape (n_samples, n_features)
              学習データ

            Returns
            -------
              次の形のndarray, shape (n_samples, 1)
              線形の仮定関数による推定結果

            """
            h = X@self.coef_
            g = 1 / (1+np.exp(-h))
            return g

        def _gradient_descent(self, X, error):
            """
            最急降下法により学習させる（1回）

            Parameters
            ----------
            X : 次の形のndarray, shape (n_samples, n_features)
              学習データ

            Returns
            -------
            returnはない

            """
            self.coef_ = self.coef_ - self.lr*(np.average(error*X.T, axis=1) + (self.regularization/X.shape[0])*np.concatenate([np.array([0]), self.coef_[1:]]))
            return

        def _cost(self, y_true, y_pred_proba):
            j = np.average(-y_true*np.log(y_pred_proba) -(1-y_true)*np.log(1-y_pred_proba)) + (self.regularization/(2*len(y_true)))*np.sum(self.coef_[1:])
            return j

        def learning_curve(self):
            plt.title("model loss")
            plt.xlabel("iter")
            plt.ylabel("loss")
            plt.plot(np.arange(self.iter), self.loss, label="loss")
            if self.val_enable:
                plt.plot(np.arange(self.iter), self.val_loss, label="val_loss")
            plt.legend()
            plt.show()


        def evalate(y_true, y_pred):
            print("accuracy =", accuracy_score(y_true, y_pred))
            print("precision =", precision_score(y_true, y_pred, average='macro'))
            print("recall =", recall_score(y_true, y_pred, average='macro'))
            print("f1 =", f1_score(y_true, y_pred, average='macro'))
            print(confusion_matrix(y_true, y_pred))
        pass

        iris_data = load_iris()
        x1, x2 = 2,3
        iris_X = iris_data.data[iris_data.target!=0][:,[x1,x2]]
        iris_y = iris_data.target[iris_data.target!=0] - 1
        iris_target_names = iris_data.target_names[1:]
        iris_feature_names = iris_data.feature_names[x1],iris_data.feature_names[x2]
        iris_X[:5], iris_y[:5], iris_target_names, iris_feature_names

        scratch_logistic = ScratchLogisticRegression(num_iter=10000, lr=0.05, no_bias=False, verbose=True, regularization=0.1)
        iris_X_train, iris_X_test, iris_y_train, iris_y_test = scratch_train_test_split(iris_X, iris_y)
        scratch_logistic.fit(iris_X_train, iris_y_train, iris_X_test, iris_y_test)
        y_pred = scratch_logistic.predict(iris_X_test)
        evalate(iris_y_test, y_pred)

NameError: name 'scratch_train_test_split' is not defined