
# Sprint 機械学習スクラッチ ロジスティック回帰

In [4]:
from sklearn.datasets import load_iris
import numpy as np
import pandas as pd

In [None]:
class ScratchLogisticRegression():
    """
    ロジスティック回帰のスクラッチ実装

    Parameters
    ----------
    num_iter : int
      イテレーション数
    lr : float
      学習率
    no_bias : bool
      バイアス項を入れない場合はTrue
    verbose : bool
      学習過程を出力する場合はTrue

    Attributes
    ----------
    self.coef_ : 次の形のndarray, shape (n_features,)
      パラメータ
    self.loss : 次の形のndarray, shape (self.iter,)
      訓練データに対する損失の記録
    self.val_loss : 次の形のndarray, shape (self.iter,)
      検証データに対する損失の記録

    """
    def __init__(self, num_iter, lr, bias, verbose):
        # ハイパーパラメータを属性として記録
        self.iter = num_iter
        self.lr = lr
        self.bias = bias
        self.verbose = verbose
        # 損失を記録する配列を用意
        self.loss = np.zeros(self.iter)
        self.val_loss = np.zeros(self.iter)
    def fit(self, X, y, X_val=None, y_val=None):
        """
        ロジスティック回帰を学習する。検証データが入力された場合はそれに対する損失と精度もイテレーションごとに計算する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            訓練データの特徴量
        y : 次の形のndarray, shape (n_samples, )
            訓練データの正解値
        X_val : 次の形のndarray, shape (n_samples, n_features)
            検証データの特徴量
        y_val : 次の形のndarray, shape (n_samples, )
            検証データの正解値
        """
        if self.verbose:
            #verboseをTrueにした際は学習過程を出力
            print()
        pass

    def predict(self, X):
        """
        ロジスティック回帰を使いラベルを推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """
        pass
        return
    def predict_proba(self, X):
        """
        ロジスティック回帰を使い確率を推定する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            サンプル

        Returns
        -------
            次の形のndarray, shape (n_samples, 1)
            ロジスティック回帰による推定結果
        """
        pass
        return
    

## 【問題1】仮定関数

ロジスティック回帰の仮定関数のメソッドをScratchLogisticRegressionクラスに実装してください。

## 【考察】

* ロジスティック回帰の仮定関数は、線形回帰の仮定関数を シグモイド関数 に通したもの。
* シグモイド関数
    * 線形結合の出力を確立に変換
    * S字型の曲線
    * n(x)は0～1の値
    * n(x)=0.5布巾では直線的に変化し、n(x)が0または1に近いときは、その傾きが緩やかになる。
    
    
    
## 【順序】
1. numpyを用い、sigmoid関数の作成
2. Irisデータセットを用いて、回帰描写
3. LogisticRegressionを用いて、

In [49]:
# Irisデータの準備
iris = load_iris()

# 基データから特定の2種の特徴量を抽出。
iris_raw_data = pd.DataFrame(iris.data, columns=iris.feature_names)
X = iris_raw_data[['petal length (cm)', 'petal width (cm)']]

# 基データから特定の2品種のみを抽出。
iris_raw_species = pd.DataFrame(iris.target, columns=["species"])
y = iris_raw_species[iris_raw_species['species'].isin([1, 2])]

In [50]:
# x = 特徴量ベクトル 
# theta = parameter vector

# シグモイド関数
def sigmoid(z):
    return 1 / (1 + np.exp(z))

X = np.concatenate([np.ones((X.shape[0], 1)), X], 1)

# thetaに説明変数の行列数と同数のランダム行列を作成。
theta = np.random.normal(0, 0.5, X.shape[0])

# zに線形結合を代入して、確率を返す。
z = np.dot(theta, X)

sigmoid(z)

array([0.74433558, 0.99981036, 0.99726957])

## 【問題2】最急降下法

最急降下法により学習させる実装を行なってください。以下の式で表されるパラメータの更新式のメソッド_gradient_descentを追加し、fit
メソッドから呼び出すようにする。

In [None]:
def _gradient_descent():
    
    
    