# ヒント集【Sprint 機械学習スクラッチ ロジスティック回帰】
## ゴール
- **【Sprint 機械学習スクラッチ ロジスティック回帰】を解くうえで必要な知識や技術について理解できる**

## このヒント集について
### Sprintの目的
- ロジスティック回帰の数学的知識について、理解する
- ロジスティック回帰をスクラッチ実装する際のより踏み込んだヒントを掲載しているので、それを基に、スクラッチ実装できるようになる。

### どのように学ぶか

【Sprint 機械学習スクラッチ ロジスティック回帰】の目次と照らし合わせながら、進めていきましょう。

## ロジスティック回帰
### ロジスティック回帰とは
主に生存分析（生きるか死ぬか）などで用いられるアルゴリズムです。生存分析は、病気や医療の領域だけでなく、広義には、ユーザーが特定の行動を起こすか否かというような問題にも適用され、様々な領域・分野で用いられています。

つまり、簡単に言うと、**事象が起こる確率を算出する**アルゴリズムです。

もう少し詳しく、数学的な側面からご紹介いたします。

**ロジスティック回帰(Logistic regression)**とは、ベルヌーイ分布 / 二項分布に従う分類モデルの一種である。

ロジスティック回帰の出力は、「ある出来事が発生する確率」であり、この出力によってクラスの分類を行う。

この確率は、平均へと回帰する線形結合を「関数で変換する」ことによって導かれるため、ロジスティック回帰は分類問題のタスクに用いられるにも関わらず、「回帰」と名付けられている。

具体的には、線形回帰の出力をあとで紹介するシグモイド関数に通して二項分布の正規確率へと変換したものがロジスティック回帰の出力である。

ゆえに、ロジスティック回帰も一方の変数を他方の変数(要因ごとに重みをかけた上で)によって説明しようとする点は線形回帰と変わりはない。

### ロジスティック回帰のイメージ
ロジスティック回帰は、 隠れ層のないニューラルネットワークと同じ構造であることから、ロジスティック回帰の理解は、深層学習への橋渡しとなる。

### ロジスティック回帰の前提
1. 説明変数(x)は連続値 or 離散値で、目的変数(y)は離散値である。
2. 予測値()は、ベルヌーイ分布 / 二項分布(平均np、分散np(1-p))に従う。

### 二項分布
互いに独立したベルヌーイ試行(2種類のみの結果しか得られないような試行。例えば、「サイコロを投げた場合1なのか、それ以外なのか?」というのを考える場合はベルヌーイ試行だが、「サイコロを投げてどの目が出るか?」というのを考えるのはベルヌーイ試行ではない)を独立にn回行ったときに、ある事象が何回起こるか(成功回数)を表す離散確率分布のことである。パラメータとして試行回数と成功確率を持つ。二項分布はnが十分に大きいとき、平均np、分散np(1-p)の正規分布に近づく(pは成功確率のこと)。試行回数が1回の二項分布は、べルヌーイ分布に等しい。

2項分布とベルヌーイ分布のグラフと式（期待値・分散・標準偏差・確率質量関数）

## 尤度関数

ベルヌーイ分布の尤度関数
https://www.slideshare.net/TaroTezuka/bernoulli-distributions-and-multinomial-distributions

### シグモイド関数

入力値を0.0～1.0の範囲の数値に変換して出力する関数である。

### スクラッチコードの完成形
線形回帰のクラスをスクラッチで作成していきますが、最終的なコードはどのようになっているのでしょうか。

下記は、最終的なコードの概観になります。

```python
class ScratchLogisticRegression():
    def __init__(self,・・・):
      """
      インスタンス変数初期化
      """
      ・・・

    def fit(self,・・・):
        """
        線形回帰の学習
        """
        ・・・


    # 問題1
    def _logistic_hypothesis(self,・・・):
        """
        線形回帰の出力 → シグモイド関数 → 出力
        """

    # 問題2
    def _gradient_descent(self,・・・):
        """
        最急降下法によるパラメータの更新値計算
        """
        
    # 問題3
    def predict(self,・・・):
        """
        ロジスティック回帰でのラベル推定
        """

    # 問題3
    def predict_proba(self,・・・):
        """
        ロジスティック回帰での確率の推定
        """

    # 問題4
    def _loss_func(self,・・・):
        """
        損失関数
        """
        # 問題4
        self._mse(・・・)
        

```

## 【問題1】仮定関数

https://seedata.co.jp/blog/tech/3722/

### 正則化項

https://ai-trend.jp/basic-study/neural-network/regularization/


## 【問題2】最急降下法


## 【問題3】推定

ここまで作ってきた`_logistic_hypothesis`の出力は、線形回帰同様に連続値で出てきているのがわかります。

`predict_proba`は、下記のような出力を想定しています。

|Aが起こる確率|Aが起こらない確率|
|--|--|
|0.08|0.92|
|0.15|0.85|
|0.23|0.77|
|0.99|0.01|

`predict`は、下記のような出力を想定しています。
|ラベル|
|--|
|Aが起こらない|
|Aが起こらない|
|Aが起こらない|
|Aが起こらない|
|Aが起こる|

## 【問題4】目的関数

線形回帰で実施したときと同様、式をひとつづつ分解し、実装していきましょう。


## 【問題5】学習と推定

ここまでの問題では、下記の関数を作成してきました。

`_logistic_hypothesis`：仮定関数の出力計算

`_gradient_descent`：シータの更新

この問題では、この2つの関数を利用し（変更可）、冒頭で示した`ScratchLogisticRegression`を実装していくことを目的としています。ですので、まだ実装を行っていない`__init__()`と`fit()`を実装してみましょう。

最急降下法の流れに則ると、下記の流れで実装していくとよいでしょう。
1. 学習率や学習回数の初期化＆シータの初期化（`no_bias`や`verbose`については、アドバンス課題のため考慮しなくてもよい）
2. 推定値算出
3. 値更新
4. 2,3を学習回数文繰り返す

## 【問題6】学習曲線のプロット

クラス内に描画関数を追加してもよいですし、インスタンス変数として損失値を保持しているので、クラス外部で描画してもよいです。

## 【問題7】決定領域の可視化

「決定領域を可視化する」とは、分類結果を分かりやすく色分けすることを言います。

点の描画は問題ないかと思いますが、背景色の決定境界線の描画に関しては、使用している説明変数の範囲にある全ての値の候補に対する推定結果を描画します。ヒントとしては、numpyのmeshgridという関数を使用し、**説明変数の範囲にある全ての値の候補** を求め、predictするイメージです。

https://www.dskomei.com/entry/2018/03/04/125249

クラス内に描画関数を追加してもよいですし、インスタンス変数として損失値を保持しているので、クラス外部で描画してもよいです。
