# 16章　ロジスティック回帰 
## レシピ16.1　2クラス分類器の訓練 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

# データをロードし、特徴量を2つに制限
iris = datasets.load_iris()
features = iris.data[:100,:]
target = iris.target[:100]

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# ロジスティック回帰器を作成
logistic_regression = LogisticRegression(random_state=0)

# ロジスティック回帰器を訓練
model = logistic_regression.fit(features_standardized, target)

In [None]:
# 新たな観測値を作成
new_observation = [[.5, .5, .5, .5]]

# クラスを予測
model.predict(new_observation)


In [None]:
# 予測確率を表示
model.predict_proba(new_observation)

## レシピ16.2　多クラス分類器の訓練 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# 1対その他法ロジスティック回帰器を作成
logistic_regression = LogisticRegression(random_state=0, multi_class="ovr")

# ロジスティック回帰器を訓練
model = logistic_regression.fit(features_standardized, target)

## レシピ16.3　正則化によるバリアンスの削減 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LogisticRegressionCV
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# ロジスティック回帰器を作成
logistic_regression = LogisticRegressionCV(
    penalty='l2', Cs=10, random_state=0, n_jobs=-1)

# ロジスティック回帰器を訓練
model = logistic_regression.fit(features_standardized, target)

## レシピ16.4　大規模データに対するクラス分類器の訓練 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# ロジスティック回帰器を作成
logistic_regression = LogisticRegression(random_state=0, solver="sag")

# ロジスティック回帰器を訓練
model = logistic_regression.fit(features_standardized, target)

## レシピ16.5　クラスサイズが不均衡な場合の取り扱い 


In [None]:
# ライブラリをロード
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 最初の40観測値を削除して、クラスを不均等に
features = features[40:,:]
target = target[40:]

# クラスが0なら0、それ以外なら1となるターゲットベクタを作成
target = np.where((target == 0), 0, 1)

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# ロジスティック回帰器を作成
logistic_regression = LogisticRegression(random_state=0, class_weight="balanced")

# ロジスティック回帰器を訓練
model = logistic_regression.fit(features_standardized, target)