### 複数の説明変数を用いるロジスティック回帰

In [None]:
import pandas as pd
import seaborn as sns
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score

# Irisデータセットの読み込み
iris = sns.load_dataset('iris')

# 2値データへの分類のため、species から setosa を除外
# - versicolor, virginica の2種だけにした df を作成
df = iris.query('species!="setosa"')

# versicolor, virginica だけになっていることを確認
# - 0, 50 行目を表示
df.iloc[[0, 50]]

In [None]:
# speciesを 0, 1 にするためにダミー変数化
df = pd.get_dummies(data=df, drop_first=True)

# 確認のため 0, 50 行目を表示
df.iloc[[0, 50]]

### 説明変数の組み合わせ

petal_width と他の説明変数の組み合わせではどうなるかを比較する。

- 6_1_logistic.ipynb で計算した petal_width だけの場合から精度は向上するか？
```
正確度: 0.940, 適合度: 0.958, 再現率: 0.920
```

In [None]:
# petal_width と組み合わせる他の説明変数のラベルの取得方法の確認
# - 列名から 'petal_width' と 'species_virginica' を除去
df.columns.drop(['petal_width', 'species_virginica'])

In [None]:
# ロジスティック回帰モデルを作成
model = LogisticRegression(C=10000.0)

# 固定する説明変数
x1_label = 'petal_width'

# dfの列名から x1_label と 'species_virginica' を除去し、それぞれについて、for ループ内を実行
for x2_label in df.columns.drop([x1_label, 'species_virginica']):
    # 説明変数、目的変数
    X = df[[x1_label, x2_label]]
    Y = df.species_virginica

    # ロジスティック回帰モデルを作成
    model.fit(X, Y)

    # 教師データについてモデルからの予測値を計算
    Y_predict = model.predict(X)

    # 精度の出力
    print('{}, {}: 正確度: {:.3f}, 適合度: {:.3f}, 再現率: {:.3f}'.format(
        x1_label, x2_label,
        accuracy_score(Y, Y_predict), precision_score(Y, Y_predict),
        recall_score(Y, Y_predict)))