# ロジスティック回帰

銀行のデータを元にロジスティック回帰を作成します

データはポルトガルの銀行のものであり、顧客が定期預金をするかどうか分類することを目的とします

データの最初の列はインデックスです

## ライブラリのインポート

In [None]:
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

from scipy import stats
stats.chisqprob = lambda chisq, df: stats.chi2.sf(chisq, df)

## データの読み込み

‘Example_bank_data.csv’を使います

In [None]:
raw_data = pd.read_csv('Example_bank_data.csv')
raw_data

In [None]:
# データのコピーを作成します
data = raw_data.copy()

# インデックスの列を削除します
data = data.drop(['Unnamed: 0'], axis = 1)

# mapメソッドを使い、yesとnoを1と0に変換していきます 
data['y'] = data['y'].map({'yes':1, 'no':0})
data

In [None]:
# 記述統計量の確認
data.describe()

### 従属変数と独立変数の宣言

In [None]:
y = data['y']
x1 = data['duration']

### ロジスティック回帰

回帰を行い、散布図を作成します

In [None]:
x = sm.add_constant(x1)
reg_log = sm.Logit(y,x)
results_log = reg_log.fit()

# まとめ表の表示
results_log.summary()

In [None]:
# x1とyの散布図を作成します
plt.scatter(x1,y,color = 'C0')

# 軸に名前を付けます
plt.xlabel('Duration', fontsize = 20)
plt.ylabel('Subscription', fontsize = 20)
plt.show()