In [0]:
# 必要なライブラリのインポート
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.style.use('seaborn-darkgrid')

# 乱数のシードを固定
np.random.seed(0)  

# 2次元ガウス分布で模擬データ100人分を作成
mean = [10, 10]  # 平均値
cov = [[10, 3], [3, 10]]  # 分散共分散行列
x1, y1 = np.random.multivariate_normal(mean, cov, 100).T  # 2次元データ生成
true_false = np.random.rand(100) > 0.9  # 0-1の一様乱数の10%がTrue
label1 = np.where(true_false, 1, 0)  # Advanced indexingでLabelデータ生成

# 次元ガウス分布で模擬データ100人分を作成
mean = [20, 20]  # 平均値
cov = [[8, 4], [4, 8]]  # 分散共分散行列
x2, y2 = np.random.multivariate_normal(mean, cov, 100).T
true_false = np.random.rand(100) > 0.1  # 0-1の一様乱数の90%がTrue  
label2 = np.where(true_false, 1, 0)  # Advanced indexingでLabelデータ生成

# データを描画
X = (np.r_[x1, x2])  # 配列の結合
Y = (np.r_[y1, y2])
label = (np.r_[label1, label2])

# ラベル1の継続会員とラベル0の退会会員をAdvanced indexingで取り出して描画
plt.scatter(X[label == 1], Y[label == 1], marker='^', s=30,
            c='blue', edgecolors='', label='1:continue')
plt.scatter(X[label == 0], Y[label == 0], marker=',', s=30,
            c='red',  edgecolors='', label='0:withdraw')
plt.xlabel("Annual number of purchases")
plt.ylabel("Average purchase price")
plt.legend(loc="lower right")  # 凡例の出現位置を制御
plt.show()

In [0]:
!pip install mlxtend

In [0]:
# 必要なライブラリのインポート
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from mlxtend.plotting import plot_decision_regions

# 訓練データとテストデータに分割
Data = (np.c_[X, Y])
X_train, X_test, y_train, y_test = train_test_split(Data, label, random_state=0)

# ロジスティック回帰の適用
clf = linear_model.LogisticRegression(random_state=0)
clf.fit(X_train, y_train)

# 学習した識別平面とテストデータをプロットする
plot_decision_regions(X_test, y_test, clf=clf, res=0.01, legend=2)

In [0]:
# テストデータで性能評価
print(f'Accuracy: {clf.score(X_test, y_test):.2f}') 

# 未知のデータを分類
label_prenew = clf.predict([[20, 15]])  # 適当なデータ[20,15]を分類
print(f'新たな顧客のラベルは{label_prenew}です。')