# マーケットセグメンテーションの例

## ライブラリのインポート

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
# クラスタリングを行うためのKMeansモジュールをインポートします
from sklearn.cluster import KMeans

## データの読み込み

In [None]:
# データの読み込み
data = pd.read_csv ('3.12. Example.csv')

In [None]:
# 中身の確認
data

## データの図示

In [None]:
# 散布図の作成
plt.scatter(data['Satisfaction'],data['Loyalty'])
# 軸に名前を付ける 
plt.xlabel('Satisfaction')
plt.ylabel('Loyalty')

## 特徴量の選択

In [None]:
# データのコピーの作成
x = data.copy()

## クラスタリング

In [None]:
# クラスからオブジェクトを作成
kmeans = KMeans(2)
# モデルにフィットさせる
kmeans.fit(x)

## クラスタリングの結果

In [None]:
# 入力データのコピー
clusters = x.copy()
# 予測したデータの作成 
clusters['cluster_pred']=kmeans.fit_predict(x)

In [None]:
# 満足度をロイヤリティを元に散布図を作成
plt.scatter(clusters['Satisfaction'],clusters['Loyalty'],c=clusters['cluster_pred'],cmap='rainbow')
plt.xlabel('Satisfaction')
plt.ylabel('Loyalty')

## 変数の標準化

In [None]:
from sklearn import preprocessing
# 入力データの標準化
x_scaled = preprocessing.scale(x)
x_scaled

## エルボー法

In [None]:
# 空のリストの作成
wcss =[]

# ループを使ってクラスター毎のWCSSの値を求めていきます
for i in range(1,10):
    kmeans = KMeans(i)
    kmeans.fit(x_scaled)
    wcss.append(kmeans.inertia_)

#結果の確認
wcss

In [None]:
# クラスターの数とWCSSで散布図を作成
plt.plot(range(1,10),wcss)
# 軸に名前を付ける
plt.xlabel('Number of clusters')
plt.ylabel('WCSS')