# url: https://toukei-lab.com/decile-analysis#google_vignette

デシル分析: あるデータをもとに要素を10等分に分け、それぞれのグループの傾向や特性を分析する手法です！

ビジネスにおいては、10分割した各グループに対して異なる施策の検討や最適なリソース配分を決定するといった目的での活用事例があります。

このデシル分析は、顧客を購入金額などをもとに10個のグループに分類する手法なんです！(メインの使われ方)

顧客を累計購入金額の値によって1～10グループに分け、グループごとの購入ボリュームなどの傾向から顧客の特徴を理解し、各グループに対して最適なマーケティング施策を打つ

後に紹介しますがこのデシル分析、購入金額などの１指標を基にランキング形式で10段階にグループ分けしていく手法なので大変シンプルで汎用性が高いです！

なるほど！デシル分析はとってもシンプルな手法なんだね！でもなんで10個にデータを分割するの？

質問が鋭くなってきたね、、！いくつか理由があるよ。まず、10グループに分けることで各グループに十分な数のデータが含まれつつ、その比較も行いやすいバランスの良い分割数なんだ！

ふむふむ、でも10個じゃなくてもいい気が。。

あとは、多くの組織や研究者が10グループに分けるというアプローチを使っていて、異なるデータ間や業界間での比較を行えるというメリットがあるよ！ただ、分析の目的やデータの性質によっては10にこだわり過ぎずにグループ数を変更することもあるんだ！

そして毎度のことですが、この手法ももちろん、10個のグループに分けて、「できました！はい終わり！」では意味がございません。

そこから、具体的なアクションに繋げていくのです。

顧客分析で用いる場合には、売上上位のグループにはリテンションを高めるための特別な施策を用意するといった行動が有効かもしれません。

限られた予算の中で、施策を実施する際の優先順位を定めるのに活用することもできます。

また、顧客の信用リスクの評価や、市場ごとの傾向の違いの分析にも応用できます。

顧客をグルーピングするデシル分析を例に出しましたが、その他の例として、商品をグルーピング対象とし、それらを累計売上でランク付けするという使い方もできます。

その活用例と効果を以下にまとめます。

# 商品ごとの購入金額によるランク付け

## ①高価値な商品にリソースや広告予算を重点的に割り当てるために利用
→ 収益性の高い部分にフォーカスを当てられるのでROI（投資収益率）向上に繋がる

## ②在庫の最適な管理に利用
→ 上位グループの商品は適切な在庫を確保し、下位グループの商品は在庫コストを最小限におさえることで在庫最適化に繋がる

## ③価格戦略に利用
→ 上位グループの商品にはプレミアム価格を設定、そこからグラデーションを設け下位グループには競争力のある価格を提供するなど、価格設定の調整に活用

グルーピングを行ったうえで各グループに対してどんなアプローチをしていくか？をある程度イメージしてから、分析を行うと効果的だよ！

# よく混同するABC分析やRFM分析との違い

## ABC分析との違い
    ・ABC分析では３つにグルーピングするのに対し、デシル分析では10個にグルーピングする違いがある。
    ・分け方にも違いあり。ABC分析では累積構成比を用いてグルーピングを行うのに対し、デシル分析ではデータをランキング形式で10等分に分割する違いがある。

例えば30人の顧客に対してABC分析を実行した場合Aグループに5人、Bグループは10人、Cグループが15人というグループごとに人数が異なる結果がありえるけど、デシル分析では3人ずつ均等な10グループへグルーピングされるという性質の違いがあるんだ！

## RFM分析との違い
    ・RFM分析も顧客分析として用いられるが、直近購入・購入頻度・購入金額といった３つの要素を総合的にスコア化して評価（デシル分析では購入金額、などといった1軸に絞って評価を行う）

デシル分析はシンプルな反面、特定の1指標に基づいてグルーピングを行うため、その指標が重要である場合には優れた精度が得られる一方で、他の指標は無視されることには注意しましょう。

お手軽さではデシル分析に軍配が、正確性ではRFM分析に軍配が上がるといった印象だね！

# python実装

## 1. データを用意

まずはPython上で、疑似的にデータを生成していきます。

使用したいデータがある場合はもちろんそちらを使用してください！

In [1]:
import pandas as pd
import random

# デモ用のデータを生成
n = 1000  # 顧客数
data = []

for _ in range(n):
    customer_id = random.randint(1, 100)  # 1から100までのランダムな顧客IDを生成
    purchase_amount = round(random.uniform(1.0, 1000.0), 2)  # ランダムな購入金額を生成
    data.append([customer_id, purchase_amount])

# データをDataFrameに変換
columns = ['customer_id', '購入金額']
data_df = pd.DataFrame(data, columns=columns)

display(data_df) #データの出力

# 1000件の購買データが並んでいるね！
# ここではcustomer_idは1～100に設定されているから、現実のように、複数回購入した顧客も存在することになるね！
display(data_df['customer_id'].value_counts()) #データの出力

Unnamed: 0,customer_id,購入金額
0,66,169.28
1,71,497.91
2,42,938.39
3,51,275.44
4,76,21.05
...,...,...
995,99,635.46
996,13,35.62
997,66,81.57
998,89,662.27


97    19
5     17
22    17
29    17
63    17
      ..
36     5
27     5
38     4
96     4
73     4
Name: customer_id, Length: 100, dtype: int64

## 2. 顧客ごとに累計購入金額を算出し、ソート

続いて、顧客IDごとに累計購入金額を算出し、さらにその累計購入金額の大きい順に顧客を並び替えていきます。

In [2]:
# 顧客ごとに累計購入金額を計算
data_df['累計購入金額'] = data_df.groupby('customer_id')['購入金額'].cumsum()

# 顧客ごとにデータを設定
customer_data = data_df.drop_duplicates(subset=['customer_id'], keep='last')

# 累計購入金額でソート
sorted_data = customer_data.sort_values(by='累計購入金額', ascending=False)
sorted_data.drop(columns='購入金額', inplace=True) #累計を求めたため購入金額列は削除

display(sorted_data) #データの出力

# 上記コードにより、customer_IDごとに全部でいくら購入したか？が算出されています。

Unnamed: 0,customer_id,累計購入金額
991,97,9365.76
977,83,8993.81
972,29,8790.74
968,74,8697.76
988,22,8679.33
...,...,...
911,69,2370.97
810,26,2343.02
979,94,2174.32
527,36,2000.27


## 3.デシルランクごとに振り分け

最後は顧客の累計購入金額のランキングによって10個のグループに振り分けていく作業です。

In [3]:
# decileごとにランク付け
sorted_data['decile'] = 10 - pd.qcut(sorted_data['累計購入金額'], q=10, labels=False)

# 通し番号を追加
sorted_data.reset_index(drop=True, inplace=True)
sorted_data.index += 1

# 結果を表示
display(sorted_data)

# 結果は、以下のようにcustomer_IDとそれに紐づく累計購入金額、デシルランクの値、の順で記載されています！

# 以上で、10グループへの振り分けまで完了いたしました！
# ここからさらに、グループごとに全体売上に対する割合などを計算していくことで、高いデシルの顧客に焦点を当てた広告を展開するなどのアクションにまで繋げていこう！

Unnamed: 0,customer_id,累計購入金額,decile
1,97,9365.76,1
2,83,8993.81,1
3,29,8790.74,1
4,74,8697.76,1
5,22,8679.33,1
...,...,...,...
96,69,2370.97,10
97,26,2343.02,10
98,94,2174.32,10
99,36,2000.27,10


# まとめ

デシル分析ではグルーピング後のアクションにも目を向けることで、「各グループごとに必要な統計量は何か？」についてもおのずとイメージが浮かんでくると思います！