# CRM Analytics (RFM Analysis, CLTV)

![](https://cdn-images-1.medium.com/max/800/1*8kB7crU624Xc4Gksb327mw.png)

1- **Data Understanding** (Veriyi anlama)

2- **Data Preperation** (Veri Ã¶n iÅŸleme)

3- **Creating RFM Segments** (RFM Analizi ile mÃ¼ÅŸterilerin Recency ve Frequency deÄŸerlerini kullanarak mÃ¼ÅŸteri segmentasyonu gerÃ§ekleÅŸtireceÄŸiz.)

4- **Calculated CLTV** (Bir mÃ¼ÅŸterinin ÅŸirket iÃ§in deÄŸerinin hesaplanÄ±p segmentlere ayrÄ±lmasÄ±nÄ± gÃ¶receÄŸiz.)

5- **Predicted CLTV** (Bu mÃ¼ÅŸteri deÄŸeri hesaplamasÄ±nÄ±n zaman eksenli bir projeksiyonu olmadÄ±ÄŸÄ± iÃ§in zaman projeksiyonu getirerek geleceÄŸe yÃ¶nelik mÃ¼ÅŸteri deÄŸeri hesaplamayÄ± ve segmentlere ayÄ±rmayÄ± gerÃ§ekleÅŸtireceÄŸiz.)
 * BG-NBD modeli ile gelceÄŸe yÃ¶nelik beklenen satÄ±ÅŸlarÄ±n tahmini,
 * Gamma-Gamma modeli ile geleceÄŸe yÃ¶nelik beklenen karlÄ±lÄ±k tahmini gerÃ§ekleÅŸtireceÄŸiz.
 * BG-NBD ve Gamma-Gamma modelleri ile belirli bir zaman periyodu iÃ§in CLTV tahmini gerÃ§ekleÅŸtireceÄŸiz.

6- TÃ¼m Ã§alÄ±ÅŸmalarÄ± tek bir Ã§atÄ± altÄ±nda toplayarak proje Ã¼zerinden Ã¶nemli yorumlamalar yapacaÄŸÄ±z.

---

### Veri Seti Hikayesi  ðŸ‘‰  https://archive.ics.uci.edu/ml/datasets/Online+Retail+II

Online Retail II, Ä°ngiltere merkezli bir e-ticaret ÅŸirketinin 01/12/2009 - 09/12/2011 tarihleri arasÄ±ndaki satÄ±ÅŸlarÄ±nÄ± iÃ§ermektedir. Åžirket hediyelik eÅŸya satÄ±ÅŸÄ± gerÃ§ekleÅŸtirmekte ve mÃ¼ÅŸterileri de toptancÄ±lardÄ±r.

### Veri Setindeki DeÄŸiÅŸkenler

* **Invoice:** Fatura numarasÄ±. Her faturaya ait eÅŸsiz numara. EÄŸer bu kod C ile baÅŸlÄ±yorsa iÅŸlemin iptal edildiÄŸini ifade eder.
* **StockCode:** ÃœrÃ¼n kodu. Her bir Ã¼rÃ¼n iÃ§in eÅŸsiz numara.
* **Description:** ÃœrÃ¼n ismi
* **Quantity:** ÃœrÃ¼n adedi. Faturalardaki Ã¼rÃ¼nlerden kaÃ§ar tane satÄ±ldÄ±ÄŸÄ±nÄ± ifade etmektedir.
* **InvoiceDate:** Fatura tarihi ve zamanÄ±.
* **UnitPrice:** ÃœrÃ¼n fiyatÄ±
* **CustomerID:** EÅŸsiz mÃ¼ÅŸteri numarasÄ±
* **Country:** Ãœlke ismi. MÃ¼ÅŸterinin yaÅŸadÄ±ÄŸÄ± Ã¼lke.


# 1- Data Understanding

In [None]:
!pip install xlrd
!pip install openpyxl
!pip install lifetimes

In [None]:
# Projede gerekli olan kÃ¼tÃ¼phanelerin import iÅŸlemini yapÄ±yoruz.
import datetime as dt
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from lifetimes import BetaGeoFitter
from lifetimes import GammaGammaFitter

# Ã‡Ä±ktÄ±da tÃ¼m sÃ¼tun ve satÄ±rlarÄ± gÃ¶zlemlemek iÃ§in;
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

# Ã‡Ä±ktÄ±da sÃ¼tunlarÄ±n alta kaymasÄ±nÄ± engellemek iÃ§in sÃ¼tunlarÄ± yan yana getireceÄŸimiz kod.
pd.set_option('display.expand_frame_repr', False)

In [None]:
# Veri Setini okuma iÅŸlemlerini gerÃ§ekleÅŸtiriyoruz. Projede 2010-2011 yÄ±lÄ±na ait verileri kullanacaÄŸÄ±z.
df_ = pd.read_excel("../input/online-retail-ii-data-set-from-ml-repository/online_retail_II.xlsx", sheet_name="Year 2010-2011")

In [None]:
# Veri setini boyutu fazla olduÄŸundan dolayÄ± veriyi okutma sÃ¼resi uzun sÃ¼rmektedir. 
# Herhangi bir sebeple veriyi tekrar okutmamÄ±z gerekirse beklememek iÃ§in veriyi kopyalÄ±yoruz. 
df = df_.copy()

### Veri okuma iÅŸlemini gerÃ§ekleÅŸtirdik.
### Veriyi anlamaya Ã§alÄ±ÅŸacaÄŸÄ±z.

In [None]:
# Veri setindeki ilk 5 gÃ¶zlem deÄŸerini inceliyoruz.
df.head()

In [None]:
# Veride kaÃ§ satÄ±r, kaÃ§ sÃ¼tun vardÄ±r?
df.shape

In [None]:
# KaÃ§ eÅŸsiz Ã¼rÃ¼n var? 
df["Description"].nunique()

In [None]:
# Hangi Ã¼rÃ¼nden kaÃ§ar tane var?
df["Description"].value_counts().head()   

In [None]:
# En Ã§ok sipariÅŸ edilen ilk 5 Ã¼rÃ¼n hangileridir? 
# Veri setindeki Ã¼rÃ¼n isimlerini(Description) groupby alarak Ã¼rÃ¼n adetlerinin(Quantity) toplamÄ±nÄ± alÄ±yoruz.
# ÃœrÃ¼n adetine(Quantity) gÃ¶re bÃ¼yÃ¼kten kÃ¼Ã§Ã¼ÄŸe sÄ±ralÄ±yoruz. .head() iÅŸlemiyle ilk 5 gÃ¶zleme bakÄ±yoruz.
df.groupby("Description").agg({"Quantity":"sum"}).sort_values("Quantity", ascending = False).head()

In [None]:
# En pahalÄ± ilk 5 Ã¼rÃ¼n hangileridir?
# Veri setindeki Ã¼rÃ¼n isimlerini(Description) groupby alarak Ã¼rÃ¼n fiyatlarÄ±nÄ±n(Price) maksimum deÄŸerini alÄ±yoruz.
# ÃœrÃ¼n fiyatÄ±na(Price) gÃ¶re bÃ¼yÃ¼kten kÃ¼Ã§Ã¼ÄŸe sÄ±ralÄ±yoruz. .head() iÅŸlemiyle ilk 5 gÃ¶zleme bakÄ±yoruz.
df.groupby("Description").agg({"Price":"max"}).sort_values("Price", ascending = False).head()

In [None]:
# En Ã§ok Ã¼rÃ¼n satÄ±n alan mÃ¼ÅŸteriler hangi Ã¼lkeden satÄ±n alma gerÃ§ekleÅŸtirmiÅŸtir?
df.groupby("Country").agg({"Quantity":"sum"}).sort_values("Quantity", ascending=False).head()

# 2- Data Preperation

In [None]:
# Ä°lk olarak eksik gÃ¶zlemimiz var mÄ± onu kontrol edelim.
# Kod, deÄŸiÅŸkenlerdeki toplam eksik gÃ¶zlem sayÄ±sÄ±nÄ± vermektedir.
df.isnull().sum()

In [None]:
# Eksik gÃ¶zlemler Ã¼zerinde de iÅŸlemler yapabilirim ancak veri setimde Ã§ok fazla gÃ¶zlem var. 
# Bu proje Ã¶zelinde eksik gÃ¶zlemleri veri setinden direk siliyorum.
# axis=0 satÄ±ra gÃ¶re, axis=1 sÃ¼tuna gÃ¶re iÅŸlem yapar. Ä°nplace=True ise bu iÅŸlemi atama yapmadan kalÄ±cÄ± hale getirir.
df.dropna(axis=0, inplace=True)
# Ä°snull fonskiyonu ile tekrar eksik gÃ¶zlem kontrolÃ¼ yapÄ±yorum. GÃ¶rÃ¼ldÃ¼ÄŸÃ¼ Ã¼zere eksik gÃ¶zlemleri temizledik.
df.isnull().sum()

In [None]:
# Fatura numaralarÄ±(Invoice) deÄŸiÅŸkeninde "C" ile baÅŸlayan deÄŸerler iade olan faturalarÄ± ifade ediyordu.
# Biz bu Ã§alÄ±ÅŸmada iade olan faturalarla ilgili bir analiz yapmayacaÄŸÄ±mÄ±z iÃ§in,
# Invoice deÄŸiÅŸkeninde C iÃ§eren gÃ¶zlemlerin dÄ±ÅŸÄ±ndakileri seÃ§erek tekrar df olarak atama yapÄ±yoruz.
df = df[~df["Invoice"].str.contains("C", na=False)]

In [None]:
# Bu iÅŸlemlerden sonra satÄ±r ve sÃ¼tun sayÄ±larÄ±mÄ±za bakalÄ±m.
df.shape

In [None]:
# Bu bÃ¶lÃ¼mde veri setinin betimsel istatistiklerine bakmak Ã¶nemlidir.
# EÄŸer bir aykÄ±rÄ±lÄ±k gÃ¶ze Ã§arparsa bu aykÄ±rlÄ±ÄŸÄ± gidermek iÃ§in iÅŸlemler yapmamÄ±z gerekir.
# AÅŸaÄŸÄ±da Ã¼rÃ¼n adeti(Quantity) ve Ã¼rÃ¼n fiyatÄ±nÄ±nÄ±n(Price) istatistiklerini incelediÄŸimizde ;
# Ä°ki deÄŸiÅŸkenin de %99'luk ve maksimum deÄŸerleri arasÄ±nda ciddi bir aykÄ±rÄ±lÄ±k gÃ¶rÃ¼lmektedir.
df.describe([0.05,0.10,0.25,0.50,0.80,0.95,0.99]).T

In [None]:
# Analize gÃ¶zlem aykÄ±rlÄ±ÄŸÄ±nÄ± gidererek devam etmemiz gerekiyor.
# AÅŸaÄŸÄ±daki outlier_thresholds fonksiyonu ile aykÄ±rÄ± deÄŸerler iÃ§in bir eÅŸik deÄŸer belirliyoruz.
# Alt ve Ãœst sÄ±nÄ±r olarak bir eÅŸik deÄŸer belirliyoruz. Bu aykÄ±rÄ± gÃ¶zlemler eÅŸik deÄŸerin dÄ±ÅŸÄ±nda kalÄ±yor.
def outlier_thresholds(dataframe, variable):
    quartile1 = dataframe[variable].quantile(0.01)
    quartile3 = dataframe[variable].quantile(0.99)
    interquantile_range = quartile3 - quartile1
    up_limit = quartile3 + 1.5 * interquantile_range
    low_limit = quartile1 - 1.5 * interquantile_range
    return low_limit, up_limit

In [None]:
# replace_with_thresholds fonksiyonunda ise aykÄ±rÄ± olan deÄŸerleri outlier_thresholds fonksiyonunda saptaÄ±ÄŸÄ±mÄ±z eÅŸik deÄŸerlerle deÄŸiÅŸtiriyoruz.
# Yani aykÄ±rÄ± deÄŸerler artÄ±k bizim belirlediÄŸimiz Ã§eyreklikte eÅŸik deÄŸerlerle deÄŸiÅŸmiÅŸ oluyor.
def replace_with_thresholds(dataframe, variable):
    low_limit, up_limit = outlier_thresholds(dataframe, variable)
    # dataframe.loc[(dataframe[variable] < low_limit), variable] = low_limit
    dataframe.loc[(dataframe[variable] > up_limit), variable] = up_limit

In [None]:
# ArtÄ±k hem Ã¼rÃ¼n adeti(Quantity) deÄŸiÅŸkeninde hem de Ã¼rÃ¼n fiyatÄ±(Price) deÄŸiÅŸkenindeki aykÄ±rlÄ±ÄŸÄ± giderebiliriz. 
replace_with_thresholds(df, "Quantity")
replace_with_thresholds(df, "Price")

In [None]:
df.describe([0.05,0.10,0.25,0.50,0.80,0.95,0.99]).T

In [None]:
# Quantity ve Price deÄŸiÅŸkenleri Ã¼rÃ¼n adet ve her bir Ã¼rÃ¼nÃ¼n birim fiyatÄ±nÄ± gÃ¶stermektedir.
# Biz Ã§alÄ±ÅŸmamÄ±zda toplam fatura fiyatÄ±nÄ± deÄŸerlendireceÄŸiz.
# Bunun iÃ§in ise "Quantity" ve "Price" deÄŸiÅŸkenlerindeki gÃ¶zlemleri Ã§arparak yeni bir "Total Price" deÄŸiÅŸkeni oluÅŸturacaÄŸÄ±z.
df["TotalPrice"] = df["Quantity"] * df["Price"]

In [None]:
# TÃ¼m veri Ã¶n iÅŸleme adÄ±mlarÄ±ndan sonra artÄ±k verimizin son halinden ilk 5 gÃ¶zlemi gÃ¶rebiliriz.
# Total Price deÄŸiÅŸkeni de gÃ¶rÃ¼lmektedir.
df.head()

# 3- Creating RFM Segments

RFM, mÃ¼ÅŸterilerin satÄ±n alma alÄ±ÅŸkanlÄ±klarÄ± Ã¼zerinden onlarÄ± segmentlere ayÄ±rarak pazarlama ve satÄ±ÅŸ stratejileri belirlemeye yardÄ±mcÄ± olur.

3 davranÄ±ÅŸ metriÄŸinin baÅŸ harflerinden meydana gelir.

* **Recency :** MÃ¼ÅŸterinin ÅŸirketle son temasÄ±ndan yani mÃ¼ÅŸterinin son satÄ±n almasÄ±ndan bugÃ¼ne kadar geÃ§en sÃ¼redir.
    * (Recency = BugÃ¼nÃ¼n tarihiâ€Š-â€ŠSon satÄ±n alma tarihi)
    * Burada dikkat etmemiz gereken nokta Recency deÄŸeri olacaktÄ±r. Bu deÄŸerde Frequency ve Monetary metriklerine gÃ¶re tersten bir skorlama yapÄ±lmaktadÄ±r.
    * Recency deÄŸeri yani mÃ¼ÅŸterinin en son satÄ±n alma gerÃ§ekleÅŸtirdiÄŸi tarih ne kadar yakÄ±nsa bizim iÃ§in bir o kadar deÄŸerlidir. Bu yÃ¼zden yukarÄ±daki Recency formÃ¼lÃ¼nden gelecek olan sonuÃ§ ne kadar kÃ¼Ã§Ã¼k olursa bizim iÃ§in skorlamada o kadar yÃ¼ksek puan alacaktÄ±r.

* **Frequency :** MÃ¼ÅŸterinin toplam satÄ±n alma sayÄ±sÄ±nÄ± gÃ¶sterir.

* **Monetary :** MÃ¼ÅŸterinin alÄ±ÅŸveriÅŸlerinde yaptÄ±ÄŸÄ± toplam harcamadÄ±r.

Frequency ve Monetray metriklerinin ise deÄŸerleri ne kadar yÃ¼ksekse skorlamada da o kadar yÃ¼ksek puan alacaktÄ±r.

In [None]:
# Veri setindeki deÄŸiÅŸkenler ile Receny, Frequency ve Monetary skorlarÄ±nÄ± oluÅŸturacaÄŸÄ±z.
df. info()

### Recency MetriÄŸinin HesaplanmasÄ±

Recency iÃ§in referans bir tarih belirleyip mÃ¼ÅŸterilerin son satÄ±n alma tarihlerini bu referans tarihten Ã§Ä±karacaÄŸÄ±z.

(Recency = BugÃ¼nÃ¼n tarihiâ€Š-â€ŠSon satÄ±n alma tarihi)

Bunu nasÄ±l yapacaÄŸÄ±z?
 * Ã–ncelikle bir referans tarih belirleyeceÄŸiz. Bunun sebebi ise recency formÃ¼lÃ¼ndeki bugÃ¼nÃ¼n tarihini belirlemek. BugÃ¼nÃ¼n tarihi dediÄŸimiz durum aslÄ±nda mÃ¼ÅŸterinin en son kaÃ§ gÃ¼n Ã¶nce satÄ±n alma gerÃ§ekleÅŸtirdiÄŸini bulmak istiyoruz. Bunun iÃ§in de bugÃ¼nÃ¼n tarihini veri setinin maksimum gÃ¼nÃ¼nden 1-2 gÃ¼n sonrasÄ± olarak belirleyip bu tarihten her bir mÃ¼ÅŸteri Ã¶zelinde son satÄ±n alma tarihini Ã§Ä±kardÄ±ÄŸÄ±mÄ±zda Recency deÄŸerimize ulaÅŸabiliriz.
 * 1-2 gÃ¼n sonrasÄ±nÄ± belirlememizdeki mantÄ±k ise veri setinin en son gÃ¼nÃ¼nde satÄ±n alma gerÃ§ekleÅŸtiren mÃ¼ÅŸterilerimizin Recency formÃ¼lÃ¼ndeki Ã§Ä±karma iÅŸleminden dolayÄ± recency deÄŸerlerinin "0" gelmesini engellemek.
 * Recency, mÃ¼ÅŸterinin son satÄ±n almasÄ±nÄ± temsil ettiÄŸi iÃ§in fatura tarihi(InvoiceDate) deÄŸiÅŸkeni kullanacaÄŸÄ±z. 
 * MÃ¼ÅŸteriler("CustomerID") bazÄ±nda groupby alarak lambda fonksiyonu InvoiceDate deÄŸiÅŸkenini gezerek belirlediÄŸimiz referans tarihi her bir mÃ¼ÅŸterinin son satÄ±n alma tarihinden Ã§Ä±karacaÄŸÄ±z.
 * `dataframe.groupby('Customer ID').agg({'InvoiceDate': lambda date: (today_date - date.max()).days `
 
### Frequency MetriÄŸinin HesaplanmasÄ±

Frequency, mÃ¼ÅŸterinin toplam satÄ±n alma sayÄ±sÄ±nÄ± ifade ettiÄŸi iÃ§in fatura deÄŸiÅŸkenini(Invoice) kullanacaÄŸÄ±z.

 * MÃ¼ÅŸteriler("CustomerID") bazÄ±nda groupby alarak lambda fonksiyonu (Invoice) deÄŸiÅŸkenini  gezerek her fatura numarasÄ±nÄ±n eÅŸsiz deÄŸerini bize saydÄ±racak. MÃ¼ÅŸterinin kaÃ§ farklÄ± satÄ±n alma gerÃ§ekleÅŸtirdiÄŸini gÃ¶receÄŸiz.
 * `dataframe.groupby('Customer ID').agg({'Invoice': lambda num: num.nunique()})`
 
### Monetary MetriÄŸinin HesaplanmasÄ± 

Monetary, mÃ¼ÅŸterinin alÄ±ÅŸveriÅŸlerinde yaptÄ±ÄŸÄ± toplam harcamayÄ± ifade ettiÄŸi iÃ§in 20. satÄ±rda "Ouantity" ve "Price" deÄŸiÅŸkenlerinin Ã§arpÄ±mlarÄ±yla oluÅŸturduÄŸumuz "TotalPrice" deÄŸiÅŸkenini kullanacaÄŸÄ±z.

 * MÃ¼ÅŸteriler("CustomerID") bazÄ±nda groupby alarak lambda fonksiyonu (TotalPrice) deÄŸiÅŸkenini gezerek ilgili mÃ¼ÅŸteriye ait her toplam satÄ±n alma tutarÄ±nÄ± toplamÄ±nÄ± bize verecektir. MÃ¼ÅŸterinin yapmÄ±ÅŸ olduÄŸu toplam harcamayÄ± gÃ¶receÄŸiz.
 * `dataframe.groupby('Customer ID').agg({"TotalPrice": lambda price: price.sum()})`

In [None]:
# Veri setindeki maksimum tarihi gÃ¶relim. Ona gÃ¶re referans bir tarih belirleyeceÄŸiz.
# Maksimum tarihimiz 09.12.2011
df["InvoiceDate"].max()

In [None]:
# Referans tarih belirleyeceÄŸiz. Maksimum tarihten 2 gÃ¼n sonrasÄ±nÄ± seÃ§iyorum.
today_date = dt.datetime(2011, 12, 11)

In [None]:
# ArtÄ±k Recency, Frequency ve Monetary deÄŸerlerinden oluÅŸacak RFM Tablomuzu oluÅŸturabiliriz.
rfm = df.groupby('Customer ID').agg({'InvoiceDate': lambda date: (today_date - date.max()).days,
                                                'Invoice': lambda num: num.nunique(),
                                                "TotalPrice": lambda price: price.sum()})

In [None]:
# RFM Tablosunun ilk 5 gÃ¶zlemini gÃ¶rÃ¼yoruz.
# Bu tablo 'InvoiceDate', 'Invoice' ve 'TotalPrice' deÄŸiÅŸkenlerinden oluÅŸuyor.
rfm.head()

In [None]:
# YukarÄ±daki deÄŸiÅŸkenlerimiz bizim artÄ±k Recency, Frequency ve Monetary deÄŸerlerimizi ifade ediyor.
# O zaman deÄŸiÅŸkenlerin isimlerini deÄŸiÅŸtirebiliriz.rfm.columns'a yeni isimleri atÄ±yorum.
rfm.columns = ['recency', 'frequency', "monetary"]
rfm.head()

In [None]:
# OluÅŸturduÄŸumuz rfm tablomuzda monetray ve frequency deÄŸerlerimizde "0"'dan bÃ¼yÃ¼k olmayanlar var mÄ± diye kontrol amaÃ§lÄ± bir bakÄ±yoruz.
# Bu kontrolÃ¼ yapmamÄ±n sebebi ise Frequency ve Monetray deÄŸerleri "0" gelmemesi lazÄ±m.
# Kontrol sonucunda MÃ¼ÅŸteri 1 satÄ±n alma gerÃ§ekleÅŸtirmiÅŸ ancak mÃ¼ÅŸterinin bÄ±raktÄ±ÄŸÄ± toplam tutar "0" birim.
# BÃ¶yle bir durum gerÃ§ekleÅŸmesi mÃ¼mkÃ¼n olmayacaÄŸÄ± iÃ§in bunu iki deÄŸiÅŸken iÃ§in de 0 dan bÃ¼yÃ¼k olanlarÄ± tekrar rfm olarak atama yapÄ±yoruz.
rfm[~((rfm["monetary"]) > 0 & (rfm["frequency"] > 0))]

In [None]:
rfm = rfm[(rfm['monetary'] > 0)]

In [None]:
rfm.head()

ArtÄ±k RFM metriklerini hesaplamÄ±ÅŸ bulunmaktayÄ±z. Tekrardan hatÄ±rlamak iÃ§in;
 * Recency : MÃ¼ÅŸterilerimizin son satÄ±n alma tarihinden referans tarihe kadar geÃ§en sÃ¼reyi ifade ediyor.
 * Frequency : MÃ¼ÅŸterilerimizin toplam satÄ±n alma sayÄ±larÄ±nÄ± ifade ediyor.
 * Monetary : MÃ¼ÅŸterilerin bu satÄ±n almalar sonucunda toplam harcama tutarÄ±nÄ± ifade ediyor.

Gelin birlikte Ã¶rnek olarak yukarÄ±dan bir mÃ¼ÅŸteriyi yorumlayalÄ±m.
 * 12348 ID'lÄ± mÃ¼ÅŸterimiz, 76 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸ. 4 satÄ±n alma gerÃ§ekleÅŸtirmiÅŸ. Bu satÄ±n almalar sonucunda bÄ±raktÄ±ÄŸÄ± toplam tutar 1770.78 birimdir. 
 
ArtÄ±k RFM skorlarÄ±nÄ± hesaplamaya geÃ§ebiliriz.

### RFM SkorlarÄ±nÄ±n HesaplanmasÄ±

RFM metriklerini daha kolay karÅŸÄ±laÅŸtÄ±rabilmek aÃ§Ä±sÄ±ndan 1â€“5 arasÄ±nda deÄŸerler vererek metrikleri RFM skorlarÄ±na Ã§evireceÄŸiz. Bununla beraber 1 Ã§ok kÃ¶tÃ¼, 5 Ã§ok iyi olacak ÅŸekilde mÃ¼ÅŸterileri segmentlere ayÄ±rmÄ±ÅŸ olucaÄŸÄ±z.

Buradaki Ã¶nemli nokta ise biz mÃ¼ÅŸterilerimizin segmentlerini tanÄ±mlarken sadece Recency ve Frequency deÄŸerlerini kullanacaÄŸÄ±z. Ã‡Ã¼nkÃ¼ Monetary deÄŸeri RFM segmenti tanÄ±mlamada kullanÄ±lmÄ±yor. Rfm segmenti tanÄ±mlamada Ã¶nemli olan deÄŸiÅŸkenler mÃ¼ÅŸterimizin en son satÄ±n alma yaptÄ±ÄŸÄ± tarih ve yapmÄ±ÅŸ olduÄŸu satÄ±n alma sayÄ±sÄ± bunlarÄ± da bize sÄ±rasÄ±yla Recency ve Frequency deÄŸiÅŸkenleri veriyor.

Peki RFM skorlarÄ±nÄ± nasÄ±l oluÅŸturacaÄŸÄ±z ?

* .qcut() fonksiyonu ile deÄŸiÅŸkeni kÃ¼Ã§Ã¼kten bÃ¼yÃ¼ÄŸe sÄ±ralayÄ±p istediÄŸimiz Ã§eyreklik deÄŸere bÃ¶lmÃ¼ÅŸ oluyoruz.

* Recency deÄŸiÅŸkenini kÃ¼Ã§Ã¼kten bÃ¼yÃ¼ÄŸe sÄ±ralarken En kÃ¼Ã§Ã¼k olana 5 puan verip, en yÃ¼ksek olana 1 puan vereceÄŸiz.Ã‡Ã¼nkÃ¼ en kÃ¼Ã§Ã¼k olan sayÄ± en yakÄ±n satÄ±n alma yapmÄ±ÅŸ olanlarÄ± ifade ettiÄŸinden dolayÄ± en iyi skoru en kÃ¼Ã§Ã¼k sayÄ±ya veriyoruz.
    * `pd.qcut(rfm['Recency'], 5, labels=[5, 4, 3, 2, 1])`

* Frequency deÄŸiÅŸkeninde ise satÄ±n alma sayÄ±sÄ± en fazla olana 5, en az satÄ±n alma sayÄ±sÄ±na sahip olana 1 skorlarÄ±nÄ± vereceÄŸiz.
    * `pd.qcut(rfm['Frequency'].rank(method="first"), 5, labels=[1, 2, 3, 4, 5])`

In [None]:
# YukarÄ±da ifade ettiÄŸimiz ÅŸekilde RFM skorlarÄ±nÄ± hesaplÄ±yoruz.
# recency_score ve frequency_score olarak atama yapÄ±yoruz.
rfm["recency_score"] = pd.qcut(rfm['recency'], 5, labels=[5, 4, 3, 2, 1])
rfm["frequency_score"] = pd.qcut(rfm["frequency"].rank(method="first"), 5, labels=[1, 2, 3, 4, 5])

ArtÄ±k RFM Metrikleri ve RFM SkorlarÄ±nÄ± oluÅŸturduk.

Ã–rneÄŸin aÅŸaÄŸÄ±daki tabloyu yorumladÄ±ÄŸÄ±mÄ±zda;
* 12347 ID'li mÃ¼ÅŸteri recency deÄŸeri 3, Frequecny deÄŸeri 7, yani mÃ¼ÅŸteri en son 3 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸ ve bu benim iÃ§in Ã¶nemli bir metrik olduÄŸundan dolayÄ± RFM skoru olarak 5 puanÄ± aldÄ±. AynÄ± mÃ¼ÅŸterinin satÄ±n alma sayÄ±sÄ± da 7 olduÄŸu iÃ§in yine frequecny skoru olarak 5 puanÄ±nÄ± aldÄ±.

In [None]:
# ArtÄ±k RFM Metrikleri ve RFM SkorlarÄ±nÄ± oluÅŸturduk.
rfm.head()

### RFM Segmentlerinin OluÅŸturulmasÄ±

RFM skorlarÄ±nÄ± oluÅŸturduktan sonra aÅŸaÄŸÄ±daki yaygÄ±n olarak kullanÄ±lan RFM tablosuna gÃ¶re RFM segmentlerini oluÅŸturacaÄŸÄ±z. AÅŸaÄŸÄ±daki tabloda mÃ¼ÅŸteriler segmentlere ayrÄ±lmÄ±ÅŸtÄ±r. Bu tabloda Frequecy ve Recency olarak 2 metrik bulunmaktadÄ±r. SkorlarÄ±mÄ±zÄ± biz de bu 2 metrik Ã¼zerinden oluÅŸturmuÅŸtuk. 2 Metrik iÃ§in de 1 Ã§ok iyi, 5 Ã§ok kÃ¶tÃ¼ anlamÄ±na gelir.

Biz de mÃ¼ÅŸterilerimizi yukarÄ±daki onlarÄ±n davranÄ±ÅŸlarÄ±ndan oluÅŸturduÄŸumuz skorlara gÃ¶re Frequency ve Recency deÄŸerleri ile aÅŸaÄŸÄ±daki tablo Ã¶zelinde segmentlere ayÄ±racaÄŸÄ±z.

Gelin Ã¶nce beraber tablodan birkaÃ§ sÄ±nÄ±fÄ± inceleyelim;
 * Champions sÄ±nÄ±fÄ±nda yer alanlar bizim iÃ§in en deÄŸerli mÃ¼ÅŸterilerdir. Bu sÄ±nÄ±fÄ±n son satÄ±n alma tarihi en erken ve satÄ±n alma sayÄ±sÄ± en fazla olan sÄ±nÄ±ftÄ±r.
 * Loyal Customer sÄ±nÄ±fÄ±nda yer alanlar bizim sadÄ±k mÃ¼ÅŸterilerimizdir. Bu sÄ±nÄ±fta bulunanlarÄ±n Recency deÄŸeri 3 ve 4, Frequency deÄŸeri ise 4 ve 5 skorlarÄ±ndan oluÅŸur.
 * At Risk sÄ±nÄ±fÄ±nda bulunanlar ise riskli sÄ±nÄ±fÄ± temsil eder. Bu sÄ±nÄ±fta bulunanlarÄ±n Recency deÄŸeri 1 ve 2, Frequecny deÄŸeri ise 3 ve 4 skorlarÄ±ndan oluÅŸur. Yani En son satÄ±n alma tarihi Ã¼zerinden uzun bir sÃ¼re geÃ§miÅŸ ve bu uzun sÃ¼re Ã¶nce satÄ±n alma sayÄ±larÄ± ortalama olan mÃ¼ÅŸterilerdir.
 
Tabloyu bu ÅŸekilde yorumlayabiliriz.

![](https://miro.medium.com/max/805/1*TjJt4rUiBtXLAF84--V-Cg.png)

Biz artÄ±k RFM skorlarÄ±mÄ±zÄ± oluÅŸturduk. Åžimdi ise bu skorlarÄ± kullanarak mÃ¼ÅŸterilerimizi yukarÄ±da gÃ¶rdÃ¼ÄŸÃ¼mÃ¼z tablo Ã¶zelinde segmentlere ayÄ±racaÄŸÄ±z. Ã–rneÄŸin Frequency deÄŸeri 5 ve Recency deÄŸeri 5 olan mÃ¼ÅŸterimize "Champions" sÄ±nÄ±fÄ±nda yer vereceÄŸiz.

In [None]:
# Ã–nce bir segment deÄŸiÅŸkeni atayalÄ±m. ToplamlarÄ±nÄ± yukarÄ±daki tabloyu oluÅŸtururken kullanacaÄŸÄ±z.
# Tipi str yapmamÄ±n sebebi ise matematiksel olarak toplama iÅŸlemi yapmayacaÄŸÄ±z. Sadece rakamlarÄ± yan yana getireceÄŸiz.
# AÅŸaÄŸÄ±da tabloda rfm_segment deÄŸiÅŸkeninde yaptÄ±ÄŸÄ±mÄ±z iÅŸlem gÃ¶rÃ¼lmektedir.
rfm['rfm_segment'] = rfm['recency_score'].astype(str) + rfm['frequency_score'].astype(str)
rfm.head()

In [None]:
# Bu tablo bile bize birÅŸeyler anlatmaktadÄ±r. 
# Ã–rneÄŸin satÄ±n alma davranÄ±ÅŸÄ± en iyi mÃ¼ÅŸterilerimizi gÃ¶relim.
rfm[rfm["rfm_segment"] == "55"].head()

In [None]:
# SatÄ±n alma davranÄ±ÅŸÄ± en kÃ¶tÃ¼ mÃ¼ÅŸterilerimizi gÃ¶relim.
rfm[rfm["rfm_segment"] == "11"].head()

In [None]:
# Åžimdi ise aÅŸaÄŸÄ±daki Regular Expressions(Regex) yapÄ±sÄ±yla mÃ¼ÅŸterilerimizi RFM skorlarÄ±na gÃ¶re yukarÄ±da incelediÄŸimiz renkli tablodaki RFM segmentlerine atayacaÄŸÄ±z.
# MÃ¼ÅŸterilerimizin Recency ve Frequency skorlarÄ±na gÃ¶re hangi segmentte yer alacaÄŸÄ±nÄ± aÅŸaÄŸÄ±da tek tek belirtiyoruz.
# Ã–rneÄŸin Recency deÄŸeri 1-2, Frequency deÄŸeri ise 3 veya 4 olan mÃ¼ÅŸteriler At_risk segmentine atanacaktÄ±r.
seg_map = {
        r'[1-2][1-2]': 'hibernating',
        r'[1-2][3-4]': 'at_risk',
        r'[1-2]5': 'cant_loose',
        r'3[1-2]': 'about_to_sleep',
        r'33': 'need_attention',
        r'[3-4][4-5]': 'loyal_customers',
        r'41': 'promising',
        r'51': 'new_customers',
        r'[4-5][2-3]': 'potential_loyalists',
        r'5[4-5]': 'champions'
    }

In [None]:
# Bu Regex yapÄ±sÄ±nÄ±, RFM tablomuzdaki rfm_segment isimli deÄŸiÅŸkenle deÄŸiÅŸtirip dataframe'e Ã§evirme iÅŸlemi yapÄ±yoruz.
# rfm_segment deÄŸiÅŸkenimizde mÃ¼ÅŸterilerimizin hangi sÄ±nÄ±fta/segmentte olduÄŸunu gÃ¶rebiliyoruz.
rfm['rfm_segment'] = rfm['rfm_segment'].replace(seg_map, regex=True)

In [None]:
rfm = rfm[["recency", "frequency", "monetary", "rfm_segment"]]
rfm.head()

In [None]:
# Segmentlerde kaÃ§ar mÃ¼ÅŸterimiz var?
# Segmentlerin betimsel istatistiklerini inceleyelim.
rfm[["rfm_segment", "recency", "frequency", "monetary"]].groupby("rfm_segment").agg(["mean","median", "count"])

In [None]:
# Bu satÄ±rdaki iÅŸlemleri gÃ¶rselleÅŸtirme yapabilmek iÃ§in uyguladÄ±m.
# Bu satÄ±rdaki iÅŸlemler projemiz ile ilgili bir kod iÃ§ermemektedir.
rfm1 = rfm[["rfm_segment", "recency", "frequency", "monetary"]].groupby("rfm_segment").agg(["mean","median", "count"])
rfm1.columns = rfm1.columns.droplevel(0)
rfm1.reset_index(inplace=True)
rfm1.columns = ["rfm_segment","boÅŸ","boÅŸ","count","boÅŸ","boÅŸ","boÅŸ","boÅŸ","boÅŸ","boÅŸ"]
rfm1 = rfm1.sort_values(by="count", ascending=False)

In [None]:
# Matplotlib kÃ¼tÃ¼phanesini import ederek bir pie chart oluÅŸturdum.
# AÅŸaÄŸÄ±daki gÃ¶rselde mÃ¼ÅŸterilerimizin segmentlere gÃ¶re daÄŸÄ±lÄ±mÄ±nÄ± gÃ¶rÃ¼yoruz. 

import matplotlib.pyplot as plt

colors = ['#C2C2C2', '#5BADFF', '#33FF99', '#FFAB4B', 
          '#C184FF', '#AD6F33','#FFFF5B','#85BBB2',
          '#FF8484','#33FFFF']

fig1, ax1 = plt.subplots(figsize=(10,7))

ax1.pie(rfm1["count"] ,labels=rfm1["rfm_segment"].unique() ,colors=colors, 
        explode=[0,0.1,0.1,0.1,0,0,0,0,0,0] ,autopct='%1.1f%%');

### RFM Analizi Sonucu Yorumlama ve Aksiyon KararlarÄ±

RFM Segmentasyonu oluÅŸturarak RFM analizi sÃ¼recini tamamladÄ±k.YukarÄ±daki gÃ¶rsellerden faydalanarak betimsel istatistik tablolarÄ±nÄ± daha detaylÄ± bir ÅŸekilde analiz ettim. RFM Analizi sonucunda yukarÄ±daki gÃ¶rselde pasta dilimi olarak ayÄ±rdÄ±ÄŸÄ±m 3 farklÄ± segmenti seÃ§erek bu sÄ±nÄ±flar genelinde yorumlamalar ve bu sÄ±nÄ±fta bulunan mÃ¼ÅŸterilerimizle ilgili alÄ±nmasÄ± gereken aksiyon planlarÄ±nÄ± aÅŸaÄŸÄ±da gÃ¶rebilirsiniz.

#### Kapsam ve AmaÃ§ :

 * RFM Analizi sonucunda tablodaki 3 segmentin seÃ§ilmesinde segmentlerin mÃ¼ÅŸteri sayÄ±larÄ±nÄ±n daÄŸÄ±lÄ±mÄ± dikkate alÄ±nmÄ±ÅŸtÄ±r. 
 * En Ã§ok hangi segmentte mÃ¼ÅŸteri daha fazla ise o segmente aksiyon alabiliriz.
 * Veride 2010-2011 yÄ±llarÄ± arasÄ±ndaki tekil mÃ¼ÅŸteri sayÄ±sÄ± 4338â€™dir. 
 * Bu mÃ¼ÅŸterilerin %19â€™u Loyal_Customers, %15â€™i Champions, %14â€™Ã¼ At_Risk segmentlerine aittir.
 * Hibernating grubu en Ã§ok mÃ¼ÅŸterimizin bulunduÄŸu grup olmasÄ±na raÄŸmen ortalama 217 gÃ¼n ile gÃ¼ncel alÄ±ÅŸveriÅŸ deÄŸeri en eski olan gruptur. MÃ¼ÅŸterilerin bu grupta bulunmasÄ±na raÄŸmen Recency deÄŸeri ortalamasÄ±nÄ± gÃ¶z Ã¶nÃ¼nde bulundurduÄŸumuzda ÅŸimdilik bu segment aksiyon aÃ§Ä±sÄ±ndan dikkate alÄ±nmamÄ±ÅŸtÄ±r.
 
#### LOYAL CUSTOMERS
 
 * Bu grupta 819 kiÅŸi yer alÄ±yor.
 * Ortalama 33 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸlar.
 * Bu gruptaki mÃ¼ÅŸterilerin satÄ±n alma sayÄ±larÄ± ise ortalama 6â€™dÄ±r. Bu veri setinde bulunan mÃ¼ÅŸteriler, tÃ¼m segmentlerdeki mÃ¼ÅŸterilere oranla %52 daha fazla alÄ±ÅŸveriÅŸ yapmÄ±ÅŸlardÄ±r. (Genel ortalama satÄ±n alma sayÄ±sÄ± 4,27)
 * Grubun ortalama harcama tutarÄ± ise 2864,00Â£. Bu veri setinde harcama yapmÄ±ÅŸ olan tÃ¼m mÃ¼ÅŸterilere oranla %39 daha fazla harcama tutarÄ± gerÃ§ekleÅŸtirmiÅŸlerdir.   

*Aksiyon Ã–nerileri :*
 * Bu grupla ilgilenerek Champions segmentine dahil olmasÄ± saÄŸlanmalÄ±dÄ±r. Buna elveriÅŸli mÃ¼ÅŸteriler mevcuttur.
 * Champions grubundaki Ã¶zel iÃ§erikleri arttÄ±rarak bu grup teÅŸvik edilebilir. 
 * Bu segmentin Recency deÄŸeri yani alÄ±ÅŸveriÅŸ sÃ¼relerini Ã¶ne Ã§ekebilecek ÅŸekilde daha fazla temas halinde olmalÄ±yÄ±z.

#### CHAMPÄ°ONS

 * Bu grupta 633 kiÅŸi yer alÄ±yor.
 * Ortalama 6 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸlar.
 * Bu gruptaki mÃ¼ÅŸterilerin satÄ±n alma sayÄ±larÄ± ise ortalama 12â€™dÄ±r. 
 * Grubun ortalama harcama tutarÄ± ise 6857,96Â£. 

*Aksiyon Ã–nerileri :*
 * Kalite ve fiyat aÃ§Ä±sÄ±ndan en tepede olan Ã¼rÃ¼nleri bu segmente Ã¶nerebiliriz.
 * Piyasaya yeni sÃ¼rÃ¼len ve kullanÄ±cÄ±lara tanÄ±tÄ±lacak Ã¼rÃ¼nleri bu gruba Ã¼cretsiz gÃ¶ndererek deneyimlerinden deÄŸer ortaya Ã§Ä±karabiliriz.
 * Bu segmente Ã¶zel kartlarla anlaÅŸmalÄ± giyim, aksesuar ve yiyecek, iÃ§ecek yerlerinden indirim saÄŸlanabilir. GerÃ§ekten ayrÄ±calÄ±klÄ± olduklarÄ±nÄ± hissettirmemiz gerekir.
 
#### AT RÄ°SK

 * Bu grupta 593 kiÅŸi yer alÄ±yor.
 * Ortalama 153 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸlar.
 * Bu gruptaki mÃ¼ÅŸterilerin satÄ±n alma sayÄ±larÄ± ise ortalama 2,87â€™dÄ±r. Bu veri setinde bulunan mÃ¼ÅŸteriler, tÃ¼m segmentlerdeki mÃ¼ÅŸterilere oranla %33 daha **az** alÄ±ÅŸveriÅŸ yapmÄ±ÅŸlardÄ±r. (Genel ortalama alÄ±ÅŸveriÅŸ sayÄ±sÄ± 4,27)
 * Grubun ortalama harcama tutarÄ± ise 1084,54Â£. Bu veri setinde harcama yapmÄ±ÅŸ olan tÃ¼m mÃ¼ÅŸterilere oranla %47 daha **az** harcama tutarÄ± gerÃ§ekleÅŸtirmiÅŸlerdir.   

*Aksiyon Ã–nerileri :*
 * Sms yoluyla iletiÅŸime geÃ§ilebilir.
 * Bu gruptaki mÃ¼ÅŸterilerin uyku grubuna geÃ§me durumlarÄ± Ã§ok yÃ¼ksek. Bu gruba Ã¶zel indirimler ve kampanyalar tanÄ±mlanabilir.

---

# 4- Calculated CLTV

Åžirketimizdeki tÃ¼m mÃ¼ÅŸterilerden elde edilen toplam kazanÃ§, toplam sipariÅŸ sayÄ±sÄ±, toplam mÃ¼ÅŸteri sayÄ±sÄ± gibi durumlarÄ± tÃ¼m mÃ¼ÅŸteriler Ã¶zelinde kÄ±yaslayarak her bir mÃ¼ÅŸterinin ÅŸirketimizdeki deÄŸerini hesaplayacaÄŸÄ±z. SonrasÄ±nda mÃ¼ÅŸterilerimizi bu yaÅŸam deÄŸerine gÃ¶re segmentlere ayÄ±racaÄŸÄ±z.

MÃ¼ÅŸteri deÄŸerini hesaplamak iÃ§in bazÄ± metriklere ihtiyacÄ±mÄ±z var. Bu metrikler ;

![](https://cdn-images-1.medium.com/max/800/1*qOR8X-PBdKHXXgLIqjc-SA.png)

![](https://cdn-images-1.medium.com/max/800/1*YzP7_bHcQYl6Hss8wp7aoA.png)

TÃ¼m bu adÄ±mlarÄ± gerÃ§ekleÅŸtirerek mÃ¼ÅŸterimizin bizim ÅŸirketimizdeki deÄŸerini hesaplayacaÄŸÄ±z. Bu deÄŸere gÃ¶re onlarÄ± tekrar segmentlere atayacaÄŸÄ±z.

In [None]:
# OluÅŸturduÄŸumuz RFM tablosu Ã¼zerinden ilk Ã¶nce avg_order _value deÄŸerini hesaplayacaÄŸÄ±z.
# MÃ¼ÅŸterinin her iÅŸlemde ortalama ne kadar bÄ±raktÄ±ÄŸÄ±nÄ± buluyoruz.
rfm['avg_order_value'] = rfm['monetary'] / rfm['frequency']

In [None]:
# purchase_frequency deÄŸerini hesaplÄ±yoruz. Bu iÅŸlemle genele gÃ¶re standartlaÅŸtÄ±rma yapÄ±yoruz.
# Toplam sipariÅŸ sayÄ±sÄ± / toplam mÃ¼ÅŸteri sayÄ±sÄ±
rfm["purchase_frequency"] = rfm['frequency'] / rfm.shape[0]

In [None]:
# Profit_margin
# MÃ¼ÅŸterinin toplam harcama tutarÄ±ndan %0.5 kar ettiÄŸimizi varsayÄ±yoruz.
rfm['profit_margin'] = rfm['monetary'] * 0.05

In [None]:
# Repeat_rate ve churn_rate
# Veri setinde en az 1 kere alÄ±ÅŸveriÅŸ yapan mÃ¼ÅŸteri sayÄ±sÄ± / tÃ¼m mÃ¼ÅŸteri sayÄ±sÄ±
repeat_rate = rfm[rfm.frequency > 1].shape[0] / rfm.shape[0]
churn_rate = 1 - repeat_rate

In [None]:
# Customer Value
rfm['cv'] = (rfm['avg_order_value'] * rfm["purchase_frequency"])

In [None]:
# Customer Lifetime Value
rfm['cltv'] = (rfm['cv'] / churn_rate) * rfm['profit_margin']

In [None]:
# MÃ¼ÅŸteri yaÅŸam boyu deÄŸerini artÄ±k hesapladÄ±k.
rfm.head()

In [None]:
# MinMaxScaler
# BulduÄŸumuz CLTV deÄŸerini daha kolay okumak adÄ±na 1-100 arasÄ± puanlÄ±yoruz.
# cltv_c adÄ±nda yeni bir deÄŸiÅŸkene atÄ±yoruz.Calculate edilmiÅŸ cltv deÄŸerine eriÅŸiyoruz.
scaler = MinMaxScaler(feature_range=(1, 100))
scaler.fit(rfm[["cltv"]])
rfm["cltv_c"] = scaler.transform(rfm[["cltv"]])

In [None]:
# ArtÄ±k bu hesaplanmÄ±ÅŸ mÃ¼ÅŸteri yaÅŸam deÄŸeri Ã¼zerinden de mÃ¼ÅŸterilerim arasÄ±nda bir segment oluÅŸturabilirim.
#.qcut() fonksiyonu ile bÃ¼yÃ¼kten kÃ¼Ã§Ã¼ÄŸe sÄ±ralayÄ±p en dÃ¼ÅŸÃ¼k segment C, en iyi mÃ¼ÅŸterilerin bulunduÄŸu segment A olacak ÅŸekilde grupluyoruz.
rfm["cltv_c_segment"] = pd.qcut(rfm["cltv_c"], 3, labels=["C", "B", "A"])

In [None]:
# Ä°lk oluÅŸturduÄŸum RFM tablosu ile beraber hesaplanan cltv deÄŸeri ve bu deÄŸere gÃ¶re oluÅŸturduÄŸum segmenti tek bir dataframe'de topluyorum. 
rfm_cltv = rfm[["recency", "frequency", "monetary", "rfm_segment","cltv_c", "cltv_c_segment"]]

In [None]:
# HesapladÄ±ÄŸÄ±mÄ±z mÃ¼ÅŸteri yaÅŸam boyu deÄŸerine gÃ¶re mÃ¼ÅŸterilerimizi segmentlere ayÄ±rdÄ±k.
rfm_cltv.sort_values(by="cltv_c", ascending=False).head()

---

# 5- Predicted CLTV

TÃ¼m mÃ¼ÅŸterilerimizin kullanÄ±cÄ± davranÄ±ÅŸlarÄ±nÄ± gÃ¶z Ã¶nÃ¼nde bulundurarak belli bir zaman projeksiyonu ile geleceÄŸe yÃ¶nelik Customer Life Time Value tahmini yapacaÄŸÄ±z.

MÃ¼ÅŸteriye ait elimizde ortalama en son ne zaman satÄ±n alma yaptÄ±ÄŸÄ±, bÄ±raktÄ±ÄŸÄ± gelir ve satÄ±n alma frekansÄ± olsa da ileriye dÃ¶nÃ¼k tahmin yapamÄ±yor olmamÄ±zÄ±n sebebi,
 * Åžirket aÃ§Ä±sÄ±ndan tÃ¼m mÃ¼ÅŸterilerin davranÄ±ÅŸ daÄŸÄ±lÄ±mÄ± elimizde yok.
 * Bireyler aÃ§Ä±sÄ±ndan da bu olasÄ±lÄ±k daÄŸÄ±lÄ±mÄ±na gÃ¶re bir tahmin yok.

BG-NBD ve Gamma-Gamma modelleri ile bu sorunu Ã§Ã¶zerek ileriye dÃ¶nÃ¼k tahminleme yapmÄ±ÅŸ olacaÄŸÄ±z.

CLTV tahmini gerÃ§ekleÅŸtirirken RFM tablosuna benzer bir tablo oluÅŸturup, ek olarak Tenure deÄŸeri ekleyeceÄŸiz. **Tenure**, mÃ¼ÅŸterinin ÅŸirket ile ilk kontaÄŸÄ±ndan referans belirlediÄŸimiz tarihe kadar geÃ§en zaman olarak tanÄ±mlanÄ±r. BelirlediÄŸimiz referans tarihten mÃ¼ÅŸterinin ilk satÄ±n alma yaptÄ±ÄŸÄ± tarih Ã§Ä±karÄ±larak hesaplanabilir. Buna ek olarak Recency deÄŸeri hesaplarken referans tarihimizden son satÄ±n alma tarihini Ã§Ä±karÄ±yorduk. Ancak CLTV tahmini yaparken mÃ¼ÅŸterinin satÄ±n alma yaptÄ±ÄŸÄ± son tarihten, satÄ±n alma yaptÄ±ÄŸÄ± ilk tarihi Ã§Ä±karmamÄ±z gerekiyor. Bunun sebebi ise; BGNBD ve Gamma-Gamma modelleri formÃ¼lleri bizden argÃ¼manlarÄ± bu hesaplama mantÄ±ÄŸÄ±yla istiyor. 

 * **recency_cltv_p :** `lambda date: (date.max() - date.min()).days`
 * **Tenure :** `lambda date: (today_date - date.min()).days`
 

In [None]:
#Referans seÃ§tÄŸimiz tarihi hatÄ±rlayarak baÅŸlayalÄ±m.
today_date

In [None]:
# RFM tablosuna benzer tablomuzu oluÅŸturuyoruz.
rfm = df.groupby('Customer ID').agg({'InvoiceDate': [lambda date: (date.max() - date.min()).days,
                                                                lambda date: (today_date - date.min()).days],
                                                'Invoice': lambda num: num.nunique(),
                                                'TotalPrice': lambda TotalPrice: TotalPrice.sum()})

In [None]:
#HiyerarÅŸik index yapÄ±sÄ± oluÅŸtuÄŸundan dolayÄ± onu ortadan kaldÄ±rÄ±yoruz.
rfm.columns = rfm.columns.droplevel(0)

In [None]:
rfm.head()

In [None]:
# DeÄŸiÅŸkenler lambda olarak geldiÄŸi iÃ§in sÃ¼tunlarÄ± tekrar isimlendiriyoruz. 
rfm.columns = ['recency_cltv_p', 'T', 'frequency', 'monetary']

In [None]:
# Gamma gamma modeli klasik monetry deÄŸerini deÄŸil de ortalama monetray deÄŸerini ister.
# Her bir iÅŸlemde(Frequency) mÃ¼ÅŸteri ortalama ne kadar bÄ±rakmÄ±ÅŸ.
# Her bir mÃ¼ÅŸteri Her bir faturada ortalama ne kadar kazandÄ±rmÄ±ÅŸ.
rfm["monetary"] = rfm["monetary"] / rfm["frequency"]

In [None]:
# monetary deÄŸeri Gamma-Gamma modeline uygun hale geldi.
rfm.head()

In [None]:
# Gamma-Gamma modeli iÃ§in yapmÄ±ÅŸ olduÄŸumuz deÄŸiÅŸikliÄŸin farkedilmesi aÃ§Ä±sÄ±ndan monetary deÄŸerini de monetary_avg olarak deÄŸiÅŸtiriyoruz. 
rfm.rename(columns={"monetary": "monetary_avg"}, inplace=True)

In [None]:
# BGNB Modeli iÃ§in haftalÄ±k Recency (recency_weekly_p) ve haftalÄ±k Tenure (T_weekly) deÄŸerlerini hesaplÄ±yoruz.
# Bu deÄŸerler kaÃ§ hafta Ã¶nce alÄ±ÅŸveriÅŸ yaptÄ±ÄŸÄ± ve kaÃ§ haftalÄ±k mÃ¼ÅŸteri oldupu bilgisini veriyor.
rfm["recency_weekly_cltv_p"] = rfm["recency_cltv_p"] / 7  # kaÃ§ hafta Ã¶nce alÄ±ÅŸveriÅŸ yaptÄ±ÄŸÄ±
rfm["T_weekly"] = rfm["T"] / 7  # kaÃ§ haftalÄ±k mÃ¼ÅŸteri olduÄŸu

In [None]:
# Kontrol iÃ§in monetary_avg deÄŸerlerinin "0" dan bÃ¼yÃ¼k olanlarÄ± alÄ±yoruz.
rfm = rfm[rfm["monetary_avg"] > 0]

In [None]:
# Daha saÄŸlÄ±klÄ± bir CLTV hesabÄ± iÃ§in; 
rfm = rfm[(rfm['frequency'] > 1)]

In [None]:
rfm.head()

In [None]:
# BG-NBD ve Gamma-Gamma modelleri frequency deÄŸerini float istemiyor.
# O yÃ¼zden kontrol amaÃ§lÄ± yine de frequency tipini int yapÄ±yoruz.
rfm["frequency"] = rfm["frequency"].astype(int)

In [None]:
# BGNBD modelinin fit edilmesi, BG-NBD modelinin fit edilmesi ile beklenen satÄ±ÅŸ adetlerinin tahmini adÄ±mÄ±na geÃ§ebiliriz. 
bgf = BetaGeoFitter(penalizer_coef=0.01)
    
bgf.fit(rfm['frequency'],
        rfm['recency_weekly_cltv_p'],
        rfm['T_weekly'])

In [None]:
# 1 aylÄ±k beklenen satÄ±ÅŸlarÄ±n tahminini veren kod.
# recency_weekly_cltv_p ve T_weekly deÄŸerini haftalÄ±k deÄŸere Ã§evirdiÄŸimiz iÃ§in modelde 4 yazmamÄ±z bize 1 aylÄ±k beklenen satÄ±ÅŸlarÄ± verir.
rfm["exp_sales_1_month"] = bgf.predict(4,
                                        rfm['frequency'],
                                        rfm['recency_weekly_cltv_p'],
                                        rfm['T_weekly'])

In [None]:
# 3 aylÄ±k beklenen satÄ±ÅŸlarÄ±n tahminini veren kod.
rfm["exp_sales_3_month"] = bgf.predict(12,
                                        rfm['frequency'],
                                        rfm['recency_weekly_cltv_p'],
                                        rfm['T_weekly'])

In [None]:
# MÃ¼ÅŸterilerin geleceÄŸe yÃ¶nelik 1 ve 3 aylÄ±k periyotta beklenen satÄ±ÅŸlarÄ±nÄ± tabloda gÃ¶rÃ¼yoruz.
rfm.head()

In [None]:
# Gamma-Gamma modelinin fit edilmesi, Gamma-Gamma modelinin fit edilmesi ile beklenen karlÄ±lÄ±k tahmini adÄ±mÄ±na geÃ§ebiliriz. 
ggf = GammaGammaFitter(penalizer_coef=0.01)

ggf.fit(rfm['frequency'], rfm['monetary_avg'])

rfm["expected_average_profit"] = ggf.conditional_expected_average_profit(rfm['frequency'],
                                                                         rfm['monetary_avg'])

In [None]:
# Tabloda gÃ¶rÃ¼nen expacted_average_profit ile mÃ¼ÅŸterilerin beklenen karlÄ±lÄ±ÄŸÄ±nÄ±n tahmin etmiÅŸ olduk. 
rfm.head()

In [None]:
# MÃ¼ÅŸterilerin 6 aylÄ±k CLTV_p deÄŸerini hesaplÄ±yoruz
cltv = ggf.customer_lifetime_value(bgf,
                                    rfm['frequency'],
                                    rfm['recency_weekly_cltv_p'],
                                    rfm['T_weekly'],
                                    rfm['monetary_avg'],
                                    time=6,
                                    freq="W",
                                    discount_rate=0.01)

In [None]:
rfm["cltv_p"] = cltv

In [None]:
# Her bir mÃ¼ÅŸteri iÃ§in cltv_p tahminini hesaplamÄ±ÅŸ olduk.
# 1-100 arasÄ±nda puanlayarak daha iyi okunabilmesini saÄŸlayalÄ±m.
scaler = MinMaxScaler(feature_range=(1, 100))
scaler.fit(rfm[["cltv_p"]])
rfm["cltv_p"] = scaler.transform(rfm[["cltv_p"]])

In [None]:
# 1-100 arasÄ±ndaki cltv_p deÄŸerlerini segmentlere ayÄ±rÄ±yoruz.
rfm["cltv_p_segment"] = pd.qcut(rfm["cltv_p"], 3, labels=["C", "B", "A"])

In [None]:
#6 aylÄ±k CLTV Prediction segmentlerini de oluÅŸturmuÅŸ olduk.
rfm.head()

MÃ¼ÅŸterilerimizle ilgili detaylÄ± kararlar alabilmek iÃ§in RFM Analizi, CLTV Calculate ve CLTV Prediction Ã§Ä±ktÄ±larÄ±nÄ±n hepsini tek bir crm_final olarak oluÅŸturarak gerekli yorumlar ve aksiyon kararlarÄ±nÄ± gerÃ§ekleÅŸtirebiliriz. 

In [None]:
# MÃ¼ÅŸterilerimizle ilgili detaylÄ± kararlar alabilmek iÃ§in Ã§Ä±ktÄ±larÄ± birleÅŸtiriyoruz.
crm_final = rfm_cltv.merge(rfm, on="Customer ID", how="left")

In [None]:
crm_final.head(10)

Ã‡Ä±ktÄ±da boÅŸ gelen deÄŸerler ÅŸu ana kadar 1 satÄ±n alma gerÃ§ekleÅŸtiren mÃ¼ÅŸterilerimizi ifade etmektedir. HatÄ±rlayacak olursak CLTV Prediction hesabÄ±nda bunlarÄ± Ã§alÄ±ÅŸmanÄ±n dÄ±ÅŸÄ±nda tutmuÅŸtuk. En az 1'den fazla satÄ±n alma gerÃ§ekleÅŸtiren mÃ¼ÅŸterilerin ileriye dÃ¶nÃ¼k mÃ¼ÅŸteri yaÅŸam boyu deÄŸerlerini hesaplamÄ±ÅŸtÄ±k.

CRM Ã§alÄ±ÅŸmalarÄ± Ã¶zelinde ele alacaÄŸÄ±mÄ±z konularÄ± tamamladÄ±k. 

Peki biz Ã¶zet olarak ne yaptÄ±kÂ ?Â 

 * 1- Mevcut mÃ¼ÅŸterilerimizin  satÄ±n alma davranÄ±ÅŸlarÄ±nÄ± gÃ¶z Ã¶nÃ¼nde bulundurarak RFM analizi ile mÃ¼ÅŸterilerimizi segmentlere ayÄ±rÄ±p onlar iÃ§in Ã¶zel kararlar alabildik. (RFM_Segmentation)
     
 * 2- SonrasÄ±nda ÅŸirketimizdeki tÃ¼m mÃ¼ÅŸterilerin davranÄ±ÅŸlarÄ±nÄ± kÄ±yaslayarak ve tek bir mÃ¼ÅŸterinin satÄ±n alma alÄ±ÅŸkanlÄ±klarÄ±nÄ± gÃ¶z Ã¶nÃ¼nde bulundurup onun ÅŸirket iÃ§indeki deÄŸerini bulduk. (CLTV_Calculate)
     
 * 3- En sonunda ise hem uzun sÃ¼redir bizde olan hem de yeni gelmiÅŸ mÃ¼ÅŸterilerin satÄ±n alma davranÄ±ÅŸlarÄ±nÄ± gÃ¶z Ã¶nÃ¼nde bulundurarak BGNBD ve Gamma-Gamma modellerini kullanÄ±p geleceÄŸe yÃ¶nelik bir zaman projeksiyonu koyarak mÃ¼ÅŸterimizin ÅŸirketimizdeki diÄŸer mÃ¼ÅŸteriler genelinde deÄŸerini tahminledik. (CLTV_Prediction)
     
TÃ¼m bu Ã§alÄ±ÅŸmanÄ±n sonunda oluÅŸturmuÅŸ olduÄŸumuz CRM_final Ã§Ä±ktÄ±sÄ±nÄ± tÃ¼m deÄŸiÅŸkenler Ã¶zelinde deÄŸerlendirdim. YorumlarÄ±ma aÅŸaÄŸÄ±da yer verdir. 


### CRM_Final Sonucu Yorumlama ve Aksiyon KararlarÄ±

AÅŸaÄŸÄ±da CLTV Calculateâ€™e gÃ¶re A segmentinde olduÄŸu hesaplanan 3 farklÄ± mÃ¼ÅŸterinin CLTV Predictionâ€™a gÃ¶re nasÄ±l farklÄ± segmentte yer aldÄ±ÄŸÄ±nÄ± deÄŸerlendireceÄŸiz. AÅŸaÄŸÄ±daki yorumlar Ã¶zelinde A segmenti en iyi mÃ¼ÅŸteriler, C segmenti en kÃ¶tÃ¼ mÃ¼ÅŸterileri ifade eder.

 * 1.satÄ±rdaki mÃ¼ÅŸterinin Calculate sonucu A segmentinde olacaÄŸÄ± deÄŸerlendirilirken Prediction sonucu B segmentinde olduÄŸu gÃ¶zlemleniyor. Bunun sebeplerinden biri "Recency" deÄŸeri yani 10 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸ olmasÄ±na raÄŸmen, mÃ¼ÅŸterinin yaptÄ±ÄŸÄ± 17 alÄ±ÅŸveriÅŸ sonucunda bÄ±raktÄ±ÄŸÄ± ortalama "monetary_avg" diÄŸer 2 kiÅŸiye gÃ¶re daha az tutardÄ±r.
 
 * 2.satÄ±rdaki mÃ¼ÅŸteri ise tahmin edilen ortalama harcama tutarÄ± diÄŸer 1. satÄ±rdaki mÃ¼ÅŸteriden daha yÃ¼ksek olmasÄ±na karÅŸÄ±n Prediction sonucu C segmentinde gÃ¶zlemleniyor. Bunun sebebi "frequency" deÄŸerinin 5 olmasÄ±yla birlikte en son 219 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸ ve buna karÅŸÄ±lÄ±k "recency_cltv_p" ise yani son alÄ±ÅŸveriÅŸ ve ilk alÄ±ÅŸveriÅŸ arasÄ±ndaki gÃ¼n farkÄ± ise 153 gÃ¼n hesaplanmÄ±ÅŸ. Yani ben bu mÃ¼ÅŸteriden ilk alÄ±ÅŸveriÅŸ ve son alÄ±ÅŸveriÅŸ tarihi aralÄ±ÄŸÄ±nÄ± maksimum 153 gÃ¼n beklerken mÃ¼ÅŸteri 219 gÃ¼ndÃ¼r yok. En son 219 gÃ¼n Ã¶nce alÄ±ÅŸveriÅŸ yapmÄ±ÅŸ. ArtÄ±k mÃ¼ÅŸterinin beni terk ettiÄŸi yorumu yapabilirim. Bu sebeple Prediction sonucu C segmentinde yer alÄ±yor.
 
 * 3.satÄ±rdaki mÃ¼ÅŸteri Calculate segmenti A ve Prediction sonucu segmenti de A olarak hesaplanmÄ±ÅŸ. Bu mÃ¼ÅŸterinin "frequency" deÄŸeri dÃ¼ÅŸÃ¼k olmasÄ±na raÄŸmen "monetray_avg" deÄŸerinden dolayÄ± yani yapmÄ±ÅŸ olduÄŸu alÄ±ÅŸveriÅŸlerden yÃ¼ksek para bÄ±rakacaÄŸÄ±ndan dolayÄ± Prediction sonucu A segmenti olarak tahmin edilmiÅŸtir.

![image-2.png](attachment:image-2.png)

Projemi incelediÄŸiniz iÃ§in teÅŸekkÃ¼rler.