In [1]:
import pandas as pd
import numpy as np
import seaborn as sns
from sklearn.preprocessing import MinMaxScaler
import datetime as dt



### İş Problemi (Business Problem)

- FLO müşterilerini segmentlere ayırıp bu segmentlere göre pazarlama stratejileri belirlemek istiyor.
- Buna yönelik olarak müşterilerin davranışları tanımlanacak ve bu davranış öbeklenmelerine göre gruplar oluşturulacak..


### Veri Seti Hikayesi


- Veri seti son alışverişlerini 2020 - 2021 yıllarında OmniChannel(hem online hem offline alışveriş yapan) olarak yapan müşterilerin geçmiş alışveriş davranışlarından
- elde edilen bilgilerden oluşmaktadır.

- master_id: Eşsiz müşteri numarası
- order_channel : Alışveriş yapılan platforma ait hangi kanalın kullanıldığı (Android, ios, Desktop, Mobile, Offline)
- last_order_channel : En son alışverişin yapıldığı kanal
- first_order_date : Müşterinin yaptığı ilk alışveriş tarihi
- last_order_date : Müşterinin yaptığı son alışveriş tarihi
- last_order_date_online : Muşterinin online platformda yaptığı son alışveriş tarihi
- last_order_date_offline : Muşterinin offline platformda yaptığı son alışveriş tarihi
- order_num_total_ever_online : Müşterinin online platformda yaptığı toplam alışveriş sayısı
- order_num_total_ever_offline : Müşterinin offline'da yaptığı toplam alışveriş sayısı
- customer_value_total_ever_offline : Müşterinin offline alışverişlerinde ödediği toplam ücret
- customer_value_total_ever_online : Müşterinin online alışverişlerinde ödediği toplam ücret
- interested_in_categories_12 : Müşterinin son 12 ayda alışveriş yaptığı kategorilerin listesi

# GÖREV 1: Veriyi Anlama (Data Understanding) ve Hazırlama
- 1. flo_data_20K.csv verisini okuyunu
- 2. Veri setinde
     - a. İlk 10 gözlem,
     - b. Değişken isimleri,
     - c. Betimsel istatistik,
     - d. Boş değer,
     - e. Değişken tipleri, incelemesi yapınız.
  3. Omnichannel müşterilerin hem online'dan hemde offline platformlardan alışveriş yaptığını ifade etmektedir. Herbir müşterinin toplam
     - alışveriş sayısı ve harcaması için yeni değişkenler oluşturun.
     - 4.Değişken tiplerini inceleyiniz. Tarih ifade eden değişkenlerin tipini date'e çeviriniz.
     - 5.Alışveriş kanallarındaki müşteri sayısının, ortalama alınan ürün sayısının ve ortalama harcamaların dağılımına bakınız.
     - 6.En fazla kazancı getiren ilk 10 müşteriyi sıralayınız.
     - 7. En fazla siparişi veren ilk 10 müşteriyi sıralayınız.
     - 8. Veri ön hazırlık sürecini fonksiyonlaştırınız.


### Soru 1
- flo_data_20K.csv verisini okuyunuz

In [2]:
df_ = pd.read_csv("../input/odev1/FLO_RFM_Analizi/flo_data_20k.csv")
df = df_.copy()
df.head()


Unnamed: 0,master_id,order_channel,last_order_channel,first_order_date,last_order_date,last_order_date_online,last_order_date_offline,order_num_total_ever_online,order_num_total_ever_offline,customer_value_total_ever_offline,customer_value_total_ever_online,interested_in_categories_12
0,cc294636-19f0-11eb-8d74-000d3a38a36f,Android App,Offline,2020-10-30,2021-02-26,2021-02-21,2021-02-26,4.0,1.0,139.99,799.38,[KADIN]
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,Android App,Mobile,2017-02-08,2021-02-16,2021-02-16,2020-01-10,19.0,2.0,159.97,1853.58,"[ERKEK, COCUK, KADIN, AKTIFSPOR]"
2,69b69676-1a40-11ea-941b-000d3a38a36f,Android App,Android App,2019-11-27,2020-11-27,2020-11-27,2019-12-01,3.0,2.0,189.97,395.35,"[ERKEK, KADIN]"
3,1854e56c-491f-11eb-806e-000d3a38a36f,Android App,Android App,2021-01-06,2021-01-17,2021-01-17,2021-01-06,1.0,1.0,39.99,81.98,"[AKTIFCOCUK, COCUK]"
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,Desktop,Desktop,2019-08-03,2021-03-07,2021-03-07,2019-08-03,1.0,1.0,49.99,159.99,[AKTIFSPOR]


### 2. Soru:
Veri setinde
- a. İlk 10 gözlem,
- b. Değişken isimleri,
- c. Boyut,
- d. Betimsel istatistik,
- e. Boş değer,
- f. Değişken tipleri, incelemesi yapınız.


In [3]:
df.head(10)
df.columns
df.shape
df.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
order_num_total_ever_online,19945.0,3.110855,4.225647,1.0,1.0,2.0,4.0,200.0
order_num_total_ever_offline,19945.0,1.913913,2.06288,1.0,1.0,1.0,2.0,109.0
customer_value_total_ever_offline,19945.0,253.922597,301.532853,10.0,99.99,179.98,319.97,18119.14
customer_value_total_ever_online,19945.0,497.32169,832.601886,12.99,149.98,286.46,578.44,45220.13


In [4]:
df.isnull().sum()

master_id                            0
order_channel                        0
last_order_channel                   0
first_order_date                     0
last_order_date                      0
last_order_date_online               0
last_order_date_offline              0
order_num_total_ever_online          0
order_num_total_ever_offline         0
customer_value_total_ever_offline    0
customer_value_total_ever_online     0
interested_in_categories_12          0
dtype: int64

In [5]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 19945 entries, 0 to 19944
Data columns (total 12 columns):
 #   Column                             Non-Null Count  Dtype  
---  ------                             --------------  -----  
 0   master_id                          19945 non-null  object 
 1   order_channel                      19945 non-null  object 
 2   last_order_channel                 19945 non-null  object 
 3   first_order_date                   19945 non-null  object 
 4   last_order_date                    19945 non-null  object 
 5   last_order_date_online             19945 non-null  object 
 6   last_order_date_offline            19945 non-null  object 
 7   order_num_total_ever_online        19945 non-null  float64
 8   order_num_total_ever_offline       19945 non-null  float64
 9   customer_value_total_ever_offline  19945 non-null  float64
 10  customer_value_total_ever_online   19945 non-null  float64
 11  interested_in_categories_12        19945 non-null  obj

### 3.Soru
- Omnichannel müşterilerin hem online'dan hemde offline platformlardan alışveriş yaptığını ifade etmektedir.
- Herbir müşterinin toplam alışveriş sayısı ve harcaması için yeni değişkenler oluşturunuz.

In [6]:
df["total_order"]=df["order_num_total_ever_online"]+df["order_num_total_ever_offline"]
df["total_spend"]=df["customer_value_total_ever_offline"]+df["customer_value_total_ever_online"]
df.head(3)

Unnamed: 0,master_id,order_channel,last_order_channel,first_order_date,last_order_date,last_order_date_online,last_order_date_offline,order_num_total_ever_online,order_num_total_ever_offline,customer_value_total_ever_offline,customer_value_total_ever_online,interested_in_categories_12,total_order,total_spend
0,cc294636-19f0-11eb-8d74-000d3a38a36f,Android App,Offline,2020-10-30,2021-02-26,2021-02-21,2021-02-26,4.0,1.0,139.99,799.38,[KADIN],5.0,939.37
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,Android App,Mobile,2017-02-08,2021-02-16,2021-02-16,2020-01-10,19.0,2.0,159.97,1853.58,"[ERKEK, COCUK, KADIN, AKTIFSPOR]",21.0,2013.55
2,69b69676-1a40-11ea-941b-000d3a38a36f,Android App,Android App,2019-11-27,2020-11-27,2020-11-27,2019-12-01,3.0,2.0,189.97,395.35,"[ERKEK, KADIN]",5.0,585.32


### 4. Soru
- Değişken tiplerini inceleyiniz. Tarih ifade eden değişkenlerin tipini date'e çeviriniz.

In [7]:
date_columns = df.columns[df.columns.str.contains("date")]
df[date_columns] = df[date_columns].apply(pd.to_datetime)
date_columns

Index(['first_order_date', 'last_order_date', 'last_order_date_online',
       'last_order_date_offline'],
      dtype='object')

In [8]:
df["first_order_date"].dtypes

dtype('<M8[ns]')

### 5. Soru
- Alışveriş kanallarındaki müşteri sayısının, toplam alınan ürün sayısı ve toplam harcamaların dağılımına bakınız.

In [9]:
df.groupby("order_channel").agg({"master_id":["count"],
                                "total_order":[sum],
                                "total_spend":[sum]})

Unnamed: 0_level_0,master_id,total_order,total_spend
Unnamed: 0_level_1,count,sum,sum
order_channel,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
Android App,9495,52269.0,7819062.76
Desktop,2735,10920.0,1610321.46
Ios App,2833,15351.0,2525999.93
Mobile,4882,21679.0,3028183.16


### 6. Soru
- En fazla kazancı getiren ilk 10 müşteriyi sıralayınız.

In [10]:
df.sort_values("total_spend",ascending=False).head(10)

Unnamed: 0,master_id,order_channel,last_order_channel,first_order_date,last_order_date,last_order_date_online,last_order_date_offline,order_num_total_ever_online,order_num_total_ever_offline,customer_value_total_ever_offline,customer_value_total_ever_online,interested_in_categories_12,total_order,total_spend
11150,5d1c466a-9cfd-11e9-9897-000d3a38a36f,Android App,Desktop,2013-10-11,2021-04-30,2021-04-30,2020-12-24,200.0,2.0,684.97,45220.13,"[AKTIFCOCUK, ERKEK, COCUK, KADIN, AKTIFSPOR]",202.0,45905.1
4315,d5ef8058-a5c6-11e9-a2fc-000d3a38a36f,Android App,Android App,2018-08-06,2021-02-23,2021-02-23,2020-07-06,67.0,1.0,130.49,36687.8,"[AKTIFCOCUK, ERKEK, KADIN, AKTIFSPOR]",68.0,36818.29
7613,73fd19aa-9e37-11e9-9897-000d3a38a36f,Ios App,Offline,2014-01-14,2021-05-18,2021-01-30,2021-05-18,81.0,1.0,1263.76,32654.34,"[ERKEK, COCUK, KADIN, AKTIFSPOR]",82.0,33918.1
13880,7137a5c0-7aad-11ea-8f20-000d3a38a36f,Ios App,Offline,2021-03-01,2021-04-13,2021-03-18,2021-04-13,10.0,1.0,538.94,30688.47,"[ERKEK, KADIN, AKTIFSPOR]",11.0,31227.41
9055,47a642fe-975b-11eb-8c2a-000d3a38a36f,Android App,Offline,2021-04-07,2021-04-27,2021-04-07,2021-04-27,1.0,3.0,18119.14,2587.2,[AKTIFSPOR],4.0,20706.34
7330,a4d534a2-5b1b-11eb-8dbd-000d3a38a36f,Desktop,Desktop,2020-02-16,2021-04-30,2021-04-30,2020-12-18,66.0,4.0,843.68,17599.89,"[ERKEK, KADIN, AKTIFSPOR]",70.0,18443.57
8068,d696c654-2633-11ea-8e1c-000d3a38a36f,Ios App,Ios App,2017-05-10,2021-04-13,2021-04-13,2019-08-15,69.0,1.0,82.48,16836.09,"[AKTIFCOCUK, ERKEK, COCUK, KADIN, AKTIFSPOR]",70.0,16918.57
163,fef57ffa-aae6-11e9-a2fc-000d3a38a36f,Mobile,Desktop,2016-11-08,2021-05-12,2021-05-12,2020-07-09,36.0,1.0,180.73,12545.37,"[ERKEK, AKTIFSPOR]",37.0,12726.1
7223,cba59206-9dd1-11e9-9897-000d3a38a36f,Android App,Android App,2013-02-21,2021-05-09,2021-05-09,2020-01-25,130.0,1.0,49.99,12232.25,"[AKTIFCOCUK, ERKEK, KADIN, AKTIFSPOR]",131.0,12282.24
18767,fc0ce7a4-9d87-11e9-9897-000d3a38a36f,Desktop,Desktop,2018-11-24,2020-11-11,2020-11-11,2019-12-06,18.0,2.0,64.97,12038.18,"[ERKEK, KADIN]",20.0,12103.15


In [11]:
df["total_spend"].max()

45905.1

### 7. Soru
- En fazla siparişi veren ilk 10 müşteriyi sıralayınız.

In [12]:
df.sort_values("total_order",ascending=False).head(10)

Unnamed: 0,master_id,order_channel,last_order_channel,first_order_date,last_order_date,last_order_date_online,last_order_date_offline,order_num_total_ever_online,order_num_total_ever_offline,customer_value_total_ever_offline,customer_value_total_ever_online,interested_in_categories_12,total_order,total_spend
11150,5d1c466a-9cfd-11e9-9897-000d3a38a36f,Android App,Desktop,2013-10-11,2021-04-30,2021-04-30,2020-12-24,200.0,2.0,684.97,45220.13,"[AKTIFCOCUK, ERKEK, COCUK, KADIN, AKTIFSPOR]",202.0,45905.1
7223,cba59206-9dd1-11e9-9897-000d3a38a36f,Android App,Android App,2013-02-21,2021-05-09,2021-05-09,2020-01-25,130.0,1.0,49.99,12232.25,"[AKTIFCOCUK, ERKEK, KADIN, AKTIFSPOR]",131.0,12282.24
8783,a57f4302-b1a8-11e9-89fa-000d3a38a36f,Android App,Offline,2019-08-07,2020-11-04,2020-09-07,2020-11-04,2.0,109.0,10239.46,143.98,"[AKTIFCOCUK, ERKEK, COCUK, KADIN, AKTIFSPOR]",111.0,10383.44
2619,fdbe8304-a7ab-11e9-a2fc-000d3a38a36f,Android App,Offline,2018-10-18,2020-06-30,2018-10-18,2020-06-30,1.0,87.0,8432.25,139.98,[ERKEK],88.0,8572.23
6322,329968c6-a0e2-11e9-a2fc-000d3a38a36f,Ios App,Ios App,2019-02-14,2021-04-05,2021-04-05,2020-02-17,2.0,81.0,3997.55,242.81,[ERKEK],83.0,4240.36
7613,73fd19aa-9e37-11e9-9897-000d3a38a36f,Ios App,Offline,2014-01-14,2021-05-18,2021-01-30,2021-05-18,81.0,1.0,1263.76,32654.34,"[ERKEK, COCUK, KADIN, AKTIFSPOR]",82.0,33918.1
9347,44d032ee-a0d4-11e9-a2fc-000d3a38a36f,Mobile,Mobile,2019-02-11,2021-02-11,2021-02-11,2020-12-24,3.0,74.0,4640.77,543.28,"[KADIN, AKTIFSPOR]",77.0,5184.05
10954,b27e241a-a901-11e9-a2fc-000d3a38a36f,Mobile,Mobile,2015-09-12,2021-04-01,2021-04-01,2019-10-08,72.0,3.0,292.93,5004.95,"[AKTIFCOCUK, ERKEK, KADIN, AKTIFSPOR]",75.0,5297.88
8068,d696c654-2633-11ea-8e1c-000d3a38a36f,Ios App,Ios App,2017-05-10,2021-04-13,2021-04-13,2019-08-15,69.0,1.0,82.48,16836.09,"[AKTIFCOCUK, ERKEK, COCUK, KADIN, AKTIFSPOR]",70.0,16918.57
7330,a4d534a2-5b1b-11eb-8dbd-000d3a38a36f,Desktop,Desktop,2020-02-16,2021-04-30,2021-04-30,2020-12-18,66.0,4.0,843.68,17599.89,"[ERKEK, KADIN, AKTIFSPOR]",70.0,18443.57


In [13]:
df["total_order"].max()

202.0

### 8. Soru
- Veri ön hazırlık sürecini fonksiyonlaştırınız.

In [14]:
def analiz(dataframe):
    dataframe["total_order"] = dataframe["order_num_total_ever_online"] + dataframe["order_num_total_ever_offline"]
    dataframe["total_spend"] = dataframe["customer_value_total_ever_offline"] + dataframe["customer_value_total_ever_online"]
    date_columns = dataframe.columns[dataframe.columns.str.contains("date")]
    dataframe[date_columns] = dataframe[date_columns].apply(pd.to_datetime)
    return dataframe

In [15]:
df=analiz(df)

# GÖREV 2(RFM Metriklerinin Hesaplanması)

### 1.Soru
- Veri setindeki en son alışverişin yapıldığı tarihten 2 gün sonrasını analiz tarihi

In [16]:
df_time=df.columns[df.columns.str.contains("date")]
df[df_time]=df[df_time].apply(pd.to_datetime)

In [17]:
analiz_date=dt.datetime(2021,2,28)
df[["last_order_date"]]


Unnamed: 0,last_order_date
0,2021-02-26
1,2021-02-16
2,2020-11-27
3,2021-01-17
4,2021-03-07
...,...
19940,2020-07-05
19941,2020-12-22
19942,2021-05-24
19943,2021-02-13


### 2. Soru
- customer_id, recency, frequnecy ve monetary değerlerinin yer aldığı yeni bir rfm dataframe

In [18]:
rfm = pd.DataFrame()
rfm["customer_id"] = df["master_id"]
rfm["recency"] = (analiz_date - df["last_order_date"]).astype('timedelta64[D]')
rfm["frequency"] = df["total_order"]
rfm["monetary"] = df["total_spend"]

In [19]:
rfm

Unnamed: 0,customer_id,recency,frequency,monetary
0,cc294636-19f0-11eb-8d74-000d3a38a36f,2.0,5.0,939.37
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,12.0,21.0,2013.55
2,69b69676-1a40-11ea-941b-000d3a38a36f,93.0,5.0,585.32
3,1854e56c-491f-11eb-806e-000d3a38a36f,42.0,2.0,121.97
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,-7.0,2.0,209.98
...,...,...,...,...
19940,727e2b6e-ddd4-11e9-a848-000d3a38a36f,238.0,3.0,401.96
19941,25cd53d4-61bf-11ea-8dd8-000d3a38a36f,68.0,2.0,390.47
19942,8aea4c2a-d6fc-11e9-93bc-000d3a38a36f,-85.0,3.0,632.94
19943,e50bb46c-ff30-11e9-a5e8-000d3a38a36f,15.0,6.0,1009.77


# Görev 3 (RF ve RFM Skorlarının Hesaplanması (Calculating RF and RFM Scores))


### 1.Soru
 - Recency, Frequency ve Monetary metriklerini qcut yardımı ile 1-5 arasında skorlara çevrilmesi ve

In [20]:
rfm["Monetary_score"]=pd.qcut(rfm["monetary"],5,labels=[1,2,3,4,5])

In [21]:
rfm["Recency_score"]=pd.qcut(rfm["recency"],5,labels=[5,4,3,2,1])

In [22]:
rfm["Frequency_score"]=pd.qcut(rfm["frequency"].rank(method="first"),5,labels=[1,2,3,4,5])

In [23]:
rfm.head(10)

Unnamed: 0,customer_id,recency,frequency,monetary,Monetary_score,Recency_score,Frequency_score
0,cc294636-19f0-11eb-8d74-000d3a38a36f,2.0,5.0,939.37,4,3,4
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,12.0,21.0,2013.55,5,3,5
2,69b69676-1a40-11ea-941b-000d3a38a36f,93.0,5.0,585.32,3,2,4
3,1854e56c-491f-11eb-806e-000d3a38a36f,42.0,2.0,121.97,1,3,1
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,-7.0,2.0,209.98,1,3,1
5,e585280e-aae1-11e9-a2fc-000d3a38a36f,-13.0,3.0,200.86,1,4,2
6,c445e4ee-6242-11ea-9d1a-000d3a38a36f,133.0,4.0,375.93,2,2,3
7,3f1b4dc8-8a7d-11ea-8ec0-000d3a38a36f,200.0,2.0,163.63,1,1,1
8,cfbda69e-5b4f-11ea-aca7-000d3a38a36f,-7.0,5.0,1054.69,5,3,4
9,1143f032-440d-11ea-8b43-000d3a38a36f,147.0,2.0,165.96,1,1,1


In [24]:
rfm["RFM_Score"]=rfm["Recency_score"].astype(str)+rfm["Frequency_score"].astype(str)

### 2.Soru
- Bu skorları recency_score, frequency_score ve monetary_score olarak kaydedilmesi

In [25]:
rfm["RF_Skor"] = (rfm['Recency_score'].astype(str) + rfm['Frequency_score'].astype(str))
rfm.head()

Unnamed: 0,customer_id,recency,frequency,monetary,Monetary_score,Recency_score,Frequency_score,RFM_Score,RF_Skor
0,cc294636-19f0-11eb-8d74-000d3a38a36f,2.0,5.0,939.37,4,3,4,34,34
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,12.0,21.0,2013.55,5,3,5,35,35
2,69b69676-1a40-11ea-941b-000d3a38a36f,93.0,5.0,585.32,3,2,4,24,24
3,1854e56c-491f-11eb-806e-000d3a38a36f,42.0,2.0,121.97,1,3,1,31,31
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,-7.0,2.0,209.98,1,3,1,31,31


### 3.Soru
 recency_score ve frequency_score ve monetary_score'u tek bir değişken olarak ifade edilmesi ve RFM_SCORE olarak kaydedilmesi

In [26]:
rfm["RFM_Skor"] = (rfm['Recency_score'].astype(str) + rfm['Frequency_score'].astype(str) + rfm['Monetary_score'].astype(str))
rfm.head()

Unnamed: 0,customer_id,recency,frequency,monetary,Monetary_score,Recency_score,Frequency_score,RFM_Score,RF_Skor,RFM_Skor
0,cc294636-19f0-11eb-8d74-000d3a38a36f,2.0,5.0,939.37,4,3,4,34,34,344
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,12.0,21.0,2013.55,5,3,5,35,35,355
2,69b69676-1a40-11ea-941b-000d3a38a36f,93.0,5.0,585.32,3,2,4,24,24,243
3,1854e56c-491f-11eb-806e-000d3a38a36f,42.0,2.0,121.97,1,3,1,31,31,311
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,-7.0,2.0,209.98,1,3,1,31,31,311


# Görev 4 (RF Skorlarının Segment Olarak Tanımlanması)

### 1.Soru
- Oluşturulan RFM skorların daha açıklanabilir olması için segment tanımlama ve  tanımlanan seg_map yardımı ile RF_SCORE'u segmentlere çevirme

In [27]:
seg_map = {
    r'[1-2][1-2]': 'hibernating',
    r'[1-2][3-4]': 'at_Risk',
    r'[1-2]5': 'cant_loose',
    r'3[1-2]': 'about_to_sleep',
    r'33': 'need_attention',
    r'[3-4][4-5]': 'loyal_customers',
    r'41': 'promising',
    r'51': 'new_customers',
    r'[4-5][2-3]': 'potential_loyalists',
    r'5[4-5]': 'champions'
}


In [28]:
rfm['segment'] = rfm['RF_Skor'].replace(seg_map, regex=True)

In [29]:
rfm.head(10)

Unnamed: 0,customer_id,recency,frequency,monetary,Monetary_score,Recency_score,Frequency_score,RFM_Score,RF_Skor,RFM_Skor,segment
0,cc294636-19f0-11eb-8d74-000d3a38a36f,2.0,5.0,939.37,4,3,4,34,34,344,loyal_customers
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,12.0,21.0,2013.55,5,3,5,35,35,355,loyal_customers
2,69b69676-1a40-11ea-941b-000d3a38a36f,93.0,5.0,585.32,3,2,4,24,24,243,at_Risk
3,1854e56c-491f-11eb-806e-000d3a38a36f,42.0,2.0,121.97,1,3,1,31,31,311,about_to_sleep
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,-7.0,2.0,209.98,1,3,1,31,31,311,about_to_sleep
5,e585280e-aae1-11e9-a2fc-000d3a38a36f,-13.0,3.0,200.86,1,4,2,42,42,421,potential_loyalists
6,c445e4ee-6242-11ea-9d1a-000d3a38a36f,133.0,4.0,375.93,2,2,3,23,23,232,at_Risk
7,3f1b4dc8-8a7d-11ea-8ec0-000d3a38a36f,200.0,2.0,163.63,1,1,1,11,11,111,hibernating
8,cfbda69e-5b4f-11ea-aca7-000d3a38a36f,-7.0,5.0,1054.69,5,3,4,34,34,345,loyal_customers
9,1143f032-440d-11ea-8b43-000d3a38a36f,147.0,2.0,165.96,1,1,1,11,11,111,hibernating


### 2. Soru
- Segmentlerin recency, frequnecy ve monetary ortalamalarını inceleyiniz.

In [30]:
rfm[["segment", "recency", "frequency", "monetary"]].groupby("segment").agg([sum,max,min,np.mean])

Unnamed: 0_level_0,recency,recency,recency,recency,frequency,frequency,frequency,frequency,monetary,monetary,monetary,monetary
Unnamed: 0_level_1,sum,max,min,mean,sum,max,min,mean,sum,max,min,mean
segment,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2
about_to_sleep,33859.0,52.0,-9.0,20.785144,3912.0,3.0,2.0,2.401473,584825.6,1607.45,49.98,359.008963
at_Risk,465288.0,274.0,53.0,148.606835,14003.0,7.0,3.0,4.472373,2024536.65,3615.67,80.97,646.610236
cant_loose,170933.0,274.0,53.0,142.444167,12838.0,111.0,7.0,10.698333,1769361.86,12103.15,274.42,1474.468217
champions,-146626.0,-60.0,-91.0,-75.893375,17261.0,202.0,4.0,8.934265,2717599.71,45905.1,250.34,1406.625109
hibernating,558438.0,274.0,53.0,154.949501,8628.0,3.0,2.0,2.394007,1320026.49,2533.04,44.98,366.267062
loyal_customers,-34972.0,52.0,-59.0,-10.405237,28147.0,83.0,4.0,8.374591,4089727.37,36818.29,183.12,1216.818616
need_attention,17142.0,52.0,-9.0,20.828676,3068.0,4.0,3.0,3.727825,462643.66,4361.44,80.86,562.142965
new_customers,-51056.0,-60.0,-91.0,-75.082353,1360.0,2.0,2.0,2.0,231169.77,1725.38,69.98,339.955544
potential_loyalists,-164070.0,-10.0,-91.0,-55.844112,9708.0,4.0,2.0,3.304289,1566495.96,20706.34,65.91,533.184466
promising,-22049.0,-10.0,-59.0,-34.078825,1294.0,2.0,2.0,2.0,217180.24,1671.75,44.98,335.672705


# Görev 5 

### 1. Soru
- FLO bünyesine yeni bir kadın ayakkabı markası dahil ediyor. Dahil ettiği markanın ürün fiyatları genel müşteri tercihlerinin üstünde. Bu nedenle markanın  tanıtımı ve ürün satışları için ilgilenecek profildeki müşterilerle özel olarak iletişime geçeilmek isteniliyor. Bu müşterilerin sadık  ve
kadın kategorisinden alışveriş yapan kişiler olması planlandı. Müşterilerin id numaralarını csv dosyasına yeni_marka_hedef_müşteri_id.cvs
olarak kaydediniz.

In [31]:
rfm.head()
target_segments_customer_ids = rfm[rfm["segment"].isin(["champions","loyal_customers"])]["customer_id"]
cust_ids = df[(df["master_id"].isin(target_segments_customer_ids)) & (df["interested_in_categories_12"].str.contains("KADIN"))]["master_id"]
cust_ids.to_csv("yeni_marka_hedef_müşteri_id.csv", index=False)
cust_ids.shape
df.head()


Unnamed: 0,master_id,order_channel,last_order_channel,first_order_date,last_order_date,last_order_date_online,last_order_date_offline,order_num_total_ever_online,order_num_total_ever_offline,customer_value_total_ever_offline,customer_value_total_ever_online,interested_in_categories_12,total_order,total_spend
0,cc294636-19f0-11eb-8d74-000d3a38a36f,Android App,Offline,2020-10-30,2021-02-26,2021-02-21,2021-02-26,4.0,1.0,139.99,799.38,[KADIN],5.0,939.37
1,f431bd5a-ab7b-11e9-a2fc-000d3a38a36f,Android App,Mobile,2017-02-08,2021-02-16,2021-02-16,2020-01-10,19.0,2.0,159.97,1853.58,"[ERKEK, COCUK, KADIN, AKTIFSPOR]",21.0,2013.55
2,69b69676-1a40-11ea-941b-000d3a38a36f,Android App,Android App,2019-11-27,2020-11-27,2020-11-27,2019-12-01,3.0,2.0,189.97,395.35,"[ERKEK, KADIN]",5.0,585.32
3,1854e56c-491f-11eb-806e-000d3a38a36f,Android App,Android App,2021-01-06,2021-01-17,2021-01-17,2021-01-06,1.0,1.0,39.99,81.98,"[AKTIFCOCUK, COCUK]",2.0,121.97
4,d6ea1074-f1f5-11e9-9346-000d3a38a36f,Desktop,Desktop,2019-08-03,2021-03-07,2021-03-07,2019-08-03,1.0,1.0,49.99,159.99,[AKTIFSPOR],2.0,209.98


### 2.Soru
- Erkek ve Çoçuk ürünlerinde %40'a yakın indirim planlanmaktadır. Bu indirimle ilgili kategorilerle ilgilenen geçmişte iyi müşterilerden olan ama uzun süredir
alışveriş yapmayan ve yeni gelen müşteriler özel olarak hedef alınmak isteniliyor. Uygun profildeki müşterilerin id'lerini csv dosyasına indirim_hedef_müşteri_ids.csv
olarak kaydediniz.

In [32]:
target_segments_customer_ids = rfm[rfm["segment"].isin(["cant_loose","hibernating","new_customers"])]["customer_id"]
cust_ids = df[(df["master_id"].isin(target_segments_customer_ids)) & ((df["interested_in_categories_12"].str.contains("ERKEK"))|(df["interested_in_categories_12"].str.contains("COCUK")))]["master_id"]

In [33]:
cust_ids.to_csv("indirim_hedef_müşteri_ids.csv", index=False)
cust_ids.shape

(2771,)