# **Market Basket Analysis**

Table of Contents :


1.   Pendahuluan
2.   Apa itu Market Basket Analysis?
3.   Apa saja *metrics* yang dipertimbangkan dalam proses analysis ini?
4.   Import library & data
5.   Data pre-processing
6.   Pengolahan data
7.   Kesimpulan



### **Pendahuluan**

Bisnis retail dan groceries menjadi salah satu bisnis yang paling potensial untuk berkembang secara cepat, dan paling cepat juga untuk mengalami kerugian secara cepat. Hal yang dapat membuat suatu bisnis retail/groceries berkembang pesat diantaranya adalah :


1.   Lengkapnya barang/produk pada satu retail yang dibuka
2.   Lancarnya perputaran barang dan minimnya barang *slow moving* yang menumpuk digudang
3.   Tepatnya analisa dari *stakeholders* perusahaan dalam menentukan promo yang menarik untuk meningkatkan penjualan
4.   Tata letak produk yang strategis agar penjualan seluruh produk berimbang/tidak ada product yang terlalu *slow moving*

Namun pada faktnya beberapa masalah yang sering di alami oleh pemiliki bisnis retail adalah :
1.   Sulitnya *stakeholders* perusahaan dalam menentukan promo yang tepat untuk meningkatkan penjualan
2.   Sering adanya produk *slow moving* yang mengakibatkan kerugian khususnya pada biaya penyimpanan gudang, dan meningkatkan potensi barang rusak
3.   Sering tidak tepatnya dalam melakukan display barang, sehingga tidak dapat menyentuh psikologis pelanggan untuk melakukan pembelian lebih dari 1 barang

### **Apa itu Market Basket Analysis?**

Secara sederhana market basket analysis adalah proses analisa dari seluruh transaksi/penjualan yang ada pada suatu bisnis retail/groceries, untuk menentukan produk mana yang paling memungkinkan untuk diadakan promo "bundling".

Market Basket Analysis ini menjadi sangat berguna, karena proses analisa melibatkan "mesin" untuk mengetahui kombinasi mana saja yang mempunyai potensi tinggi untuk terjual dan menarik minat dari konsumen. Sering kali "mesin" atau program yang dibuat, mampu menemukan kombinasi-kombinasi tidak terduga yang bisa didapatkan dari hasil analisis pola pada data penjualan.

Market Basket Analysis ini menjadi sangat berguna bagi pemilik bisnis, mengingat bisa menjadi refrensi kedua setelah intiusisi pemilik bisnis dalam melakukan keputusan bisnis.

### **Apa Saja Metrics yang Menjadi Pertimbangan dalam Proses Market Basket Analysis?**



1.   Support
2.   Confidence
3.   Lift

Untuk deskripsi lebih lengkap mengenai 3 metriks diatas, anda dapat melihat artikel berikut untuk mengetahui, lengkap dengan rumus yang digunakan :
[The Data Schools - Understanding Market Basket Analysis](https://www.thedataschool.co.uk/liu-zhang/understanding-lift-for-market-basket-analysis/)



# Code

#### ***Loading Packages***

In [3]:
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
from sklearn.preprocessing import OneHotEncoder
from mlxtend.preprocessing import TransactionEncoder
from itertools import combinations


#### ***Upload Files to Google Collabs***

In [7]:
from google.colab import files
uploaded = files.upload()

  and should_run_async(code)


Saving basket.csv to basket (1).csv


#### ***Explore Data***

In [4]:
df = pd.read_csv('basket.csv')
df.head()

  and should_run_async(code)


Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10
0,whole milk,pastry,salty snack,,,,,,,,
1,sausage,whole milk,semi-finished bread,yogurt,,,,,,,
2,soda,pickled vegetables,,,,,,,,,
3,canned beer,misc. beverages,,,,,,,,,
4,sausage,hygiene articles,,,,,,,,,


In [5]:
print("Total transaksi =" ,len(df)) #Melihat berapa banyak Transaksi dari banyak nya nomor invoice pada dataset ini

Total transaksi = 14963


  and should_run_async(code)


Ada 14.963 transaksi pada dataset yang akan kita gunakan pada dataset ini

#### Data Transformation

In [6]:
df.fillna('1', inplace = True)

Transactions=[] # Untuk melihat transaksi keberapa

for i in range (14963):
    transaction = []
    for j in range(11):
        if df.iloc[i,j] != '1':
            transaction.append(df.iloc[i,j])
    Transactions.append(transaction)

  and should_run_async(code)


In [7]:
# Contoh
Transactions[2]

  and should_run_async(code)


['soda', 'pickled vegetables']

In [8]:
te = TransactionEncoder()
te_bin = te.fit_transform(Transactions)
Transactions = pd.DataFrame(te_bin, columns = te.columns_)

  and should_run_async(code)


In [9]:
Transactions

  and should_run_async(code)


Unnamed: 0,Instant food products,UHT-milk,abrasive cleaner,artif. sweetener,baby cosmetics,bags,baking powder,bathroom cleaner,beef,berries,...,turkey,vinegar,waffles,whipped/sour cream,whisky,white bread,white wine,whole milk,yogurt,zwieback
0,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,True,False,False
1,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,True,True,False
2,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False
3,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False
4,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
14958,False,False,False,False,False,False,False,False,False,False,...,False,False,False,True,False,False,False,False,False,False
14959,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False
14960,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False
14961,False,False,False,False,False,False,False,False,False,False,...,False,False,False,False,False,False,False,False,False,False


In [10]:
def encode(x):
    if x <= 0:
        return 0
    if x >= 1:
        return 1
Transactions = Transactions.applymap(encode)

  and should_run_async(code)


In [11]:
Transactions

  and should_run_async(code)


Unnamed: 0,Instant food products,UHT-milk,abrasive cleaner,artif. sweetener,baby cosmetics,bags,baking powder,bathroom cleaner,beef,berries,...,turkey,vinegar,waffles,whipped/sour cream,whisky,white bread,white wine,whole milk,yogurt,zwieback
0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,1,0,0
1,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,1,1,0
2,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
3,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
4,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
14958,0,0,0,0,0,0,0,0,0,0,...,0,0,0,1,0,0,0,0,0,0
14959,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
14960,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
14961,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


## Pengolahan Data

In [12]:
frequent_items = apriori(Transactions, min_support = 0.001,use_colnames = True)
frequent_items.head()

  and should_run_async(code)


Unnamed: 0,support,itemsets
0,0.00401,(Instant food products)
1,0.021386,(UHT-milk)
2,0.00147,(abrasive cleaner)
3,0.001938,(artif. sweetener)
4,0.008087,(baking powder)


In [20]:
rules = association_rules(frequent_items, metric='lift',min_threshold =1)
# Filter the rules to keep only 3-item combinations
rules['consequents_len'] = rules['consequents'].apply(lambda x: len(x))
rules = rules[rules['consequents_len'] == 2]

# Display the 3-item rules
print(rules)

            antecedents                     consequents  antecedent support  \
213        (rolls/buns)        (other vegetables, soda)            0.110005   
214  (other vegetables)              (rolls/buns, soda)            0.122101   
215              (soda)  (rolls/buns, other vegetables)            0.097106   
219        (rolls/buns)           (whole milk, sausage)            0.110005   
220        (whole milk)           (rolls/buns, sausage)            0.157923   
221           (sausage)        (rolls/buns, whole milk)            0.060349   
225        (rolls/buns)            (yogurt, whole milk)            0.110005   
226            (yogurt)        (rolls/buns, whole milk)            0.085879   
227        (whole milk)            (rolls/buns, yogurt)            0.157923   
231        (whole milk)                 (sausage, soda)            0.157923   
232           (sausage)              (whole milk, soda)            0.060349   
233              (soda)           (whole milk, sausa

  and should_run_async(code)


In [21]:
rules = rules.sort_values(by='lift', ascending = False)
rules

  and should_run_async(code)


Unnamed: 0,antecedents,consequents,antecedent support,consequent support,support,confidence,lift,leverage,conviction,zhangs_metric,consequents_len
239,(sausage),"(yogurt, whole milk)",0.060349,0.011161,0.00147,0.024363,2.182917,0.000797,1.013532,0.576701,2
237,(yogurt),"(whole milk, sausage)",0.085879,0.008955,0.00147,0.017121,1.91176,0.000701,1.008307,0.521727,2
238,(whole milk),"(yogurt, sausage)",0.157923,0.005748,0.00147,0.00931,1.619866,0.000563,1.003596,0.45443,2
232,(sausage),"(whole milk, soda)",0.060349,0.011629,0.001069,0.017719,1.523708,0.000368,1.0062,0.365781,2
221,(sausage),"(rolls/buns, whole milk)",0.060349,0.013968,0.001136,0.018826,1.347825,0.000293,1.004952,0.274638,2
220,(whole milk),"(rolls/buns, sausage)",0.157923,0.005347,0.001136,0.007194,1.345594,0.000292,1.001861,0.305,2
233,(soda),"(whole milk, sausage)",0.097106,0.008955,0.001069,0.011012,1.229612,0.0002,1.002079,0.206819,2
219,(rolls/buns),"(whole milk, sausage)",0.110005,0.008955,0.001136,0.010328,1.153275,0.000151,1.001387,0.149331,2
214,(other vegetables),"(rolls/buns, soda)",0.122101,0.008087,0.001136,0.009305,1.150651,0.000149,1.00123,0.149137,2
231,(whole milk),"(sausage, soda)",0.157923,0.005948,0.001069,0.006771,1.138374,0.00013,1.000829,0.14435,2


## Kesimpulan

Hasil dari pengolahan dataset ini menggunakan algoritma apriori, dan beberapa proses pengolahan lainnya. Menjelaskan bahwa 3 kombinasi teratas yang dapat dilakukan pemilik bisnis retail untuk meningkatkan penjualannya adalah dengan melakukan treatment khusus terhadap beberapa kombinasi barang berikut :


1.   Sosis - Yoghurt - Susu
2.   Sosis - Susu - Soda
3.   Sosis - Roti - Susu

Beberapa langkah yang dapat dilakukan pemilik bisnis untuk megoptimasi promo, terhadap beberapa kombinasi barang diatas adalah :

1.   Menyusun ketiga barang yang ada pada kombinasi diatas secara berdekatan
2.   Melakuakn paket bundling khusus, semisal beli sosis minimal 2 pcs, maka akan mendapatkan diskon khusus yoghurt dan susu
3.   Melakukan campaign member, dengan minimal pembelian sosis 5 pcs mendapatkan gratis 1 pcs roti dan 1 pcs susu. Campaign ini dapat dijadikan sebagai sumber untuk menarik data pelanggan yang lebih lengkap, sehingga dapat melakukan campaign marketing yang lebih komperhensif kedepannya.