##Mengenal Market Basket Analysis
Market Basket Analysis adalah metode analisis Market Basket Analysis (MBA) merupakan salah satu bentuk penerapan dari analisis asosiasi. Analisis asosiasi atau dikenal juga dengan association rule mining adalah teknik data mining untuk menemukan aturan asosiasi (gabungan) antara suatu kombinasi item.

MBA adalah suatu metodologi untuk melakukan analisis buying habit konsumen dengan menemukan asosiasi antar beberapa item yang berbeda, yang diletakkan konsumen dalam shopping basket (keranjang belanja) yang dibeli pada suatu transaksi tertentu. Tujuan dari MBA adalah untuk mengetahui produk-produk mana yang mungkin akan dibeli secara bersamaan.

Cara kerjanya adalah dengan mencari kombinasi item atau barang yang sering dibeli bersamaan dalam transaksi, atau bisa dibilang mencari item apa saja yang sering dibeli oleh konsumen berbarengan dengan item lainnya. Misalnya, teh dan gula sering dibeli bersamaan. Dengan kata lain, MBA memungkinkan penjual untuk mengidentifikasi hubungan antara barang - barang yang dibeli oleh konsumen. Aturan asosiasi tersebut seringkali digunakan untuk menganalisis keranjang belanja atau data transaksi.

Dengan mengetahui asosiasi tersebut, penjual bisa menentukan target pemasaran, misalnya menjual barang yang punya asosiasi kuat, atau menggabungkan (bundling) barang yang paling laris dengan barang yang kurang laris sehingga ketika pembeli banyak yang membeli barang yang paling laris tersebut, otomatis penjualan barang yang kurang laris ikut meningkat.





### Market Basket Analysis dengan Python


Membaca Data Transaksi

In [1]:
#Mengimpor library pandas & numpy
import pandas as pd
import numpy as np

#Membaca file
dataset_transaksi = pd.read_csv('https://storage.googleapis.com/dqlab-dataset/transaksi_dqlab_retail.tsv', sep='\t')

#Menampilkan isi data
print(dataset_transaksi)

      Kode Transaksi              Nama Barang
0                 #1                     Kaos
1                 #1             Shampo Biasa
2                 #1      Sepatu Sport merk Z
3                 #1            Serum Vitamin
4                 #1  Baju Renang Pria Dewasa
...              ...                      ...
33663          #3450     Flat Shoes Ballerina
33664          #3450       Sepatu Sandal Anak
33665          #3450      Sepatu Kulit Casual
33666          #3450     Celana Jogger Casual
33667          #3450      Sepatu Sport merk Z

[33668 rows x 2 columns]


Melihat Detail dari Dataset

In [2]:
#Melihat detail tipe data
dataset_transaksi.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 33668 entries, 0 to 33667
Data columns (total 2 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   Kode Transaksi  33668 non-null  object
 1   Nama Barang     33668 non-null  object
dtypes: object(2)
memory usage: 526.2+ KB


Membuat Flag

In [3]:
#Flag digunakan untuk menandakan barang/item terdapat pada basket.
dataset_transaksi['Flag'] = 1

#Menampilkan isi data
print(dataset_transaksi)

      Kode Transaksi              Nama Barang  Flag
0                 #1                     Kaos     1
1                 #1             Shampo Biasa     1
2                 #1      Sepatu Sport merk Z     1
3                 #1            Serum Vitamin     1
4                 #1  Baju Renang Pria Dewasa     1
...              ...                      ...   ...
33663          #3450     Flat Shoes Ballerina     1
33664          #3450       Sepatu Sandal Anak     1
33665          #3450      Sepatu Kulit Casual     1
33666          #3450     Celana Jogger Casual     1
33667          #3450      Sepatu Sport merk Z     1

[33668 rows x 3 columns]


Mengelompokkan 'Flag' Berdasarkan 'Kode Transaksi' dan 'Nama Barang'

In [None]:
#Melakukan pengelompokkan Flag berdasarkan kolom Kode Transaksi dan Nama Barang
basket = dataset_transaksi.groupby(['Kode Transaksi','Nama Barang'])['Flag'].sum().unstack().reset_index().fillna(0).set_index('Kode Transaksi')

#Menampilkan basket
print(basket)

Nama Barang     Atasan Baju Belang  Atasan Kaos Putih  Baju Batik Wanita  \
Kode Transaksi                                                             
#1                             0.0                0.0                0.0   
#10                            0.0                0.0                1.0   
#100                           0.0                0.0                0.0   
#1000                          0.0                0.0                1.0   
#1001                          0.0                0.0                0.0   
...                            ...                ...                ...   
#995                           0.0                1.0                0.0   
#996                           0.0                0.0                0.0   
#997                           0.0                0.0                1.0   
#998                           0.0                0.0                1.0   
#999                           0.0                0.0                1.0   

Nama Barang

Normalisasi Data

In [5]:
# Menyusun Matriks Keranjang Belanja
basket = dataset_transaksi.groupby(['Kode Transaksi','Nama Barang'])['Flag'].sum().unstack().reset_index().fillna(0).set_index('Kode Transaksi')

#Membuat function untuk menormalisasi data
def encode_units(x):
	if x <= 0 :
		return 0
	if x > 0:
		return 1

#Menerapkan fungsi encode_units pada dataset
basket_encode = basket.applymap(encode_units)

#Menampilkan basket_encode
print(basket_encode)

Nama Barang     Atasan Baju Belang  Atasan Kaos Putih  Baju Batik Wanita  \
Kode Transaksi                                                             
#1                               0                  0                  0   
#10                              0                  0                  1   
#100                             0                  0                  0   
#1000                            0                  0                  1   
#1001                            0                  0                  0   
...                            ...                ...                ...   
#995                             0                  1                  0   
#996                             0                  0                  0   
#997                             0                  0                  1   
#998                             0                  0                  1   
#999                             0                  0                  1   

Nama Barang

  basket_encode = basket.applymap(encode_units)


Menggunakan Algoritma Apriori dengan Python - Part 1

In [6]:
#Mengimport algoritma apriori
from mlxtend.frequent_patterns import apriori

#Menerapkan algoritma apriori untuk mendapatkan frequent_itemset
frequent_itemset = apriori(basket_encode, min_support=0.03, use_colnames=True)
print(frequent_itemset)



       support                                           itemsets
0     0.118841                                (Atasan Kaos Putih)
1     0.380290                                (Baju Batik Wanita)
2     0.121159                 (Baju Kaos Anak - Karakter Kartun)
3     0.115942                     (Baju Kaos Anak - Superheroes)
4     0.089275                               (Baju Kaos Olahraga)
...        ...                                                ...
1255  0.031304  (Celana Pendek Jeans, Tas Tangan, Baju Kaos An...
1256  0.042609  (Shampo Biasa, Baju Kaos Anak - Superheroes, S...
1257  0.038551  (Wedges Hitam, Tas Travel, Baju Renang Pria De...
1258  0.047536  (Sepatu Sandal Anak, Shampo Biasa, Blouse Deni...
1259  0.037391  (Wedges Hitam, Tas Travel, Baju Renang Pria De...

[1260 rows x 2 columns]


Menggunakan Algoritma Apriori dengan Python - Part 2

In [7]:
#Mengimport association_rules
from mlxtend.frequent_patterns import association_rules

#Menerapkan association_rules berdasarkan frequent_itemset
rules = association_rules(frequent_itemset, metric='lift', min_threshold=1).sort_values('lift', ascending=False).reset_index(drop=True)
print(rules)

                                            antecedents  \
0                             (Cover Koper, Tas Tangan)   
1     (Baju Kaos Anak - Karakter Kartun, Celana Pend...   
2     (Baju Kaos Anak - Karakter Kartun, Celana Pend...   
3                                (Tank Top, Tas Tangan)   
4     (Tank Top, Baju Kaos Anak - Karakter Kartun, C...   
...                                                 ...   
5143                                     (Wedges Hitam)   
5144                     (Serum Vitamin, Tas Waist Bag)   
5145                                (Baju Kemeja Putih)   
5146                        (Tali Pinggang Gesper Pria)   
5147                        (Serum Vitamin, Hair Dryer)   

                                            consequents  antecedent support  \
0     (Baju Kaos Anak - Karakter Kartun, Celana Pend...            0.031884   
1                             (Cover Koper, Tas Tangan)            0.034493   
2                                (Tank Top, Tas Tangan