<a href="https://colab.research.google.com/github/AyuHidayatiMunasyiroh/Market-Basket-Analysis/blob/main/Market_Basket_Analysis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# MARKET BASKET ANALYSIS
Market Basket Analysis (MBA) adalah sebuah teknik analisis data yang digunakan dalam bidang ilmu data mining dan analisis bisnis. Tujuannya adalah untuk menemukan pola-pola hubungan antara item atau produk yang dibeli oleh pelanggan dalam sebuah toko atau dalam suatu transaksi. Teknik ini sering digunakan dalam industri ritel dan e-commerce untuk memahami perilaku pembelian pelanggan dan meningkatkan strategi pemasaran serta penempatan produk. Berikut adalah beberapa konsep kunci dalam Market Basket Analysis:

*   **Itemset:** Itemset adalah sekumpulan item atau produk yang dibeli bersama-sama dalam satu transaksi atau pembelian oleh pelanggan. Contohnya, jika seseorang membeli roti dan mentega dalam satu transaksi, maka roti dan mentega merupakan itemset.

*   **Support:** Support mengukur seberapa sering sebuah itemset muncul dalam transaksi pelanggan. Ini dihitung dengan membagi jumlah transaksi yang mengandung itemset tersebut dengan total transaksi. Support membantu mengidentifikasi itemset yang populer atau umum.

*   **Confidence:** Confidence mengukur seberapa sering itemset A dan itemset B dibeli bersama-sama. Ini dihitung dengan mengukur berapa persentase transaksi yang mengandung itemset A juga mengandung itemset B. Confidence membantu mengidentifikasi korelasi antara itemset.

*   **Lift:** Lift mengukur seberapa kuatnya korelasi antara itemset A dan itemset B dibandingkan dengan seberapa sering keduanya muncul secara acak. Lift dihitung dengan membagi Confidence (A -> B) dengan Support (B). Jika lift > 1, itu menunjukkan bahwa itemset A dan B cenderung dibeli bersama, sementara jika lift < 1, mereka cenderung tidak dibeli bersama.

*   **Association Rules:** Association rules adalah aturan atau pernyataan yang menggambarkan hubungan antara itemset dalam bentuk "Jika A, maka B". Contohnya, "Jika seseorang membeli roti, maka mereka cenderung juga membeli mentega."

*   **Target Produk:** Dalam praktiknya, Market Basket Analysis sering digunakan untuk mengidentifikasi produk-produk yang bisa dipasangkan atau dipromosikan bersama untuk meningkatkan penjualan. Misalnya, toko bisa menggunakan hasil analisis ini untuk menampilkan rekomendasi produk kepada pelanggan berdasarkan pembelian sebelumnya.

Market Basket Analysis dapat memberikan wawasan yang berharga kepada bisnis dalam hal penentuan harga, strategi promosi, dan penempatan produk. Dengan memahami hubungan antara produk-produk yang dibeli bersama-sama, perusahaan dapat meningkatkan efisiensi operasional dan kepuasan pelanggan.

In [None]:
install.packages("arules")

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)



In [None]:
#Menggunakan library arules
library(arules)

#Membaca transaksi dari file data_transaksi2.txt
transaksi <- read.transactions(file="https://storage.googleapis.com/dqlab-dataset/data_transaksi2.txt", format="single", sep="\t", cols=c(1,2), skip=1)

#Summary data
str(transaksi)

Formal class 'transactions' [package "arules"] with 3 slots
  ..@ data       :Formal class 'ngCMatrix' [package "Matrix"] with 5 slots
  .. .. ..@ i       : int [1:9735] 5 9 10 14 22 34 45 46 48 2 ...
  .. .. ..@ p       : int [1:1001] 0 9 20 31 42 55 68 77 90 104 ...
  .. .. ..@ Dim     : int [1:2] 70 1000
  .. .. ..@ Dimnames:List of 2
  .. .. .. ..$ : NULL
  .. .. .. ..$ : NULL
  .. .. ..@ factors : list()
  ..@ itemInfo   :'data.frame':	70 obs. of  1 variable:
  .. ..$ labels: chr [1:70] "Atasan Baju Belang" "Atasan Kaos Putih" "Baju Batik Wanita" "Baju Kaos Anak - Karakter Kartun" ...
  ..@ itemsetInfo:'data.frame':	1000 obs. of  1 variable:
  .. ..$ transactionID: chr [1:1000] "#1" "#10" "#100" "#1000" ...


In [None]:
#Menampilkan jumlah kombinasi dari produk yang terdapat pada daftar transaksi yang ada
MBA <- inspect(apriori(transaksi, parameter = list(support=.03, minlen=2, target='frequent itemsets')))

Apriori

Parameter specification:
 confidence minval smax arem  aval originalSupport maxtime support minlen
         NA    0.1    1 none FALSE            TRUE       5    0.03      2
 maxlen            target  ext
     10 frequent itemsets TRUE

Algorithmic control:
 filter tree heap memopt load sort verbose
    0.1 TRUE TRUE  FALSE TRUE    2    TRUE

Absolute minimum support count: 30 

set item appearances ...[0 item(s)] done [0.00s].
set transactions ...[70 item(s), 1000 transaction(s)] done [0.00s].
sorting and recoding items ... [56 item(s)] done [0.00s].
creating transaction tree ... done [0.00s].
checking subsets of size 1 2 3 4 5 6 done [0.00s].
sorting transactions ... done [0.00s].
writing ... [1248 set(s)] done [0.00s].
creating S4 object  ... done [0.00s].
       items                               support count
[1]    {Shampo Biasa,                                   
        Tas Makeup}                          0.031    31
[2]    {Tank Top,                                  

# Penjelasan Syntax
*   **parameter = list(support=.03, minlen=2, target='frequent itemsets')**: Ini adalah argumen kedua yang diberikan kepada fungsi apriori(). Argumen ini digunakan untuk mengatur parameter analisis Apriori, dan di sini Anda memberikan parameter dalam bentuk daftar (list). Parameter yang diatur adalah:

*   **support=.03**: Ini mengatur tingkat dukungan (support) minimum yang diperlukan untuk itemset yang akan diidentifikasi sebagai "frequent" (sering muncul). Nilai 0.03 menunjukkan bahwa itemset-itemset yang muncul dalam setidaknya 3% dari transaksi akan dianggap frequent.

*   **minlen=2**: Ini mengatur panjang minimum dari itemset yang akan diidentifikasi. Dalam hal ini, itemset harus terdiri dari setidaknya 2 item.

*   **target='frequent itemsets'**: Ini mengatur jenis hasil yang diinginkan dari analisis. Dalam hal ini, Anda ingin mengidentifikasi "frequent itemsets" atau itemset-itemset yang sering muncul dalam transaksi.