## Algoritma Apriori dan Association Rules

Bicara mengenai pemaketan produk sebenarnya adalah mencari produk-produk yang memiliki hubungan atau asosiasi kuat di dalam transaksi. Hubungan "kuat" disini akan dilihat berdasarkan proporsi jumlah kemunculan kombinasi produk yang akan dipaketkan dengan keseluruhan transaksi.

Mari kita lihat contoh pada gambar berikut. Nomor transaksi (1 s/d 5) menunjukkan nomor struk belanja. Sedangkan gambar buah yang berwarna menunjukkan produk atau item yang dibeli.

![image.png](attachment:image.png)

Pada gambar terlihat ada dua transaksi dimana terdapat buah rambutan dan pisang. Dan dimana terdapat pisang maka ada rambutan, dan sebaliknya. Ini menunjukkan hubungan atau asosiasi yang kuat diantara dua produk buah ini.

Apel sendiri terdapat di seluruh transaksi, sehingga ada atau tidak ada produk buah lain tidak menjadi "masalah" buat 
Apel. Istilahnya, untuk laku maka Apel jual mahal... tidak memerlukan apapun jadi pendampingnya. Bisa dikatakan, tidak ada asosiasi antara apel dengan produk apapun. Jeruk, apel dan rambutan ada dua kali muncul, tapi jeruk bisa muncul sendirian juga bersama apel. Sehingga kombinasi paket jeruk, apel dan rambutan walaupun ada asosiasi tapi tidak sekuat apel dan rambutan.

Nah, terlihat kan ada kombinasi-kombinasi yang perlu diperiksa? Untuk 4 item dari contoh transaksi kita, dengan minimal 2 item per transaksi maka ada 9 kombinasi yang perlu dicek. Dengan makin banyaknya item maka kombinasi juga akan berkembang cepat.

Sebagai gambaran buat Anda, jika terdapat 1.000 item, maka kemungkinan terdapat jutaan kombinasi yang harus diproses. Jumlah sebesar ini tentunya tidak bisa manual dan butuh bantuan algoritma komputer untuk memprosesnya.

Dan algoritma yang bisa kita gunakan adalah algoritma apriori yang merupakan algoritma di kategori association rules pada literatur machine learning. Algoritma ini akan menghasilkan kombinasi-kombinasi yang kemudian disusun dalam bentuk rule "Jika membeli ini.... maka akan juga membeli... ".

Ada cukup banyak penerapan dari association rules , seperti di dunia cyber security untuk mendeteksi intrusi jaringan, di bidang sales marketing untuk pemaketan produk, mencari pola pemakaian web, dan lain-lain.


In [1]:
#Menggunakan library arules
library(arules)

"package 'arules' was built under R version 3.6.3"Loading required package: Matrix
"package 'Matrix' was built under R version 3.6.3"
Attaching package: 'arules'

The following objects are masked from 'package:base':

    abbreviate, write



In [2]:
#Membaca transaksi dari file data_transaksi.txt
transaksi <- read.transactions(file="Data_Transaksi.txt", format="single", sep="\t", cols=c(1,2), skip=1)

## Menampilkan Kombinasi dari Contoh Transaksi "Kecil"
Dari subbab "Contoh Code Market Basket Analysis di R" pada bab satu kita telah melihat isi file dengan 10 transaksi yang terdapat pada file kita. Disini, DQLab akan mencantumkan hasilnya seperti terlihat di bawah ini.

         items                      transactionID
    [1]  {Pet Food,Sirup,Teh Celup} #01          
    [2]  {Gula,Teh Celup}           #02          
    [3]  {Pet Food,Sirup}           #03          
    [4]  {Sirup,Teh Celup}          #04          
    [5]  {Gula,Sirup,Teh Celup}     #05          
    [6]  {Pet Food,Teh Celup}       #06          
    [7]  {Pet Food,Sirup,Teh Celup} #07          
    [8]  {Teh Celup}                #08          
    [9]  {Gula,Teh Celup}           #09          
    [10] {Gula,Pet Food,Sirup}      #10


In [3]:
#Menampilkan data transaksi dengan print dan inspect 
inspect(transaksi)

     items                      transactionID
[1]  {Pet Food,Sirup,Teh Celup} #01          
[2]  {Gula,Teh Celup}           #02          
[3]  {Pet Food,Sirup}           #03          
[4]  {Sirup,Teh Celup}          #04          
[5]  {Gula,Sirup,Teh Celup}     #05          
[6]  {Pet Food,Teh Celup}       #06          
[7]  {Pet Food,Sirup,Teh Celup} #07          
[8]  {Teh Celup}                #08          
[9]  {Gula,Teh Celup}           #09          
[10] {Gula,Pet Food,Sirup}      #10          


Nah, untuk mendapatkan gambaran berapa kombinasi produk yang mungkin terjadi cobalah jalankan code berikut sehingga Anda akan melihat hasil sebagai berikut.

        items                      support
    [1] {Gula,Pet Food}            0.1    
    [2] {Gula,Sirup}               0.2    
    [3] {Gula,Teh Celup}           0.3    
    [4] {Pet Food,Sirup}           0.4    
    [5] {Pet Food,Teh Celup}       0.3    
    [6] {Sirup,Teh Celup}          0.4    
    [7] {Gula,Pet Food,Sirup}      0.1    
    [8] {Gula,Sirup,Teh Celup}     0.1    
    [9] {Pet Food,Sirup,Teh Celup} 0.2 
Terlihat ada sembilan kombinasi produk dengan nilai support adalah rasio dari kombinasi tersebut terhadap keseluruhan transaksi.

Sebagai contoh, kombinasi {Pet Food, Sirup} memiliki support 0.4 yang artinya kombinasi ini terdapat di 4 dari 10 transaksi yang tercatat.


In [4]:
#Menghasilkan model Market Basket Analysis
mba <- apriori(transaksi,parameter = list(supp = 0.1, confidence = 0.5))

Apriori

Parameter specification:
 confidence minval smax arem  aval originalSupport maxtime support minlen
        0.5    0.1    1 none FALSE            TRUE       5     0.1      1
 maxlen target  ext
     10  rules TRUE

Algorithmic control:
 filter tree heap memopt load sort verbose
    0.1 TRUE TRUE  FALSE TRUE    2    TRUE

Absolute minimum support count: 1 

set item appearances ...[0 item(s)] done [0.00s].
set transactions ...[4 item(s), 10 transaction(s)] done [0.00s].
sorting and recoding items ... [4 item(s)] done [0.00s].
creating transaction tree ... done [0.00s].
checking subsets of size 1 2 3 done [0.00s].
writing ... [16 rule(s)] done [0.00s].
creating S4 object  ... done [0.00s].


In [5]:
#Menampilkan paket produk
inspect(subset(mba, lift>1))

    lhs                     rhs        support confidence coverage lift    
[1] {Pet Food}           => {Sirup}    0.4     0.8000000  0.5      1.333333
[2] {Sirup}              => {Pet Food} 0.4     0.6666667  0.6      1.333333
[3] {Gula,Pet Food}      => {Sirup}    0.1     1.0000000  0.1      1.666667
[4] {Pet Food,Teh Celup} => {Sirup}    0.2     0.6666667  0.3      1.111111
    count
[1] 4    
[2] 4    
[3] 1    
[4] 2    


In [6]:
#Menampilkan jumlah kombinasi dari produk yang terdapat pada daftar transaksi yang ada
inspect(apriori(transaksi, parameter = list(support=.1, minlen=2, target='frequent itemsets')))

Apriori

Parameter specification:
 confidence minval smax arem  aval originalSupport maxtime support minlen
         NA    0.1    1 none FALSE            TRUE       5     0.1      2
 maxlen            target  ext
     10 frequent itemsets TRUE

Algorithmic control:
 filter tree heap memopt load sort verbose
    0.1 TRUE TRUE  FALSE TRUE    2    TRUE

Absolute minimum support count: 1 

set item appearances ...[0 item(s)] done [0.00s].
set transactions ...[4 item(s), 10 transaction(s)] done [0.00s].
sorting and recoding items ... [4 item(s)] done [0.00s].
creating transaction tree ... done [0.00s].
checking subsets of size 1 2 3 done [0.00s].
sorting transactions ... done [0.00s].
writing ... [9 set(s)] done [0.00s].
creating S4 object  ... done [0.00s].
    items                      support transIdenticalToItemsets count
[1] {Gula,Pet Food}            0.1     0.0                      1    
[2] {Gula,Sirup}               0.2     0.0                      2    
[3] {Gula,Teh Celup}      