In [1]:
# Mengimpor pustaka pandas dan numpy
import pandas as pd
import numpy as np
# Memasang pustaka mlxtend yang digunakan untuk algoritma asosiasi
!pip install mlxtend
# Mengimpor fungsi fpgrowth dan association_rules dari mlxtend.frequent_patterns
from mlxtend.frequent_patterns import fpgrowth
from mlxtend.frequent_patterns import association_rules



In [2]:
# Data transaksi dalam bentuk list of lists
dataset=[['milk','onion','nutmeg','kidney beans','eggs','yogurt'],
         ['oil','onion','nutmeg','kidney beans','eggs','yogurt'],
         ['milk','apple','kidney beans','eggs'],
         ['milk','unicorn','corn','kidney beans','yogurt'],
         ['corn','onion','onion','kidney beans','ice cream','eggs']]

In [3]:
# Mengimpor TransactionEncoder dari mlxtend.preprocessing
from mlxtend.preprocessing import TransactionEncoder

# Menginisialisasi objek TransactionEncoder
te=TransactionEncoder()
# Menyesuaikan dan mengubah data transaksi menjadi format array boolean
te_ary=te.fit(dataset).transform(dataset)
# Membuat DataFrame dari array boolean dengan kolom sesuai item dalam transaksi
df=pd.DataFrame(te_ary,columns=te.columns_)
# Menampilkan DataFrame yang terbentuk
df

Unnamed: 0,apple,corn,eggs,ice cream,kidney beans,milk,nutmeg,oil,onion,unicorn,yogurt
0,False,False,True,False,True,True,True,False,True,False,True
1,False,False,True,False,True,False,True,True,True,False,True
2,True,False,True,False,True,True,False,False,False,False,False
3,False,True,False,False,True,True,False,False,False,True,True
4,False,True,True,True,True,False,False,False,True,False,False


In [4]:
# Menggunakan algoritma fpgrowth untuk menemukan itemset yang sering muncul dengan minimum support 0.6
fpgrowth(df,min_support=0.6)

Unnamed: 0,support,itemsets
0,1.0,(4)
1,0.8,(2)
2,0.6,(10)
3,0.6,(8)
4,0.6,(5)
5,0.8,"(2, 4)"
6,0.6,"(10, 4)"
7,0.6,"(8, 2)"
8,0.6,"(8, 4)"
9,0.6,"(8, 2, 4)"


In [5]:
# Menyimpan itemset yang sering muncul ke dalam variabel frequent_itemsets
frequent_itemsets=fpgrowth(df,min_support=0.6, use_colnames=True)
# Menampilkan itemset yang sering muncul
frequent_itemsets

Unnamed: 0,support,itemsets
0,1.0,(kidney beans)
1,0.8,(eggs)
2,0.6,(yogurt)
3,0.6,(onion)
4,0.6,(milk)
5,0.8,"(kidney beans, eggs)"
6,0.6,"(yogurt, kidney beans)"
7,0.6,"(onion, eggs)"
8,0.6,"(kidney beans, onion)"
9,0.6,"(kidney beans, onion, eggs)"


In [6]:
# Menghasilkan aturan asosiasi dari itemset yang sering muncul dengan menggunakan metrik confidence dan minimum threshold 0.8
rules=association_rules(frequent_itemsets, metric="confidence", min_threshold=0.8)
# Menampilkan aturan asosiasi yang dihasilkan
rules

Unnamed: 0,antecedents,consequents,antecedent support,consequent support,support,confidence,lift,leverage,conviction,zhangs_metric
0,(kidney beans),(eggs),1.0,0.8,0.8,0.8,1.0,0.0,1.0,0.0
1,(eggs),(kidney beans),0.8,1.0,0.8,1.0,1.0,0.0,inf,0.0
2,(yogurt),(kidney beans),0.6,1.0,0.6,1.0,1.0,0.0,inf,0.0
3,(onion),(eggs),0.6,0.8,0.6,1.0,1.25,0.12,inf,0.5
4,(onion),(kidney beans),0.6,1.0,0.6,1.0,1.0,0.0,inf,0.0
5,"(kidney beans, onion)",(eggs),0.6,0.8,0.6,1.0,1.25,0.12,inf,0.5
6,"(onion, eggs)",(kidney beans),0.6,1.0,0.6,1.0,1.0,0.0,inf,0.0
7,(onion),"(kidney beans, eggs)",0.6,0.8,0.6,1.0,1.25,0.12,inf,0.5
8,(milk),(kidney beans),0.6,1.0,0.6,1.0,1.0,0.0,inf,0.0


In [7]:
# Mengimpor fungsi apriori dari mlxtend.frequent_patterns
from mlxtend.frequent_patterns import apriori
# Mengukur waktu yang dibutuhkan untuk menjalankan algoritma apriori
%timeit apriori(df,min_support=0.6)

3.84 ms ± 217 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [8]:
# Mengimpor fungsi fpgrowth dari mlxtend.frequent_patterns
from mlxtend.frequent_patterns import fpgrowth
# Mengukur waktu yang dibutuhkan untuk menjalankan algoritma fpgrowth
%timeit fpgrowth(df,min_support=0.6)

1.64 ms ± 161 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [None]:
# Frequent Itemsets: Algoritma fpgrowth menemukan itemset yang sering muncul dalam dataset dengan minimum support 0.6. Dari hasil yang ditampilkan, bisa dilihat kombinasi item mana yang sering dibeli bersama dalam transaksi.

# Association Rules: Dari itemset yang sering muncul, aturan asosiasi dibentuk menggunakan metrik confidence dengan minimum threshold 0.8. Aturan ini menunjukkan hubungan yang kuat antara item-item dalam transaksi. Contoh aturan mungkin menunjukkan bahwa jika seseorang membeli onion dan kidney beans, maka ada kemungkinan besar mereka juga akan membeli eggs.

# Comparison of Algorithms: Waktu eksekusi untuk algoritma apriori dan fpgrowth diukur. Biasanya, fpgrowth lebih cepat daripada apriori untuk dataset besar karena fpgrowth menggunakan pendekatan tree-based yang lebih efisien.