## Market Basket Analysis Using Apriori

**Assosiation rules** digunakan untuk mengidentifikasi hubungan antara berbagai item. Salah satu algoritma yang dapat digunakan saat association rules adalah algoritma apriori. Algoritma apriori sering digunakan untuk mengidentifikasi market basket analysis dimana biasanya terdapat pola saat customer berbelanja. </br>

**Algoritma apriori** merupakan algoritma machine learning yang digunakan untuk mengetahui hubungan antara berbagai item yang terlibat dimana output yang dihasilkan adalah rekomendasi produk berdasarkan produk yang telah berada dalam keranjang pengguna.

**Daftar isi**:
1. Data Preprocessing
2. Apriori
3. Kesimpulan

Menu barang yang disediakan adalah sebagai berikut:
![Capture](capture.PNG)

### Import Libraries

In [4]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
!pip install apyori
from apyori import apriori



You are using pip version 9.0.1, however version 19.2.3 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.


### Import Dataset

In [5]:
belanja=pd.read_csv('Belanja.csv')
belanja.head()

Unnamed: 0,Timestamp,Name,Item 1,Item 2,Item 3
0,2019/09/17 8:58:22 AM GMT+7,Firdaus Adi Nugroho,HP,Racket,Watch
1,2019/09/17 8:58:24 AM GMT+7,faizah,HP,Camera,Watch
2,2019/09/17 8:58:30 AM GMT+7,andrem,Watch,Camera,Music Pad
3,2019/09/17 8:58:30 AM GMT+7,laili,Camera,Watch,Mouse
4,2019/09/17 8:58:33 AM GMT+7,Tara,HP,Watch,Music Pad


**menghapus variabel timestamp dan name :**

In [6]:
belanja1=belanja.drop(['Timestamp','Name'],axis=1)

### Data Preprocessing

Library Apriori menggunakan dataset dengan berbentuk list dimana keseluruhan dataset merupakan list dari transaksi barang yang akan dibeli sehingga perlu merubah bentuk data dari data frame menjadi list.

In [7]:
records=[]
for i in range(0, 23):
    records.append([str(belanja1.values[i,j]) for j in range (0,3)])

In [8]:
records

[['HP', 'Racket', 'Watch'],
 ['HP', 'Camera', 'Watch'],
 ['Watch', 'Camera', 'Music Pad'],
 ['Camera', 'Watch', 'Mouse'],
 ['HP', 'Watch', 'Music Pad'],
 ['Watch', 'Racket', 'Camera'],
 ['HP', 'Camera', 'Watch'],
 ['Watch', 'Camera', 'Music Pad'],
 ['Racket', 'Soap', 'Guitar'],
 ['Racket', 'Camera', 'Guitar'],
 ['Camera', 'Bag', 'nan'],
 ['Music Pad', 'Guitar', 'Camera'],
 ['Camera', 'Watch', 'nan'],
 ['Guitar', 'Camera', 'Music Pad'],
 ['Camera', 'Watch', 'Music Pad'],
 ['Camera', 'Racket', 'Guitar'],
 ['Guitar', 'Camera', 'Watch'],
 ['Guitar', 'Watch', 'nan'],
 ['Camera', 'Watch', 'nan'],
 ['Soap', 'Bag', 'Guitar'],
 ['Router', 'Bag', 'nan'],
 ['Watch', 'Racket', 'Soap'],
 ['Music Pad', 'Soap', 'Watch']]

### Applying Apriori

Parameter yang digunakan pada apriori :<br>
1. Min_support
2. Min_confidence
3. Min_lift
4. Min_length (jumlah minimum item yang Anda inginkan dalam aturan)

In [21]:
association_rules=apriori(records, min_supports=0.05,min_confidence=0.05, min_lift=1.2)
association_results=list(association_rules)
association_results

[RelationRecord(items=frozenset({'Guitar', 'Racket'}), support=0.13043478260869565, ordered_statistics=[OrderedStatistic(items_base=frozenset({'Guitar'}), items_add=frozenset({'Racket'}), confidence=0.375, lift=1.4375), OrderedStatistic(items_base=frozenset({'Racket'}), items_add=frozenset({'Guitar'}), confidence=0.5, lift=1.4375)]),
 RelationRecord(items=frozenset({'Watch', 'HP'}), support=0.17391304347826086, ordered_statistics=[OrderedStatistic(items_base=frozenset({'HP'}), items_add=frozenset({'Watch'}), confidence=1.0, lift=1.5333333333333332), OrderedStatistic(items_base=frozenset({'Watch'}), items_add=frozenset({'HP'}), confidence=0.26666666666666666, lift=1.5333333333333334)])]

**Tiga komponen utama pada algoritma apriori:** <br>
**1. Support : ** Seberapa sering itemset muncul dalam dataset. <br>
**2. Lift : ** Peningkatan rasio penjualan item B ketika A terjual <br>
**3. Confidence : ** Kemungkinan barang B juga dibeli jika barang A dibeli

In [22]:
results=[]
for item in association_results:

    pair = item[0] 
    items = [x for x in pair]
    
    value0=str(items[0])
    value1=str(items[1])
    value2=str(item[1])[:7]
    value3=str(item[2][0][2])[:7]
    value4=str(item[2][0][3])[:7]
    
    rows=(value0, value1, value2, value3, value4)
    results.append(rows)
    
labels=['Barang1', 'Barang2','Support','Confidence','Lift' ]
belanja_suggestion=pd.DataFrame.from_records(results, columns=labels)

print(belanja_suggestion)

  Barang1 Barang2  Support Confidence     Lift
0  Guitar  Racket  0.13043      0.375   1.4375
1   Watch      HP  0.17391        1.0  1.53333


### Kesimpulan

Dengan menggunakan batas minimal : <br>
**supports** =0.05 <br>
**confidence** =0.05 <br>
**lift**=1.2 </br>

Didapatkan hasil bahwa support paling tinggi adalah antara watch dan HP. Sehingga kemungkinan orang membeli HP lalu membeli watch adalah 100%.
