# Mağaza Verilerinin Pazar Sepeti Analizi

## Veri kümesi

* Bir Fransız perakende mağazasında bir hafta boyunca 7500 işlem verilen farklı ürünler.
* Apriori kullanarak birliktelik kuralını hesaplamak için kütüphanemiz(**apyori**) var.



## Kütüphaneleri import edelim

In [None]:
!pip install apyori

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from apyori import apriori

## Verileri okuyalım ve göz atalım

In [None]:
#ROOT_DIR = "/content/drive/MyDrive/..."
ROOT_DIR = "https://raw.githubusercontent.com/yavuzKomecoglu/yapay-zeka-egitimi-tubitak-bideb-2237a/main/"
DATASET_PATH = ROOT_DIR + "datasets/apyori/store_data.csv"

In [None]:
store_data = pd.read_csv(DATASET_PATH, header=None)
display(store_data.head())
print(store_data.shape)

## Veri ön işleme adımları
*  Burada Apriori Algoritması için liste şeklinde bir veriye ihtiyacımız var.

In [None]:
records = []
for i in range(1, 7501):
    #records.append([str(store_data.values[i, j]) for j in range(0, 20)])
    items = []
    for j in range(0, 20):
      item = str(store_data.values[i, j])
      #print(item)
      if item != 'nan':
        items.append(item)

    records.append(items)

In [None]:
print(type(records))

## Apriori Algoritması

* Şimdi verilere algoritma uygulama zamanı.
* Kuralları elde etmek için kullanacağımız "min_support", "min_confidence", "min_lift" ve "min uzunluk" değerlerini hesaplamak için örnek veri kümesi sağladık.

#### Ölçüm 1: Support (Destek).
Bu, bir öğe kümesinin (itemset) göründüğü işlemlerin oranıyla ölçüldüğünde, bir öğe kümesinin ne kadar popüler olduğunu gösterir. 

Aşağıdaki Tablo 1'de {elma} desteği 8 üzerinden 4 veya %50'dir. Öğe kümeleri ayrıca birden çok öğe içerebilir. Örneğin, {elma, bira, pirinç} desteği 8 üzerinden 2 veya %25'tir.

![](https://annalyzin.files.wordpress.com/2016/04/association-rule-support-table.png?w=503&h=447)

Belirli bir oranın üzerindeki ürün satışlarının kârınız üzerinde önemli bir etkisi olduğunu keşfederseniz, bu oranı destek eşiğiniz olarak kullanmayı düşünebilirsiniz. Ardından, bu eşiğin üzerindeki destek değerlerine sahip öğe kümelerini önemli öğe kümeleri olarak tanımlayabilirsiniz.

#### Ölçüm 2: Confidence (Güven) 

Bu, {X -> Y} olarak ifade edilen, X öğesi satın alındığında Y öğesinin ne kadar büyük olasılıkla satın alındığını belirtir. Bu, Y öğesinin de göründüğü X öğesiyle yapılan işlemlerin oranıyla ölçülür. Tablo 1'de, {elma -> bira} güvenirliği 4 üzerinden 3 veya %75'tir.

![](https://annalyzin.files.wordpress.com/2016/03/association-rule-confidence-eqn.png?w=527&h=77)

Güven ölçüsünün bir dezavantajı, bir ilişkinin önemini yanlış yansıtabilmesidir. Bunun nedeni, yalnızca elmaların ne kadar popüler olduğunu açıklıyor, ancak biraları değil. Genel olarak biralar da çok popülerse, elma içeren bir işlemin bira içermesi ve dolayısıyla güven ölçüsünü şişirme olasılığı daha yüksek olacaktır. Her iki bileşen öğesinin temel popülerliğini hesaba katmak için, lift adı verilen üçüncü bir ölçü kullanıyoruz.

#### Measure 3: Lift. 

Bu, Y öğesinin ne kadar popüler olduğunu kontrol ederken, X öğesi satın alındığında Y öğesinin de satın alınma olasılığını belirtir. Tablo 1'de, {elma -> bira} artışı 1'dir ve bu, öğeler arasında hiçbir ilişki olmadığı anlamına gelir. 1'den büyük bir artış değeri, X öğesi satın alınırsa Y öğesinin satın alınmasının muhtemel olduğu anlamına gelirken, 1'den küçük bir değer, X öğesinin satın alınması durumunda Y öğesinin satın alınma olasılığının düşük olduğu anlamına gelir.

![](https://annalyzin.files.wordpress.com/2016/03/association-rule-lift-eqn.png?w=566&h=80)

In [None]:
association_rules = apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2)
association_results = list(association_rules)

## Kaç tane ilişki türetilmiştir?

In [None]:
print("There are {} Relation derived.".format(len(association_results)))

### Türetilmiş Birliktelik Kuralları

In [None]:
for i in range(0, len(association_results)):
    print(association_results[i][0])

## Oluşturulan Kurallar

In [None]:
for item in association_results:
    # first index of the inner list
    # Contains base item and add item
    pair = item[0]
    items = [x for x in pair]
    print("Rule: " + items[0] + " -> " + items[1])

    # second index of the inner list
    print("Support: " + str(item[1]))

    # third index of the list located at 0th
    # of the third index of the inner list

    print("Confidence: " + str(item[2][0][2]))
    print("Lift: " + str(item[2][0][3]))
    print("=====================================")