In [5]:
!pip install mlxtend 



In [9]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# mlxtend: machine learning extensions
# TransactionEncoder alışveriş sepeti gibi liste şeklindeki verileri [['milk', 'bread'], ['bread']] binary tabloya çevirir.
from mlxtend.preprocessing import TransactionEncoder
# apriori: Sık geçen ürün gruplarını (frequent itemsets) bulmak için kullanılır.
# association_rules: Bu sık gruplardan anlamlı ilişki kuralları üretir.
# Örneğin, {milk, bread} sık geçiyor milk->bread kuralı çıkarılabilir.
from mlxtend.frequent_patterns import apriori, association_rules

In [12]:
# 1. CSV'den veriyi oku
df = pd.read_csv("sepet.csv", header=None)

In [11]:
df.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19
0,shrimp,almonds,avocado,vegetables mix,green grapes,whole weat flour,yams,cottage cheese,energy drink,tomato juice,low fat yogurt,green tea,honey,salad,mineral water,salmon,antioxydant juice,frozen smoothie,spinach,olive oil
1,burgers,meatballs,eggs,,,,,,,,,,,,,,,,,
2,chutney,,,,,,,,,,,,,,,,,,,
3,turkey,avocado,,,,,,,,,,,,,,,,,,
4,mineral water,milk,energy bar,whole wheat rice,green tea,,,,,,,,,,,,,,,


In [13]:
# 2. Transaction Listesi oluştur
transactions = df.apply(lambda row: [item for item in row if pd.notnull(item)], axis=1).tolist()

In [14]:
# 3. One-hot encoding işlemi
te = TransactionEncoder()
te_array = te.fit(transactions).transform(transactions)
df_trans = pd.DataFrame(te_array, olumncs=te.columns_)

In [15]:
# 4. Apriori Algoritmasını uygula (min_support %2)
frequent_itemsets = apriori(df_trans, min_support=0.02, use_colnames=True)

In [16]:
# 5. Association Rules çıkar 
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1.0) # lift

In [17]:
# 6. Sonuçları gör
print(rules[['antecedents','consequents','support','confidence','lift']])

        antecedents     consequents   support  confidence      lift
0            (eggs)       (burgers)  0.028796    0.160237  1.837830
1         (burgers)          (eggs)  0.028796    0.330275  1.837830
2         (burgers)  (french fries)  0.021997    0.252294  1.476173
3    (french fries)       (burgers)  0.021997    0.128705  1.476173
4   (mineral water)       (burgers)  0.024397    0.102349  1.173883
..              ...             ...       ...         ...       ...
89       (pancakes)     (spaghetti)  0.025197    0.265077  1.522468
90         (shrimp)     (spaghetti)  0.021197    0.296642  1.703760
91      (spaghetti)        (shrimp)  0.021197    0.121746  1.703760
92       (tomatoes)     (spaghetti)  0.020931    0.306043  1.757755
93      (spaghetti)      (tomatoes)  0.020931    0.120214  1.757755

[94 rows x 5 columns]


## Satır 0: (eggs) -> (burgers)
- Support = 0.028 -> Tüm işlemlerin yaklaşık %2.8'inde hem yumurta hem burger birlikte geçiş.
- Confidence = 0.16 -> Yumurtayı alanların %16'sı burger da almış.
- Lift = 1.83 -> Burger alma ihtimali, yumurta varsa 1.83 kat daha fazla
- Yorum: Bu ilişki istatistiksel olarak anlamlı ve öneri sisteminde kullanılabilir.
## Öneri Sistemi Örneği
- Eğer bir kullanıcı alışveriş sepetine `eggs` eklediyse, Lift değeri 1.83 olan `burgers` önerilebilir:
- __"Yumurtayı tercih edenler, burger de almayı seviyor. Sizin için öneriyoruz!"__
## Çıktı Kolonlarının Anlamı
|Kolon |Açıklama |
|:-----|----:|
|`antecedents` |Koşul kısmı (Eğer bu ürün varsa...) |
|`consequents` |Sonuç kısmı (... bu ürün de alınır) |
|`support` |Bu iki ürün birlikte kaç işlemde var? (oran) |
|`confidence`|Eğer antecedent varsa, consequent'in gelme olasılığı|
|`lift`|Bu ilişki ne kadar güçlü? Tesadüften daha anlamlı mı?|

## Hangi Kurallar Değerlidir?
|Ölçüt |Ne aramalısın? |Neden?|
|:-----|----|----:|
|Lift |> 1.2-1.5 ve üzeri |İlişkinin gücü|
|Confidence |> %30-40 |Güvenilir tahmin|
|Support |> %1-2 |Anlamlı yaygınlık|

# Sonuç:
- Bu çıktılar, müşteri davranış kalıplarını anlamak ve:
    - Öneri sistemleri oluşturmak
    - Kampanya hedefleri belirlemek
    - Ürün yerleşimi düzenlemek
için kullanılabilir.

In [19]:
# 1. Anlamlı kural kriterleri belirle
min_support = 0.02
min_confidence = 0.3
min_lift = 1.2

# 2. Filtreleme Kriterleri
filtered_rules = rules[
    (rules['support'] >= 0.02)&
    (rules['confidence'] >= 0.3)&
    (rules['lift'] >= 1.2)
]

# Anlamlı kuralları göster
print(filtered_rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

            antecedents      consequents   support  confidence      lift
1             (burgers)           (eggs)  0.028796    0.330275  1.837830
9                (cake)  (mineral water)  0.027463    0.338816  1.421397
11            (chicken)  (mineral water)  0.022797    0.380000  1.594172
24          (chocolate)  (mineral water)  0.052660    0.321400  1.348332
29        (cooking oil)  (mineral water)  0.020131    0.394256  1.653978
51    (frozen smoothie)  (mineral water)  0.020264    0.320000  1.342461
55  (frozen vegetables)  (mineral water)  0.035729    0.374825  1.572463
62        (ground beef)  (mineral water)  0.040928    0.416554  1.747522
64        (ground beef)      (spaghetti)  0.039195    0.398915  2.291162
67     (low fat yogurt)  (mineral water)  0.023997    0.313589  1.315565
69               (milk)  (mineral water)  0.047994    0.370370  1.553774
73          (olive oil)  (mineral water)  0.027596    0.419028  1.757904
75           (pancakes)  (mineral water)  0.033729 

In [23]:
# En anlamlı ilk 5 kuralı getir
top_rules = filtered_rules.sort_values(by = 'lift', ascending=False).head(5)
print(top_rules[['antecedents','consequents','support','confidence','lift']])

      antecedents      consequents   support  confidence      lift
64  (ground beef)      (spaghetti)  0.039195    0.398915  2.291162
86    (olive oil)      (spaghetti)  0.022930    0.348178  1.999758
79         (soup)  (mineral water)  0.023064    0.456464  1.914955
1       (burgers)           (eggs)  0.028796    0.330275  1.837830
73    (olive oil)  (mineral water)  0.027596    0.419028  1.757904


In [1]:
filtered_rules.to_csv("anlamli_kurallar.csv", index=False)
# CSV dosyaları belli süre aralığında çekilmeli.

NameError: name 'filtered_rules' is not defined