Workshop X – thème
Objectif : appliquer [Apriori / FP-Growth / Market Basket] pour extraire des règles d'association

In [1]:


import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

# 1. Définir un petit jeu de transactions à la main
transactions = [
    ['bread', 'milk'],
    ['bread', 'diaper', 'beer', 'eggs'],
    ['milk', 'diaper', 'beer', 'cola'],
    ['bread', 'milk', 'diaper', 'beer'],
    ['bread', 'milk', 'diaper', 'cola'],
]

# 2. Encoder les transactions en tableau binaire (one-hot)
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_ary, columns=te.columns_)

print("Aperçu du tableau binaire :")
print(df.head())

# 3. Extraire les itemsets fréquents avec Apriori
frequent_itemsets = apriori(df, min_support=0.4, use_colnames=True)
print("\nItemsets fréquents :")
print(frequent_itemsets)

# 4. Générer les règles d'association à partir des itemsets
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1.0)

# 5. Trier les règles par lift pour voir les plus intéressantes
rules_sorted = rules.sort_values(by="lift", ascending=False)

print("\nRègles d'association triées par lift :")
print(rules_sorted[['antecedents', 'consequents', 'support', 'confidence', 'lift']])



Aperçu du tableau binaire :
    beer  bread   cola  diaper   eggs   milk
0  False   True  False   False  False   True
1   True   True  False    True   True  False
2   True  False   True    True  False   True
3   True   True  False    True  False   True
4  False   True   True    True  False   True

Itemsets fréquents :
    support               itemsets
0       0.6                 (beer)
1       0.8                (bread)
2       0.4                 (cola)
3       0.8               (diaper)
4       0.8                 (milk)
5       0.4          (beer, bread)
6       0.6         (beer, diaper)
7       0.4           (beer, milk)
8       0.6        (bread, diaper)
9       0.6          (bread, milk)
10      0.4         (diaper, cola)
11      0.4           (milk, cola)
12      0.6         (milk, diaper)
13      0.4  (beer, bread, diaper)
14      0.4   (beer, milk, diaper)
15      0.4  (bread, milk, diaper)
16      0.4   (diaper, milk, cola)

Règles d'association triées par lift :
        an