In [1]:
import numpy as np
from Transactions import *

# Défintion de chemin de fichier des Transactions, min_support, min_conf

In [2]:
path = "data.txt"
min_support = 0.35
min_conf = 0.5

In [3]:
Transactions = load_transactions(path)
num_trans = len(Transactions)

In [4]:
Transactions

[['GPS', 'LCD', '3G', 'Bluetooth', 'Wi-Fi', 'USB', 'HDMI'],
 ['Wi-Fi', 'USB'],
 ['LCD', 'Bluetooth'],
 ['Bluetooth', 'Wi-Fi'],
 ['GPS', 'LCD', 'Bluetooth', 'Wi-Fi'],
 ['GPS', '3G', 'Bluetooth', 'Wi-Fi', 'USB', 'HDMI']]

# Initialisation des listes C et L

#### C : Dictionnaire qui stocke les différents ensembles d'articles 
#### L : Dictionnaire qui stocke les ensembles d'articles fréquents qui satisfont la condition de support minimale.
Les transactions sont stockées dans la variable Transactions et l'ensemble de tous les éléments dans les transactions est stocké dans la variable all_items.La variable frequent_items est utilisée pour stocker tous les éléments fréquents de la taille 1.

Le code parcourt ensuite chaque transaction pour créer tous les itemsets de taille 1 et stocker ces itemsets dans C. Les éléments qui apparaissent dans ces itemsets sont également stockés dans frequent_items.

In [5]:
C = {}
L = {}
itemset_size = 1

discarded = {itemset_size : []}
all_items = set()
for Transaction in Transactions:
    for item in Transaction:
        all_items.add(item)

all_items = sorted(all_items)
C[itemset_size] = [[item] for item in all_items]

frequent_items = set()
for itemset in C[itemset_size]:
    for item in itemset:
        frequent_items.add(item)

print("Items:", frequent_items)

Items: {'Wi-Fi', 'Bluetooth', 'LCD', 'HDMI', 'GPS', '3G', 'USB'}


In [6]:
C

{1: [['3G'], ['Bluetooth'], ['GPS'], ['HDMI'], ['LCD'], ['USB'], ['Wi-Fi']]}

# Définition des Sous_Ensembles fréquent avec le min_supp = 0.35

In [7]:
def print_table(T, supp_count):
    print("Itemset | Support")
    for k in range(len(T)):
        print("{} : {}".format(T[k], supp_count[k]))
    print("\n\n")

#####  Nous définissons d'abord "f", "sup" et "new_discarded" en utilisant la fonction "get_frequent" pour les éléments de taille 1 dans "C". Nous mettons à jour "discarded" en ajoutant les éléments abandonnés de cette étape et "L" en ajoutant les éléments fréquents obtenus. 


In [8]:
supp_count_L = {}
f, sup, new_discarded = get_frequent(C[itemset_size], Transactions, min_support, discarded)
discarded.update({itemset_size : new_discarded})
L.update({itemset_size : f})
supp_count_L.update({itemset_size : sup})

In [9]:
print("Taille 1 \n\n")
print_table(L[1], supp_count_L[1])

Taille 1 


Itemset | Support
['Bluetooth'] : 5
['GPS'] : 3
['LCD'] : 3
['USB'] : 3
['Wi-Fi'] : 5





In [10]:
L

{1: [['Bluetooth'], ['GPS'], ['LCD'], ['USB'], ['Wi-Fi']]}

### Ce code implémente l'algorithme d'analyse des ensembles fréquents Apriori. Il définit un processus itératif pour trouver des ensembles fréquents à partir de données de transactions.

##### À chaque tour de boucle, un nouvel ensemble C est créé en joignant les ensembles fréquents de la tour précédente.
##### Les occurrences de chaque ensemble candidat dans les transactions sont ensuite déterminées.
##### Les ensembles candidats qui ne répondent pas au critère de support minimum sont marqués comme des ensembles rejetés pour les itérations ultérieures.
##### Les ensembles candidats qui répondent au critère de support minimum sont marqués comme des ensembles fréquents pour cette itération.

In [11]:
k = itemset_size + 1
convergence = False
while not convergence:
    C.update({ k : join_set_itemsets(L[k-1])})
    print("Table C{}: \n".format(k))
    print_table(C[k], [count_occurences(it, Transactions) for it in C[k]])
    f, sup, new_discarded = get_frequent(C[k], Transactions, min_support, discarded)
    discarded.update({k : new_discarded})
    L.update({k : f})
    supp_count_L.update({k : sup})
    if len(L[k]) == 0:
        convergence = True
    else:
        print("Table L{}: \n".format(k))
        print_table(L[k], supp_count_L[k])
    k += 1 

Table C2: 

Itemset | Support
['Bluetooth', 'GPS'] : 3
['Bluetooth', 'LCD'] : 3
['Bluetooth', 'USB'] : 2
['Bluetooth', 'Wi-Fi'] : 4
['LCD', 'GPS'] : 2
['GPS', 'USB'] : 2
['Wi-Fi', 'GPS'] : 3
['LCD', 'USB'] : 1
['LCD', 'Wi-Fi'] : 2
['Wi-Fi', 'USB'] : 3



Table L2: 

Itemset | Support
['Bluetooth', 'GPS'] : 3
['Bluetooth', 'LCD'] : 3
['Bluetooth', 'Wi-Fi'] : 4
['Wi-Fi', 'GPS'] : 3
['Wi-Fi', 'USB'] : 3



Table C3: 

Itemset | Support
['Bluetooth', 'LCD', 'GPS'] : 2
['Bluetooth', 'Wi-Fi', 'GPS'] : 3
['Bluetooth', 'Wi-Fi', 'GPS', 'USB'] : 2
['Bluetooth', 'Wi-Fi', 'LCD'] : 2
['Bluetooth', 'Wi-Fi', 'LCD', 'GPS'] : 2
['Bluetooth', 'Wi-Fi', 'LCD', 'USB'] : 1
['Bluetooth', 'Wi-Fi', 'USB'] : 2
['Wi-Fi', 'GPS', 'USB'] : 2



Table L3: 

Itemset | Support
['Bluetooth', 'Wi-Fi', 'GPS'] : 3



Table C4: 

Itemset | Support





In [17]:
print("Ensemble Frequent:")
for itemset in L.values():
    for item in itemset:
        print(item)    

Ensemble Frequent:
['Bluetooth']
['GPS']
['LCD']
['USB']
['Wi-Fi']
['Bluetooth', 'GPS']
['Bluetooth', 'LCD']
['Bluetooth', 'Wi-Fi']
['Wi-Fi', 'GPS']
['Wi-Fi', 'USB']
['Bluetooth', 'Wi-Fi', 'GPS']


# Défnition des Règles de Gestion

##### Cette fonction powerset permet de générer tous les sous-ensembles possibles d'un ensemble .

La fonction utilise la bibliothèque itertools et sa fonction combinations pour créer les combinaisons d'éléments à partir de l'ensemble "s" avec une longueur allant de 1 à la longueur totale de "s". Le résultat est ensuite concaténé à l'aide de la fonction chain.from_iterable pour obtenir la liste complète de tous les sous-ensembles.

In [13]:
from itertools import combinations, chain
def powerset(s):
    return list(chain.from_iterable(combinations(s, r) for r in range(1, len(s) + 1)))

##### La fonction write_rules prend en entrée les éléments suivants :

La fonction retourne une chaîne de caractères qui représente la règle d'association générée à partir des entrées. La chaîne de caractères comprend l'itemset fréquent, la règle d'association, et la confiance de la règle.

In [14]:
def write_rules(X, X_S, S, conf, num_trans):
    out_rules = ""
    out_rules += "Freq. Itemset: {}\n\n".format(X)
    out_rules += "     Rule:{} -> {} \n".format(list(S), list(X_S))
    out_rules += "     Conf:{0:2.3f} \n\n".format(conf)
    return out_rules

#### C'est une fonction pour écrire les règles d'association à partir des itemsets fréquents. Elle prend en entrée les itemsets fréquents L, le nombre de transactions (num_trans) et la minimale valeur de confiance (min_conf).

In [15]:
assoc_rules_str = ""
for i in range(1, len(L)):
    for j in range(len(L[i])):
        s = list(powerset(set(L[i][j])))
        s.pop()
        for z in s:
            S = set(z)
            X = set(L[i][j])
            X_S = set(X-S)
            sup_x = count_occurences(X, Transactions)
            sup_x_s = count_occurences(X_S, Transactions)
            conf = sup_x / count_occurences(S, Transactions)
            if conf >= min_conf and sup_x >= min_support:
                assoc_rules_str += write_rules(X, X_S, S, conf, num_trans)

## Les Règles de Gestion:

In [16]:
print(assoc_rules_str)

Freq. Itemset: {'Bluetooth', 'GPS'}

     Rule:['Bluetooth'] -> ['GPS'] 
     Conf:0.600 

Freq. Itemset: {'Bluetooth', 'GPS'}

     Rule:['GPS'] -> ['Bluetooth'] 
     Conf:1.000 

Freq. Itemset: {'Bluetooth', 'LCD'}

     Rule:['Bluetooth'] -> ['LCD'] 
     Conf:0.600 

Freq. Itemset: {'Bluetooth', 'LCD'}

     Rule:['LCD'] -> ['Bluetooth'] 
     Conf:1.000 

Freq. Itemset: {'Bluetooth', 'Wi-Fi'}

     Rule:['Bluetooth'] -> ['Wi-Fi'] 
     Conf:0.800 

Freq. Itemset: {'Bluetooth', 'Wi-Fi'}

     Rule:['Wi-Fi'] -> ['Bluetooth'] 
     Conf:0.800 

Freq. Itemset: {'Wi-Fi', 'GPS'}

     Rule:['Wi-Fi'] -> ['GPS'] 
     Conf:0.600 

Freq. Itemset: {'Wi-Fi', 'GPS'}

     Rule:['GPS'] -> ['Wi-Fi'] 
     Conf:1.000 

Freq. Itemset: {'Wi-Fi', 'USB'}

     Rule:['Wi-Fi'] -> ['USB'] 
     Conf:0.600 

Freq. Itemset: {'Wi-Fi', 'USB'}

     Rule:['USB'] -> ['Wi-Fi'] 
     Conf:1.000 

Freq. Itemset: {'Bluetooth', 'Wi-Fi', 'GPS'}

     Rule:['Bluetooth'] -> ['Wi-Fi', 'GPS'] 
     Conf:0.600 

Freq.