# R4.04 - Méthode d'optimisation

## Fiche 3

#### Import des bibliothèques 


In [13]:
import pandas as pd
import numpy as np
from mlxtend.frequent_patterns import apriori, association_rules

### Étape 1 : Chargement et filtrage des données


In [14]:
# Définition des chemins vers les fichiers de données
fichier_ancien = "online_retail_2009-2010.csv"  
fichier_recent = "online_retail_2010_2011.csv"

# Importation des données
ancien_dataset = pd.read_csv(fichier_ancien, sep=";", encoding="latin1")
recent_dataset = pd.read_csv(fichier_recent, sep=";", encoding="latin1")

# Fusion des données
ensemble_donnees = pd.concat([ancien_dataset, recent_dataset])

# Filtrage des données pour ne conserver que les transactions en France
donnees_france = ensemble_donnees[ensemble_donnees['Country'] == "France"]

### Étape 2 : Préparation des données pour l'algorithme Apriori


Génère une matrice où chaque ligne est une facture, chaque colonne est un produit, et les valeurs sont les quantités achetées.

In [15]:
pivot_table = pd.crosstab(donnees_france['Invoice'], donnees_france['Description'])
pivot_table

Description,50'S CHRISTMAS GIFT BAG LARGE,DOLLY GIRL BEAKER,FLAMINGO LIGHTS,I LOVE LONDON MINI BACKPACK,LARGE SKULL WINDMILL,NINE DRAWER OFFICE TIDY,RED/WHITE DOT MINI CASES,SET 2 TEA TOWELS I LOVE LONDON,SPACEBOY BABY GIFT SET,TRELLIS COAT RACK,...,YELLOW RED FLOWER PIGGY BANK,YELLOW SHARK HELICOPTER,YOU'RE CONFUSING ME METAL SIGN,ZINC STAR T-LIGHT HOLDER,ZINC FOLKART SLEIGH BELLS,ZINC HERB GARDEN CONTAINER,ZINC METAL HEART DECORATION,ZINC T-LIGHT HOLDER STAR LARGE,ZINC T-LIGHT HOLDER STARS SMALL,ZINC WILLIE WINKIE CANDLE STICK
Invoice,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
489439,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
489557,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
489883,0,0,0,0,0,0,1,0,0,0,...,0,0,0,0,0,0,0,0,0,0
490139,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
490152,0,0,0,0,0,0,1,0,0,0,...,0,0,0,0,0,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
C579532,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
C579562,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
C580161,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
C580263,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


Convertit cette matrice en booléens (`True` si un produit figure dans la facture).

In [16]:
binaire_table = pivot_table > 0

### Étape 3 : Application de l'algorithme Apriori

 Trouve les ensembles d'articles fréquents (itemsets) avec un support minimum de 5%.

In [9]:
itemsets_frequents = apriori(binaire_table, min_support=0.05, use_colnames=True)

Produit des règles d'association en analysant la relation entre items avec une confiance d'au moins 80%.

In [11]:
regles_assoc = association_rules(itemsets_frequents, metric="confidence", min_threshold=0.8)

### Étape 4 : Affichage des résultats


In [None]:
print("Ensembles d'articles fréquents :")
print(itemsets_frequents)

print("\nRègles d'association :")
print(regles_assoc)
len(regles_assoc)
regles_assoc

Ensembles d'articles fréquents :
      support                                           itemsets
0    0.053619                      (4 TRADITIONAL SPINNING TOPS)
1    0.057641                       (ALARM CLOCK BAKELIKE GREEN)
2    0.060322                        (ALARM CLOCK BAKELIKE PINK)
3    0.056300                        (ALARM CLOCK BAKELIKE RED )
4    0.069705                       (ASSORTED COLOUR MINI CASES)
..        ...                                                ...
97   0.072386  (PLASTERS IN TIN WOODLAND ANIMALS, POSTAGE, PL...
98   0.064343  (PLASTERS IN TIN WOODLAND ANIMALS, POSTAGE, PL...
99   0.058981  (ROUND SNACK BOXES SET OF4 WOODLAND , POSTAGE,...
100  0.081769  (POSTAGE, SET/6 RED SPOTTY PAPER PLATES, SET/6...
101  0.058981  (SET/20 RED RETROSPOT PAPER NAPKINS , SET/6 RE...

[102 rows x 2 columns]

Règles d'association :
                                          antecedents  \
0                         (ALARM CLOCK BAKELIKE PINK)   
1                        

37