üî¥ Avanc√© | ‚è± 60 min | üîë Concepts : Counter, defaultdict, deque, chain, groupby

# 8. Collections et Itertools

## Objectifs

- Ma√Ætriser les structures de donn√©es avanc√©es du module collections
- Utiliser Counter, defaultdict, deque, OrderedDict, ChainMap
- Exploiter le module itertools pour manipuler des it√©rateurs
- Comprendre les fonctions utilitaires de functools
- Optimiser le code avec les bons outils

## Pr√©requis

- Structures de donn√©es de base (list, dict, set)
- Compr√©hensions et g√©n√©rateurs
- Fonctions et lambda

## 1. Counter : comptage d'√©l√©ments

Counter est un dictionnaire sp√©cialis√© pour compter les occurrences.

In [None]:
from collections import Counter

# Compter des √©l√©ments dans une liste
fruits = ['pomme', 'banane', 'pomme', 'orange', 'banane', 'pomme', 'kiwi']
compteur = Counter(fruits)

print(f"Compteur: {compteur}")
print(f"Type: {type(compteur)}")

# Acc√®s aux valeurs
print(f"\nNombre de pommes: {compteur['pomme']}")
print(f"Nombre de mangues: {compteur['mangue']}")  # 0 par d√©faut

# Compter des caract√®res
texte = "bonjour le monde"
lettres = Counter(texte)
print(f"\nLettres: {lettres}")
print(f"Nombre de 'o': {lettres['o']}")

### most_common() et op√©rations

In [None]:
from collections import Counter

mots = "le chat mange le poisson le chat dort".split()
compteur = Counter(mots)

# most_common() - √©l√©ments les plus fr√©quents
print("Top 2 mots:")
for mot, count in compteur.most_common(2):
    print(f"  {mot}: {count}")

# Tous les √©l√©ments tri√©s par fr√©quence
print("\nTous les mots (tri√©s):")
for mot, count in compteur.most_common():
    print(f"  {mot}: {count}")

# Op√©rations arithm√©tiques
c1 = Counter(['a', 'b', 'c', 'a', 'b'])
c2 = Counter(['b', 'c', 'd', 'b'])

print(f"\nc1: {c1}")
print(f"c2: {c2}")
print(f"\nc1 + c2: {c1 + c2}")  # Addition
print(f"c1 - c2: {c1 - c2}")    # Soustraction (garde positifs)
print(f"c1 & c2: {c1 & c2}")    # Intersection (min)
print(f"c1 | c2: {c1 | c2}")    # Union (max)

## 2. defaultdict : valeurs par d√©faut automatiques

defaultdict cr√©e automatiquement des valeurs pour les cl√©s inexistantes.

In [None]:
from collections import defaultdict

# Dict classique - erreur si cl√© absente
scores_normal = {}
try:
    scores_normal['alice'] += 10
except KeyError as e:
    print(f"Erreur avec dict normal: {e}")

# defaultdict - cr√©e automatiquement la valeur
scores = defaultdict(int)  # int() retourne 0
scores['alice'] += 10
scores['bob'] += 20
scores['alice'] += 5

print(f"\nScores: {dict(scores)}")
print(f"Score de charlie (inexistant): {scores['charlie']}")

# defaultdict avec list
groupes = defaultdict(list)
groupes['fruits'].append('pomme')
groupes['fruits'].append('banane')
groupes['legumes'].append('carotte')

print(f"\nGroupes: {dict(groupes)}")

# defaultdict avec lambda
config = defaultdict(lambda: 'default_value')
config['host'] = 'localhost'
print(f"\nHost: {config['host']}")
print(f"Port (d√©faut): {config['port']}")

### Cas pratique : regrouper des donn√©es

In [None]:
from collections import defaultdict

# Donn√©es : transactions par utilisateur
transactions = [
    ('alice', 100),
    ('bob', 50),
    ('alice', 200),
    ('charlie', 75),
    ('bob', 150),
    ('alice', 50),
]

# Approche classique - verbeux
totaux_normal = {}
for user, montant in transactions:
    if user not in totaux_normal:
        totaux_normal[user] = 0
    totaux_normal[user] += montant

print(f"Approche classique: {totaux_normal}")

# Avec defaultdict - √©l√©gant
totaux = defaultdict(int)
for user, montant in transactions:
    totaux[user] += montant

print(f"\nAvec defaultdict: {dict(totaux)}")

# Regrouper par cat√©gorie
produits = [
    ('fruits', 'pomme'),
    ('legumes', 'carotte'),
    ('fruits', 'banane'),
    ('legumes', 'tomate'),
    ('fruits', 'orange'),
]

categories = defaultdict(list)
for categorie, produit in produits:
    categories[categorie].append(produit)

print(f"\nCat√©gories:")
for cat, items in categories.items():
    print(f"  {cat}: {items}")

## 3. OrderedDict : historique (Python < 3.7)

OrderedDict conserve l'ordre d'insertion. Depuis Python 3.7, dict est ordonn√© par d√©faut.

In [None]:
from collections import OrderedDict

# Python 3.7+ : dict est d√©j√† ordonn√©
d = {}
d['c'] = 3
d['a'] = 1
d['b'] = 2
print(f"Dict normal (Python 3.7+): {d}")
print(f"Ordre pr√©serv√©: {list(d.keys())}")

# OrderedDict a des m√©thodes suppl√©mentaires
od = OrderedDict()
od['c'] = 3
od['a'] = 1
od['b'] = 2

print(f"\nOrderedDict: {od}")

# move_to_end() - d√©placer un √©l√©ment
od.move_to_end('a')  # D√©place 'a' √† la fin
print(f"Apr√®s move_to_end('a'): {od}")

od.move_to_end('b', last=False)  # D√©place 'b' au d√©but
print(f"Apr√®s move_to_end('b', last=False): {od}")

# popitem() avec argument last
last_item = od.popitem(last=True)  # Retire le dernier
print(f"\nDernier √©l√©ment retir√©: {last_item}")
print(f"OrderedDict apr√®s popitem: {od}")

# Note: Pour la plupart des cas, dict suffit maintenant!

## 4. deque : double-ended queue

deque est optimis√© pour les ajouts/retraits aux extr√©mit√©s.

In [None]:
from collections import deque
import time

# Cr√©er une deque
d = deque(['b', 'c', 'd'])
print(f"Deque initiale: {d}")

# Ajouter aux extr√©mit√©s
d.append('e')      # Ajouter √† droite
d.appendleft('a')  # Ajouter √† gauche
print(f"Apr√®s ajouts: {d}")

# Retirer des extr√©mit√©s
droite = d.pop()       # Retirer √† droite
gauche = d.popleft()   # Retirer √† gauche
print(f"\nRetir√© √† droite: {droite}")
print(f"Retir√© √† gauche: {gauche}")
print(f"Deque: {d}")

# rotate() - rotation
d = deque([1, 2, 3, 4, 5])
print(f"\nDeque: {d}")
d.rotate(2)  # Rotation vers la droite
print(f"Apr√®s rotate(2): {d}")
d.rotate(-1)  # Rotation vers la gauche
print(f"Apr√®s rotate(-1): {d}")

# maxlen - taille maximale
historique = deque(maxlen=3)
for i in range(5):
    historique.append(i)
    print(f"Ajout de {i}: {historique}")

### Performance : deque vs list

In [None]:
from collections import deque
import time

# Comparaison de performance pour insertions au d√©but
n = 10000

# List - appendleft est lent (O(n))
start = time.perf_counter()
lst = []
for i in range(n):
    lst.insert(0, i)  # Insertion au d√©but
time_list = time.perf_counter() - start

# Deque - appendleft est rapide (O(1))
start = time.perf_counter()
dq = deque()
for i in range(n):
    dq.appendleft(i)  # Insertion au d√©but
time_deque = time.perf_counter() - start

print(f"Temps pour {n} insertions au d√©but:")
print(f"  List:  {time_list*1000:.2f}ms")
print(f"  Deque: {time_deque*1000:.2f}ms")
print(f"\nDeque est {time_list/time_deque:.1f}x plus rapide")

print("\nR√àGLE: Utiliser deque pour:")
print("  - Files (FIFO)")
print("  - Piles (LIFO)")
print("  - Buffers circulaires")
print("  - Insertions/retraits fr√©quents aux extr√©mit√©s")

## 5. ChainMap : fusionner des dicts

ChainMap groupe plusieurs dicts sans les copier.

In [None]:
from collections import ChainMap

# Configs avec priorit√©s
defaults = {'host': 'localhost', 'port': 8080, 'debug': False}
user_config = {'port': 9000, 'debug': True}
env_config = {'host': 'prod.example.com'}

# ChainMap recherche dans l'ordre
config = ChainMap(env_config, user_config, defaults)

print(f"Host: {config['host']}")    # De env_config
print(f"Port: {config['port']}")    # De user_config
print(f"Debug: {config['debug']}")  # De user_config

print(f"\nToutes les configs:")
for key, value in config.items():
    print(f"  {key}: {value}")

# Voir les maps
print(f"\nMaps: {config.maps}")

# Ajouter une nouvelle map
runtime_config = {'timeout': 30}
config = config.new_child(runtime_config)
print(f"\nApr√®s new_child: {dict(config)}")
print(f"Timeout: {config['timeout']}")

## 6. itertools : outils pour it√©rateurs

### chain() : concat√©ner des iterables

In [None]:
from itertools import chain

# Concat√©ner plusieurs listes
liste1 = [1, 2, 3]
liste2 = [4, 5, 6]
liste3 = [7, 8, 9]

# M√©thode classique
concat_normal = liste1 + liste2 + liste3
print(f"Concat√©nation classique: {concat_normal}")

# Avec chain - plus efficace, pas de copie
concat_chain = list(chain(liste1, liste2, liste3))
print(f"Avec chain: {concat_chain}")

# chain.from_iterable - pour liste de listes
listes = [[1, 2], [3, 4], [5, 6]]
aplatir = list(chain.from_iterable(listes))
print(f"\nAplatir: {aplatir}")

# M√©langer diff√©rents types d'iterables
mixed = list(chain(
    [1, 2, 3],
    'abc',
    (4, 5, 6),
    {7, 8, 9}
))
print(f"\nM√©lange de types: {mixed}")

### islice() : slicing sur it√©rateurs

In [None]:
from itertools import islice, count

# islice fonctionne sur n'importe quel it√©rateur
# Contrairement au slicing normal [start:stop:step]

# Exemple 1: Premiers √©l√©ments
nombres = range(100)
premiers_10 = list(islice(nombres, 10))
print(f"Premiers 10: {premiers_10}")

# Exemple 2: Avec start et stop
elements_10_20 = list(islice(nombres, 10, 20))
print(f"\n√âl√©ments 10-20: {elements_10_20}")

# Exemple 3: Avec step
pairs = list(islice(nombres, 0, 20, 2))
print(f"\nPairs 0-20: {pairs}")

# Exemple 4: Sur un g√©n√©rateur infini
# count() g√©n√®re des nombres √† l'infini
infini = count(start=0, step=5)
premiers = list(islice(infini, 10))  # Seulement 10 premiers
print(f"\nPremiers de count(0, 5): {premiers}")

# Cas pratique: lire un gros fichier par chunks
def lire_par_chunks(iterable, taille_chunk):
    """Lit un it√©rable par chunks de taille fixe."""
    iterator = iter(iterable)
    while True:
        chunk = list(islice(iterator, taille_chunk))
        if not chunk:
            break
        yield chunk

data = range(25)
print("\nChunks de 7:")
for i, chunk in enumerate(lire_par_chunks(data, 7), 1):
    print(f"  Chunk {i}: {chunk}")

### groupby() : regrouper des √©l√©ments

**IMPORTANT** : groupby n√©cessite que les donn√©es soient tri√©es!

In [None]:
from itertools import groupby
from operator import itemgetter

# Donn√©es : √©tudiants avec leurs classes
etudiants = [
    ('Alice', 'A'),
    ('Bob', 'B'),
    ('Charlie', 'A'),
    ('David', 'B'),
    ('Eve', 'A'),
    ('Frank', 'C'),
]

# IMPORTANT: Trier d'abord par la cl√© de regroupement!
etudiants_tries = sorted(etudiants, key=itemgetter(1))
print(f"Donn√©es tri√©es: {etudiants_tries}")

# Grouper par classe
print("\n√âtudiants par classe:")
for classe, groupe in groupby(etudiants_tries, key=itemgetter(1)):
    membres = list(groupe)
    print(f"  Classe {classe}: {[nom for nom, _ in membres]}")

# Exemple 2: grouper des nombres par parit√©
nombres = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print("\nNombres par parit√©:")
for est_pair, groupe in groupby(nombres, key=lambda x: x % 2 == 0):
    type_nombre = "pairs" if est_pair else "impairs"
    print(f"  {type_nombre}: {list(groupe)}")

# PI√àGE: Sans tri pr√©alable
print("\n‚ö†Ô∏è  PI√àGE - Sans tri pr√©alable:")
data = ['A', 'A', 'B', 'A', 'B', 'C']  # Non group√©
for key, groupe in groupby(data):
    print(f"  {key}: {list(groupe)}")
# A appara√Æt 2 fois car pas tri√©!

### product(), permutations(), combinations()

In [None]:
from itertools import product, permutations, combinations, combinations_with_replacement

# product() - produit cart√©sien
couleurs = ['rouge', 'bleu']
tailles = ['S', 'M', 'L']

produits = list(product(couleurs, tailles))
print(f"Produit cart√©sien ({len(produits)} combinaisons):")
for p in produits:
    print(f"  {p}")

# product avec repeat
des = list(product(range(1, 7), repeat=2))  # Lancer 2 d√©s
print(f"\nLancer 2 d√©s: {len(des)} r√©sultats")
print(f"Premiers r√©sultats: {des[:5]}")

# permutations() - arrangements
lettres = ['A', 'B', 'C']
perms = list(permutations(lettres))
print(f"\nPermutations de {lettres}:")
for p in perms:
    print(f"  {''.join(p)}")

# permutations de longueur 2
perms2 = list(permutations(lettres, 2))
print(f"\nPermutations de longueur 2: {perms2}")

# combinations() - combinaisons
nombres = [1, 2, 3, 4]
combos = list(combinations(nombres, 2))
print(f"\nCombinaisons de 2 parmi {nombres}:")
for c in combos:
    print(f"  {c}")

# combinations_with_replacement - avec r√©p√©tition
combos_rep = list(combinations_with_replacement([1, 2, 3], 2))
print(f"\nCombinaisons avec r√©p√©tition: {combos_rep}")

### Autres fonctions itertools utiles

In [None]:
from itertools import accumulate, starmap, count, cycle, repeat, takewhile, dropwhile
import operator

# accumulate() - sommes cumul√©es
nombres = [1, 2, 3, 4, 5]
cumul = list(accumulate(nombres))
print(f"Sommes cumul√©es de {nombres}: {cumul}")

# accumulate avec op√©rateur
produit_cumul = list(accumulate(nombres, operator.mul))
print(f"Produits cumul√©s: {produit_cumul}")

# starmap() - map avec d√©ballage
paires = [(2, 5), (3, 2), (10, 3)]
puissances = list(starmap(pow, paires))  # pow(2,5), pow(3,2), pow(10,3)
print(f"\nPuissances: {puissances}")

# count() - compteur infini
compteur = count(start=10, step=5)
print(f"\nPremiers de count(10, 5): {[next(compteur) for _ in range(5)]}")

# cycle() - r√©p√®te ind√©finiment
cyclique = cycle(['A', 'B', 'C'])
print(f"Cycle ABC (10 premiers): {[next(cyclique) for _ in range(10)]}")

# repeat() - r√©p√®te une valeur
repetitions = list(repeat('Python', 3))
print(f"\nRepeat 'Python' 3x: {repetitions}")

# takewhile() - tant que condition vraie
nombres = [1, 2, 3, 4, 5, 6, 7, 8]
petits = list(takewhile(lambda x: x < 5, nombres))
print(f"\nTakewhile x<5: {petits}")

# dropwhile() - ignore tant que condition vraie
apres = list(dropwhile(lambda x: x < 5, nombres))
print(f"Dropwhile x<5: {apres}")

## 7. functools : fonctions utilitaires

### reduce() : r√©duction

In [None]:
from functools import reduce
import operator

# reduce applique une fonction de mani√®re cumulative
nombres = [1, 2, 3, 4, 5]

# Somme
somme = reduce(lambda x, y: x + y, nombres)
print(f"Somme: {somme}")
# √âquivalent: ((((1 + 2) + 3) + 4) + 5)

# Avec operator
somme2 = reduce(operator.add, nombres)
print(f"Somme (operator.add): {somme2}")

# Produit
produit = reduce(operator.mul, nombres)
print(f"\nProduit: {produit}")

# Maximum
maximum = reduce(lambda x, y: x if x > y else y, nombres)
print(f"Maximum: {maximum}")

# Avec valeur initiale
somme_init = reduce(operator.add, nombres, 100)
print(f"\nSomme avec init=100: {somme_init}")

# Cas pratique: fusionner des dicts
dicts = [
    {'a': 1, 'b': 2},
    {'b': 3, 'c': 4},
    {'c': 5, 'd': 6}
]
fusion = reduce(lambda x, y: {**x, **y}, dicts)
print(f"\nFusion de dicts: {fusion}")

### partial() : application partielle

In [None]:
from functools import partial

# partial fixe certains arguments d'une fonction
def puissance(base, exposant):
    return base ** exposant

# Cr√©er des fonctions sp√©cialis√©es
carre = partial(puissance, exposant=2)
cube = partial(puissance, exposant=3)

print(f"carr√© de 5: {carre(5)}")
print(f"cube de 5: {cube(5)}")

# Cas pratique: logger avec contexte
def log(niveau, module, message):
    print(f"[{niveau}] {module}: {message}")

# Cr√©er des loggers sp√©cialis√©s
log_info = partial(log, "INFO")
log_error = partial(log, "ERROR")
log_db = partial(log, module="database")

print()
log_info("app", "Application d√©marr√©e")
log_error("app", "Erreur critique")
log_db("WARNING", "Connexion lente")

# Avec int() pour conversion
int_base2 = partial(int, base=2)
int_base16 = partial(int, base=16)

print(f"\n'1010' en base 2: {int_base2('1010')}")
print(f"'FF' en base 16: {int_base16('FF')}")

### lru_cache() : mise en cache

In [None]:
from functools import lru_cache
import time

# Sans cache - tr√®s lent
def fibonacci_lent(n):
    if n < 2:
        return n
    return fibonacci_lent(n-1) + fibonacci_lent(n-2)

# Avec cache - tr√®s rapide
@lru_cache(maxsize=128)
def fibonacci_cache(n):
    if n < 2:
        return n
    return fibonacci_cache(n-1) + fibonacci_cache(n-2)

# Comparaison
n = 30

start = time.perf_counter()
result_lent = fibonacci_lent(n)
time_lent = time.perf_counter() - start

start = time.perf_counter()
result_cache = fibonacci_cache(n)
time_cache = time.perf_counter() - start

print(f"Fibonacci({n}): {result_cache}")
print(f"\nTemps sans cache: {time_lent*1000:.2f}ms")
print(f"Temps avec cache: {time_cache*1000:.4f}ms")
print(f"\nAcc√©l√©ration: {time_lent/time_cache:.0f}x plus rapide")

# Info sur le cache
print(f"\nInfo cache: {fibonacci_cache.cache_info()}")

# Vider le cache
fibonacci_cache.cache_clear()
print(f"Apr√®s clear: {fibonacci_cache.cache_info()}")

## Pi√®ges courants

### 1. groupby sans tri pr√©alable

In [None]:
from itertools import groupby

# PI√àGE: Utiliser groupby sans trier
data = ['A', 'A', 'B', 'A', 'B', 'C']

print("Sans tri (INCORRECT):")
for key, groupe in groupby(data):
    print(f"  {key}: {list(groupe)}")
# Probl√®me: 'A' appara√Æt 2 fois!

# SOLUTION: Trier d'abord
print("\nAvec tri (CORRECT):")
for key, groupe in groupby(sorted(data)):
    print(f"  {key}: {list(groupe)}")

### 2. deque vs list - mauvais choix

In [None]:
from collections import deque

# PI√àGE: Utiliser list pour acc√®s au d√©but
# Mauvaise performance pour .insert(0, x) et .pop(0)

# SOLUTION: Utiliser deque
file = deque()

# Ajout efficace
file.append(1)       # O(1)
file.appendleft(2)   # O(1)

print(f"File: {file}")

# Retrait efficace
file.pop()      # O(1)
file.popleft()  # O(1)

print(f"Apr√®s retraits: {file}")

# MAIS: deque est lent pour l'acc√®s par index
d = deque(range(1000))
# d[500]  # O(n) - lent!

print("\nR√àGLE:")
print("  - deque: acc√®s aux extr√©mit√©s")
print("  - list: acc√®s par index")

### 3. Counter - op√©rations arithm√©tiques

In [None]:
from collections import Counter

c1 = Counter(['a', 'b', 'c'])
c2 = Counter(['b', 'c', 'd'])

# PI√àGE: Croire que - retourne toutes les cl√©s
diff = c1 - c2
print(f"c1: {c1}")
print(f"c2: {c2}")
print(f"c1 - c2: {diff}")  # Seulement 'a' (les n√©gatifs sont exclus)

# Pour garder toutes les cl√©s:
from collections import defaultdict
diff_complet = defaultdict(int)
for key in set(c1.keys()) | set(c2.keys()):
    diff_complet[key] = c1[key] - c2[key]

print(f"\nDiff compl√®te: {dict(diff_complet)}")

## Mini-exercices

### Exercice 1: Analyse de texte avec Counter

Analysez un texte pour trouver les mots les plus fr√©quents.

In [None]:
# √Ä compl√©ter
texte = """
Python est un langage de programmation. Python est facile √† apprendre.
Python est utilis√© en data science. Python est populaire.
"""

# TODO:
# 1. Nettoyer le texte (minuscules, sans ponctuation)
# 2. Compter les mots avec Counter
# 3. Afficher les 5 mots les plus fr√©quents
# 4. Afficher le nombre de mots uniques

### Solution Exercice 1

In [None]:
from collections import Counter
import string

texte = """
Python est un langage de programmation. Python est facile √† apprendre.
Python est utilis√© en data science. Python est populaire.
"""

# Nettoyer le texte
texte_propre = texte.lower()
for ponct in string.punctuation:
    texte_propre = texte_propre.replace(ponct, '')

# Compter les mots
mots = texte_propre.split()
compteur = Counter(mots)

# Top 5
print("Top 5 des mots les plus fr√©quents:")
for mot, count in compteur.most_common(5):
    print(f"  {mot}: {count}")

# Statistiques
print(f"\nNombre de mots total: {sum(compteur.values())}")
print(f"Nombre de mots uniques: {len(compteur)}")

# Mots apparaissant une seule fois
hapax = [mot for mot, count in compteur.items() if count == 1]
print(f"\nMots uniques (1 occurrence): {len(hapax)}")
print(f"Exemples: {hapax[:5]}")

### Exercice 2: Grouper des donn√©es avec groupby

Groupez des transactions par date et calculez les totaux.

In [None]:
# √Ä compl√©ter
transactions = [
    ('2024-01-01', 100),
    ('2024-01-01', 150),
    ('2024-01-02', 200),
    ('2024-01-02', 50),
    ('2024-01-02', 75),
    ('2024-01-03', 300),
]

# TODO:
# 1. Trier par date
# 2. Grouper par date avec groupby
# 3. Calculer le total par jour
# 4. Afficher les r√©sultats

### Solution Exercice 2

In [None]:
from itertools import groupby
from operator import itemgetter

transactions = [
    ('2024-01-01', 100),
    ('2024-01-01', 150),
    ('2024-01-02', 200),
    ('2024-01-02', 50),
    ('2024-01-02', 75),
    ('2024-01-03', 300),
]

# Trier par date (d√©j√† fait ici, mais important!)
transactions_triees = sorted(transactions, key=itemgetter(0))

# Grouper et calculer
print("Totaux par jour:")
print("=" * 40)

for date, groupe in groupby(transactions_triees, key=itemgetter(0)):
    montants = [montant for _, montant in groupe]
    total = sum(montants)
    nb_transactions = len(montants)
    moyenne = total / nb_transactions
    
    print(f"\nDate: {date}")
    print(f"  Transactions: {nb_transactions}")
    print(f"  Montants: {montants}")
    print(f"  Total: {total}‚Ç¨")
    print(f"  Moyenne: {moyenne:.2f}‚Ç¨")

# Calculer le grand total
grand_total = sum(montant for _, montant in transactions)
print(f"\n{'='*40}")
print(f"Grand total: {grand_total}‚Ç¨")

### Exercice 3: Combinaisons pour analyse

G√©n√©rez toutes les paires de produits pour une analyse de co-occurrence.

In [None]:
# √Ä compl√©ter
paniers = [
    ['pain', 'lait', 'beurre'],
    ['pain', 'lait', 'oeufs'],
    ['lait', 'beurre', 'fromage'],
    ['pain', 'beurre', 'oeufs'],
    ['lait', 'fromage', 'oeufs'],
]

# TODO:
# 1. Pour chaque panier, g√©n√©rer toutes les paires de produits
# 2. Compter les co-occurrences
# 3. Afficher les paires les plus fr√©quentes

### Solution Exercice 3

In [None]:
from itertools import combinations
from collections import Counter

paniers = [
    ['pain', 'lait', 'beurre'],
    ['pain', 'lait', 'oeufs'],
    ['lait', 'beurre', 'fromage'],
    ['pain', 'beurre', 'oeufs'],
    ['lait', 'fromage', 'oeufs'],
]

# G√©n√©rer toutes les paires
paires = []
for panier in paniers:
    # Combiner 2 produits √† la fois
    for paire in combinations(sorted(panier), 2):
        paires.append(paire)

# Compter les co-occurrences
compteur = Counter(paires)

print("Analyse de co-occurrence:")
print("=" * 50)
print(f"\nNombre total de paires: {len(paires)}")
print(f"Paires uniques: {len(compteur)}")

print("\nTop 5 des paires les plus fr√©quentes:")
for (prod1, prod2), count in compteur.most_common(5):
    print(f"  {prod1} + {prod2}: {count} fois")

# Statistiques par produit
print("\nProduits individuels:")
tous_produits = []
for panier in paniers:
    tous_produits.extend(panier)

produits_count = Counter(tous_produits)
for produit, count in produits_count.most_common():
    print(f"  {produit}: {count} paniers")

# Support de chaque paire (pourcentage de paniers)
print("\nSupport des paires (% des paniers):")
nb_paniers = len(paniers)
for (prod1, prod2), count in compteur.most_common():
    support = (count / nb_paniers) * 100
    print(f"  {prod1} + {prod2}: {support:.1f}%")