# Les ensembles

## Présentation

Les ensembles, en Python, constituent la troisième arme pour manipuler des collections de données. Ils sont à mi-chemin entre les listes et les dictionnaires.

|Objet|Mutabilité|Ordonné|Accès atomique|
|:-|:-:|:-:|:-:|
|Liste|Oui|Oui|Indice|
|Dictionnaire|Oui|Non|Clé|
|Ensemble|Oui|Non|–|

Oui, un ensemble est un objet mutable mais, non, l’accès atomique est impossible. Après tout, un ensemble, c’est un ensemble : on le prend tel quel avec tout ce qu’il contient.

À quoi servent les ensembles alors ?

Déjà, l’une de leurs forces est d’effectuer *de facto* un dédoublonnage des données. On obtient un ensemble d’objects uniques à partir de n’importe quelle liste grâce à une simple transformation de type.

Ensuite, les ensembles amènent avec eux un lot d’outils pour exécuter des opérations… ensemblistes ! Des opérations comme $A \cup B$ ou $A \cap B$ qui facilitent nettement les comparaisons entre deux sommes de données.

## Manipuler des ensembles

### Créer un ensemble

La création d’un ensemble se fait soit par la fonction `set()` avec un objet de type liste en argument, soit *in extenso* avec les accolades `{}` et des virgules pour séparer les éléments.

In [None]:
lannister = set(['Cersei', 'Jaime', 'Tyrion', 'Sansa'])
stark = {'Arya', 'Sansa', 'John'}

In [None]:
print(type(lannister), type(stark))

### Ajouter un élément

On procède soit avec la méthode `update()`, héritée des dictionnaires, qui accepte en argument un sous-ensemble, soit avec la méthode `add()` qui ne prend alors qu’un seul élément à la fois :

In [None]:
lannister.add('Joffrey')
stark.update({'Eddard', 'Brandon', 'Bran'})

### Supprimer un élément

Il existe plusieurs méthodes pour supprimer un élément, et chacune répond à un besoin particulier :
- `discard()` : pour supprimer un élément particulier ;
- `remove()` : idem, sauf qu’une exception est levée si l’élément est introuvable ;
- `pop()` : pour supprimer et renvoyer aléatoirement un élément de l’ensemble ;
- `clear()` : pour vider entièrement l’ensemble.

## Opérations ensemblistes

Les opérations sont héritées de la théorie mathématique des ensembles. Elles utilisent des symboles mais sont également disponibles à l’aide de méthodes nommées. Par exemple, pour effectuer une union entre deux ensembles, on utilisera indifféremment :
```python
A | B
A.union(B)
```
Le résultat des opérations sera toujours de type `set()`, garantissant l’unicité des éléments présents dans la collection.

### Union

Les maisons Lannister et Stark se réunissent sous une même bannière :

In [None]:
# Sansa was married to Tyrion, so she should appears two times.
# But the result is a set, a collection of unique items!
lannister | stark
lannister.union(stark)

### Intersection

Comme on a marié Sansa à Tyrion, elle appartient aux deux maisons :

In [None]:
lannister & stark
lannister.intersection(stark)

### Différence

Quels membres de la maison Lannister n’ont jamais eu aucun lien marital avec un Stark ? Attention, le résultat est différent si la question devient : quels membres de la maison Stark n’ont jamais eu aucun lien marital avec un Lannister ?

In [None]:
lannister - stark
stark.difference(lannister)

### Différence symétrique

Elle répond aux deux questions précédentes, à savoir qui, chez les deux familles, n’a eu de lien marital avec aucun membre de l’autre.

Du point de vue mathématique, on a une union de deux différences : $A \Delta B = (A - B) \cup (B - A)$

In [None]:
lannister ^ stark
lannister.symmetric_difference(stark)

### Tests ensemblistes

Est-ce que le couple Robert-Cersei appartient à la maison Stark ?

In [None]:
{'Robert', 'Cersei'} <= lannister
{'Robert', 'Cersei'}.issubset(lannister)

Dans la famille Lannister, je voudrais le couple Tyrion-Sansa :

In [None]:
# similar to: {'Tyrion', 'Sansa'} <= lannister
lannister >= {'Tyrion', 'Sansa'}
lannister.issuperset({'Tyrion', 'Sansa'})

Les deux familles n’ont-elles jamais vu d’unions entre elles ?

In [None]:
lannister.isdisjoint(stark)

L’opération revient à se demander si le résultat d’une intersection renvoie un ensemble vide ou non : $A \cap B = \emptyset$

## Techniques courantes

### Cardinalité

Comme pour d’autres structures de données, la fonction `len()` renvoie le nombre d’éléments présents dans l’ensemble :

In [None]:
len(lannister)

### Test d’appartenance

L’opérateur `in` est également fonctionnel avec les ensembles. Et contrairement aux listes, le test s’effectue en temps constant.

In [None]:
'Tommen' in lannister

### Opérations sur plus de deux ensembles

Certaines questions impliquant plus de deux ensembles peuvent se régler en enchaînant les opérateurs. C’est le cas de l’union, de la différence et de l’intersection.

Ajoutons la maison Bolton aux côtés des Lannister et des Stark :

In [None]:
bolton = {'Sansa', 'Ramsay', 'Roose'}

Réunissons-les sur un champ de bataille pour une grande boucherie :

In [None]:
lannister | stark | bolton

Vérifions si un membre de ces familles ne serait pas apparenté aux trois :

In [None]:
lannister & stark & bolton

Qui, de la maison Lannister, ne sait jamais uni à aucun membre des deux autres ?

In [None]:
lannister - stark - bolton

Plus compliquée à présent, la question est d’identifier les membres qui n’ont aucun lien avec les autres familles. Cela revient à réaliser l’union de toutes leurs différences :

$((A - B) \cup (B - A)) \cup ((A - C) \cup (C - A)) \cup ((B - C) \cup (C - B))$

In [None]:
(
    (lannister - stark) | (stark - lannister)
) | (
    (lannister - bolton) | (bolton - lannister)
) | (
    (stark - bolton) | (bolton - stark)
)

Cette technique se révèle un peu fastidieuse. Si vous faites attention, vous remarquez sans doute une séquence que l’on a déjà vue et qui se répète autant de fois qu’il y a d’ensembles. Il s’agit de la structure $(X-Y) \cup (Y-X)$ qui est équivalente à l’opération de la différence symétrique $X \Delta Y$.

En effectuant les remplacements, on obtient une formule bien plus courte :

In [None]:
lannister ^ stark | lannister ^ bolton | stark ^ bolton