Ensembles
==

Notion de conteneur
--

Les conteneurs sont simplement des objets qui contiennent d'autres objets. On distingue :

Type | Modifiable | Unicité | Relation d'ordre
 ---: | :---: | :---: | :--- 
Liste | Oui | Non | Oui
N-Uplet | Non | Non | Oui
Ensemble | Oui | Oui 1.2 | Non
Frozenset | Non | Oui 2.2 | Non
Dictionnaire | Oui | Clé: Oui, valeurs: Non | Oui depuis Python 3.8

L'ensemble des éléments contenus dans un conteneur sont séparés par des virgules

---

Un **ensemble** est une *collection* **non ordonnée** d'objets **hashables** et **uniques**

Les ensembles sont bien souvent ignorés, parce que peu enseignés en informatique et en algorithmique. Mais ils sont un outil formidable et permettent de simplifier très largement les algorithmes.

Considérations syntaxiques
--

Voici un ensemble vide :

In [None]:
s = set()

Pour des raisons historiques, l'écriture de l'ensemble vide échappe à la grammaire. Sinon, ce sont les accolades qui symbolisent les ensembles, même si la représentation d'un ensemble en python 2 ne les utilisent pas (il s'agit en fait d'un rétro-portage de python3) :

In [None]:
s = {1, 3, 5, 7, 9}

In [None]:
print(s)

Voici la liste des attributs et méthodes de l'ensemble :

In [None]:
dir(set())

Les opérateurs utilisés sont ceux-ci :

* l'opération **A OU B** utilise **|** et peut se faire via la méthode **union** ;
* l'opération **A ET B** utilise **&** et peut se faire via la méthode **intersection** ;
* l'opération **A ET NON B** utilise **-** et peut se faire via la méthode **difference** ;
* l'opération **NON A ET NON B** utilise **^** et peut se faire via la méthode **symmetric_difference** ;

In [None]:
a, b = {1, 2, 3}, {3, 4, 5}

In [None]:
a | b

In [None]:
a & b

In [None]:
a - b

In [None]:
b - a

In [None]:
a ^ b

Il est possible également de modifier un ensemble à l'aide des mêmes opérateurs :

* l'opération **A = A OU B** utilise **|=** et peut se faire via la méthode **update** ;
* l'opération **A = A ET B** utilise **&=** et peut se faire via la méthode **intersection_update** ;
* l'opération **A = A ET NON B** utilise **-=** et peut se faire via la méthode **difference_update** ;
* l'opération **A = NON A ET NON B** utilise **^=** et peut se faire via la méthode **symmetric_difference_update** ;

In [None]:
a, b = {1, 2, 3}, {3, 4, 5}
a |= b
print(a)

In [None]:
a, b = {1, 2, 3}, {3, 4, 5}
a &= b
print(a)

In [None]:
a, b = {1, 2, 3}, {3, 4, 5}
a -= b
print(a)

In [None]:
a, b = {1, 2, 3}, {3, 4, 5}
a ^= b
print(a)

Enfin, il est possible de travailler sur un élément en particulier :

* la méthode **add** permet de rajouter un élément à l'ensemble ;
* la méthode **discard** permet d'en retirer un, s'il existe (s'il n'existe pas, il n'y a pas d'exception) ;
* la méthode **remove** permet d'en retirer un, mais de lancer une exception s'il n'existe pas ;
* la méthode **pop** permet de retirer un élément en le renvoyant ;
* la méthode **clear** permet de vider le dictionnaire.

In [None]:
a = {1, 2, 3}
a.add(1)
a.add(4)
a.discard(2)
a.discard(42) # 42 n'existe pas dans l'ensemble
print(a)

In [None]:
a.remove(3)

In [None]:
a.remove(3) # Il n'y a plus l'élément 3, donc une exception sera lancée

In [None]:
a.pop()

In [None]:
print(a)

Une dernière précision est à apporter sur la méthode **pop** : l'ensemble n'ayant pas de relation d'ordre, il est impossible de prévoir dans quel ordre les éléments sortiront.

Cas concrets
---------

1. En une ligne, il est possible de voir quelles sont les méthodes qui existent pour les nombres flottants et non pour les entiers

In [None]:
sorted(set(dir(float)) - set(dir(int)))

2. On décide de représenter une case d'un plateau de bataille navale par un 2-uplet comprenant une lettre majuscule de A à J et un nombre de 0 à 9. Voici comment générer l'ensemble des cases d'un plateau

In [None]:
from itertools import product
plateau = list(product("ABCDEFGHIJ", range(10)))
print(plateau)

Voici 2 bateaux.

In [None]:
bateau1 = {('F', 3), ('F', 4), ('F', 5), ('F', 6), ('F', 7)}
bateau2 = {('D', 5), ('E', 5), ('F', 5), ('G', 5)}

Voici un algorithme classique pour déterminer si ces bateaux se chevauchent ou non:

In [None]:
ok = False
for b1 in bateau1:
    for b2 in bateau2:
        if b1 == b2:
            print("La case %s%s est en double" % b1)
            ok = True
            break
    if ok:
        break

Voici un algorithme plus élégant, mais tout aussi complexe, qui réutilise le produit cartésien pour ne faire qu'une seule boucle d'itération

In [None]:
from itertools import product
for b1, b2 in product(bateau1, bateau2):
    if b1 == b2:
        print("La case %s%s est en double" % b1)
        break

Voici une solution en utilisant les spécificités des ensembles

In [None]:
bateau1 & bateau2

In [None]:
bateau1.isdisjoint(bateau2)

---

Passage d'une collection à une autre :
--------------------------------------

A tout moment, il est possible de passer d'un type de donnée à un autre :

In [None]:
l = ['b', 'a', 'b', 'c', 'e', 'b', 'g', 'c', 'b']

Que va-t-il se passer si l'on transforme cette liste en un ensemble ?

In [None]:
s = set(l)

In [None]:
print(s)

In [None]:
l2 = sorted(set(l))

In [None]:
print(l2)

Voici comment créer un dictionnaire dont les clés sont chaque élément unique de la liste et les valeurs leur nombre d'occurences dans la liste.

In [None]:
d = {}
for e in set(l):
    d[e] = l.count(e)
print(d)

Solution alternative :

In [None]:
d = {}
for e in l:
    if e not in d:
        d[e] = 1
    else:
        d[e] += 1
print(d)

Solution alternative améliorée grâce au module **collections** :

In [None]:
from collections import defaultdict
d = defaultdict(int)
for e in l:
    d[e] += 1
print(d)
print(dict(d))

---