# Ensembles

### Propriété fondamentale d'un ensemble (d'après D. Panzoli)
L'ensemble est une collection d'éléments uniques, dépourvus d'indice ou de rang, qui offre les fonctionnalités élémentaires suivantes :
* Obtenir la cardinalité de l'ensemble
* Tester de manière efficace l'appartenance d'un élément à un ensemble
* Réaliser des opérations ensemblistes (union, intersection) de manière efficace.
* Parcourir les éléments dans un ordre quelconque, ou dans l'ordre naturel s'ils sont comparables


### Déclaration d'un ensemble et ajout d'éléments

Un ensemble peut être déclaré vide puis se voir ajouter des éléments

In [1]:
E=set()
E.add(1)
E.add(2)
E.add(3)
print(E)
E.add(1)
print(E) #Noter que le doublon n'a pas été ajouté

{1, 2, 3}
{1, 2, 3}


On peut aussi créer un ensemble initialisé à partir d'éléments donnés

In [2]:
E={1,2,3}
print(E)
F={'a','b','b'}
print(F)

{1, 2, 3}
{'b', 'a'}


Un ensemble peut également être créé à partir d'une autre collection, comme par exemple une liste

In [3]:
E=set(['a','b','a','c','e','d'])
print(E) # Notez l'ordre d'affichage des éléments
print(sorted(E))

{'b', 'd', 'e', 'a', 'c'}
['a', 'b', 'c', 'd', 'e']


### Parcours des éléments d'un ensemble
La boucle `for` permet de parcourir les éléments de l'ensemble, une et une seule fois chacun.

In [4]:
E={'h','e','l','l','o','w','o','r','l','d'}
for e in E:
  print(e)

e
l
o
w
h
d
r


Si nécessaire, il est possible d'attribuer un rang aux éléments parcourus, grâce à la fonction `enumerate` :

In [5]:
for i,e in enumerate(E):
  print(i,e)

0 e
1 l
2 o
3 w
4 h
5 d
6 r


Ou en transformant l'ensemble en liste. On peut alors manipuler la liste comme vu précédemment.

In [6]:
L=list(E)
print(L)

['e', 'l', 'o', 'w', 'h', 'd', 'r']


### Suppression d'éléments d'un ensemble
Tout comme on peut ajouter des éléments, on peut aussi en enlever grâce aux opérateurs `discard` et `pop` :

In [7]:
E=set("helloworld")
print(E)
E.discard('h')
print(E)
E.discard('a')
print(E)
E.pop()
E.pop()
print(E)
E.pop(0)

{'l', 'w', 'd', 'r', 'e', 'h', 'o'}
{'l', 'w', 'd', 'r', 'e', 'o'}
{'l', 'w', 'd', 'r', 'e', 'o'}
{'d', 'r', 'e', 'o'}


TypeError: set.pop() takes no arguments (1 given)

# Test d'appartenance
L'objectif principal de l'ensemble n'est pas le parcours des éléments mais le test d'appartenance.

In [8]:
E={1,2,3}
print(1 in E, 4 in E, 6 not in E)

True False True


Le test d'appartenance est réalisé de manière plus efficace que celui de la liste

In [None]:
import random
import time
L = [random.randrange(1, 10**9, 1) for i in range(10000)]
start = time.time()
for i in range(1000):
  n = random.randint(0,10**9)
  b = n in L
print("%.2f ms" % ((time.time() - start)*1000) )

175.97 ms


In [None]:
import random
import time
E = set([random.randrange(1, 10**9, 1) for i in range(10000)])
start = time.time()
for i in range(1000):
  n = random.randint(0,10**9)
  b = n in E
print("%.2f ms" % ((time.time() - start)*1000) )

5.05 ms


# Opérations ensemblistes
Un deuxième intérêt du TAD Ensemble, hormis le test d'appartenance, est de pouvoir effectuer des opérations ensemblistes.

### Union
Le résultat de l'union de deux ensembles est un nouvel ensemble qui contient les éléments des deux ensembles :

In [9]:
E={1,3,5}
F={2,4,6}
print(E.union(F))
print(E|F)

{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}


In [10]:
E=set("PARIS")
F=set("DAKAR")
print(E|F)

{'R', 'I', 'A', 'D', 'K', 'P', 'S'}


### Intersection
Le résultat de l'intersection de deux ensembles est un nouvel ensemble qui contient les éléments communs aux deux ensembles :

In [11]:
E=set("PARIS")
F=set("DAKAR")
print(E.intersection(F))
print(E&F)

{'A', 'R'}
{'A', 'R'}


In [12]:
E={1,3,5}
F={2,4,6}
print(E&F)

set()


### Différence et différence symmétrique
Un ensemble peut être soustrait d'un autre ensemble, c'est à dire que tous les éléments du deuxième ensemble sont enlevés du premier, s'ils y existent.

In [13]:
E={1,2,3,4,5,6}
F={1,3,5}
print(E.difference(F))
print(E-F)
print(F-E)

{2, 4, 6}
{2, 4, 6}
set()


La notion de différence symétrique correspond à l'opérateur logique XOR (ou exclusif) : le résultat contient les éléments qui sont soit dans le premier ensemble, soit dans le deuxième, mais pas dans les deux.

In [None]:
E={1,2,3}
F={1,3,5}
print(E^F)
print(F^E) #Bien entendu, la différence symétrique est symétrique

### Sous-ensemble
L'opérateur `issubset` renvoie `True` si le premier ensemble est inclus dans le deuxième :

In [1]:
E={1,2,3,4,5,6}
F={1,3,5}
print(F.issubset(E))

True


Il existe aussi les méthodes `issuperset` et `isdisjoint`.

In [2]:
print(E.issuperset(F))
print(F.isdisjoint(E))

True
False
