# Ensembles

Les ensembles (sets) sont une structure de données ressemblant aux dictionnaires (ils sont implémentés avec une table de hachage) mais comportant uniquement des clés, sans que celles-ci ne soient associées à aucune valeur. Comme pour les dictionnaire, il ne peut y avoir la même clée plus d'une fois. Les ensembles ont accès à des méthodes (fonctions) très pratiques pour manipuler et comparer des ensembles.

In [None]:
# On utilise les {}, aka 'curly brackets', pour créer un ensemble en lui affectant des valeurs
a = {1, 2, 3}
b = {3, 'a', True, False}  # Comme avec les autres structures composées, on peut affecter différents types de données

# Pour créen un ensemble vide, on doit utiliser sont constructeur set() car ={} retourne un dictionnaire...
c = {}
d = set()
print(type(c))
print(type(d))

Pour ajouter ou supprimer des éléments à un ensemble, on utilise respectivement les méthodes add() et remove(). On ne peut ajouter un élément qui existe déja dans l'ensemble (ne génère pas d'erreur cependant).

In [None]:
a.add(4)
print(a)

a.remove(4)
print(a)

a.add(3)
print(a)

L'intérêt d'utiliser des ensembles vient des nombreuses méthodes qu'ils possèdent. Certaines d'entre-elles permettent de facilement comparer des ensembles entre-eux.

In [None]:
# Union
print(a.union(b))  # Attention!! True et False, lorsque comparés dans les ensembles, sont évalués respectivement à 1 et 0

# Intersection
print(a.intersection(b))          # Ce qui est commun aux deux ensembles

# Différence
print(a.symmetric_difference(b))  # Ce qui n'est pas commun aux deux ensembles
print(a.difference(b))            # Ce qui est dans a mais pas dans b
print(b.difference(a))            # Ce qui est dans b mais pas dans a

# Ces méthodes n'existent que pour les ensembles, mais la comparaison peut être faite sur les clés d'un dictionnaire.
e = {1:'a', 2:'b'}
print(a.difference(e))

# On transforme facilement un autre type de variable en ensemble au moment de la comparaison au besoin
f = 'abc'
print(set(f).intersection(b))


In [None]:
# Exemple de validation à l'aide des ensembles

nucleotides = {'A', 'C', 'G', 'T'}

seq1 = 'ATTGCTAAGTTTCGA'
seq2 = 'ACGTxyz'

print(f"seq1 est {'valide' if not set(seq1).difference(nucleotides) else 'invalide'}")
print(f"seq2 est {'valide' if not set(seq2).difference(nucleotides) else 'invalide'}")