# üü¢ Les Sets (Ensembles) en Python

**Badge:** üü¢ D√©butant | ‚è± 30 min | üîë **Concepts:** ensembles, op√©rations ensemblistes, frozenset

---

## üìã Objectifs

√Ä la fin de ce notebook, vous serez capable de :
- Cr√©er et manipuler des sets en Python
- Utiliser les op√©rations ensemblistes (union, intersection, diff√©rence)
- Comprendre l'unicit√© des √©l√©ments dans un set
- Appliquer les m√©thodes principales des sets
- Utiliser frozenset pour cr√©er des ensembles immutables
- Identifier les cas d'usage optimaux pour les sets

## üéØ Pr√©requis

- Connaissance des types de base (listes, dictionnaires)
- Compr√©hension des concepts de hashabilit√©

## 1. Introduction aux Sets

Un **set** est une collection **non ordonn√©e** d'√©l√©ments **uniques** et **hashables**. Les sets sont inspir√©s de la th√©orie math√©matique des ensembles et offrent des op√©rations ensemblistes tr√®s performantes.

### Caract√©ristiques principales :
- **Non ordonn√©** : pas d'indexation possible
- **Unique** : pas de doublons
- **Mutable** : on peut ajouter/supprimer des √©l√©ments
- **Hashable** : les √©l√©ments doivent √™tre hashables
- **Performance O(1)** : pour les tests d'appartenance

## 2. Cr√©ation de Sets

In [None]:
# M√©thode 1 : Avec des accolades {}
fruits = {'pomme', 'banane', 'orange'}
print("Fruits:", fruits)
print("Type:", type(fruits))

# M√©thode 2 : Avec le constructeur set()
nombres = set([1, 2, 3, 4, 5])
print("\nNombres:", nombres)

# Cr√©ation d'un set vide (ATTENTION : {} cr√©e un dict !)
set_vide = set()  # Correct
dict_vide = {}    # Ceci est un dictionnaire !
print("\nSet vide:", set_vide, type(set_vide))
print("Dict vide:", dict_vide, type(dict_vide))

In [None]:
# Cr√©ation depuis une cha√Æne de caract√®res
lettres = set('bonjour')
print("Lettres uniques dans 'bonjour':", lettres)

# Cr√©ation depuis un range
nombres_pairs = set(range(0, 20, 2))
print("Nombres pairs de 0 √† 18:", nombres_pairs)

## 3. Unicit√© des √âl√©ments

Le principe fondamental d'un set est que chaque √©l√©ment est **unique**. Les doublons sont automatiquement √©limin√©s.

In [None]:
# Les doublons sont automatiquement supprim√©s
nombres = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4}
print("Set avec doublons:", nombres)

# Conversion liste -> set pour d√©dupliquer
liste_avec_doublons = [1, 2, 2, 3, 4, 4, 5, 5, 5]
liste_dedupliquee = list(set(liste_avec_doublons))
print("\nListe originale:", liste_avec_doublons)
print("Liste d√©dupliqu√©e:", liste_dedupliquee)
print("Note: l'ordre n'est pas pr√©serv√©!")

In [None]:
# Exemple pratique : compter les √©l√©ments uniques
temperatures = [20, 21, 20, 22, 21, 23, 20, 22, 24]
temperatures_uniques = set(temperatures)

print(f"Temp√©ratures mesur√©es: {temperatures}")
print(f"Temp√©ratures uniques: {temperatures_uniques}")
print(f"Nombre de temp√©ratures diff√©rentes: {len(temperatures_uniques)}")

## 4. Op√©rations Ensemblistes

Les sets supportent toutes les op√©rations math√©matiques classiques sur les ensembles.

In [None]:
# D√©finition de deux ensembles pour nos exemples
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

print("Ensemble A:", A)
print("Ensemble B:", B)

### 4.1 Union (|)

L'union combine tous les √©l√©ments des deux ensembles (sans doublons).

In [None]:
# Union avec l'op√©rateur |
union1 = A | B
print("A | B =", union1)

# Union avec la m√©thode .union()
union2 = A.union(B)
print("A.union(B) =", union2)

# Union multiple
C = {9, 10}
union_multiple = A | B | C
print("A | B | C =", union_multiple)

### 4.2 Intersection (&)

L'intersection retourne les √©l√©ments pr√©sents dans **les deux** ensembles.

In [None]:
# Intersection avec l'op√©rateur &
intersection1 = A & B
print("A & B =", intersection1)

# Intersection avec la m√©thode .intersection()
intersection2 = A.intersection(B)
print("A.intersection(B) =", intersection2)

# Exemple pratique
etudiants_python = {'Alice', 'Bob', 'Charlie', 'David'}
etudiants_sql = {'Bob', 'David', 'Eve', 'Frank'}

etudiants_deux_cours = etudiants_python & etudiants_sql
print("\n√âtudiants suivant Python ET SQL:", etudiants_deux_cours)

### 4.3 Diff√©rence (-)

La diff√©rence retourne les √©l√©ments pr√©sents dans le premier ensemble mais pas dans le second.

In [None]:
# Diff√©rence avec l'op√©rateur -
difference1 = A - B
print("A - B =", difference1)

# Diff√©rence avec la m√©thode .difference()
difference2 = B.difference(A)
print("B - A =", difference2)

# Exemple pratique
etudiants_python = {'Alice', 'Bob', 'Charlie', 'David'}
etudiants_sql = {'Bob', 'David', 'Eve', 'Frank'}

seulement_python = etudiants_python - etudiants_sql
print("\n√âtudiants suivant seulement Python:", seulement_python)

### 4.4 Diff√©rence Sym√©trique (^)

La diff√©rence sym√©trique retourne les √©l√©ments pr√©sents dans **un seul** des deux ensembles.

In [None]:
# Diff√©rence sym√©trique avec l'op√©rateur ^
diff_sym1 = A ^ B
print("A ^ B =", diff_sym1)

# Diff√©rence sym√©trique avec la m√©thode .symmetric_difference()
diff_sym2 = A.symmetric_difference(B)
print("A.symmetric_difference(B) =", diff_sym2)

# Exemple pratique
etudiants_python = {'Alice', 'Bob', 'Charlie', 'David'}
etudiants_sql = {'Bob', 'David', 'Eve', 'Frank'}

un_seul_cours = etudiants_python ^ etudiants_sql
print("\n√âtudiants suivant un seul cours:", un_seul_cours)

## 5. M√©thodes de Modification

### 5.1 Ajouter des √©l√©ments

In [None]:
# add() : ajouter un √©l√©ment
fruits = {'pomme', 'banane'}
print("Fruits initiaux:", fruits)

fruits.add('orange')
print("Apr√®s add('orange'):", fruits)

# Ajouter un √©l√©ment d√©j√† pr√©sent (pas d'effet)
fruits.add('pomme')
print("Apr√®s add('pomme'):", fruits)

# update() : ajouter plusieurs √©l√©ments
fruits.update(['kiwi', 'mangue', 'ananas'])
print("Apr√®s update():", fruits)

### 5.2 Supprimer des √©l√©ments

In [None]:
nombres = {1, 2, 3, 4, 5}
print("Nombres initiaux:", nombres)

# remove() : supprime un √©l√©ment (l√®ve KeyError si absent)
nombres.remove(3)
print("Apr√®s remove(3):", nombres)

# Tester remove() avec un √©l√©ment absent
try:
    nombres.remove(10)
except KeyError as e:
    print("Erreur avec remove(10):", e)

# discard() : supprime un √©l√©ment (pas d'erreur si absent)
nombres.discard(5)
print("Apr√®s discard(5):", nombres)

nombres.discard(10)  # Pas d'erreur
print("Apr√®s discard(10):", nombres)

In [None]:
# pop() : retire et retourne un √©l√©ment arbitraire
nombres = {1, 2, 3, 4, 5}
print("Nombres initiaux:", nombres)

element = nombres.pop()
print(f"√âl√©ment retir√©: {element}")
print("Apr√®s pop():", nombres)

# clear() : vide le set
nombres.clear()
print("Apr√®s clear():", nombres)

## 6. M√©thodes de Comparaison

In [None]:
# D√©finition d'ensembles pour les exemples
A = {1, 2, 3}
B = {1, 2, 3, 4, 5}
C = {6, 7, 8}

print("A =", A)
print("B =", B)
print("C =", C)

In [None]:
# issubset() : A est-il un sous-ensemble de B ?
print("A.issubset(B):", A.issubset(B))  # True
print("B.issubset(A):", B.issubset(A))  # False
print("A <= B:", A <= B)  # √âquivalent √† issubset()

# issuperset() : A contient-il tous les √©l√©ments de B ?
print("\nB.issuperset(A):", B.issuperset(A))  # True
print("A.issuperset(B):", A.issuperset(B))  # False
print("B >= A:", B >= A)  # √âquivalent √† issuperset()

# isdisjoint() : A et C n'ont-ils aucun √©l√©ment en commun ?
print("\nA.isdisjoint(C):", A.isdisjoint(C))  # True
print("A.isdisjoint(B):", A.isdisjoint(B))  # False

## 7. Frozenset - Set Immutable

Un `frozenset` est une version **immutable** d'un set. Il peut donc √™tre utilis√© comme cl√© de dictionnaire ou √©l√©ment d'un autre set.

In [None]:
# Cr√©ation d'un frozenset
fs1 = frozenset([1, 2, 3, 4, 5])
fs2 = frozenset([4, 5, 6, 7, 8])

print("Frozenset 1:", fs1)
print("Frozenset 2:", fs2)
print("Type:", type(fs1))

# Les op√©rations ensemblistes fonctionnent
print("\nUnion:", fs1 | fs2)
print("Intersection:", fs1 & fs2)

# Mais on ne peut pas modifier un frozenset
try:
    fs1.add(10)
except AttributeError as e:
    print("\nErreur:", e)

In [None]:
# Utilisation de frozenset comme cl√© de dictionnaire
coordonnees1 = frozenset([0, 1])
coordonnees2 = frozenset([2, 3])

grille = {
    coordonnees1: 'X',
    coordonnees2: 'O'
}

print("Grille:", grille)
print("Valeur aux coordonn√©es [0,1]:", grille[coordonnees1])

# Set de frozensets
ensemble_de_sets = {
    frozenset([1, 2]),
    frozenset([3, 4]),
    frozenset([5, 6])
}
print("\nEnsemble de frozensets:", ensemble_de_sets)

## 8. Performance et Cas d'Usage

In [None]:
import time

# Comparaison de performance : set vs list pour membership testing
grande_liste = list(range(100000))
grand_set = set(range(100000))

# Test dans une liste
start = time.time()
result = 99999 in grande_liste
temps_liste = time.time() - start

# Test dans un set
start = time.time()
result = 99999 in grand_set
temps_set = time.time() - start

print(f"Temps de recherche dans une liste: {temps_liste:.6f}s")
print(f"Temps de recherche dans un set: {temps_set:.6f}s")
print(f"Le set est {temps_liste/temps_set:.0f}x plus rapide!")

In [None]:
# Cas d'usage typiques

# 1. D√©duplication rapide
emails = ['user@example.com', 'admin@example.com', 'user@example.com']
emails_uniques = list(set(emails))
print("1. D√©duplication:", emails_uniques)

# 2. Test d'appartenance rapide
mots_interdits = {'spam', 'casino', 'viagra', 'argent facile'}
message = "Gagnez de l'argent facile avec le casino en ligne"
contient_spam = any(mot in message.lower() for mot in mots_interdits)
print("\n2. D√©tection de spam:", contient_spam)

# 3. Trouver des √©l√©ments communs
tags_article1 = {'python', 'data', 'machine-learning'}
tags_article2 = {'python', 'web', 'flask'}
tags_communs = tags_article1 & tags_article2
print("\n3. Tags communs:", tags_communs)

# 4. √âliminer les doublons tout en pr√©servant l'ordre (avec dict)
nombres = [1, 2, 2, 3, 1, 4, 3, 5]
nombres_uniques_ordonn√©s = list(dict.fromkeys(nombres))
print("\n4. D√©duplication avec ordre pr√©serv√©:", nombres_uniques_ordonn√©s)

## 9. Pi√®ges Courants ‚ö†Ô∏è

### Pi√®ge 1 : {} cr√©e un dict, pas un set

In [None]:
# INCORRECT : {} cr√©e un dictionnaire vide
pas_un_set = {}
print("Type de {}:", type(pas_un_set))

# CORRECT : utiliser set()
vrai_set = set()
print("Type de set():", type(vrai_set))

### Pi√®ge 2 : Les √©l√©ments doivent √™tre hashables

In [None]:
# Les listes ne sont pas hashables
try:
    mauvais_set = {[1, 2], [3, 4]}
except TypeError as e:
    print("Erreur avec des listes:", e)

# Solution : utiliser des tuples (hashables)
bon_set = {(1, 2), (3, 4)}
print("\nSet avec des tuples:", bon_set)

# Les dictionnaires ne sont pas hashables non plus
try:
    mauvais_set = {{'a': 1}, {'b': 2}}
except TypeError as e:
    print("\nErreur avec des dicts:", e)

### Pi√®ge 3 : L'ordre n'est pas garanti

In [None]:
# L'ordre peut varier (bien que Python 3.7+ pr√©serve souvent l'ordre d'insertion)
nombres = [5, 1, 3, 2, 4]
set_nombres = set(nombres)
liste_depuis_set = list(set_nombres)

print("Liste originale:", nombres)
print("Liste depuis set:", liste_depuis_set)
print("Note: Ne comptez jamais sur l'ordre d'un set!")

### Pi√®ge 4 : remove() vs discard()

In [None]:
nombres = {1, 2, 3}

# remove() l√®ve une erreur si l'√©l√©ment n'existe pas
try:
    nombres.remove(10)
except KeyError:
    print("remove() a lev√© une KeyError")

# discard() ne fait rien si l'√©l√©ment n'existe pas
nombres.discard(10)  # Pas d'erreur
print("discard() n'a pas lev√© d'erreur")

# Conseil : utilisez discard() si vous n'√™tes pas s√ªr que l'√©l√©ment existe

## 10. Mini-Exercices üéØ

### Exercice 1 : D√©duplication intelligente

√âcrivez une fonction qui prend une liste de pr√©noms (avec des doublons potentiels) et retourne :
1. La liste sans doublons
2. Le nombre de doublons supprim√©s
3. Les pr√©noms qui apparaissaient en double

In [None]:
# VOTRE CODE ICI
def analyser_doublons(prenoms):
    """
    Analyse les doublons dans une liste de pr√©noms.
    
    Args:
        prenoms: Liste de pr√©noms (avec possibles doublons)
    
    Returns:
        tuple: (liste_unique, nb_doublons, prenoms_en_double)
    """
    pass

# Test
prenoms = ['Alice', 'Bob', 'Charlie', 'Alice', 'David', 'Bob', 'Alice']
# R√©sultat attendu: (['Alice', 'Bob', 'Charlie', 'David'], 3, {'Alice', 'Bob'})

### Solution Exercice 1

In [None]:
def analyser_doublons(prenoms):
    """
    Analyse les doublons dans une liste de pr√©noms.
    
    Args:
        prenoms: Liste de pr√©noms (avec possibles doublons)
    
    Returns:
        tuple: (liste_unique, nb_doublons, prenoms_en_double)
    """
    # Cr√©er un set pour les pr√©noms uniques
    prenoms_uniques = list(set(prenoms))
    
    # Calculer le nombre de doublons supprim√©s
    nb_doublons = len(prenoms) - len(prenoms_uniques)
    
    # Trouver les pr√©noms qui apparaissaient en double
    prenoms_en_double = set()
    prenoms_vus = set()
    
    for prenom in prenoms:
        if prenom in prenoms_vus:
            prenoms_en_double.add(prenom)
        prenoms_vus.add(prenom)
    
    return prenoms_uniques, nb_doublons, prenoms_en_double

# Test
prenoms = ['Alice', 'Bob', 'Charlie', 'Alice', 'David', 'Bob', 'Alice']
unique, nb, doubles = analyser_doublons(prenoms)

print(f"Pr√©noms uniques: {unique}")
print(f"Nombre de doublons supprim√©s: {nb}")
print(f"Pr√©noms en double: {doubles}")

### Exercice 2 : Analyse de groupes d'√©tudiants

Trois cours ont les √©tudiants suivants :
- Python : {'Alice', 'Bob', 'Charlie', 'David', 'Eve'}
- SQL : {'Bob', 'David', 'Frank', 'Grace'}
- Docker : {'Alice', 'David', 'Frank', 'Henry'}

Trouvez :
1. Les √©tudiants qui suivent les 3 cours
2. Les √©tudiants qui suivent au moins 2 cours
3. Les √©tudiants qui suivent exactement 1 cours
4. Le nombre total d'√©tudiants uniques

In [None]:
# VOTRE CODE ICI
python = {'Alice', 'Bob', 'Charlie', 'David', 'Eve'}
sql = {'Bob', 'David', 'Frank', 'Grace'}
docker = {'Alice', 'David', 'Frank', 'Henry'}

# Votre code ici

### Solution Exercice 2

In [None]:
python = {'Alice', 'Bob', 'Charlie', 'David', 'Eve'}
sql = {'Bob', 'David', 'Frank', 'Grace'}
docker = {'Alice', 'David', 'Frank', 'Henry'}

# 1. √âtudiants qui suivent les 3 cours
trois_cours = python & sql & docker
print("1. √âtudiants suivant les 3 cours:", trois_cours)

# 2. √âtudiants qui suivent au moins 2 cours
python_et_sql = python & sql
python_et_docker = python & docker
sql_et_docker = sql & docker
au_moins_deux = python_et_sql | python_et_docker | sql_et_docker
print("2. √âtudiants suivant au moins 2 cours:", au_moins_deux)

# 3. √âtudiants qui suivent exactement 1 cours
tous_etudiants = python | sql | docker
exactement_un = tous_etudiants - au_moins_deux
print("3. √âtudiants suivant exactement 1 cours:", exactement_un)

# 4. Nombre total d'√©tudiants uniques
print("4. Nombre total d'√©tudiants:", len(tous_etudiants))

### Exercice 3 : Validation de permissions

Cr√©ez un syst√®me de validation de permissions. Un utilisateur a un set de permissions, et une action requiert un set de permissions minimales.

√âcrivez une fonction qui :
1. V√©rifie si l'utilisateur a toutes les permissions requises
2. Retourne les permissions manquantes si l'acc√®s est refus√©

In [None]:
# VOTRE CODE ICI
def verifier_permissions(permissions_utilisateur, permissions_requises):
    """
    V√©rifie si un utilisateur a les permissions requises.
    
    Args:
        permissions_utilisateur: set des permissions de l'utilisateur
        permissions_requises: set des permissions requises
    
    Returns:
        tuple: (acces_autorise: bool, permissions_manquantes: set)
    """
    pass

# Test
user_perms = {'read', 'write', 'execute'}
required_perms = {'read', 'write', 'delete'}
# R√©sultat attendu: (False, {'delete'})

### Solution Exercice 3

In [None]:
def verifier_permissions(permissions_utilisateur, permissions_requises):
    """
    V√©rifie si un utilisateur a les permissions requises.
    
    Args:
        permissions_utilisateur: set des permissions de l'utilisateur
        permissions_requises: set des permissions requises
    
    Returns:
        tuple: (acces_autorise: bool, permissions_manquantes: set)
    """
    # V√©rifier si l'utilisateur a toutes les permissions requises
    acces_autorise = permissions_requises.issubset(permissions_utilisateur)
    
    # Calculer les permissions manquantes
    permissions_manquantes = permissions_requises - permissions_utilisateur
    
    return acces_autorise, permissions_manquantes

# Tests
print("=== Test 1 : Acc√®s refus√© ===")
user_perms = {'read', 'write', 'execute'}
required_perms = {'read', 'write', 'delete'}
autorise, manquantes = verifier_permissions(user_perms, required_perms)
print(f"Acc√®s autoris√©: {autorise}")
print(f"Permissions manquantes: {manquantes}")

print("\n=== Test 2 : Acc√®s autoris√© ===")
user_perms = {'read', 'write', 'execute', 'delete', 'admin'}
required_perms = {'read', 'write'}
autorise, manquantes = verifier_permissions(user_perms, required_perms)
print(f"Acc√®s autoris√©: {autorise}")
print(f"Permissions manquantes: {manquantes}")

## üìö R√©capitulatif

### Points cl√©s √† retenir :

1. **Cr√©ation** : `set()` ou `{}` (mais pas `{}` pour un set vide !)
2. **Unicit√©** : Les doublons sont automatiquement √©limin√©s
3. **Op√©rations ensemblistes** :
   - Union : `|` ou `.union()`
   - Intersection : `&` ou `.intersection()`
   - Diff√©rence : `-` ou `.difference()`
   - Diff√©rence sym√©trique : `^` ou `.symmetric_difference()`
4. **Modification** : `add()`, `remove()`, `discard()`, `pop()`, `clear()`
5. **Comparaison** : `issubset()`, `issuperset()`, `isdisjoint()`
6. **Frozenset** : Version immutable d'un set
7. **Performance** : O(1) pour les tests d'appartenance
8. **Limitations** : Non ordonn√©s, √©l√©ments hashables uniquement

### Quand utiliser un set ?
- D√©duplication rapide
- Tests d'appartenance fr√©quents
- Op√©rations ensemblistes (union, intersection, etc.)
- Garantir l'unicit√© des √©l√©ments