# 🧩 Insiemi

## Introduzione

Gli **insiemi** (in inglese *sets*) rappresentano una delle strutture dati fondamentali in Python, ispirata direttamente alla **teoria degli insiemi** della matematica. Sono utilizzati per modellare collezioni **non ordinate**, **mutabili** e composte da **elementi unici**. Si tratta di un tipo di oggetto estremamente utile in un'ampia varietà di scenari applicativi: dalla rimozione dei duplicati all'esecuzione efficiente di operazioni di confronto tra gruppi di dati.

In [30]:
# Introduzione
insieme = {1, 2, 3, 4}
print(insieme)  # Output: {1, 2, 3, 4}

{1, 2, 3, 4}


## Conversioni a `set`

Il costruttore `set()` in Python permette di convertire diverse strutture dati in un insieme (set), eliminando automaticamente gli elementi duplicati. Questa funzionalità è utile per filtrare i dati univoci da collezioni come liste, tuple, stringhe e altri iterabili.

### Tipi di conversione supportati

- **Liste**: `set([1, 2, 2, 3])` produce `{1, 2, 3}`
- **Tuple**: `set((1, 1, 2))` produce `{1, 2}`
- **Stringhe**: `set("emma")` produce `{'a', 'e', 'm'}`
- **Altri set o frozenset**: produce una copia dell'insieme

La conversione, in caso di duplicati, li rimuove automaticamente.

### Uso comune

- Eliminare duplicati da una lista: `list(set(lista))`
- Verificare se due collezioni hanno gli stessi elementi: `set(a) == set(b)`
- Ottenere l'unione, l'intersezione, o altre operazioni tra collezioni trasformandole in set prima

Questa funzionalità è particolarmente utile per operazioni di confronto, pulizia dei dati, o per aumentare l'efficienza delle ricerche.

In [58]:
# Conversione da lista a set (rimuove duplicati)
lista = [1, 2, 2, 3, 4, 4, 5]
insieme = set(lista)
print(insieme)  # Output: {1, 2, 3, 4, 5}

{1, 2, 3, 4, 5}


In [59]:
# Conversione da tupla a set
tupla = (10, 10, 20, 30)
insieme_da_tupla = set(tupla)
print(insieme_da_tupla)  # Output: {10, 20, 30}

{10, 20, 30}


In [60]:
# Conversione da stringa a set (caratteri unici)
stringa = "mississippi"
caratteri_unici = set(stringa)
print(caratteri_unici)  # Output: {'m', 'i', 's', 'p'}

{'m', 'i', 's', 'p'}


In [63]:
# Conversione da set a set (copia)
originale = {1, 2, 3}
copia = set(originale)
print(copia)  # Output: {1, 2, 3}
print(id(originale), id(copia))

{1, 2, 3}
132391003525792 132391003526688


## Caratteristiche Generali degli Insiemi

1. **Unicità degli elementi**  
   Ogni elemento presente in un set è unico. Questo significa che, anche se si tenta di inserire più volte lo stesso oggetto, esso verrà mantenuto una sola volta. Questo comportamento è automatico e intrinseco alla struttura.

2. **Non ordinati**  
   Gli insiemi non conservano l’ordine con cui gli elementi sono stati inseriti. Quando si visualizza o si itera un set, l’ordine può sembrare casuale e può variare tra un’esecuzione e l’altra.

3. **Non indicizzabili**  
   Non è possibile accedere direttamente agli elementi tramite un indice numerico (come si fa con liste o tuple). Gli insiemi vanno trattati come collezioni "globali", non sequenziali.

4. **Mutabilità**  
   Gli insiemi possono essere modificati dopo la loro creazione: è possibile aggiungere o rimuovere elementi. Tuttavia, gli elementi al loro interno devono essere **immutabili** (come numeri, stringhe o tuple hashabili).

5. **Efficienza**  
   Le operazioni di verifica di appartenenza (es. "x è presente nell’insieme?") sono estremamente rapide grazie all’implementazione tramite **tabelle hash**. Questo rende i set molto più efficienti di liste o tuple in questo tipo di operazioni.

In [66]:
# Caratteristiche Generali degli Insiemi
dati = [1, 2, 2, 3, 4, 4, 4]
insieme_unico = set(dati)
print(insieme_unico)  # Output: {1, 2, 3, 4}

esempio = {'a', 'b', 'c'}
print(esempio)  # L'ordine può variare

{1, 2, 3, 4}
{'a', 'c', 'b'}


In [68]:
# Comportamento dell’Ordine
s = {5, 10, 1, 3}
for elemento in s:
    print(elemento)

1
10
3
5


## Funzioni Più Comuni degli Insiemi in Python

Gli insiemi (`set`) in Python forniscono numerosi metodi integrati per aggiungere, rimuovere, copiare, unire o modificare il contenuto dell’insieme. Di seguito sono elencate e spiegate le funzioni più comuni con esempi pratici:

### `add(elem)` (in-place)
Aggiunge un singolo elemento all’insieme. Se l’elemento è già presente, non viene aggiunto nuovamente.

In [55]:
# add
s = {1, 2}
s.add(3)         # s = {1, 2, 3}
s.add(2)         # s resta {1, 2, 3}
s

{1, 2, 3}

### `remove(elem)` (in-place)
Rimuove un elemento specifico. Se l’elemento non esiste, viene sollevata un'eccezione `KeyError`.

In [56]:
# remove
s.remove(1)      # s = {2, 3}
# s.remove(4)    # KeyError
s

{2, 3}

### `discard(elem)` (in-place)
Simile a `remove`, ma se l’elemento non esiste, non viene sollevata alcuna eccezione.

In [None]:
# discard
s.discard(3)     # s = {2}
s.discard(10)    # Nessun errore
s

### `pop()` (in-place)
Rimuove e restituisce un elemento arbitrario dall’insieme. Se l’insieme è vuoto, solleva `KeyError`.

In [None]:
# pop
element = s.pop()  # Rimuove un elemento arbitrario
print(element, s)

### `clear()` (in-place)
Rimuove tutti gli elementi, svuotando completamente l’insieme.

In [None]:
# clear
s.clear()        # s = set()
s

### `copy()`
Restituisce una copia superficiale del set, utile per lavorare con versioni temporanee senza modificare l’originale.

In [37]:
# copy
a = {1, 2, 3}
b = a.copy()     # b = {1, 2, 3}

### `update(*others)` (in-place)
Unisce all’insieme corrente uno o più insiemi o iterabili, aggiungendo tutti gli elementi presenti negli altri contenitori.

In [76]:

# update
c = {1, 2}
c.update({3, 4}, [5, 6])  # c = {1, 2, 3, 4, 5, 6}

## Elementi Ammessi negli Insiemi

Gli insiemi possono contenere solo **oggetti immutabili** e **hashabili**, cioè oggetti il cui contenuto non cambia e che implementano una funzione hash valida. In concreto, ciò significa che si possono inserire:

- Numeri (interi, floating-point, complessi)
- Stringhe
- Tuple contenenti solo oggetti immutabili

Non è possibile inserire oggetti **mutabili** come:

- Liste
- Altri set mutabili
- Dizionari

Il tentativo di aggiungere elementi mutabili genera un errore (`TypeError`), poiché questi non sono idonei all’hashing.

In [39]:
# Elementi Ammessi negli Insiemi
insieme = {42, "ciao", (1, 2)}
print(insieme)

# set_invalido = {[1, 2]}  # TypeError: unhashable type: 'list'

{42, (1, 2), 'ciao'}


## Operazioni Fondamentali (not in-place)

I set implementano nativamente le **principali operazioni insiemistiche** previste dalla teoria matematica. Queste operazioni permettono di unire, confrontare o differenziare insiemi in modo naturale e leggibile.

### Unione (Union)

L’unione tra due insiemi produce un nuovo insieme contenente **tutti gli elementi presenti almeno in uno dei due**.

$$
A \cup B = \{ x \mid x \in A \ \text{o} \ x \in B \}
$$

### Intersezione (Intersection)

L’intersezione restituisce un nuovo insieme contenente **solo gli elementi presenti in entrambi**.

$$
A \cap B = \{ x \mid x \in A \ \text{e} \ x \in B \}
$$

### Differenza (Difference)

La differenza tra due insiemi \( A - B \) contiene tutti gli elementi di \( A \) **che non sono in \( B \)**.

$$
A - B = \{ x \mid x \in A \ \text{e} \ x \notin B \}
$$

### Differenza Simmetrica (Symmetric Difference)

La differenza simmetrica tra due insiemi produce un insieme con gli elementi **presenti in uno solo dei due**, ma non in entrambi.

$$
A \triangle B = (A - B) \cup (B - A) = \{ x \mid (x \in A \ \text{e} \ x \notin B) \ \text{o} \ (x \in B \ \text{e} \ x \notin A) \}
$$

In [70]:
# Operazioni Fondamentali e Proprietà Matematiche
A = {1, 2, 3}
B = {3, 4, 5}

print(A | B)  # Unione: {1, 2, 3, 4, 5}
print(A & B)  # Intersezione: {3}
print(A - B, B - A)  # Differenza: {1, 2}
print(A ^ B)  # Differenza simmetrica: {1, 2, 4, 5}

{1, 2, 3, 4, 5}
{3}
{1, 2} {4, 5}
{1, 2, 4, 5}


## Confronti e Relazioni tra Insiemi

Gli insiemi possono essere confrontati e relazionati tra loro utilizzando operatori e metodi specifici che rispecchiano le proprietà matematiche degli insiemi.

- **Uguaglianza (`==`)**: due insiemi sono uguali se contengono gli stessi elementi, indipendentemente dall’ordine.

$$
A = B \iff \forall x \ (x \in A \leftrightarrow x \in B)
$$

- **Sottoinsieme ($\subseteq$, `<`)**: verifica se un insieme è contenuto in un altro.

$$
A \subseteq B \iff \forall x \ (x \in A \implies x \in B)
$$

- **Sovrainsieme ($\supseteq$, `>`)**: verifica se un insieme contiene un altro.

$$
A \supseteq B \iff \forall x \ (x \in B \implies x \in A)
$$

- **Disgiunzione (`isdisjoint`)**: verifica se due insiemi **non condividono elementi comuni**.

$$
A \cap B = \emptyset
$$

Queste relazioni sono fondamentali in algoritmi di classificazione, filtraggio, insiemi di utenti o gruppi di accesso.

In [71]:
# Confronti e Relazioni tra Insiemi
A = {1, 2, 3}
B = {1, 2}
C = {4, 5}

print(B <= A)             # True
print(A >= B)             # True
print(A < C)              # Flase
print(A == {3, 2, 1})     # True
print(A.isdisjoint(C))    # True

True
True
False
True
True


## Operazioni Mutanti (in-place)

Oltre alle operazioni classiche, esistono le versioni **in-place**, che modificano direttamente l’insieme originale, risparmiando memoria:

- `update`: unione in-place
- `intersection_update`: intersezione in-place
- `difference_update`: differenza in-place
- `symmetric_difference_update`: differenza simmetrica in-place

In [77]:
# Operazioni Mutanti (in-place)
A = {1, 2, 3}
B = {3, 4, 5}

A.update(B)
print(A)  # {1, 2, 3, 4, 5}

A = {1, 2, 3}
A.intersection_update({2, 3, 4})
print(A)  # {2, 3}

A.difference_update({3})
print(A)  # {2}

A.symmetric_difference_update({2, 5})
print(A)  # {5}

{1, 2, 3, 4, 5}
{2, 3}
{2}
{5}


## Frozenset: Insiemi Immutabili

Python fornisce anche una variante **immutabile** del set chiamata `frozenset`. Una volta creato, il frozenset **non può essere modificato**. Questo lo rende utile quando si desidera usare un insieme come **chiave in un dizionario** o elemento di un altro set.

Essendo hashabile, è compatibile con tutte le strutture dati che richiedono oggetti immutabili.

In [78]:
# Frozenset: Insiemi Immutabili
fs = frozenset([1, 2, 3])
# fs.add(4)  # Errore: immutabile

dizionario = {fs: "valore associato"}
print(dizionario[fs])

valore associato


### Deep Copy

Una **deep copy** (copia profonda) di un insieme (o di qualsiasi altra struttura dati complessa) crea una copia completamente indipendente dall'originale. Mentre il metodo `copy()` applicato a un set restituisce una **shallow copy** (copia superficiale), che è sufficiente per insiemi contenenti solo elementi immutabili (come numeri e stringhe), nel caso di insiemi che contengono elementi mutabili (come tuple con oggetti, altri set congelati, ecc.), può essere necessario effettuare una copia profonda.

Per eseguire una deep copy, si utilizza il modulo `copy` della libreria standard di Python, in particolare la funzione `copy.deepcopy()`.

#### Caratteristiche della deep copy:

- Viene creata una nuova struttura dati completamente indipendente dall’originale.
- Tutti gli oggetti nidificati vengono ricorsivamente copiati.
- Le modifiche apportate alla copia non influenzano l’originale e viceversa.

#### Quando usare una deep copy:
- Quando il set contiene elementi mutabili (ad esempio, `frozenset`, tuple con liste, dizionari annidati, ecc.).
- Quando si vuole evitare qualsiasi riferimento condiviso tra oggetti originali e copiati.

#### Nota:
I set Python standard (`set`) non possono contenere oggetti mutabili come altri set o liste, ma possono contenere `frozenset`, che sono immutabili e quindi hashabili.

In [79]:
import copy

# Set contenente oggetti immutabili
original_set = {1, 2, 3}
shallow_copy = original_set.copy()  # copia superficiale
deep_copy = copy.deepcopy(original_set)  # copia profonda (equivalente per oggetti immutabili)

# Set contenente frozenset (immutabile e quindi consentito in un set)
nested_set = {frozenset([1, 2]), frozenset([3, 4])}
deep_copied_set = copy.deepcopy(nested_set)

# Modifica di un elemento della copia (non modifica l'originale)
# Nota: poiché frozenset è immutabile, non si può modificare direttamente,
# ma possiamo sostituire l'intero elemento (solo per esempio illustrativo)
modified_set = set(deep_copied_set)
modified_set.remove(frozenset([1, 2]))
modified_set.add(frozenset([9, 9]))

print("Original Set:", nested_set)
print("Modified Copy:", modified_set)

Original Set: {frozenset({3, 4}), frozenset({1, 2})}
Modified Copy: {frozenset({3, 4}), frozenset({9})}


## Complessità Computazionale

Gli insiemi sono estremamente efficienti grazie alla loro implementazione tramite tabelle hash. Le seguenti sono le complessità medie delle operazioni più comuni:

- **Controllo di appartenenza**: O(1)
- **Aggiunta o rimozione**: O(1)
- **Intersezione/Unione**: O(n + m), dove n e m sono le dimensioni dei due insiemi

Queste prestazioni li rendono ideali per elaborazioni ad alte prestazioni su grandi volumi di dati.

In [2]:
import time

# Preparazione dati
numeri_set = set(range(10000000))
numeri_list = list(range(10000000))

# Controllo appartenenza (in)
start = time.time()
_ = 9999999 in numeri_set
time_set = time.time() - start

start = time.time()
_ = 9999999 in numeri_list
time_list = time.time() - start

print(f"Membership test in set: {time_set:.6f} seconds")
print(f"Membership test in list: {time_list:.6f} seconds")

Membership test in set: 0.000084 seconds
Membership test in list: 0.094920 seconds


## Applicazioni Pratiche

Gli insiemi trovano impiego in numerosissimi contesti pratici, tra cui:

- **Eliminazione di duplicati** da una sequenza
- **Filtraggio rapido** di valori in liste o colonne di dataset
- **Gestione di etichette, tag, parole chiave**
- **Analisi di testi**, per individuare il vocabolario unico di un documento
- **Confronto tra dataset**, come elenchi di utenti, logs, dati sensibili
- **Controllo di appartenenza** istantaneo in algoritmi di ricerca

In [3]:
# Applicazioni Pratiche
nomi = ["Anna", "Luca", "Anna", "Marco"]
unici = set(nomi)
print(unici)  # {'Marco', 'Anna', 'Luca'}

testo = "il gatto e il topo giocano nel giardino con il gatto"
parole_uniche = set(testo.split())
print(parole_uniche)

{'Luca', 'Marco', 'Anna'}
{'topo', 'il', 'giardino', 'gatto', 'nel', 'con', 'e', 'giocano'}


## Differenze tra Set e Altre Strutture

| Caratteristica             | List        | Tuple       | Set         | Dict (chiavi) |
|----------------------------|-------------|-------------|-------------|---------------|
| Ordinato                   | Sì          | Sì          | No          | No*           |
| Elementi duplicati ammessi| Sì          | Sì          | No          | No            |
| Mutabilità                 | Sì          | No          | Sì          | Sì (valori)   |
| Indicizzazione diretta     | Sì          | Sì          | No          | No            |
| Supporto per operazioni insiemistiche | No | No        | Sì          | No            |

*I dizionari in Python 3.7+ mantengono l’ordine di inserimento, ma ciò è una caratteristica di implementazione, non garantita da tutti gli interpreti.

---

## Considerazioni Finali

Gli insiemi (`set`) sono una delle strutture dati più potenti e sottovalutate del linguaggio Python. Oltre alla loro semplicità sintattica, offrono prestazioni eccezionali e si prestano a una vasta gamma di applicazioni sia teoriche che pratiche.

Conoscerli a fondo consente di:

- Scrivere codice più leggibile
- Ottimizzare le performance
- Rappresentare dati in modo matematicamente corretto
- Risolvere problemi complessi in maniera elegante

Imparare a sfruttare al meglio i set significa **sviluppare una comprensione più profonda di Python stesso** e della logica algoritmica che ne sottende molte delle operazioni quotidiane.