In [1]:
# Ricordati di eseguire questa cella con Shift+Invio

import jupman


# Insiemi

## [Scarica zip esercizi](../_static/generated/sets.zip)

[Naviga file online](https://github.com/DavidLeoni/softpython-it/tree/master/sets)


Un insieme è una collezione _mutabile_ _senza ordine_ di elementi _immutabili_ e _distinti_ (cioè senza duplicati). Il tipo di dati in Python per rappresentare gli insiemi si chiama `set`.


### Che fare

<div class="alert alert-warning">

**ATTENZIONE**: Per essere visualizzato correttamente, il file del notebook DEVE essere nella cartella szippata.
</div>

- apri il Jupyter Notebook da quella cartella. Due cose dovrebbero aprirsi, prima una console e poi un browser. Il browser dovrebbe mostrare una lista di file: naviga la lista e apri il notebook `sets1.ipynb`
- Prosegui leggendo il file degli esercizi, ogni tanto al suo interno troverai delle scritte **ESERCIZIO**, che ti chiederanno di scrivere dei comandi Python nelle celle successive. 

Scorciatoie da tastiera:

* Per eseguire il codice Python dentro una cella di Jupyter, premi `Control+Invio`
* Per eseguire il codice Python dentro una cella di Jupyter E selezionare la cella seguente, premi `Shift+Invio`
* Per eseguire il codice Python dentro una cella di Jupyter E creare una nuova cella subito dopo, premi `Alt+Invio`
* Se per caso il Notebook sembra inchiodato, prova a selezionare `Kernel -> Restart`



## Creare un insieme

Possiamo creare un insieme usando le parentesi graffe, e separando gli elementi da virgole `,` 

Proviamo un insieme di caratteri:

In [2]:
s = {'b','a','d','c'}

In [3]:
type(s)

set

<div class="alert alert-warning">

**ATTENZIONE: GLI INSIEMI** ***NON*** **SONO ORDINATI !!!**

**NON** CREDERE A QUELLO CHE VEDI !!
</div>

Proviamo a stampare l'insieme:

In [4]:
print(s)

{'d', 'b', 'c', 'a'}


Come vedi, l'ordine in cui è stata effettuata la stampa è diverso da quello con cui abbiamo costruito l'insieme. A seconda della versione di Python che stai usando, sul tuo computer potrebbe essere diverso ancora!! 

Questo perchè l'ordine negli insiemi NON è garantito: l'unica cosa che conta è se un elemento appartiene ad un insieme oppure no.

Come ulteriore dimostrazione, possiamo chiedere a Jupyter di mostrarci il contenuto dell'insieme, scrivendo solo la variabile `s` SENZA la `print`:

In [5]:
s

{'a', 'b', 'c', 'd'}

Adesso appare in ordine alfabetico ! Succede così perchè Jupyter quando mostra le variabili le stampa implicitamente non con la `print` ma con la [pprint](https://docs.python.org/3/library/pprint.html) (_pretty_ print), che SOLO per gli insiemi ci fa la cortesia di ordinare il risultato prima di stamparlo. Possiamo ringraziare, ma non lasciamo che ci confonda !!

**Indice degli elementi**: visto che gli insiemi non hanno ordine, chiedere a Python di estrarre un elemento ad una certa posizione non avrebbe senso. Quindi, diversamente da stringhe, liste e tuple, con gli insiemi NON è possibile ricavare un elemento a partire da un indice:

```python
s[0]

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-352-c9c96910e542> in <module>
----> 1 s[0]

TypeError: 'set' object is not subscriptable
```

Abbiamo detto che un insieme ha solo elementi _distinti_, cioè senza duplicati - che succede se proviamo a metterli comunque ?

In [6]:
s = {6,7,5,9,5,5,7}

In [7]:
s

{5, 6, 7, 9}

Notiamo che Python ha silenziosamente rimosso i duplicati.

### Convertire sequenze in insiemi

Come per liste e stringhe, possiamo creare un `set` a partire da un'altra sequenza:

In [8]:
set('acacia') # da stringa

{'a', 'c', 'i'}

In [9]:
set( [1,2,3,1,2,1,2,1,3,1] ) # da lista

{1, 2, 3}

In [10]:
set( (4,6,1,5,1,4,1,5,4,5) ) # da tupla

{1, 4, 5, 6}

Di nuovo, notiamo come nell'insieme creato non siano presenti duplicati.

<div class="alert alert-info">

**RICORDATI: Gli insiemi sono utili per rimuovere duplicati da una sequenza** 
</div>

### Elementi mutabili e hash

Rivediamo la definizione di insieme data all'inizio:

> Un insieme è una collezione _mutabile_ _senza ordine_ di elementi _immutabili_ e _distinti_

Finora abbiamo creato l'insieme solo usando elementi _immutabili_ come numeri e stringhe. 

Cosa succede se mettiamo degli elementi mutabili, come liste?

```python
>>> s = { [1,2,3], [4,5] }  

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-40-a6c538692ccb> in <module>
----> 1 s = { [1,2,3], [4,5]  } 

TypeError: unhashable type: 'list'
```    

Otteniamo `TypeError: unhashable type: 'list'`, che letteralmente significa che Python non è riuscito a calcolare lo spezzatino (_hash_) della lista. Cosa sarà mai questa particolare pietanza??


**Cos'è lo hash?** Lo _hash_ di un oggetto è un numero che Python può associargli, per esempio puoi vedere lo `hash` di un oggetto con l'omonima funzione:

In [11]:
hash( "Questa è una bella giornata" )  # stringa

8476997338545103310

In [12]:
hash( 111112222223333333344444445555555555 )   # numero

651300278308214397

 Immagina che lo _hash_ sia una specie di etichetta con queste caratteristiche:

- è troppo breve per descrivere completamente l'oggetto a cui è associata (tradotto: data solo un'etichetta hash, _non_ puoi ricostruire l'oggetto che rappresenta)
- è abbastanza lunga per identificare _quasi_ univocamente l'oggetto...
- ... anche se al mondo _potrebbero_  esistere oggetti diversi hanno però associata esattamente la stessa etichetta

**Cosa c'entra con i nostri insiemi?** Lo _hash_ ha vari utilizzi, ma tipicamente Python lo usa per ritrovare velocemente un'oggetto in collezioni basate sugli hash, come gli insiemi e i dizionari. Quanto velocemente? Parecchio: anche con insiemi enormi, otteniamo una risposta sempre in un tempo costante e brevissimo! In altre parole, la velocità di risposta  _non_ dipende dalla dimensione dell'insieme (salvo casi patologici).

Questa velocità è consentita dal fatto che dato un oggetto da cercare, Python è in grado di ricavare velocemente la sua etichetta _hash:_ poi con l'etichetta in mano, riesce a individuare nel magazzino della memoria molto in fretta se vi sono oggetti che hanno la stessa etichetta. Se vengono trovati, saranno quasi sicuramente molto pochi, e basterà quindi confrontarli con quello cercato.

**Gli oggetti _immutabili_ hanno sempre lo stessa etichetta hash** da quando sono creati fino alla fine del programma. Quelli _mutabili_ invece no: ogni volta che li cambiamo,  viene anche automaticamente cambiato l'_hash_. Immaginati un supermercato dove i commessi dispongono gli alimentari in base all'etichetta separando per esempio il caffè nello scaffale per la prima colazione e la varechina nello scaffale dei detersivi. Se sei un cliente e vuoi il caffè, guardi i cartelli e ti dirigi subito verso lo scaffale della prima colazione. Immagina cosa succederebbe se un mago malvagio potesse trasmutare gli oggetti già collocati negli scaffali in altri oggetti, quindi per esempio il caffè in varechina (assumiamo che al momento della trasmutazione oltre al caffè cambi anche l'etichetta _hash_). Sicuramente porterebbe tanta confusione, e se non si sta attenti, anche un gran mal di pancia.

Quindi per offrirti il vantaggio della ricerca rapida evitando situazioni disastrose, Python ti impone di collocare nell'insieme solo oggetti con _hash_ stabile, cioè gli oggetti _immutabili_.

**DOMANDA**: Possiamo inserire una tupla dentro un insieme? Prova a verificare la tua supposizione con un esempio di codice.

**RISPOSTA**: Sì, le tuple sono _immutabili_, quindi hanno uno _hash_ corrispondente stabile per tutta la durata del programma, per es questo è un set di tuple: `{(1,2), (3,4,5)}`

### Insieme vuoto

<div class="alert alert-warning">

**ATTENZIONE: Se scrivi** `{}` **otterrai un dizionario, NON un insieme !!!**

</div>

Per creare un insieme vuoto dobbiamo chiamare la funzione `set()`:

In [13]:
s = set()

In [14]:
s

set()

**ESERCIZIO**: prova a scrivere nella cella qua sotto `{}` e guarda il tipo dell'oggetto ottenuto con `type`

In [15]:
# scrivi qui


**DOMANDA**: Possiamo inserire un insieme dentro un'altro insieme? Guarda bene la definizione di insieme, poi verifica le tuo supposizioni provando a scrivere del codice per creare un insieme che abbia dentro un'altro insieme.

<div class="alert alert-warning">

**ATTENZIONE: Per fare la verifica, NON usare la funzione** `set`, **usa solo creazione con parentesi graffe**
</div>

**RISPOSTA**: Un insieme è _mutabile_, pertanto _non_ possiamo inserirlo come elemento di un altro insieme (la sua etichetta _hash_ potrebbe variare nel tempo ). Scrivendo  `{{1,2,3}}` otterrai un errore.

**DOMANDA**: Se scriviamo una cosa del genere, cosa otterremo? (attento !)

```python
set(set(['a','b']))
```

1. un insieme con dentro `'a'` e `'b'`
2. un insieme con dentro un insieme contenente gli elementi `'a'` e `'b'`
3. un errore (quale?)

**RISPOSTA**: la 1:

- all'interno abbiamo l'espressione `set(['a','b'])` che genera l'insieme `{'a','b'}`
- all'esterno abbiamo l'espressione `set( set(['a','b'])  )` che  si vede passare questo insieme appena creato, quindi la possiamo riscrivere come `set({'a','b'})`
- Dato che la `set` quando usata come funzione si attende una sequenza, e un insieme *è* una sequenza, la `set` esterna preleva tutti gli elementi che trova all'interno della sequenza `{'a','b'}` che gli abbiamo passato, e genera un nuovo insieme con dentro `'a'` e `'b'`.

**DOMANDA**:  Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):

1.  ```python
    {'oh','la','la'}
    ```   
1.  ```python
    set([3,4,2,3,2,2,2,-1])
    ```  
1.  ```python    
    {(1,2),(2,3)}
    ```   
1.  ```python    
    set('aba')
    ```   
1.  ```python
    str({'a'})
    ```       
1.  ```python    
    {1;2;3}
    ```   
1.  ```python    
    set(  1,2,3  )
    ```   
1.  ```python    
    set( {1,2,3} )
    ```   
1.  ```python    
    set( [1,2,3] )
    ```   
1.  ```python    
    set( (1,2,3) )
    ```   
1.  ```python    
    set(  "abc"  )
    ```   
1.  ```python    
    set(  "1232"  )
    ```   
1.  ```python    
    set( [ {1,2,3,2} ] )
    ```   
1.  ```python    
    set( [ [1,2,3,2] ] )
    ```   
1.  ```python    
    set( [ (1,2,3,2) ] )
    ```   
1.  ```python    
    set( [ "abcb"   ] )
    ```   
1.  ```python    
    set( [ "1232"   ] )
    ```   
1.  ```python    
    set((1,2,3,2))
    ```   
1.  ```python    
    set([(),()])
    ```   
1.  ```python    
    set([])
    ```   
1.  ```python    
    set(list(set()))
    ```

### Esercizio: dedup

Scrivi del codice breve per creare una lista `lb` che contiene tutti gli elementi dalla lista `la` senza duplicati e ordinati alfabeticamente.

- NON DEVE cambiare la lista originale `la`
- NON usare cicli
- il tuo codice dovrebbe funzionare con qualunque `la`

```python
la = ['c','a','b','c','d','b','e']
```

dopo il tuo codice, dovresti ottenere:

```python
>>> print(la)
['c', 'a', 'b', 'c', 'd', 'b', 'e']
>>> print(lb)
['a', 'b', 'c', 'd', 'e']
```

In [16]:
la = ['c','a','b','c','d','b','e']

# scrivi qui

lb = list(set(la))
lb.sort()
#lb = list(sorted(set(la)))  # alternativa, NOTA: sorted genera una NUOVA sequenza

print("la =",la)
print("lb =",lb)

la = ['c', 'a', 'b', 'c', 'd', 'b', 'e']
lb = ['a', 'b', 'c', 'd', 'e']


In [16]:
la = ['c','a','b','c','d','b','e']

# scrivi qui



la = ['c', 'a', 'b', 'c', 'd', 'b', 'e']
lb = ['a', 'b', 'c', 'd', 'e']


### Frozenset

<div class="alert alert-info" >

**INFO**: questo argomento è opzionale ai fini della comprensione del libro
</div>

In Python esistono anche insiemi _immutabili_ che si chiamano `frozenset`. Qui ci limitamo a ricordare che i `frozenset` essendo _immutabili_ hanno un'etichetta _hash_ associata e possono essere inseriti come elementi di altri insiemi. Per il resto rimandiamo alla [documentazione ufficiale](https://docs.python.org/3/library/stdtypes.html#frozenset).

## Operatori

|Operatore| Risultato | Descrizione |
|---------|-----------|-------------|
|`len`(set)|`int` | il numero di elementi nel set|
|el `in` set|`bool`|verifica se elemento è contenuto nel set|
|set <code>&#124;</code>  set| `set` | unione, crea un NUOVO set|
|set `&` set| `set` | intersezione, crea un NUOVO set|
|set `-` set| `set` | differenza, crea un NUOVO set|
|set `^` set| `set` | differenza simmetrica, crea un NUOVO set|
|`==`,`!=`|`bool`| Controlla se due insiemi sono uguali o differenti|


### len

In [17]:
len( {'a','b','c'}  )

3

In [18]:
len( set() )

0

### Esercizio - distinte

Data una stringa `parola`, scrivere del codice che 

* stampa  le lettere distinte presenti  in `parola` ordinate alfabeticamente (senza le quadre!), assieme al loro numero
* stampa il numero di lettere duplicate trovate in totale


**Esempio 1** - data:

```python
parola = "ababbbbcdd"
```
dopo il tuo codice deve stampare

```
parola     : ababbbbcdd
4 distinte : a,b,c,d
6 duplicate
```

**Esempio 2** - data:

```python
parola = "cccccaaabbbb"
```

dopo il tuo codice deve stampare

```
parola     : cccccaaabbbb
3 distinte : a,b,c
9 duplicate
```


In [19]:
# scrivi qui
parola = "ababbbbcdd"
#parola = "cccccaaabbbb"
s = set(parola)
print("parola     :", parola)
la = list(s) 
la.sort()
print(len(s), 'distinte :', ",".join(la))
#print(len(s), 'distinte :', list(sorted(s)))  # ALTERNATIVA CON SORTED
print(len(parola) - len(s), 'duplicate')

parola     : ababbbbcdd
4 distinte : a,b,c,d
6 duplicate


In [19]:
# scrivi qui



parola     : ababbbbcdd
4 distinte : a,b,c,d
6 duplicate


### Appartenenza

Come per tutte le sequenze, se vogliamo verificare se un elemento è contenuto in un insieme possiamo usare l'operatore `in` che ci ritorna un valore booleano:

In [20]:
'a' in {'m','e','n','t','a'}

True

In [21]:
'z' in {'m','e','n','t','a'}

False

<div class="alert alert-warning">

`in` **NEGLI INSIEMI E' UN'OPERAZIONE MOLTO VELOCE**

La velocità dell'operatore `in` NON dipende dalla dimensione dell'insieme
</div>

Questo è una differenza sostanziale rispetto alle altre sequenze già viste: se provi a cercare un elemento con `in` su stringhe, liste o tuple, Python potrebbe dover scorrere _tutta_ la lista se per sfortuna l'elemento da cercare è alla fine (o non c'è proprio). 

#### not in

Per verificare se qualcosa **non** appartiene ad una sequenza, possiamo usare due forme:

**not in - forma 1**:

In [22]:
"carota" not in {"anguria","banana","mela"}

True

In [23]:
"anguria" not in {"anguria","banana","mela"}

False

**not in - forma 2**

In [24]:
not "carota" in {"anguria","banana","mela"}

True

In [25]:
not "anguria" in {"anguria","banana","mela"}

False

**DOMANDA**: Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):

1.  ```python
    2*10 in {10,20,30,40}
    ```
1.  ```python    
    'four' in {'f','o','u','r'}
    ```
1.  ```python    
    'aa' in set('aa')
    ```
1.  ```python    
    'a' in set(['a','a'])
    ```
1.  ```python    
    [3 in {3,4}, 6 in {3,4} ]
    ```
1.  ```python    
    4 in set([1,2,3]*4)
    ```
1.  ```python    
    2 in {len('3.4'.split('.'))}
    ```
1.  ```python    
    4 not in {1,2,3}
    ```
1.  ```python    
    '3' not in {1,2,3}
    ```
1.  ```python    
    not 'a' in {'b','c'}
    ```
1.  ```python    
    not {} in set([])
    ```
1.  ```python    
    {not 'a' in {'a'}}
    ```
1.  ```python    
    4 not in set((4,))
    ```
1.  ```python    
    () not in set([()])
    ```

**DOMANDA**: le seguenti espressioni sono simili. Cosa hanno in comune? Qual'è la differenza con l'ultima (oltre al fatto che è su un insieme)? 


1.  ```python    
    'e' in 'abcde'
    ```    
2.  ```python    
    'abcde'.find('e') >= 0
    ```
3.  ```python
    'abcde'.count('e') > 0
    ```
4.  ```python
    'e' in ['a','b','c','d','e']
    ```
5.  ```python
    ['a','b','c','d','e'].count('e') > 0
    ```
6.  ```python
    'e' in ('a','b','c','d','e')
    ```
7.  ```python
    ('a','b','c','d','e').count('e') > 0
    ```
8. ```python    
    'e' in {'a','b','c','d','e'}
    ```

**RISPOSTA**: Tutte le espressioni sopra riportate ritornano un booleano che è `True` se l'elemento `'e'` è presente nella sequenza. 

Tutte le operazioni di ricerca e/o conteggio (`in`, `find`, `index`, `count`) su stringhe, liste e tuple impiegano un tempo di ricerca che alla peggio come in questo caso può essere pari alla dimensione della sequenza (`'e'` à alla fine).

Gli insiemi invece (espressione 8.), visto che sono basati sugli _hash_, consentono una ricerca immediata, indipendentemente dalla dimensione dell'insieme o posizione degli elementi (quindi non ha nessuna importanza se abbiamo creato l'insieme con `'e'` alla fine). 

<div class="alert alert-info">

**Per fare ricerche performanti è preferibile usare sequenze basate su hash, come insiemi o dizionari !**

</div>

### Unione

L'operatore di unione `|` (detto _pipe_)  produce un NUOVO insieme contenente tutti gli elementi del primo e del secondo insieme.

![eiu3](img/union.png)

In [26]:
{'a','b','c'} | {'b','c','d','e'}

{'a', 'b', 'c', 'd', 'e'}

Notiamo che non ci sono elementi duplicati

**ESERCIZIO**: E se usiamo il `+`? Prova a scrivere in una cella `{'a','b'} + {'c','d','e'}`. Cosa succede?

In [27]:
# scrivi qui


**DOMANDA**:  Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):


1.  ```python    
    {'a','d','b'}|{'a','b','c'}
    ```           
1.  ```python    
    {'a'}|{'a'}
    ```       
1.  ```python    
    {'a'|'b'}
    ```
1.  ```python    
    {1|2|3}
    ```   
1.  ```python    
    {'a'|'b'|'a'}
    ```       
1.  ```python    
    {{'a'}|{'b'}|{'a'}}
    ```       
1.  ```python    
    [1,2,3] | [3,4]
    ```       
1.  ```python    
    (1,2,3) | (3,4)
    ```       
1.  ```python        
    "abc" | "cd"
    ```       
1.  ```python        
    {'a'} | set(['a','b'])
    ```       
1.  ```python        
    set(".".join('pacca'))
    ```       
1.  ```python        
    '{a}'|'{b}'|'{a}'
    ```       
1.  ```python        
    set((1,2,3))|set([len([4,5])])
    ```
1.  ```python        
    {()}|{()}
    ```       
1.  ```python        
    {'|'}|{'|'}
    ```       


**DOMANDA**: Dati insiemi `x` e `y` qualunque, questa espressione 

```python
len(x | y) <= len(x) + len(y)
```

produce:

1. un errore (quale?)
2. sempre `True`
3. sempre `False`
4. a volte `True` a volte  `False` a seconda dei valori di `x` e `y`

**RISPOSTA**: La 2: il numero degli elementi dell'unione sarà sempre inferiore o uguale alla somma del numero degli elementi di ogni singolo set che andiamo ad unire, pertanto dalla comparazione con `<=` otterremo sempre `True`.

### Esercizio: tuttotranne 1

Scrivi del codice che crea un set `s4` che contiene tutti gli elementi di `s1` ed `s2` ma non contiene gli elementi di `s3`.

* Il tuo codice dovrebbe funzionare con _qualunque_ insieme `s1`, `s2`, `s3`


Esempio - dati

```python
s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])
```

Dopo il tuo codice dovresti ottenere

```python
>>> print(s4)
{'c', 'a', 'd', 'e', 'g'}
```

In [28]:

s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])

# scrivi qui
s4 = (s1 | s2) - s3
print(s4)

{'c', 'd', 'g', 'a', 'e'}


In [28]:

s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])

# scrivi qui



### Intersezione

L'operatore di intersezione `&` produce un NUOVO insieme contenente tutti gli elementi in comune del primo e secondo insieme

![okoerioe](img/intersection.png)

In [29]:
{'a','b','c'} & {'b','c','d','e'}

{'b', 'c'}

**DOMANDA**: Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):


1.  ```python
    {0} & {0,1}
    ```
1.  ```python    
    {0,1} & {0}
    ```
1.  ```python
    set("capra") & set("campa")
    ```
1.  ```python
    set("cba") & set("dcb")
    ```
1.  ```python    
    {len([1,2,3]),4} & {len([5,6,7])}
    ```
1.  ```python    
    {1,2} & {1,2}
    ```
1.  ```python    
    {0,1} & {}
    ```
1.  ```python    
    {0,1} & set()
    ```
1.  ```python    
    'cc' in (set('pacca') & set('zucca'))
    ```    
1.  ```python    
    set([1,2,3,4,5][::2]) & set([1,2,3,4,5][2::2])
    ```
1.  ```python        
    {((),)} & {()}
    ```
1.  ```python        
    {(())} & {()}
    ```        

### Differenza

L'operatore di differenza `-` produce un NUOVO insieme contenente tutti gli elementi del primo insieme eccetto queli del secondo:

![3423dde](img/difference.png)

In [30]:
{'a','b','c','d'} - {'b','c','e','f','g'}

{'a', 'd'}

**DOMANDA**: Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):

    
1.  ```python
    {3,4,2}-2
    ```
1.  ```python    
    {1,2,3}-{3,4}
    ```
1.  ```python        
    '{"a"}-{"a"}'
    ```
1.  ```python    
    {1,2,3}--{3,4}
    ```
1.  ```python    
    {1,2,3}-(-{3,4})
    ```    
1.  ```python        
    set("chiodo") - set("chiave")
    ```
1.  ```python        
    set("prova") - set("prova".capitalize())
    ```
1.  ```python        
    set("BarbA") - set("BARBA".lower())
    ```
1.  ```python    
    'c' in (set('parco') - set('cassa'))
    ```        
1.  ```python        
    set([(1,2),(3,4),(5,6)]) - set([(2,3),(4,5)])
    ```
1.  ```python        
    set([(1,2),(3,4),(5,6)]) - set([(3,4),(5,6)])
    ```
1.  ```python            
    {1,2,3} - set()
    ```
1.  ```python            
    set() - {1,2,3}
    ```

**DOMANDA**: Dati due insiemi qualunque `x` e `y`, il seguente codice cosa produce? Un errore? E' semplificabile?
    
```python
(x & y) | (x-y)
```

**RISPOSTA**: Stiamo unendo gli elementi in comune tra `x` e `y`, con gli elementi presenti in `x` ma non in `y`. Pertanto, stiamo prendendo tutti gli elementi di `x`, quindi l'espressione può essere semplificata scrivendo semplicemente 

```python
x
```

### Differenza simmetrica

La differenza simmetrica di due insiemi è la loro unione meno la loro intersezione, cioè tutti gli elementi tranne quelli in comune

![kjdfslkj](img/symmetric-difference.png)

In Python si può esprimere direttamente con l'operatore `^`:

In [31]:
{'a','b','c'} ^ {'b','c','d','e'}

{'a', 'd', 'e'}

Verifichiamo che il risultato corrisponda alla definizione:

In [32]:
s1 = {'a','b','c'}
s2 = {'b','c','d','e'}

(s1 | s2) - (s1 & s2)

{'a', 'd', 'e'}

**DOMANDA**:  Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):

1.  ```python    
    {'p','e','p','p','o'} ^ {'p','a','p','p','e'}
    ```
1.  ```python        
    {'ab','cd'} ^ {'ba','dc'}
    ```
1.  ```python    
    set('brodino') ^ set('bordo')
    ```
1.  ```python        
    set((1,2,5,3,2,3,1)) ^ set((1,4,3,2))
    ```

**DOMANDA**: Dati 3 insiemi `A`, `B`, `C`, qual'è l'espressione per ottenere la parte in azzurro? 
    
![sewqe](img/ex-abc-common.png)

**RISPOSTA**: 

```python
(A & B) | (A & C) | (B & C)
```

**DOMANDA**: Se usiamo i seguenti valori nell'esercizio precedente, l'insieme che indica la parte in blu cosa conterrebbe?

```python
A = {'a','ab','ac','abc'}
B = {'b','ab','bc','abc'}
C = {'c','ac','bc','abc'}
```

Una volta fatta la supposizione, prova ad eseguire la formula che hai trovato nell'esercizio precedente con i valori forniti e confronta i risultati con la soluzione.

**RISPOSTA**: Se la formula è corretta dovresti ottenere

```python
{'abc', 'ac', 'bc', 'ab'}
```

### Uguaglianza

Possiamo verificare se due insiemi sono uguali con l'operatore di uguaglianza `==`, che dati due insiemi ritorna `True` se contengono elementi uguali oppure `False` altrimenti:

In [33]:
{4,3,6} == {4,3,6}

True

In [34]:
{4,3,6} == {4,3}

False

In [35]:
{4,3,6} == {4,3,6, 'ciao'}

False

Attento alla rimozione dei duplicati !

In [36]:
{2,8} == {2,2,8}

True

Per verificare la disuguaglianza, possiamo usare l'operatore `!=`:

In [37]:
{2,5} != {2,5}

False

In [38]:
{4,6,0} != {2,8}

True

In [39]:
{4,6,0} != {4,6,0,2}

True

Attenti ai duplicati e all'ordine!

In [40]:
{0,1} != {1,0,0,0,0,0,0,0}

False

**DOMANDA**:  Guarda le seguenti espressioni, e per ciascuna cerca di indovinare quale risultato producono (o se danno errore):



1.  ```python
    {2 == 2, 3 == 3}
    ```
1.  ```python    
    {1,2,3,2,1} == {1,1,2,2,3,3}
    ```
1.  ```python
    {'aa'} == {'a'}
    ```
1.  ```python    
    set('aa') == {'a'}
    ```
1.  ```python    
    [{1,2,3}] == {[1,2,3]}
    ```
1.  ```python    
    set({1,2,3}) == {1,2,3}
    ```
1.  ```python    
    set((1,2,3)) == {(1,2,3)}
    ```
1.  ```python    
    {'aa'} != {'a', 'aa'}
    ```
1.  ```python    
    {set() != set()}
    ```
1.  ```python    
    set('scarpa') == set('capras')
    ```
1.  ```python    
    set('papa') != set('pappa')
    ```
1.  ```python    
    set('pappa') != set('reale')
    ```
1.  ```python    
    {(),()} == {(())}
    ```
1.  ```python    
    {(),()} != {(()), (())}
    ```
1.  ```python    
    [set()] == [set(),set()]
    ```
1.  ```python    
    (set('gosh') | set('posh')) == (set('shopping') - set('in'))
    ```

## Metodi simili agli operatori

Vi sono metodi analoghi agli operatori `|`, `&`, `-`, `^` che creano un **NUOVO** set.

**NOTA**: diversamente dagli operatori, questi metodi accettano come parametro una _qualsiasi_ sequenza, non solo insiemi:

|Metodo| Risultato | Descrizione | Operatore analogo|
|---------|-----------|-------------|------|
|`set.union(seq)`|`set`|unione, crea un NUOVO set |<code>&#124;</code>|
|`set.intersection(seq)`| `set`| intersezione, crea un NUOVO set|`&`|
|`set.difference(seq)`| `set` | differenza, crea un NUOVO set|`-`|
|`set.symmetric_difference(seq)`| `set` | differenza simmetrica, crea un NUOVO set|`^`|

Metodi che **MODIFICANO** il primo insieme su cui sono chiamati (e ritornano `None`!):

|Metodo| Risultato | Descrizione |
|---------|-----------|-------------|
|`setA.update(setB)`|`None`| unione, MODIFICA `setA`|
|`setA.intersection_update(setB)` |`None` |intersezione, MODIFICA `setA`|
|`setA.difference_update(setB)`| `None` | differenza, MODIFICA `setA`|
|`setA.symmetric_difference_update(setB)`| `None` | differenza simmetrica, MODIFICA `setA`|

### union

Guarderemo solo `union`/`update`, gli altri si comportano in modo analoghi

Con `union` dato un insieme e una generica sequenza (quindi non necessariamente un insieme) possiamo creare un NUOVO insieme:

In [41]:
sa = {'g','a','r','a'}

In [42]:
la = ['a','g','r','a','r','i','o']

In [43]:
sb = sa.union(la)

In [44]:
sb

{'a', 'g', 'i', 'o', 'r'}

**ESERCIZIO**: con `union` possiamo usare sequenze arbitrarie, invece con gli operatori no. Prova a scrivere `{1,2,3} | [2,3,4]` e guarda cosa succede.

In [45]:
# scrivi qui


Possiamo verificare che `union` crei un nuovo insieme con Python Tutor:

In [46]:
sa = {'g','a','r','a'}
la = ['a','g','r','a','r','i','o']
sb = sa.union(la)

jupman.pytut()

### update

Se vogliamo invece MODIFICARE il primo insieme, possiamo utilizzare i metodi che terminano con la parola `update`:

In [47]:
sa = {'g','a','r','a'}

In [48]:
la = ['a','g','r','a','r','i','o']

In [49]:
sa.update(la)

In [50]:
print(sa)

{'r', 'g', 'i', 'a', 'o'}


**DOMANDA**: che cosa ha ritornato la chiamata ad `update`?

**RISPOSTA**: Dal momento che Jupyter non ha mostrato nulla, significa che implicitamente la chiamata al metodo `update` ha ritornato l'oggetto `None`.

Guardiamo che è successo con Python Tutor - per evidenziare cosa è stato ritornato da update aggiungiamo anche un `x = `:

In [51]:
sa = {'g','a','r','a'}
la = ['a','g','r','a','r','i','o']
x = sa.update(la)
print(sa)
print(x)

jupman.pytut()

{'r', 'g', 'i', 'a', 'o'}
None


**DOMANDA**: Guarda i seguenti pezzi di codice, e per ciascuno cerca di indovinare quale risultato producono (o se danno errore):

1.  ```python
    set('case').intersection('sebo') == 'se'
    ```
1.  ```python
    set('naso').difference('caso')
    ```
1.  ```python
    s = {1,2,3}
    s.intersection_update([2,3,4])
    print(s)
    ```
1.  ```python
    s = {1,2,3}
    s = s & [2,3,4]
    ```
1.  ```python
    s = set('cartone')
    s = s.intersection('parto')
    print(s)
    ```
1.  ```python
    sa = set("mastice")
    sb = sa.difference("mastro").difference("collo")
    print(sa)
    print(sb)
    ```
1.  ```python
    sa = set("mastice")
    sb = sa.difference_update("mastro").difference_update("collo")
    print(sa)
    print(sb)
    ```    

### Esercizio - tuttotranne 2

Dati i set `s1`, `s2` e `s3`, scrivere del codice che MODIFICA `s1` in modo che contenga  anche gli elementi di `s2` ma non contenga gli elementi di `s3`.

* Il tuo codice dovrebbe funzionare con _qualunque_ insieme `s1`, `s2`, `s3`
* **NON** creare nuovi set

Esempio - dati

```python
s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])
```

Dopo il tuo codice dovresti ottenere

```python
>>> print(s1)
{'a', 'g', 'e', 'd', 'c'}
```

In [52]:

s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])

# scrivi qui
s1.update(s2)
s1.difference_update(s3)
print(s1)

{'e', 'c', 'd', 'g', 'a'}


In [52]:

s1 = set(['a','b','c','d','e'])
s2 = set(['b','c','f','g'])
s3 = set(['b','f'])

# scrivi qui



## Altri metodi

|Metodo| Risultato | Descrizione |
|---------|-----------|-------------|
|`set.add(el)`| `None`| aggiunge l'elemento specificato - se già presente non fa nulla)|
|`set.remove(el)`|`None`|rimuove l'elemento specificato - se non presente solleva errore|
|`set.discard(el)`|`None`|rimuove l'elemento specificato - se non presente non fa nulla|
|`set.pop()`|obj|rimuove un elemento arbitrario dall'insieme e lo ritorna|
|`set.clear()`|`None`|rimuove tutti gli elementi|
|`setA.issubset(setB`)|`bool`|verifica  se `setA` è un sottoinsieme di `setB`|
|`setA.issuperset(setB`)|`bool`|verifica se `setA` contiene tutti gli elementi di `setB`|
|`setA.isdisjoint(setB`)|`bool`|verifica  se `setA` non ha elementi in comune con `setB`|

### add

Dato un insieme, possiamo aggiungergli un elemento con il metodo `.add`:

In [53]:
s = {3,7,4}

In [54]:
s.add(5)

In [55]:
s

{3, 4, 5, 7}

Se aggiungiamo lo stesso elemento due volte, non accade nulla:

In [56]:
s.add(5)

In [57]:
s

{3, 4, 5, 7}

**DOMANDA**: Se scriviamo questo codice, che risultato otteniamo?

```python
s = {'a','b'}
s.add({'c','d','e'})
print(s)
```

1. stampa `{'a','b','c','d','e'}`
2. stampa `{{'a','b','c','d','e'}}`
3. stampa `{'a','b',{'c','d','e'}}`
4. un errore (quale?)

**RISPOSTA**: La 4 - produce `TypeError: unhashable type: 'set'` : stiamo cercando di inserire un insieme come elemento di un altro insieme, ma gli insiemi sono _mutabili_ e pertanto la loro etichetta _hash_ (che permette a Python di trovarli velocemente) potrebbe variare nel tempo

**DOMANDA**: Guarda il codice seguente, che risultato produce? 

```python
x = {'a','b'}
y = set(x)
x.add('c')
print('x=',x)
print('y=',y)
```

1. un errore (quale?)
2. `x` e `y` saranno uguali (come?)
3. `x` e `y` saranno diversi (come?)


**RISPOSTA**: La 3. Stamperà

```python
x= {'c', 'a', 'b'}
y= {'a', 'b'}
```

perchè `y=set(x)` crea un NUOVO insieme copiando gli elementi dalla sequenza di input `x`. Possiamo verificarlo con Python Tutor:

In [58]:
x = {'a','b'}
y = set(x)
x.add('c')

jupman.pytut()

### remove

Il metodo `remove` toglie un elemento specificato dall'insieme. Se non esiste, produce un errore:

In [59]:
s = {'a','b','c'}

In [60]:
s.remove('b')

In [61]:
s

{'a', 'c'}

In [62]:
s.remove('c')

In [63]:
s

{'a'}

```python
s.remove('z')

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-266-a9e7a977e50c> in <module>
----> 1 s.remove('z')

KeyError: 'z'

```

### Esercizio - bababiba

Data una stringa `scritta` di esattamente 4 sillabe da due caratteri ciascuna, creare un insieme `s` che contenga delle tuple con 2 caratteri ciascuna. Ogni tupla deve rappresentare una sillaba presa da `scritta`.

* per aggiungere elementi all'insieme, usa solo `add`
* il tuo codice deve funzionare con qualunque `scritta` da 4 bisillabe

Esempio 1 - data:

```python
scritta = "bababiba"
```

dopo il tuo codice, deve risultare:

```python
>>> print(s)
{('b', 'a'), ('b', 'i')}
```

Esempio 2 - data:

```python
scritta = "rubareru"
```

dopo il tuo codice, deve risultare:

```python
>>> print(s)
{('r', 'u'), ('b', 'a'), ('r', 'e')}
```


In [64]:

scritta = "bababiba"
#scritta = "rubareru"

# scrivi qui

s = set()
s.add(tuple(scritta[:2]))
s.add(tuple(scritta[2:4]))
s.add(tuple(scritta[4:6]))
s.add(tuple(scritta[6:8]))
print(s)

{('b', 'a'), ('b', 'i')}


In [64]:

scritta = "bababiba"
#scritta = "rubareru"

# scrivi qui



### discard

Il metodo `discard` toglie un elemento specificato dall'insieme. Se non esiste, non fa nulla:

In [65]:
s = {'a','b','c'}

In [66]:
s.discard('a')

In [67]:
s

{'b', 'c'}

In [68]:
s.discard('c')

In [69]:
s

{'b'}

In [70]:
s.discard('z')

In [71]:
s

{'b'}

### Esercizio - spazzatura

✪✪ Un impianto di processamento rifiuti riceve un carico di `spazzatura`, che rappresentiamo come insieme di stringhe: 

```python
spazzatura = {'alcheni','verdura','mercurio','carta'}
```

Per rimuovere gli elementi contaminanti che _potrebbero_ essere presenti (NOTA: non sempre sono presenti !), l'impianto ha esattamente 3 `filtri` (come lista di stringhe) che applicherà in serie alla spazzatura: 

```python
filtri = ['cadmio','mercurio','alcheni']
```

Per ogni filtro applicato, si vuole vedere lo stato della `spazzatura` processata, per vedere se il filtro ha effettivamente rimosso il contaminante (se presente)

Alla fine, si vuole anche stampare tutti e _soli_ i contaminanti che sono stati effettivamente rimossi (mettili come insieme nella variabile `separati`)

* **NON** usare comandi `if`
* **NON** serve usare cicli (il numero di filtri è fisso a 3, puoi usare copia e incolla di codice)
* Il tuo codice deve funzionare per _qualsiasi_ lista `filtri` di 3 elementi e _qualsiasi_ insieme `spazzatura` 

Esempio - dati:

```python
filtri = ['cadmio','mercurio','alcheni']
spazzatura = {'alcheni','verdura','mercurio','carta'}
```

Dopo il tuo codice, deve mostrare:

```
spazzatura iniziale: {'verdura', 'carta', 'alcheni', 'mercurio'}
Applico filtro per cadmio : {'verdura', 'carta', 'alcheni', 'mercurio'}
Applico filtro per mercurio : {'verdura', 'carta', 'alcheni'}
Applico filtro per alcheni : {'verdura', 'carta'}

Contaminanti separati: {'alcheni', 'mercurio'}
```


In [72]:

filtri = ['cadmio','mercurio','alcheni']
spazzatura = {'alcheni','verdura','mercurio','carta'}
separati = spazzatura.intersection(filtri) # crea un NUOVO insieme

# scrivi qui
s = "Applico filtro per"
print("spazzatura iniziale:", spazzatura)
spazzatura.discard(filtri[0])
print(s,filtri[0],":", spazzatura)
spazzatura.discard(filtri[1])
print(s,filtri[1],":", spazzatura)
spazzatura.discard(filtri[2])
print(s,filtri[2],":", spazzatura)
print("")

print("Contaminanti separati:", separati)

spazzatura iniziale: {'alcheni', 'mercurio', 'verdura', 'carta'}
Applico filtro per cadmio : {'alcheni', 'mercurio', 'verdura', 'carta'}
Applico filtro per mercurio : {'alcheni', 'verdura', 'carta'}
Applico filtro per alcheni : {'verdura', 'carta'}

Contaminanti separati: {'alcheni', 'mercurio'}


In [72]:

filtri = ['cadmio','mercurio','alcheni']
spazzatura = {'alcheni','verdura','mercurio','carta'}
separati = spazzatura.intersection(filtri) # crea un NUOVO insieme

# scrivi qui



## issubset

Per verificare se tutti gli elementi di un insieme `sa` sono contenuti in un altro insieme `sb` possiamo scrivere `sa.issubset(sb)`. Esempi:

In [73]:
{2,4}.issubset({1,2,3,4})

True

In [74]:
{3,5}.issubset({1,2,3,4})

False

<div class="alert alert-warning">
    
**ATTENZIONE: l'insieme vuoto è sempre considerato un sottoinsieme di un qualsiasi insieme**
</div>

In [75]:
set().issubset({3,4,2,5})

True

### issuperset

Per verificare se un insieme `sa`contiene tutti gli elementi di un altro insieme `sb` possiamo scrivere `sa.issuperset(sb)`. Esempi:

In [76]:
{1,2,3,4,5}.issuperset({1,3,5})

True

In [77]:
{1,2,3,4,5}.issuperset({2,4})

True

In [78]:
{1,2,3,4,5}.issuperset({1,3,5,7,9})

False

<div class="alert alert-warning">
**ATTENZIONE: l'insieme vuoto è sempre considerato un sottoinsieme di un qualsiasi insieme**
</div>

In [79]:
{1,2,3,4,5}.issuperset({})

True

### isdisjoint

Un insieme è disgiunto da un altro se non ha alcun elemento in comune, per verificarlo possiamo usare il metodo `isdisjoint`:

In [80]:
{1,3,5}.isdisjoint({2,4})

True

In [81]:
{1,3,5}.isdisjoint({2,3,4})

False

**DOMANDA**: Dato un insieme qualsiasi `x`, cosa produce la seguente espressione?

```python
x.isdisjoint(x)
```

1. un errore (quale?)
2. sempre `True`
3. sempre `False`
4. `True` o `False` a seconda del valore di `x`


**RISPOSTA**: La 4, `True` o `False` a seconda del valore di `x`.

Probabilmente avrai pensato che l'espressione restituisca sempre `False`, dopotutto, come potrebbe un insieme a essere disgiunto da sè stesso? In effetti l'espressione ritorna sempre `False` _eccetto_ nel caso particolare dell'insieme vuoto: 

```python
x = set()
x.isdisjoint(x)
```
in cui ritorna `True`.

<div class="alert alert-warning">

**MORALE: CONTROLLA SEMPRE L'INSIEME VUOTO !**

Per questo e per tanti altri metodi l'insieme vuoto causa spesso comportamenti non sempre intuitivi, quindi ti invitiamo sempre a provare caso per caso.

</div>

## Esercizio - matrioska

✪✪ Data una lista `insiemi` di esattamente 4 insiemi, la definiamo _a matrioska_ se ogni insieme contiene tutti gli elementi del precedente insieme (più eventualmente altri). Scrivi del codice che STAMPA `True` se la sequenza è a matrioska, altrimenti STAMPA `False`.

* **NON** usare `if`
* il tuo codice deve funzionare per _qualunque_ sequenza di esattamente 4 insiemi
* **SUGGERIMENTO**: puoi creare una lista di 3 booleani che verificano se un set è contenuto nel successivo...

Esempio 1 - data :

```python
insiemi = [{'a','b'}, 
           {'a','b','c'},
           {'a','b','c','d','e'},
           {'a','b','c','d','e','f','g','h','i'}]
```
dopo il tuo codice, deve stampare:

```
La sequenza è a matrioska? True
```

Esempio 2 - data :

```python
insiemi = [{'a','b'}, 
           {'a','b','c'},
           {'a','e','d'},
           {'a','b','d','e'}]
```
dopo il tuo codice, deve stampare:

```
La sequenza è a matrioska? False
```


In [82]:

insiemi = [{'a','b'}, 
           {'a','b','c'},
           {'a','b','c','d','e'},
           {'a','b','c','d','e','f','g','h','i'}]


#insiemi = [{'a','b'}, 
#           {'a','b','c'},
#           {'a','e','d'},
#           {'a','b','d','e'}]


# scrivi qui

controlli = [ insiemi[0].issubset(insiemi[1]),
              insiemi[1].issubset(insiemi[2]), 
              insiemi[2].issubset(insiemi[3]) ]

print("La sequenza è a matrioska?", controlli.count(True) == 3)

La sequenza è a matrioska? True


In [82]:

insiemi = [{'a','b'}, 
           {'a','b','c'},
           {'a','b','c','d','e'},
           {'a','b','c','d','e','f','g','h','i'}]


#insiemi = [{'a','b'}, 
#           {'a','b','c'},
#           {'a','e','d'},
#           {'a','b','d','e'}]


# scrivi qui



## Prosegui

Prosegui con le [challenges](https://it.softpython.org/sets/sets2-chal.html)