# Data structures

In questa sezione ci focalizzeremo sulle *data structure* più comunemente utilizzate in Python e sulle loro proprietà principali. Queste strutture hanno in comune il fatto di essere "contenitori" di elementi, siano essi numeri, stringhe, o altri contenitori a loro volta. A seconda del tipo di contenitore, appunto di *data structure*, possiamo svolgere operazioni diverse con gli elementi al suo interno.

## List

> **DOCSTRING**
>
> *Built-in mutable sequence*
>
> **METODI**
>
>`['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']`

La lista è la *data structure* forse più comune in Python, senz'altro quella con le proprietà più intuitive. E' riconoscibile perché gli elementi al suo interno sono delimitati da parentesi quadre.

In [1]:
list1 = ['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man']
print(list1)

['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man']


Una lista è innanzitutto un ***iterable***, il che significa che possiamo utilizzarla all'interno di un loop.

In [2]:
for hero in list1:
    print(hero)

Thor
Superman
Batman
Hulk
Iron Man


In [3]:
counter = 0
while counter < 3:
    counter += 1
    print(list1[counter])

print('\n')
print(f'Il valore della variabile "counter" alla fine del loop è {counter}')

Superman
Batman
Hulk


Il valore della variabile "counter" alla fine del loop è 3


Una lista è una **sequenza**: questo termine in Python denota un *contenitore* caratterizzato da una sua lunghezza, che possiamo ottenere attraverso il metodo `__len__()`, e dal fatto che gli elementi al suo interno siano ordinati, ossia associati ad un indice.

In [4]:
print(len(list1))

5


La "sequenzialità" di una lista ci consente di accedere ai suoi elementi attraverso la loro posizione all'interno della lista stessa.

> **DA RICORDARE**: PYTHON INIZIA A CONTARE DA 0, NON DA 1!

In [5]:
print(list1[0])
print(list1[1])

Thor
Superman


Utilizzando le funzionalità di *slicing* di Python, possiamo accedere a elementi multipli all'interno di una lista.

> **DA SAPERE**: Una *slice* di una lista è essa stessa una lista!

In [6]:
# dal secondo elemento al quarto
print(list1[2:4])

# i primi tre elementi
print(list1[0:3])
# oppure...
print(list1[:3])

# dal secondo elemento (incluso) fino all'ultimo
print(list1[2:])

['Batman', 'Hulk']
['Thor', 'Superman', 'Batman']
['Thor', 'Superman', 'Batman']
['Batman', 'Hulk', 'Iron Man']


Possiamo controllare se una lista contiene un determinato elemento utilizzando gli operatori `in` e `not in`.

In [7]:
print('Thor' in list1)

True


In [8]:
print('Batman' not in list1)

False


Possiamo utilizzare gli operatori `+` e `*` per creare nuove liste.

L'operatore `+` può essere utilizzato per concatenare due liste. Funziona solo se entrambi gli operandi sono liste.

In [9]:
list2 = ['Ant-Man', 'Falcon']

print(list1 + list2)

['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man', 'Ant-Man', 'Falcon']


L'operatore `*` può essere utilizzato per duplicare i valori di una lista

In [10]:
print(list1*3)

['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man', 'Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man', 'Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man']


Una proprietà che distingue la lista da altre *data structures* come la *tuple* è il fatto di essere mutabile (*mutable*). Questo significa che, una volta creata una lista, possiamo liberamente:
* modificare gli elementi all'interno della lista;
* aggiungere nuovi elementi alla lista;
* rimuovere elementi dalla lista;

Queste operazioni vengono effettuate attraverso metodi che non restituiscono nessun output, ma alterano permanentemente lo stato della lista sul quale sono invocati, come `append()`, `extend()` e `remove()`.

> **DA SAPERE**: gli operatori `+` e `*` appena utilizzati non alterano permanentemente lo stato di una lista, ma restituiscono una nuova lista lasciando inalterati i loro input!

In [11]:
print(list1) ##inalterata dalle operazioni svolte nelle due righe precedenti

['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man']


Per modificare un elemento in una lista basta accedere a quell'elemento attraverso il suo *index*, e assegnarvi un nuovo valore come faremmo per qualsiasi variabile.

In [12]:
print('Old list1:')
print(list1)

list1[3] = 'Howard the Duck'

print('\n')
print('New list1:')
print(list1)

Old list1:
['Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man']


New list1:
['Thor', 'Superman', 'Batman', 'Howard the Duck', 'Iron Man']


Esistono diversi modi attraverso cui aggiungere nuovi elementi ad una lista:

1. Utilizzando il metodo `append()`, aggiungiamo un solo elemento in fondo alla lista.

In [13]:
list1.append('Doctor Strange') #nessun output!

In [14]:
print(list1)

['Thor', 'Superman', 'Batman', 'Howard the Duck', 'Iron Man', 'Doctor Strange']


3. Il metodo `extend()` funziona in maniera simile all'operatore "+", ma anziché restituire un output modifica permanentemente la lista sulla quale è invocato

In [15]:
list1.extend(list2) #nessun output

In [16]:
print(list1)

['Thor', 'Superman', 'Batman', 'Howard the Duck', 'Iron Man', 'Doctor Strange', 'Ant-Man', 'Falcon']


Possiamo rimuovere permanentemente un elemento da una lista utilizzando il metodo `remove()`.

In [17]:
list1.remove('Howard the Duck') #nessun output
print(list1)

['Thor', 'Superman', 'Batman', 'Iron Man', 'Doctor Strange', 'Ant-Man', 'Falcon']


Nel caso in cui ci siano due o più elementi identici all'interno di una lista, il metodo `remove()` rimuove soltanto il primo.

In [18]:
ones_and_zeros = [1, 0, 0, 1, 1, 0, 0, 1]
ones_and_zeros.remove(1)
print(ones_and_zeros)

[0, 0, 1, 1, 0, 0, 1]


Altri metodi utili di una lista sono:
* `count(x)`: restituisce il numero di volte in cui l'elemento x compare all'interno di una lista;
* `copy()`: restituisce una copia di una lista;
* `sort()`: modifica permanentemente la lista, ordinandone gli elementi:
    * in ordine crescente se numerici;
    * in ordine alfabetico se caratteriali;
* `reverse()`: modifica permanentemente una lista invertendo l'ordine dei suoi elementi;
* `index(x)`: restituisce la posizione dell'elemento x all'interno di una lista (se x compare più volte, restituisce la posizione della prima *occurrence*);

## Tuple

>**DOCSTRING**
>
>*Built-in immutable sequence*
>
>**METODI**
>
>`['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'count', 'index']`

Una *tuple* è un contenitore **immutabile**. Una volta creata, non possiamo alterare il suo stato come per una lista. Dando uno sguardo all'elenco dei metodi, non troviamo infatti metodi come `append()` e `extend()` che, in una lista, modificano permanentemente lo stato dell'oggetto.

Gli elementi all'interno di una *tuple* sono delimitati da parentesi tonde.

In [19]:
tuple1 = ('Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man')
print(tuple1)

('Thor', 'Superman', 'Batman', 'Hulk', 'Iron Man')


Come una lista, anche una *tuple* è un *iterable* e una sequenza. Possiamo quindi:
* utilizzarla in un loop;
* determinare la sua lunghezza attraverso il metodo `__len__`;
* accedere ai suoi elementi attraverso la loro posizione.

In [20]:
for item in tuple1:
    print(item)

Thor
Superman
Batman
Hulk
Iron Man


In [21]:
print(len(tuple1))

5


In [22]:
print(tuple1[0])

Thor


In [23]:
print(tuple1[2:4])

('Batman', 'Hulk')


Non possiamo tuttavia modificare gli elementi di una *tuple* come potremmo fare in una lista.

In [24]:
try:
    tuple1[0] = 'Nick Fury'
except TypeError as error:
    print(error)

'tuple' object does not support item assignment


Possiamo utilizzare gli operatori `+` e `*` per ottenere nuove tuple. Il loro funzionamento è identico a quello illustrato per le liste.

## Set

>**DOCSTRING**
>
>*Build an unordered collection of unique elements*
>
>**METODI**
>
>`['__and__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__iand__', '__init__', '__init_subclass__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']`

Un *set* è un "contenitore" di elementi che non si ripetono mai ("*unique elements*") e non sono accessibili attraverso la loro posizione ("*unordered*").

Gli elementi all'interno di un *set* sono delimitati da parentesi graffe.

In [25]:
set1 = {'Thor', 'Hulk', 'Iron Man'}

Come una lista e una *tuple*, è un *iterable*, e può essere quindi utilizzato in un loop.

In [26]:
for item in set1:
    print(item)

Thor
Iron Man
Hulk


A differenza di liste e *tuple* però, un *set* non è una sequenza, quindi non possiamo accedere ai suoi elementi attraverso la loro posizione.

In [27]:
try:
    print(set1[0])
except TypeError as error:
    print(error)

'set' object is not subscriptable


Il fatto che gli elementi al'interno di un *set* non possano ripetersi e non abbiano un ordine rispecchia la nozione matematica di insieme (*set* appunto).

Non a caso infatti, il *set* è caratterizzato da una serie di metodi che replicano le operazioni caratteristiche degli insiemi (intersezione, unione, etc.).

In [28]:
numbers1 = {1, 2, 3, 4, 5}
numbers2 = {4, 5, 6, 7, 8}

In [29]:
intersection = numbers1 & numbers2
union = numbers1 | numbers2


print(f'Intersezione: {intersection}')
print('\n')
print(f'Unione: {union}')

Intersezione: {4, 5}


Unione: {1, 2, 3, 4, 5, 6, 7, 8}


Possiamo anche verificare se un *set* è un sottoinsieme di un altro e viceversa.

In [30]:
numbers3 = {3, 4}

print(numbers3.issubset(numbers1))
print(numbers1.issuperset(numbers3))
print(numbers3.issubset(numbers2))

True
True
False


Possiamo utilizzare le proprietà di *set* anche per ottenere il numero di elementi distinti all'interno di una lista o di una *tuple*.

> **DA RICORDARE**: gli elementi all'interno di un *set* non si ripetono mai!

In [31]:
numbers_list = [1, 0, 1, 2, 1, 0, 2, 2, 0, 1, 2]
numbers_set = set(numbers_list)
print(numbers_set)

{0, 1, 2}


In pratica, stiamo convertendo una lista in un *set* e, così facendo, otteniamo il numero di elementi distinti all'interno di quella lista. Se volessimo poi lavorare con quell'insieme sottoforma di lista potremmo riconvertirlo in una lista.

In [32]:
numbers_distinct_list = list(numbers_set)
print(numbers_distinct_list)

[0, 1, 2]


## Dict

>**DOCSTRING**
>
>Non molto d'aiuto...
>
>**METODI**
>
>`['__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'clear', 'copy', 'fromkeys', 'get', 'items', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values']`

Il *dictionary*, o dizionario, è un contenitore mutabile i cui valori sono accessibili non mediante la loro posizione, come in una lista, ma mediante specifiche chiavi univoche (*keys*) specificate dall'utente. In questo senso, un dizionario è un contenitore di di coppie *key*-*value*.

Come per *set*, gli elementi di un dizionario sono delimitati da parentesi graffe, ma gli elementi al suo interno sono caratterizzati dalla struttura `key : value`.

> **DA SAPERE**: sia *set* che *dict* sono delimitati da parentesi graffe, ma se inizializziamo un contenitore vuoto con il codice `container = {}`, `container` sarà di tipo *dict*, non *set*.

In [33]:
dict1 = {'Superhero name' : 'Iron Man',
         'Superpowers' : ['Genius', 'Billionaire', 'Playboy', 'Philanthropist'],
         'Real name' : 'Tony Stark',
         'Affiliation' : 'Avengers'
        }

Una volta creato, possiamo accedere ai valori all'interno di un dizionario attraverso le *key*. Per questo motivo, le *key* sono degli identificativi univoci, che possono essere stringhe, numeri o altri *type* immutabili.

In [34]:
hero_name = dict1['Superhero name']
real_name = dict1['Real name']

print(f'Il vero nome di {hero_name} è {real_name}')

Il vero nome di Iron Man è Tony Stark


Possiamo in un certo senso (**MA NON DITELO TROPPO IN GIRO**) pensare ad una lista come un dizionario in cui le *key*, le chiavi di accesso agli elementi, sono pre-determinate e corrispondono alla posizione di ogni elemento all'interno della lista.

In [35]:
list1_dict = {0 : 'Thor', 1 : 'Superman', 2 : 'Batman', 3 : 'Hulk', 4 : 'Iron Man'}
print(list1_dict[0])

Thor


Il dizionario ha diversi metodi attraverso i quali possiamo accedere alle *key* e ai valori ad esse associati.

Il metodo `keys()` restituisce le chiavi del dizionario:

In [36]:
print(dict1.keys())

dict_keys(['Superhero name', 'Superpowers', 'Real name', 'Affiliation'])


Il metodo `values()` restituisce i valori sottostanti senza che siano associati alle *key*.

In [37]:
print(dict1.values())

dict_values(['Iron Man', ['Genius', 'Billionaire', 'Playboy', 'Philanthropist'], 'Tony Stark', 'Avengers'])


Come le liste o le *tuple*, anche un dizionario è un *iterable*. Se però utilizziamo un dizionario in un loop come faremmo per una lista, il loop considererà solo le *key* del dizionario.

In [38]:
for feature in dict1:
    print(feature)

Superhero name
Superpowers
Real name
Affiliation


Per accedere ai valori di un dizionario possiamo utilizzare il metodo `values()` nel loop:

In [39]:
for feature in dict1.values():
    print(feature)

Iron Man
['Genius', 'Billionaire', 'Playboy', 'Philanthropist']
Tony Stark
Avengers


La cosa più conveniente e ***pythonic*** è utilizzare il metodo `items()` di un dizionario per accedere simultaneamente alle *key* e ai valori associati.

In [40]:
for key, value in dict1.items():
    print(f'{key} -> {value}')

Superhero name -> Iron Man
Superpowers -> ['Genius', 'Billionaire', 'Playboy', 'Philanthropist']
Real name -> Tony Stark
Affiliation -> Avengers


Come una lista, un dizionario è una *data structure* mutabile. Possiamo pertanto alterarne permanentemente lo stato in maniera simile a come abbiamo fatto con le liste.

Allo stesso modo in cui possiamo accedere al valore associato ad una *key*, possiamo anche modificarlo.

In [41]:
dict1['Affiliation'] = 'New Avengers'

print(dict1)

{'Superhero name': 'Iron Man', 'Superpowers': ['Genius', 'Billionaire', 'Playboy', 'Philanthropist'], 'Real name': 'Tony Stark', 'Affiliation': 'New Avengers'}


Possiamo aggiungere una o più coppie *key*-*value* ad un dizionario utilizzando il metodo `update()`.

>**DA SAPERE**: Il metodo `update()` prende come input soltanto un altro dizionario.

In [42]:
dict1.update({'Colors' : ['Red', 'Gold']}) #nessun output!
print(dict1)

{'Superhero name': 'Iron Man', 'Superpowers': ['Genius', 'Billionaire', 'Playboy', 'Philanthropist'], 'Real name': 'Tony Stark', 'Affiliation': 'New Avengers', 'Colors': ['Red', 'Gold']}


Se specifichiamo una chiave già esistente nel dizionario che vogliamo "aggiornare", il metodo `update()` modificherà il valore corrispondente a quella chiave.

In [43]:
dict1.update({'Real name' : 'Luca Dann'})

print(dict1)

{'Superhero name': 'Iron Man', 'Superpowers': ['Genius', 'Billionaire', 'Playboy', 'Philanthropist'], 'Real name': 'Luca Dann', 'Affiliation': 'New Avengers', 'Colors': ['Red', 'Gold']}


Per rimuovere un elemento da un dizionario possiamo utilizzare il metodo `pop()` specificando la *key* dell'elemento che vogliamo rimuovere. Come per una lista, il metodo `pop()` restituisce il valore che vogliamo rimuovere dopo averlo rimosso permanentemente dal dizionario, consentendoci di tenere salvato quel valore in una variabile.

In [44]:
superpowers = dict1.pop('Superpowers')
print(dict1)
print('\n')
print(superpowers)

{'Superhero name': 'Iron Man', 'Real name': 'Luca Dann', 'Affiliation': 'New Avengers', 'Colors': ['Red', 'Gold']}


['Genius', 'Billionaire', 'Playboy', 'Philanthropist']


Nelle prossime sezioni esploreremo due costrutti tipici di Python che ci permettono di svolgere più velocemente operazioni con le *data structure* appena descritte e di rendere il nostro codice più leggibile.

## *Unpacking*

>verb: **unpack**; 3rd person present: **unpacks**; past tense: **unpacked**; past participle: **unpacked**; gerund or present participle: **unpacking**
>
> **open and remove the contents of (a suitcase, bag, or package)**: "*she unpacked her bags and put everything away*"

Python consente di "disfare" una *data structure* come fosse una valigia e assegnare simultaneamente i suoi valori ad altrettante variabili.

In [45]:
var1, var2 = ('Wolverine', 'Magneto') #utilizziamo una tuple ma andrebbe bene anche una lista

print(var1)
print(var2)

Wolverine
Magneto


Perché l'assegnazione funzioni, dobbiamo far sì che il numero di variabili a sinistra dell'*assignment operator* (`=`) corrisponda al numero di elementi della data structure sulla destra.

In [46]:
x_men = ('Wolverine', 'Magneto', 'Cyclops', 'Phoenix')

try:
    var1, var2 = x_men
except ValueError as error:
    print(error)

too many values to unpack (expected 2)


Se abbiamo meno variabili che elementi nella *tuple*, possiamo specificare una variabile aggiuntiva e utilizzare il prefisso `*` per indicare che vogliamo assegnare i restanti elementi della *tuple* a quella variabile:

In [47]:
var1, var2, *_ = x_men # l'underscore si utilizza convenzionalmente per indicare che quei valori non ci interessano

In [48]:
print(var1)
print(var2)
print(_)

Wolverine
Magneto
['Cyclops', 'Phoenix']


L'applicazione più utile dell'unpacking è all'interno di un loop. Supponiamo di avere una *tuple* come quella mostrata sotto.

In [49]:
names_mapping = (('Peter Parker', 'Spiderman'), ('Tony Stark', 'Iron Man'), ('Matt Murdoch', 'Daredevil'))

Supponiamo di voler utilizzare un loop per associare ad ogni supereroe la sua identità segreta. Potremmo farlo con un normale loop in questo modo:

In [50]:
for element in names_mapping:
    print(f'element = {element}')
    real_name = element[0]
    hero_name = element[1]
    print(f'Il vero nome di {hero_name} è {real_name}\n')

element = ('Peter Parker', 'Spiderman')
Il vero nome di Spiderman è Peter Parker

element = ('Tony Stark', 'Iron Man')
Il vero nome di Iron Man è Tony Stark

element = ('Matt Murdoch', 'Daredevil')
Il vero nome di Daredevil è Matt Murdoch



Utilizzando l'*unpacking* possiamo accedere direttamente ai singoli elementi di ogni "sotto-*tuple*" al momento dell'invocazione del loop.

In [51]:
for real_name, hero_name in names_mapping:
    print(f'Il vero nome di {hero_name} è {real_name}')

Il vero nome di Spiderman è Peter Parker
Il vero nome di Iron Man è Tony Stark
Il vero nome di Daredevil è Matt Murdoch


Utilizzando due identificativi all'inizio del loop (`real_name` e `hero_name`) ancziché uno solo, stiamo dicendo a Python che vogliamo accedere ai singoli elementi delle "coppie" all'interno della *tuple* su cui stiamo iterando. Anche in questo caso, il numero di identificativi (variabili) deve corrispondere al numero di elementi all'interno della *tuple* su cui effettuiamo l'*unpacking* (in questo caso, 2).

Nella pratica, sarà difficile avere *pret a porter* una *tuple* già arrangiata come `names_mapping`. Più probabilmente ci capiterà di voler combinare fra loro gli elementi di due liste (o *tuple*) come quelle mostrate sotto.

In [52]:
real_names = ['Peter Parker', 'Tony Stark', 'Matt Murdoch']
hero_names = ['Spiderman', 'Iron Man', 'Daredevil']

In questo caso, possiamo utilizzare la funzione `zip()` per combinare le due liste ed ottenere lo stesso risultato che avevamo ottenuto con la *tuple* `names_mapping`.

In [53]:
for hero_name, real_name in zip(hero_names, real_names):
    print(f'Il vero nome di {hero_name} è {real_name}')

Il vero nome di Spiderman è Peter Parker
Il vero nome di Iron Man è Tony Stark
Il vero nome di Daredevil è Matt Murdoch


La funzione `zip()` "accoppia" gli elementi delle due liste e produce un *iterable* simile alla *tuple* `names_mapping` vista negli esempi precedenti, su cui possiamo effettuare l'*unpacking*.

Possiamo dare in input un qualsiasi numero di liste alla funzione `zip()`, purché all'interno del loop specifichiamo altrettanti identificativi. Se le liste da "zippare" sono di lunghezza diversa, `zip()` si fermerà una volta esauriti gli elementi della lista più corta.

In [54]:
avenger = [True, True, False, True, False]

for hero_name, is_avenger, real_name in zip(hero_names, avenger, avenger):
    print(f'{hero_name} {"è" if is_avenger else "non è"} un membro degli Avengers e il suo vero nome è {real_name}')

Spiderman è un membro degli Avengers e il suo vero nome è True
Iron Man è un membro degli Avengers e il suo vero nome è True
Daredevil non è un membro degli Avengers e il suo vero nome è False


L'*unpacking* è utile anche nel caso in cui vogliamo includere un contatore all'interno di un loop.

> **DA SAPERE**: `enumerate()` associa automaticamente un contatore ad ogni elemento di una lista.

In [55]:
boolean_list = [1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1]

ones_index = []
for i, element in enumerate(boolean_list):
    if element == 1:
        ones_index.append(i)

print(ones_index)

[0, 3, 5, 6, 7, 12]


## *Comprehensions*

Uno degli strumenti più potenti che Python ci offre è quello delle *comprehension*. Una *comprehension* ci consente di creare una lista. *set* o un dizionario con un loop in maniera più efficiente e leggibile.

Supponiamo di avere una lista di numeri e di voler ottenere una lista contenente il quadrato di ciascun numero. Con un normale *for loop* potremmo farlo in questo modo:

In [56]:
numbers = [6, 3, 15, 2, 1, 7, 9, 23, 12]

# creiamo lista vuota da popolare ad ogni iterazione del loop
numbers_squared = []

# popoliamo lista
for number in numbers:
    number_squared = number**2
    numbers_squared.append(number_squared)

print(numbers_squared)

[36, 9, 225, 4, 1, 49, 81, 529, 144]


Utilizzando una *list comprehension* possiamo svolgere la stessa operazione in una riga di codice.

In [57]:
numbers_squared = [number**2 for number in numbers]

print(numbers_squared)

[36, 9, 225, 4, 1, 49, 81, 529, 144]


Oltre all'efficienza, il vantaggio di utilizzare una *list comprehension* è che, nella maggior parte dei casi, la sua sintassi è più leggibile di quella di un normale *for loop*. Infatti, la *list comprehension* creata sopra corrisponde quasi perfettamente a come esprimeremmo lo stesso concetto in inglese:

> "*the square of each number in the numbers list*"

> **DA RICORDARE**: uno dei vantaggi fondamentali di Python rispetto ad altri linguaggi di programmazione è la sua leggibilità e la sua somiglianza con la lingua inglese. Quindi, se esistono diversi modi per fare la stessa cosa, il 99% delle volte la scelta più *pythonic* è quella di utilizzare il modo più leggibile.

Possiamo includere anche degli *if* all'interno di una *list comprehension*.

In [58]:
even_numbers_squared = [number**2 for number in numbers if number % 2 == 0]
print(even_numbers_squared)

[36, 4, 144]


>**DA SAPERE**: in una *list comprehension*, se l'*if statement* non include uno o più *else* dobbiamo specificarli prima del *for loop*. In caso contrario dobbiamo specificare l*if* dopo il *for loop* come nell'esempio precedente.

In [59]:
even_numbers_squared_2 = [number**2 if number % 2 == 0 else 0 for number in numbers]
print(even_numbers_squared_2)

[36, 0, 0, 4, 0, 0, 0, 0, 144]


All'interno di una *list comprehension* la sintassi da utilizzare per un *if statement* a più rami è leggermente diversa da quella che utilizzeremmo in un normale blocco *if*:

In [60]:
range_1 = range(20)
binning = ['< 10' if number < 10 else '[10-15]' if number < 15 else '> 15' for number in range(20)]
print(binning)

['< 10', '< 10', '< 10', '< 10', '< 10', '< 10', '< 10', '< 10', '< 10', '< 10', '[10-15]', '[10-15]', '[10-15]', '[10-15]', '[10-15]', '> 15', '> 15', '> 15', '> 15', '> 15']


Possiamo anche utilizzare più di un *for loop* (*nested for loops*) all'interno di una *list comprehension*.

>**DA SAPERE**: se utilizziamo un *nested for loop* all'interno di una list comprehension dobbiamo mettere per ultimo 

In [61]:
numbers_2 = [1, 2]

dot_product = [number*number_2 for number_2 in numbers_2 for number in numbers]

print(dot_product)

[6, 3, 15, 2, 1, 7, 9, 23, 12, 12, 6, 30, 4, 2, 14, 18, 46, 24]


Nonostante la grande flessibilità offerta dalle *list comprehension*, è bene ricordare che una delle loro finalità principali è semplificare il nostro codice e migliorarne la leggibilità. Quindi, se ci accorgiamo di stare svolgendo diversi *for* e *if* all'interno di una sola *list comprehension*, forse è il caso di chiederci se non sia il caso di utilizzare dei normali *for* e *if* per avere un codice più ordinato e leggibile.

Esistono altri 3 tipi di *comprehension*, che seguono le stesse regole di sintassi viste per le *list comprehension*:

- *Set comprehension*: restituisce un oggetto di tipo *set*.

In [62]:
even_numbers_set = {number for number in numbers if number % 2 == 0}
print(even_numbers_set)

{2, 12, 6}


- *Dict comprehension*: restituisce un dizionario. Nella maggior parte dei casi, per creare un dizionario da una *dict comprehension* occorre utilizzare l'*unpacking*.

In [63]:
numbers = range(5)
nums_as_words = ['zero', 'one', 'two', 'three', 'four']

#esempio 1
words_to_num = {word : number for word, number in zip(nums_as_words, numbers)}
print(words_to_num)
print('\n')

#esempio 2
words_to_num_even = {word : number for word, number in zip(nums_as_words, numbers) if number % 2 == 0}
print(words_to_num_even)

{'zero': 0, 'one': 1, 'two': 2, 'three': 3, 'four': 4}


{'zero': 0, 'two': 2, 'four': 4}
