# LEZIONE 8

**Elenchi**

***8.1 Un elenco è una sequenza***

Similmente ad una stringa, un elenco è una sequenza di valori. Ma mentre in una
stringa i valori sono costituiti solo da caratteri, in un elenco questi possono essere di qualsiasi tipo e sono chiamati elementi o talvolta oggetti.
Esistono diversi modi per creare un elenco; il più semplice è racchiudere gli elementi tra parentesi quadre

```
# [10, 20, 30, 40]
['crunchy frog', 'ram bladder', 'lark vomit']
```
Il primo esempio è un elenco di quattro numeri interi, il secondo è un elenco di
tre stringhe. Non è necessario che gli elementi di un elenco debbano essere dello stesso tipo: il seguente elenco contiene una stringa, un float, un intero e (**sorpresa**!) un’altra lista

```
# ['spam', 2.0, 5, [10, 20]]
```
Un elenco contenuto all’interno di un altro elenco è definito *elenco nidificato*.
Un elenco senza elementi è chiamato *elenco vuoto*: possiamo crearne uno semplicemente scrivendo due parentesi quadre vuote: [].
Come possiamo immaginare, è possibile assegnare un elenco a una variabile




In [None]:
cheeses = ['Cheddar', 'Edam', 'Gouda']
numbers = [17, 123]
empty = []
print(cheeses, numbers, empty)

***8.2 Gli elenchi sono mutabili***

La sintassi per accedere agli elementi di un elenco è la stessa usata per i caratteri di una stringa: l’operatore rappresentato dalle parentesi. L’espressione tra parentesi specifica l’indice. Ricordiamo che l’indice inizia da 0

In [None]:
print(cheeses[0])

A differenza delle stringhe, gli elenchi sono modificabili in quanto è possibile modificare l’ordine degli elementi in un elenco o riassegnare un elemento in un elenco.

Quando la parentesi è visualizzata sul lato sinistro di un’assegnazione, identifica l’elemento dell’elenco che verrà modificato.

In [None]:
numbers = [17, 123]
numbers[1] = 5
print(numbers)

L’elemento di indice uno di numbers, 123, è stato sostituito da 5.

Gli elenchi possono essere immaginati come una relazione tra indici ed elementi.
Questa relazione è chiamata mappatura; ogni indice “mappa” uno degli elementi.

Gli indici degli elenchi funzionano allo stesso modo di quelli delle stringhe:
- Qualsiasi espressione di tipo intero può essere utilizzata come indice.
- Se proviamo a leggere o scrivere un elemento che non esiste, otterremo un ’IndexError‘;
- Con un indice negativo, il conteggio inizia a ritroso partendo dalla fine
dell’elenco.

L’operatore `in` funziona anche sugli elenchi:

In [None]:
cheeses = ['Cheddar', 'Edam', 'Gouda']
print('Edam' in cheeses)
print('Brie' in cheeses)

***8.3 Scorrere un elenco***

Il modo più comune di scorrere gli elementi di un elenco è un ciclo *for*. La sintassi è la stessa delle stringhe:

In [None]:
for cheese in cheeses:
  print(cheese)

Funziona bene solo se dobbiamo leggere gli elementi di un elenco. Se vogliamo scrivere o aggiornare degli elementi, bisogna lavorare con gli *indici*. Un modo comune per farlo è combinare le funzioni range e len

In [21]:
for i in range(len(numbers)):
  numbers[i] = numbers[i] * 2

In [None]:
print(numbers)

In [23]:
#Un ciclo for su una lista vuota non esegue mai il blocco
for x in empty:
  print('This never happens.')

Come accennato sopra, un elenco può contenere un altro elenco, che comunque conta come se fosse un singolo elemento. Ad esempio, la lunghezza di questo elenco è pari a quattro:

In [None]:
array = ['spam', 1, ['Brie', 'Roquefort', 'Pol le Veq'], [1, 2, 3]]
print(array)
print(len(array))

In [None]:
for single_value in array:
  print(single_value)

***8.4 Operazioni sugli elenchi***

L’operatore + vale anche per gli elenchi ed effettua la **concatenazione**

In [None]:
a = [1, 2, 3]
b = [4, 5, 6]
c = a + b
print(c)

Anche l’operatore * è utilizzabile e ripete un elenco per un dato numero di volte ("*...similmente a una stringa...*")

In [None]:
[0] * 4

In [None]:
[1, 2, 3] * 3

***8.5 Slicing degli elenchi***

L’operatore *slice* può essere utilizzato anche con gli elenchi

In [None]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
t[1:3]

In [None]:
t[:4]

In [None]:
t[3:]

- Se omettiamo il primo indice, lo slicing comincia dall’inizio.
- Se omettiamo il secondo, lo slicing termina alla fine.
- Se mancano entrambi, lo slicing è una copia dell’intero elenco.

In [None]:
t[:]

**Poiché gli elenchi sono editabili, spesso è utile farne prima una copia e poi eseguire operazioni** che le aggreghino, le invertano o le tronchino.

Un operatore di slicing posto sul lato sinistro di un’assegnazione permette di aggiornare più elementi

In [None]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
t[1:3] = ['x', 'y']
print(t)

***8.6 Metodi degli elenchi***

Python mette a disposizione diversi metodi per operare sugli elenchi. Ad esempio tramite append possiamo aggiungere un nuovo elemento alla fine di un elenco

In [None]:
t = ['a', 'b', 'c']
print(t)
t.append('d')
print(t)

extend accetta un elenco come argomento e ne accoda tutti gli elementi all’elenco specificato

In [None]:
t1 = ['a', 'b', 'c']
t2 = ['d', 'e']
print(t1)
t1.extend(t2)
print(t1)

In questo esempio l’elenco t2 rimane immutato.

Tramite sort possiamo ordinare gli elementi dell’elenco in ordine crescente

In [None]:
t = ['d', 'c', 'e', 'b', 'a']
t.sort()
print(t)

La maggior parte dei metodi applicabili agli elenchi non accetta argomenti: modificano l’elenco e restituiscono `None`.

In [None]:
t = ['d', 'c', 'e', 'b', 'a']
t = t.sort()
print(t)

***8.7 Eliminazione di elementi***

Esistono diversi modi per eliminare elementi da un elenco: Se conosciamo l’indice dell’elemento in questione, possiamo usare `pop`

In [None]:
t = ['a', 'b', 'c']
x = t.pop(1)
print(t)
print(x)

`pop` modifica l’elenco e restituisce l’elemento rimosso. Se non forniamo un indice, il metodo elimina e restituisce l’ultimo elemento dell’elenco.

In [None]:
t = ['a', 'b', 'c']
x = t.pop()
print(t)
print(x)

Se il valore rimosso non serve, possiamo usare l’operatore `del`

In [None]:
t = ['a', 'b', 'c']
del t[1]
print(t)

Se invece conosciamo *il valore* dell’elemento da rimuovere (ma non l’*indice*), possiamo utilizzare `remove`

In [None]:
t = ['a', 'b', 'c']
t.remove('b')
print(t)

Il valore restituito da *remove* è *None*.

Per rimuovere più di un elemento, possiamo utilizzare `del` con un *indice di slicing*

In [None]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
del t[1:5]
print(t)

**Reminder**: Come al solito, **lo slice seleziona tutti gli elementi fino al secondo indice escluso**.

Nel'esempio sopra, ha selezionato tutti gli elementi dalla posizione 1 alla posizione 4

***8.8 Elenchi e funzioni***

Esistono numerose funzioni integrate dedicate agli elenchi che consentono di scorrere rapidamente un elenco senza scrivere del codice apposito

In [81]:
nums = [3, 41, 12, 9, 74, 15]

In [None]:
#length of the list
print(len(nums))

In [None]:
#biggest element
print(max(nums))

In [None]:
#smallest element
print(min(nums))

In [None]:
#sum of all the elements
print(sum(nums))

In [None]:
#average
print(sum(nums)/len(nums))

La funzione `sum()` **funziona solo se tutti gli elementi dell’elenco sono numeri**.
**Le altre funzioni** (`max()`, `len()`, ecc.) **funzionano con stringhe e altri elementi che possano essere comparati**.
Potremmo riscrivere un programma visto in precedenza che calcolava la media di
un insieme di numeri immessi dall’utente utilizzando, stavolta, un elenco.

Innanzitutto ecco lo script che abbiamo scritto per calcolare la media dei numeri inseriti

In [None]:
total = 0
count = 0
while (True):
  inp = input('Enter a number: ')
  if inp == 'done': break
  value = float(inp)
  total = total + value
  count = count + 1

average = total / count
print('Average:', average)

In questo programma le variabili count e total servono per memorizzare il numero
e il totale parziale dei numeri inseriti dall’utente mentre viene ripetutamente
richiesto all’utente di digitare un numero.
**Potremmo memorizzare progressivamente ogni numero inserito dall’utente e utilizzare le funzioni integrate per calcolare somma e numero degli elementi al termine della loro immissione**.

In [None]:
#1 - instantiate the list
numlist = list()
while (True):
  inp = input('Enter a number: ')
  if inp == 'done': break
  value = float(inp)
  #2 - adds the number to the list
  numlist.append(value)

#3 - average as sum of the numbers / length of the array
average = sum(numlist) / len(numlist)
print('Average:', average)

- Creiamo un elenco vuoto prima che inizi il ciclo (commento 1)
- Ogni volta che viene inserito un numero, lo aggiungiamo all’elenco (commento 2)
- Alla fine del programma, calcoliamo la somma dei numeri dell’elenco
e la dividiamo per il conteggio degli elementi inseriti per ottenere la media (commento 3) **sfruttando le funzioni integrate degli elenchi**

***8.9 Elenchi e stringhe***

All'inizio della lezione abbiamo detto che una stringa ed un elenco non sono la stessa cosa: una stringa è una sequenza di caratteri, mentre un elenco è una sequenza di valori. Per convertire una stringa in un elenco di caratteri, possiamo usare `list`

In [None]:
s = 'spam'
t = list(s)
print(t)

dato che *list* è un nome riservato, evitiamo di usarlo come nome per una variabile.

La funzione `list` suddivide una stringa in singole lettere. Se invece vogliamo dividere una stringa in singole parole, torna utile il metodo split

In [None]:
s = 'pining for the fjords'
t = s.split()
print(t)
print(t[2])

Dopo aver usato *split* per spezzare la stringa in un elenco di parole, possiamo usare l’operatore *indice* (parentesi quadre) per cercare una particolare parola nell’elenco.
Possiamo chiamare split con un argomento opzionale chiamato delimitatore che specifica quali caratteri usare come separatore delle parole. Nell’esempio seguente viene utilizzato un trattino come delimitatore

In [None]:
s = 'spam-spam-spam'
delimiter = '-'
s.split(delimiter)

In realtà, la funzione *split* utilizza sempre un delimitatore, nel caso in cui non passiamo un come parametro (come nell'esempio precedente), viene utilizzato il delimitatore di default, ovvero **lo spazio**

In [None]:
s = 'spam-spam-spam'
s.split()

`join` è l’inverso di *split*. Prende un elenco di stringhe e ne concatena gli elementi.
join è un metodo delle stringhe, quindi va richiamato per mezzo del delimitatore passando l’elenco come parametro

In [None]:
t = ['pining', 'for', 'the', 'fjords']
delimiter = ' '
delimiter.join(t)

`join` richiede sempre un parametro (non è *opzionale*). In questo caso il delimitatore è uno spazio, perciò join ne aggiunge uno tra le
varie parole. Se avessimo bisogno di concatenare delle stringhe senza spazi,
dovremmo comunque specificare il delimitatore; in questo caso metteremmo una stringa vuota

In [None]:
t = ['pining', 'for', 'the', 'fjords']
delimiter = ''
delimiter.join(t)

***8.10 Analisi di righe***

Di solito, quando analizziamo un file, vogliamo fare qualcosa di diverso dalla semplice visualizzazione di riga per riga. Spesso vogliamo trovare le “*righe interessanti*” e poi *analizzare* la riga per trovare la parte che stiamo cercando della riga stessa.
E se volessimo, ad esempio, estrarre il giorno della settimana da quelle righe che iniziano con “From”?

`From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008`

Il metodo `split` è molto efficace nel risolvere questo tipo di problema.

Possiamo scrivere un piccolo programma che cerca le righe che iniziano con “From”, le “divide” in parole e poi ne visualizza la terza parola (che risulta sempre essere il giorno della settimana); per comodità, lo script legge direttamente il file mbox-short.txt senza chiedere input all'utente

**copiamo ed eseguiamo lo script...**

```
fhand = open('mbox-short.txt')
for line in fhand:
  line = line.rstrip()
  if not line.startswith('From '): continue
  words = line.split()
  print(words[2])
```

**Finezza**: Abbiamo usato la forma contratta dell’istruzione if e messo continue sulla stessa riga di if. Questa forma contratta funziona come se continue fosse messo nella riga successiva indentata. Ovviamente resta obbligatorio inserire i due punti al termine della condizione.

In seguito impareremo tecniche sempre più sofisticate per scegliere le righe su cui lavorare e come smontarle per trovare l’informazione precisa che stiamo cercando.

**8.11 Oggetti e valori**

Se eseguiamo queste istruzioni di assegnazione

In [None]:
a = 'banana'
b = 'banana'

sappiamo che `a` e `b` si riferiscono entrambi a una stringa, ma non sappiamo se si riferiscono *alla stessa stringa*. Ci sono due possibili stati:
- Nel primo caso a e b si riferiscono a due oggetti diversi che hanno lo stesso valore
- Nel secondo caso si riferiscono allo stesso oggetto.
Possiamo usare l’operatore `is` per verificare se due variabili si riferiscono allo stesso oggetto.

In [None]:
a is b

In questo esempio, Python ha creato un unico oggetto stringa a cui fanno riferimento sia `a` che `b`.

**YES, BUT...** giochiamo con le due stringhe:

In [None]:
a = 'ananas'
print(a)
print(b)

In [None]:
a is b

Se invece creiamo due elenchi, otterremo due oggetti

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

In questo caso, potremmo dire che i due elenchi sono *equivalenti*, dato che contengono gli stessi elementi, ma non *identici*, perché non sono lo stesso oggetto. **Se due oggetti sono identici sono anche equivalenti, ma se sono equivalenti non sono necessariamente identici**.
Fino ad ora abbiamo usato *oggetto* e *valore* in modo intercambiabile,
ma in realtà è più preciso dire che **un oggetto ha un valore**.

Se eseguiamo `a = [1,2,3]`, `a` si riferisce ad un oggetto elenco il cui valore è una particolare sequenza di elementi. Se un altro elenco ha gli stessi elementi diremo che *ha lo stesso valore*.

***8.12 Alias***

Se `a` si riferisce ad un oggetto e assegni `b = a`, allora entrambe le variabili si riferiranno allo stesso oggetto

In [None]:
a = [1, 2, 3]
b = a
b is a

L’associazione tra una variabile e un oggetto è chiamata **riferimento**. In questo esempio, ci sono due *riferimenti* allo stesso oggetto.

Quando un oggetto ha più di un *riferimento*, ha di conseguenza più di un *nome*,
che chiameremo **alias**.

**Se l’oggetto con *alias* è modificabile, le modifiche apportate su un alias si riflettono sugli altri**

In [None]:
#MAGIC
b[0] = 17
print(a)

Sebbene questo comportamento possa essere utile, è spesso fonte di errori. In
generale, è meglio evitare gli alias quando si lavora con oggetti mutabili.
Nel caso di oggetti immutabili come le stringhe gli alias non sono un problema. Ad esempio

```
a = 'banana'
b = 'banana'
```
non fa quasi mai differenza se a e b si riferiscono alla stessa stringa o meno

**8.13 Elenchi come argomenti**

Quando passiamo un elenco a una funzione, questa ottiene un riferimento all’elenco.
Se la funzione modifica un parametro dell’elenco, il chiamante vede la modifica.
Ad esempi, creiamo una funzione `delete_head` che rimuove il primo elemento di un elenco.

In [None]:
def delete_head(t):
  del t[0]

...e di conseguenza...

In [None]:
letters = ['a', 'b', 'c']
#delete_head works directly on letters
delete_head(letters)
print(letters)

Il parametro `t` definito in `delete_head` e la variabile `letters` sono *alias* dello stesso oggetto.

È importante distinguere tra operazioni che *modificano* elenchi e operazioni che *creano nuovi elenchi*.

Nel prossimo esempio, il metodo append modifica un elenco, mentre l’operatore + ne crea uno nuovo.

In [None]:
t1 = [1, 2]
t2 = t1.append(3)
print(t1)
print(t2)

In [None]:
t1 = [1, 2]
t3 = t1 + [3]
print(t3)
t2 is t3

In [None]:
print(t2)

Questa differenza è importante quando dobbiamo scrivere funzioni in grado di modificare degli elenchi. Ad esempio questa funzione non elimina il primo elemento dell'elenco passato in input:

```
def bad_delete_head(t):
  t = t[1:]
```

**Perchè?**

Un’alternativa è scrivere una funzione che crei e restituisca un nuovo elenco. Ad esempio, creiamo la funzione `tail` che restituisce tutti gli elementi di un elenco tranne il primo

In [None]:
def tail(t):
  return t[1:]

Ricordiamo che questa funzione lascia intatto l’elenco originale.

In [None]:
letters = ['a', 'b', 'c']
rest = tail(letters)
print(rest)

***8.14 Debug***

L’uso incauto degli elenchi (e di altri oggetti mutabili) può portarci a passare
lunghe ore nelle operazioni di debug.
Ecco alcuni problemi comuni e dei suggerimenti su come evitarli

1. **La maggior parte dei metodi applicabili agli elenchi modificano l’argomento e restituiscono None**.

Questo è l’opposto del comportamento dei metodi di stringa che restituiscono una nuova stringa e lasciano immutato l’originale.
Quindi attenzione, se siamo abituati a scrivere codice per le stringhe come questo:

`word = word.strip ()`

saremo tentati di scrivere codice come questo:

`t = t.sort() #ERRATO!`

Poiché `sort` restituisce `None`, `t` varrà `None` e quindi la successiva operazione che eseguiremo su `t` probabilmente fallirà.

Prima di utilizzare i metodi e gli operatori utilizzabili sugli elenchi, è consigliato leggere attentamente la documentazione e i testi in modalità
interattiva.

I metodi e gli operatori che gli elenchi condividono con altre
sequenze (come le stringhe) sono documentati su https://docs.python.org/3.5/library/stdtypes.html#common-sequence-operations.

I metodi e gli operatori che si applicano solo alle sequenze mutabili sono documentati su https://docs.python.org/3.5/library/stdtypes.html#mutable-sequence-types.

2. **Scegliere sempre un solo idioma.**

Parte dei problemi che abbiamo con gli elenchi deriva dal fatto che ci *sono "troppi" modi per fare le stesse cose*. Ad esempio, per rimuovere un elemento da un elenco, possiamo usare `pop`, `remove`, `del`, o anche lo `slice`.

Per aggiungere un elemento possiamo usare il metodo `append` o l’operatore `+`.

**Attenzione** queste istruzioni sono corrette...

```
t.append (x)
t = t + [x]
```

...queste no!

```
t.append([x]) # ERRATO!
t = t.append(x) # ERRATO!
t + [x] # ERRATO!
t = t + x # ERRATO!
```
 O meglio, l'ultima espressione genera un errore di esecuzione, mentre le altre tre non generano errori ma fanno la cosa sbagliata. **Proviamole!**




3. **Fare delle copie per evitare gli alias.**

Se vogliamo utilizzare un metodo come `sort` per modificare l’argomento ma abbiamo la necessità di mantenere inalterato l’elenco originale, possiamo farne una copia:

```
orig = t [:]
t.sort()
```
In questo esempio
- creiamo `orig`, a partire da `t`, che conterrà l'elenco "originale" prima delle nostre elaborazioni
- ordiniamo `t`


4. **Elenchi, split e file**

Quando leggiamo e analizziamo file ci sono molte opportunità di imbattersi in
input che possano mandare in crash il nostro programma, quindi è una buona
idea rivisitare lo schema del guardiano quando capita di scrivere programmi
che leggono cercando il classico “ago nel pagliaio”.
Riprendiamo il programma che cerca il giorno della settimana nelle righe del
nostro file:

```
From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008
```
Considerato che stiamo dividendo in parole questa frase, potremmo fare a
meno dell’uso di startswith ed esaminare semplicemente la prima parola
per determinare se ci interessa questa riga. Possiamo usare continue per
saltare le righe che non hanno “From” come prima parola:

```
fhand = open('mbox-short.txt')
for line in fhand:
  words = line.split()
  if words[0] != 'From' : continue
  print(words[2])
```

Sembra molto più semplice e non abbiamo nemmeno bisogno di fare un
rstrip per cancellare il fine stringa alla fine del file. Ma è meglio? **Eseguiamo lo script!**


Sembra funzionare dato che riusciamo a visualizzare il giorno della settimana
della prima riga (Sat) ma poi il programma fallisce mostrando un errore di
traceback.

Cosa è andato storto? Quali dati hanno causato il blocco del
nostro programma elegante, intelligente e molto “Pythonic”?

Potremmo fissarlo a lungo scervellandoci o chiedere aiuto a qualcuno, ma l’approccio più rapido e intelligente è quello di aggiungere un’istruzione print. Il posto migliore per aggiungerla è proprio prima della riga in cui il programma ha dato errore e visualizzare i dati che sembrano causare l’errore.
Questo approccio può generare molte righe di output ma almeno avremo immediatamente qualche indizio su quale sia il problema. Quindi aggiungiamo un comando `print` della variabile `words` prima del'if. Aggiungiamo
persino un prefisso “Debug:” alla riga in modo da poter mantenere separato
l’output normale da quello di debug.

In ogni riga di debug viene visualizzato l’elenco di parole che otteniamo
quando segmentiamo una riga. L’elenco di parole rimane vuoto quando
il programma si blocca. **Guardiamo l'output del nostro script e il file originale...**

L’errore si verifica quando il nostro programma incappa in una riga vuota!
Perché non abbiamo pensato quando stavamo scrivendo il codice che, ovviamente,
ci sono “zero parole” su una riga vuota? In altre parole non abbiamo
previsto che quando il codice cerca in una riga vuota la prima parola

```
word[0]
```
per verificare se corrisponde a “From”, si blocca ed otteniamo l’errore
“index out of range”. Questo è ovviamente il posto perfetto per aggiungere un codice guardiano per evitare di controllare la prima parola se questa non è presente. Come sempre, ci sono più modi per proteggere il codice, noi sceglieremo di verificare il numero di parole prima di leggere la prima parola

**In concreto, cosa dobbiamo fare?**

Possiamo pensare che le due istruzioni `continue` ci stiano aiutando a perfezionare l’insieme di righe “interessanti” per le nostre elaborazioni. Una riga che non ha parole è “poco interessante”, quindi è meglio saltare alla riga successiva.
Anche una riga che non inizi con “From” è poco interessante, quindi la ignoriamo.
Dato che il nostro script viene eseguito regolarmente, *forse* ora è corretto. La nostra istruzione guardiana fa in modo che `words[0]` non generi mai un
errore, ma forse non basta. **Quando programmiamo, dobbiamo sempre pensare: "*Cosa potrebbe andare storto?*"**

**8.15 Glossario**

- **Alias** Circostanza in cui due o più variabili si riferiscono allo stesso oggetto.
- **Delimitatore** Un carattere o una stringa utilizzata per indicare il punto in cui deve essere divisa una stringa.
- **Elemento** Uno dei valori in un elenco (o altra sequenza); viene chiamato anche oggetto.
- **Equivalente** Avere lo stesso valore.
- **Indice** Un valore intero che indica la posizione di un elemento in un elenco.
- **Identico** Essere lo stesso oggetto (che implica l’equivalenza).
- **Elenco** Una sequenza di valori.
- **Elaborazione trasversale** Accesso sequenziale a ciascun elemento in un elenco.
- **Elenco annidato** Un elenco contenuto all’interno di un altro elenco.
- **Oggetto** Qualcosa a cui una variabile può riferirsi. Un oggetto è caratterizzato da un tipo e un valore.
- **Riferimento** L’associazione tra una variabile e il suo valore.