#### Autori: Domenico Lembo, Antonella Poggi, Giuseppe Santucci and Marco Schaerf

[Dipartimento di Ingegneria informatica, automatica e gestionale](https://www.diag.uniroma1.it)

<img src="https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-sa.eu.png"
     alt="License"
     style="float: left;"
     height="40" width="100" />
This notebook is distributed with license Creative Commons *CC BY-NC-SA*

# Dizionari
1. File: frequenza di caratteri
2. Dizionari
3. Esercizio: frequenza caratteri di un file usando un dizionario
4. Stampa del contenuto di un dizionario
5. Esercizio: frequenza parole in un file usando un dizionario
6. Dizionario invertito
7. Approfondimento sul metodo `split`
8. Esercizio: lista esami
9. Esercizio: dizionario esami

### File: frequenza di caratteri
Vogliamo leggere un file e calcolare la frequenza dei suoi caratteri. Consideriamo alcune varianti al problema e vediamo quale è la soluzione più adatta. 

#### Caso 1:
Assumiamo di volere contare solo i caratteri alfabetici, e di non voler distinguere fra maiuscole e minuscole (cioè se troviamo 'A' ed 'a' diciamo semplicemente che abbiamo trovato due occorrenze della lettera 'a'). Nella soluzione proposta di seguito, per rappresentare il risultato useremo una lista di 26 elementi, ognuno rappresentante la frequenza della lettera ('a'-'z') corrispondente.

In [None]:
# La funzione fCaratteri restituisce una lista di 26 interi, ognuno rappresentante, rispettivamente, 
# la frequenza della lettera ('a'-'z')
def fCaratteri(file_in):
    l=[] # inizializzo la lista risultato
    for i in range(ord('z')-ord('a')+1): #26 ripetizioni
        l.append(0) #[0,0...]
    #l=[0]*(ord('z')-ord('a')+1) # analoga al ciclo for precedente
    #l=[0 for i in range(ord('z')-ord('a')+1)] # analoga al ciclo for precedente

    fin=open(file_in,"r",encoding="UTF-8")
    c=fin.read(1).lower()#legge il primo carattere del file e lo converte in minuscolo
    
    while c!="":
        if 'a'<=c<='z':            #solo in python !!!!!!
            l[ord(c)-ord('a')]+=1  #aggiorna la posizione corrispondente al carattere
        c=fin.read(1).lower()      #legge il prossimo carattere
    fin.close()
    return l



frequenze=fCaratteri("I_Malavoglia.txt")
#print(frequenze)
for i in range(len(frequenze)):
    print(chr(ord('a')+i),frequenze[i])

#### Caso 2:
La soluzione precedente si basa sul fatto che esiste un ordinamento noto sui caratteri. Inoltre può essere adottata in modo conveniente solo quando il numero di caratteri distinti da cercare è piccolo (nel nostro esempio 26). Consideriamo ad esempio il caso in cui vogliamo calcolare la frequenza di tutti i caratteri presenti nel file. Se volessimo procedere come nel caso precedente, dovremmo usare una lista che abbia tanti elementi quanti sono i caratteri nella codifica UTF-8. Preferiamo quindi una soluzione diversa, in cui per rappresentare il risultato useremo una lista di coppie, in cui per ogni carattere presente nel file memorizziamo la coppia (carattere, numero di occorrenze). Questa soluzione è sicuramente più adatta quando il numero di potenziali caratteri da cercare è molto grande. Ha però lo svantaggio che richiede ogni volta di scandire la lista per cercare in quale posizione sia la coppia da aggiornare.

In [None]:
# La funzione aggiornaConto(l,c) prende in ingresso una lista l di coppie [c,n] e un carattere c1 e 
# aggiorna l come segue: se [c1,n1] è presente nella lista l, aumenta di 1 il numero n1, altrimenti
# inserisce la coppia [c1,1] per indicare che il carattere c1 è stato incontrato
# per la prima volta
def aggiornaConto(l,c): 
    for coppia in l:
        if coppia[0] == c:
            coppia[1] += 1
            return #appena si trova l'elemento si aggiorna e si interrompe la scansione di l
    l.append([c,1])
            

def fCaratteri2(file_in):
    l=[]
    fin=open(file_in,"r",encoding="UTF-8")
    c=fin.read(1) #legge il primo carattere
    while c!="":
        aggiornaConto(l,c)
        c=fin.read(1)   #legge il prossimo carattere
    return l

frequenze=fCaratteri2("I_Malavoglia.txt")
for i in range(len(frequenze)):
    print(frequenze[i])

### Dizionari
Il modo di rappresentare i risultati degli esercizi precedente non è molto comodo. Infatti, la prima soluzione funziona solo per situazioni in cui i caratteri da cercare sono pochi, mentre la seconda è lenta nell'aggiornamento. Per offrire una soluzione migliore a questo tipo di problemi, in Python sono stati introdotti i *Dizionari*. I dizionari sono strutture dati basate sul concetto di coppia *chiave : valore*. Cioè coppie in cui il primo valore serve per identificare univocamente la particolare coppia ed il secondo contiene il valore corrispondente alla chiave.

Un dizionario è un insieme di coppie (chiave : valore), con alcune importanti proprietà:
1. I dizionari sono oggetti **mutabili**
2. l'ordine delle coppie NON ha importanza. 
3. i valori delle chiavi **non possono mai ripetersi**
4. Si usa la chiave per accedere **direttamente** al valore corrispondente
5. L'operatore `in` si applica alle chiavi del dizionario, non ai valori né alle coppie *chiave : valore*
6. Le chiavi **possono essere disomogenee ma solo di tipi immutabili**. I valori possono essere di qualunque tipo (anche di tipo dizionario)

La chiave svolge il ruolo dell'indice nelle liste o stringhe, nel senso che ogni valore è identificato dalla chiave, non dalla posizione in cui si trova. Vediamo ora come si possa creare e modificare un dizionario.

In [1]:
d = {} # Crea un dizionario VUOTO
d['a'] = 3 # crea una prima coppia con chiave 'a' e valore 3
print(d)
d['b'] = 5 # aggiunge una coppia con chiave 'a' e valore 5
print(d)
d['a'] = 7 # modifica la coppia con chiave 'a' cambiando il valore in 7
print(d)
d[1] = [1, 2, 4] # aggiunge la coppia con chiave 1 e valore la lista [1, 2, 4]
print(d)
d[[1]] = 3 # Va in errore perché la chiave NON può essere di tipo mutabile come le liste

{'a': 3}
{'a': 3, 'b': 5}
{'a': 7, 'b': 5}
{'a': 7, 'b': 5, 1: [1, 2, 4]}


TypeError: unhashable type: 'list'

In [2]:
d = {'a': 777, 'b': 'casa', 'z': 99} # Crea e inizializza un dizionario 
print(d['a']) 
print(d['b'])
print(d['z'])

777
casa
99


#### Alcuni operatori e funzioni sui dizionari


| Sintassi  | Descrizione  |
|-|-|
| <b>diz$_1$ == diz$_2$</b>  |  `True` se stesse coppie *chiave:valore* in diz$_1$ e diz$_2$, `False` altrimenti |
| <b>diz$_1$ != diz$_2$</b>  |  `True` se almeno una coppia *chiave:valore* diversa tra diz$_1$ e diz$_2$, `False` altrimenti|
| <b>diz[*key*]</b> | indicizzazione: accesso ai singoli elementi (tramite la chiave) |
|<b>len(diz)</b> | restituisce il numero di coppie chiave-valore nel dizionario |
|<b>*key* in diz</b> | `True` se diz ha *key* fra le sue chiavi, `False` altrimenti|
|<b>*key* not in diz</b> | `True` se diz non ha *key* fra le sue chiavi, `False` altrimenti|
|<b>max(diz)</b>| restituisce la chiave maggiore se sulle chiavi è definito un ordinamento (solo numeri, solo stringhe, ecc.) |
|<b>min(diz)</b>| restituisce la chiave minore se sulle chiavi è definito un ordinamento (solo numeri, solo stringhe, ecc.) |
|<b>sum(diz)</b>| somma le chiavi se sono tutte numeri (int o float) |

Le funzioni `max()`, `min()`, `sum()` restituiscono un errore se la condizione in cui sono applicabili non è verificata dal dizionario in input. Notiamo anche che quando ricevono in ingresso un dizionario queste funzioni non hanno la stessa utilità che abbiamo visto nel loro utilizzo, ad esempio, su liste o tuple, essendo il calcolo limitato alle sole chiavi (senza considerare il valore associato a ciascuna chiave).

Si noti inoltre come per gli operatori `==` e `!=` l'ordine delle coppie *chiave:valore* nel dizionario è irrilevante.

#### Scansione di un dizionario
Per scandire tutte le coppie di un dizionario si può usare un ciclo  `for` con la seguente struttura:

```Python
for key in d:
    print(key,d[key])
```    
Notate che il ciclo si fa sulle *chiavi* del dizionario e se vogliamo accedere al valore corrispondente alla chiave `key` nel dizionario `d`, si usa la notazione `d[key]`.

In [3]:
for key in d:
    print(key,d[key])

a 777
b casa
z 99


#### Metodi fondamentali definiti per i dizionari
I metodi fondamentali definiti per i dizionari sono:
 - `clear()` svuota il dizionario, cioè riporta il dizionario a vuoto
 - `copy()` crea una copia del dizionario
 - `get(key)` restituisce il valore associato alla chiave nel dizionario, se la chiave **non è presente** nel dizionario, restituisce `None`. Notate che `None` è il valore di default restituito in caso la chiave non sia presente. Se si invoca `get()` con due argomenti, ad esempio `get(key,value)`, il secondo argomento, cioè `value`, sarà il valore restituito in caso la chiave non sia presente. 
 - `pop(key)` elimina l'elemento con chiave == key (se c'è, altrimenti va in errore) e restituisce il suo valore
 - `keys()` restituisce la lista di tutte le chiavi del dizionario
 - `values()` restituisce la lista di tutti i valori del dizionario
 
Per la precisione, le funzioni `keys()` e `values()` non restiuiscono un valore di tipo lista (rispettivamente contenenti le sole chiavi ed i soli valori del dizionario), ma restituiscono dei *dictionary view objects*. Un oggetto di questo tipo fornisce una vista dinamica sulle voci del dizionario, il che significa che **quando il dizionario cambia, la vista riflette queste modifiche**. Da un dictionary view object `W` è sempre possibile ottenere una lista con l'istruzione `list(W)`. Ad ogni modo, un dictionary view object è iterabile, per cui è ad esempio possibile scandirlo con un ciclo `for` (l'effetto sarà lo stesso che scandire la lista `list(W)`) e verificare la presenza di un valore nella vista con l'operatore `in` (anche in questo caso l'effetto sarà lo stesso che usare l'operatore sulla lista `list(W)`). Non è però possibile usare l'indicizzazione tramite le `[]` per accedere ad un elemento, né ovviamente modificare in alcun modo l'oggetto stesso (che si modifica "automaticamente" al variare del dizionario di cui è una vista):


Vediamo degli esempi:

In [4]:
d = {}
d[1] = 'palla'
d[2] = 'pelle'
d2 = d.copy()
print(d)
print(d2)
d.clear()
print(d)
print(d2)

{1: 'palla', 2: 'pelle'}
{1: 'palla', 2: 'pelle'}
{}
{1: 'palla', 2: 'pelle'}


In [5]:
d2={}
d2[1] = 'palla'
d2[2] = 'pelle'
print(d2.keys())
print(list(d2.keys()))
print(d2.values())
print(list(d2.values()))
print(d2.pop(1))
print(d2)
print(d2.get(1))
print(d2.get(2))
o=d2.keys()
v=d2.values()
print(list(o))
print(list(v))
d2[3]="nuovo elemento"
print(list(o))
print(list(v))

dict_keys([1, 2])
[1, 2]
dict_values(['palla', 'pelle'])
['palla', 'pelle']
palla
{2: 'pelle'}
None
pelle
[2]
['pelle']
[2, 3]
['pelle', 'nuovo elemento']


### Esercizio: frequenza caratteri di un file usando un dizionario
Risolviamo ora il problema che abbiamo visto all'inizio della lezione usando i dizionari. In particolare consideriamo il secondo caso, quello in cui vogliamo conoscere la frequenza di tutti i caratteri presenti nel file. Vediamo dopo quali sono i vantaggi.

In [None]:
def fCaratteriDiz(file_in):
    fin=open(file_in,"r",encoding="UTF-8")
    d={}
    c=fin.read(1) #legge il primo carattere
    while c!="":
        if c in d:
            d[c] = d[c] + 1
        else:
            d[c] = 1
        #In alternativa a questo if else si poteva usare la sola istruzione d[c] = d.get(c,0) + 1
        c=fin.read(1) 
    return d

frequenze=fCaratteriDiz("I_Malavoglia.txt")
for c in frequenze:
    print(c,frequenze[c])
    

#### Discussione
La soluzione con il dizionario combina i vantaggi delle 2 soluzioni basate sull'uso di una lista che abbiamo visto in precedenza, infatti permette una rappresentazione non ridondante che funziona anche quando ci sono tanti caratteri diversi (come per la seconda soluzione  vista sopra) ed al tempo stesso garantisce l'efficienza di accedere rapidamente ad ogni valore (come per la prima soluzione vista sopra) grazie al meccanismo delle coppie *chiave:valore*. Evitiamo quindi il ciclo in cui ricerchiamo l'elemento da aggiornare della seconda soluzione basata su liste. 

Se vogliamo rappresentare solo le occorrenze delle lettere alfabetiche comprese fra 'a e 'z', senza distinguere fra maiuscole e minuscole, possiamo anche pensare ad una soluzione alternativa come la seguente:

In [None]:
#crea un dizionario <carattere 'a' 'z'><frequenza carattere>
def fCaratteriDiz2(file_in):
    fin=open(file_in,"r",encoding="UTF-8")
    f={}
    for i in range(26):  
        f[chr(ord('a')+i)]=0 #crea un dizionario {'a':0, 'b':0, ...}
      
    c=fin.read(1).lower()#legge il primo carattere del file e lo converte in minuscolo
    while c!="":
        if 'a'<= c <='z': #controlla che il carattere letto sia tra 'a' e 'z'
            f[c]+=1
        c=fin.read(1).lower()   
    return f 

frequenze=fCaratteriDiz2("I_Malavoglia.txt")
for c in frequenze:
    print(c,frequenze[c])

#### Discussione
La soluzione appena vista ha l'unico vantaggio di presentare nel risultato anche i caratteri che non compaiono nel file e diventa inefficiente nel caso di un insieme grande di potenziali caratteri da cercare (e.g., tutti i caratteri UNICODE)  (ha quindi le stesse caratteristiche della funzione `fCaratteri()` vista in precedenza). 

### Stampa del contenuto di un dizionario
Dato un dizionario, è possibile stamparne il contenuto in diversi modi. Vediamo degli esempi.

#### Stampa in ordine di chiave
Per fare questo dobbiamo estrarre le chiavi in una lista, ordinarle e poi fare un ciclo su questa lista ordinata per stampare, per ogni chiave, il corrispondente valore.

In [None]:
frequenze=fCaratteriDiz("I_Malavoglia.txt")

l=list(frequenze.keys())
l.sort()        #l contiene tutte le chiavi di f,
                #ovvero tutti i caratteri del file in ordine alfabetico 
print('Frequenze dei caratteri in ordine alfabetico')
for k in l:      
    print(k,frequenze[k]) #stampa il dizionario usando i valori ordinati di l

#### Stampa di tutte le coppie del dizionario
Possiamo stampare tutte le coppie iterando sulle chiavi del dizionario

In [None]:
print('Frequenze dei caratteri usando le chiavi del dizionario')
for k in frequenze:
    print(k,frequenze[k]) #stampa il dizionario usando le chiavi di f (non ordinate)

#### Stampa dei valori del dizionario ordinati dal più grande al più piccolo

In [None]:
print('Valori del dizionario ordinati dal più grande al più piccolo (frequenze dei caratteri)')
valori = list(frequenze.values()) # valori convertiti in lista 
valori.sort(reverse=True) # e poi ordinati a scendere
for v in valori[:10]: #stampa i primi 10 valori del dizionario,
    print(v)          #ovvero tutte le frequenze dei caratteri (con ripetizioni)
    

Notate che non c'è un modo semplice per risalire dai valori contenuti nel dizionario alle chiavi a cui sono associati. Riprenderemo comunque questa discussione più avanti.

### Esercizio: frequenza parole in un file
Scriviamo ora un funzione che crea un dizionario delle parole presenti in un file

In [6]:
#crea un dizionario: <chiave=parola> <valore= frequenza>
def fParoleDiz(file_in):
    fin=open(file_in,"r",encoding="UTF-8")
    d={}
    parole=fin.read() #tutto il file è in una stringa
   
    for c in "()-;—<>:?!.,«»'\"*/=’":  #trasforma i separatori "umani" in spazi
        parole=parole.replace(c," ")  
    parole=parole.split()       #crea una lista di parole 
   
    for p in parole:
        if p in d:
            d[p]+=1
        else:
            d[p]=1
            # d[p] = d.get(p,0) + 1    
    return d          #<parola><frequenza>


#### Discussione
Avendo calcolato il dizionario delle parole possiamo ora usarlo, ad esempio, per stampare la frequenza delle prime 20 parole in ordine alfabetico, o per stampare la frequenza di alcune parole specifiche

In [7]:
fp=fParoleDiz("I_Malavoglia.txt")

lk=list(fp.keys()) 
lk.sort()           #lista ordinata delle chiavi di fp (parole)

print('Stampa delle prime 20 parole in ordine alfabetico (insieme alla loro frequenza nel file)')
for elem in lk[:20]:
    print(elem,fp[elem])

print() # lascia riga vuota    
    
print('-----frequenza di parole specifiche---')
for p in ['casa','mare','alici','sassi','pippo']:
    print(p,fp.get(p,0)) #fp.get(p,<valore>) cerca la chiave p. Se la trova restituisce fp[p],
                        #altrimenti <valore>

Stampa delle prime 20 parole in ordine alfabetico (insieme alla loro frequenza nel file)
0 2
11 1
12 2
1863 1
1881 1
19 1
1907 1
2018 1
25 3
26 1
3 2
30 1
66 1
78 1
A 62
Accidenti 1
Accogliamo 1
Accurimbono 1
Aci 17
Acicastello 1

-----frequenza di parole specifiche---
casa 346
mare 111
alici 0
sassi 25
pippo 0


#### Parole più frequenti
Per stampare tutte le parole che compaiono più di 500 volte possiamo fare così:

In [None]:
print('parole che compaiono più di 500 volte')

for k in fp:      #stampa di tutte le parole che compaiono più di 500 volte
    if fp[k]>500:
        print(k,fp[k])

#### Top ten parole in un file
Stampiamo ora le prime 10 posizioni nella classifica delle parole più frequenti (se più parole occupano la stessa posizione le stampiamo tutte). L'operazione è leggermente più complessa rispetto a prima. Infatti, dobbiamo estrarre la lista dei valori, eliminarne i duplicati, e poi ordinarla in modo decrescente. Ora con un ciclo sulle chiavi del dizionario, stampiamo solo le chiavi i cui corrispondenti valori sono nei primi dieci posti della lista ordinata.

In [11]:
vd=list(fp.values())  #lista valori frequenze con duplicati
vd=set(vd) # elimina i duplicati
# posso anche scrivere direttamente vd=setfp.values()) 
vd=list(vd)
        
vd.sort(reverse=True) #frequenze ordinate in ordine decrescente


#stampa le 10 parole più frequenti
print('Malavoglia top ten')
for elem in vd[:10]:
    print(elem,end=" ")
    for k in fp:
        if fp[k]==elem:
            print(k, end=" ") # se ho parole ex aequo le stampa sulla stessa riga
    print()

Malavoglia top ten
3178 e 
2402 che 
2030 la 
1887 di 
1873 a 
1678 il 
1554 non 
1024 per 
935 si 
840 in 


### Dizionario invertito
Dato un dizionario, a volte sarebbe comodo avere una sua versione invertita, in cui i valori diventano le chiavi e le chiavi valori. Ad esempio, nel dizionario in cui calcoliamo le frequenze dei caratteri non c'è un modo semplice di risalire dalle frequenze ai caratteri. Dovremmo quindi costruire un dizionario in cui le frequenze sono le chiavi e i caratteri i valori. Ci sono però alcune attenzioni da fare quando di vuole *invertire* un dizionario:
1. L'inversione si può fare solo se (anche) i valori sono di tipi *immutabili*. Infatti, i valori diventano le chiavi e le chiavi devono essere di tipi immutabili.
2. le chiavi devono essere univoche, poiché in generale i valori *non sono univoci*, la soluzione è di associare ad un valore *la lista di tutte le chiavi che hanno quel valore*

Vediamo un esempio:

In [None]:
# inverte un dizionario <chiave><valore>
# in un nuovo dizionario <valore><lista di chiavi>
def invertiDizionario(d):
    valori = set(d.values()) #crea una lista con tutti valori distinti di d

    di={}       #dizionario invertito chiave:<frequenza> valore:<lista caratteri>      

    for elem in valori:
        di[elem]=[]     #crea un elemento in di per ciascun valore in
                        #valori
    for k in d:
        di[d[k]].append(k) # aggiungo alla lista 
    return di

s=open('I_Malavoglia_50.txt',encoding='UTF-8').read() #legge il file e lo salva in s
freq={}
for c in s:                 #crea un dizionario chiave:<carattere> valore:<frequenza>
    freq[c]=1+freq.get(c,0) #freq.get(c,0): se la chiave c è presente 
                            #aggiunge 1, altrimenti restituisce 0
print("dizionario=",freq)

inv = invertiDizionario(freq)

print("dizionario invertito=",inv)

### Esercizio: lista esami
Scrivere una funzione che prende in ingresso un file (in formato csv) contenente tutti i voti ottenuti agli esami da un gruppo di studenti e il nome di uno studente e restituisce l'elenco di tutti gli esami con rispettivo voto sostenuti da quello studente. Testare il programma sul file 
[esami1.csv](esami1.csv)

#### Soluzione con liste
In questa prima soluzione calcoleremo solo gli esami sostenuti dallo studente, che saranno rappresentati con una lista in cui ogni elemento è a sua volta una lista di 2 valori, il nome dell'esame ed il voto ottenuto. Se lo studente non compare nel file, viene restituita la lista vuota (viene restituita una lista vuota anche se il file è vuoto).

In [None]:
def listaEsami(file,nome):
    fin=open(file,"r",encoding="UTF-8")
    l=[]
    campi=fin.readline()  #consuma la prima riga 
    if len(campi)==0: # se il file è vuoto restituisce una lista vuota
        return l
    campi=campi.strip().split(",") 
    
    riga=fin.readline() 
    
    while len(riga)>0: #se vero, è stata letta una riga da processare
        riga=riga.strip().split(',')
        if len(riga)==len(campi): # processa solo righe corrette
                                 # (si assume che la prima riga definisca
                                 # correttamente la struttura del file csv)
            if riga[0]==nome:
                l.append([riga[1].strip(),riga[2].strip()])
        riga=fin.readline()
    return l    

# Nota: sia la strip() che la split() sono fatte dopo avere
# verificato se la riga letta è non vuota. La prima riga definisce
# la struttura del file: le altre righe devono avere il suo stesso 
# numero di campi, altrimenti non vengono processate.

l=listaEsami("esami1.csv","Mario")

print("la lista l vale: ",l)
print()

print("for elem in l: print(elem[0], elem[1])")
for elem in l:
    print(elem[0], elem[1])

print()
    
#accesso a un singolo valore
print("accesso singolo valore print( l[1][0],l[1][1])")
print( l[1][0],l[1][1])

#### Soluzione con dizionari
In questa seconda soluzione useremo un dizionario in cui per ogni studente viene costruita la lista degli esami sostenuti. La funzione che realizziamo restituisce il dizionario, che può essere usato poi per stampare la lista di esami con voti per un qualunque studente (nella soluzione stampiamo la lista degli esami sostenuti da tutti gli studenti).

In [None]:
def listaEsami(file):
    fin=open(file,"r",encoding="UTF-8")
    d={}
    campi=fin.readline() #consuma la prima riga 
    if len(campi)==0: # se il file è vuoto restituisce un dizionario vuoto
        return d
    campi=campi.strip().split(",")
    riga=fin.readline() 
    while len(riga)>0: #se vero, è stata letta una riga da processare
        riga=riga.strip().split(',')
        if len(riga)==len(campi):
            if riga[0]in d:
                d[riga[0]].append([riga[1].strip(),riga[2].strip()])
            else:    
                d[riga[0]]=[[riga[1].strip(),riga[2].strip()]]
        # l'if-else precedente si può sostituire con l'unica istruzione 
        # d[riga[0]]=d.get(riga[0],[])+[[riga[1].strip(),riga[2].strip()]]    
        riga=fin.readline()
    fin.close()    
    return d    

d=listaEsami("esami1.csv")

print("il dizionario vale: ",d)
#print()

for k in d:
    print('\n',k,sep='')
    for elem in d[k]:
        print(elem[0], elem[1])

#### Soluzione con un dizionario di dizionari
La soluzione proposta costringe a ricordare l'ordine dei campi della lista: elem[0] è il nome dell'esame, elem[1] il voto. Questo modo di  procedere rende il codice poco leggibiele e diventa ingestibile quando il numero di campi è elevato (e.g., nome esame, data esame, nome docente, aula dell'esame, etc.) La soluzione a questo problema è l'utilizzo di una lista di dizionari, in cui l'accesso è fatto usando sempre dei nomi leggibili. Le istruzioni sono più verbose, e.g., d['Mario][1]['Voto'] ma la leggibilità del codice aumenta in modo significativo. Si veda la seguente soluzione:

In [None]:
def listaEsami(file):
    fin=open(file,"r",encoding="UTF-8")
    d={}
    campi=fin.readline() #consuma la prima riga 
    if len(campi)==0: # se il file è vuoto restituisce un dizionario vuoto
        return d
    campi=campi.strip().split(",")
    riga=fin.readline() 
    while len(riga)>0: #se vero, è stata letta una riga da processare
        riga=riga.strip().split(',')
        if len(riga)==len(campi):
            if riga[0]in d:
                d[riga[0]].append({'Esame':riga[1].strip(),'Voto':riga[2].strip()})
                #oppure d[riga[0]].append({campi[1]:riga[1].strip(),campi[2]:riga[2].strip()})
            else:    
                d[riga[0]]=[{'Esame':riga[1].strip(),'Voto':riga[2].strip()}]
        # l'if-else precedente si può sostituire con l'unica istruzione 
        # d[riga[0]]=d.get(riga[0],[])+['Esame':riga[1].strip(),'Voto':riga[2].strip()}]    
        riga=fin.readline()
    fin.close()    
    return d    

d=listaEsami("esami1.csv")


print("il dizionario vale: ",d)

for k in d:
    print('\n',k,sep='')
    for elem in d[k]: #elem è un dizionario con chiavi 'Esame' e 'Voto'
        print(elem['Esame'], elem['Voto'])

In [None]:
def listaEsami(file):
    fin=open(file,"r",encoding="UTF-8")
    d={}
    campi=fin.readline() #consuma la prima riga 
    if len(campi)==0: # se il file è vuoto restituisce un dizionario vuoto
        return d
    campi=campi.strip().split(",")
    riga=fin.readline() 
    while len(riga)>0: #se vero, è stata letta una riga da processare
        riga=riga.strip().split(',')
        if len(riga)==len(campi):
            if riga[0]in d:
                d[riga[0]].append([riga[1].strip(),riga[2].strip()])
            else:    
                d[riga[0]]=[[riga[1].strip(),riga[2].strip()]]
        # l'if-else precedente si può sostituire con l'unica istruzione 
        # d[riga[0]]=d.get(riga[0],[])+[[riga[1].strip(),riga[2].strip()]]    
        riga=fin.readline()
    fin.close()    
    return d    

d=listaEsami("esami1.csv")

print("il dizionario vale: ",d)
#print()

for k in d:
    print('\n',k,sep='')
    for elem in d[k]:
        print(elem[0], elem[1])

### Esercizi
Completate questi esercizi prima di cominciare il prossimo argomento

### Esercizio 1:
Scrivere una funzione che riceve in input il nome di un file csv contenente informazioni sulle persone e su gli importi (interi) che hanno guadagnato nell'ultimo trimestre (cioè ogni riga contiene una coppia nel formato Nome,Importo) e restituisce un dizionario contenente per ogni persona il totale guadagnato nel trimestre. Assumere che il file sia ben formato (non ci sono righe con meno di due elementi e gli importi sono sempre intepretabili come interi) oppure sia vuoto. In questo caso al funzione deve restituire un dizionario vuoto.

In [None]:
from tester import tester_fun

def sommaImporti(file):
    """MODIFICARE IL CONTENUTO DI QUESTA FUNZIONE PER SVOLGERE L'ESERCIZIO"""

tester_fun(sommaImporti,["importi1.csv"],{'Mario': 23, 'Giorgio': 15, 'Michela': 37} )
tester_fun(sommaImporti,["importi2.csv"],{'Alberto': 45, 'Mario': 13, 'Giorgio': 15, 'Michela': 37})
tester_fun(sommaImporti,["vuoto.csv"],{} )


### Esercizio 2:
Scrivere una funzione che prende in ingresso il nome di un file con le indicazioni delle altezze di un gruppo di persone misurate in vari momenti di tempo e restituisce un dizionario con chiavi i nomi delle persone e valori le liste delle loro altezze (nell'ordine in cui sono trovate nel file). Se il file letto in input è vuoto, la funzione deve restituire un dizionario vuoto.

In [None]:
from tester import tester_fun

def creaDizionarioAltezze(file):
    """MODIFICARE IL CONTENUTO DI QUESTA FUNZIONE PER SVOLGERE L'ESERCIZIO"""

tester_fun(creaDizionarioAltezze, ['altezze.csv'],{'Marco': ['1.50', '1.55', '1.66', '1.74'], 'Lucio': ['1.60', '1.65', '1.75', '1.76'], 'Giovanni': ['1.45', '1.49', '1.58', '1.70']})
tester_fun(creaDizionarioAltezze, ['vuoto.csv'],{})


### Esercizio 3: 
Scrivere un funzione che prende in ingresso il nome del file con tutti i voti presi agli esami da un gruppo di studenti e calcola l'elenco di tutti gli studenti che hanno preso almeno 27 a tutti i loro esami. L'elenco restituito deve essere in ordine alfabetico. Si può assumere che righe ben formate (sempre 3 valori separati da virgole - il terzo valore è sempre interpretabile come intero).

In [None]:
from tester import tester_fun

def voti(file):
    """MODIFICARE IL CONTENUTO DI QUESTA FUNZIONE PER SVOLGERE L'ESERCIZIO"""

tester_fun(voti,['esami1.csv'],['Giovanni', 'Maria'])
tester_fun(voti,['esami2.csv'],['Giovanni', 'Maria', 'Mario'] )


### Esercizio 4
**Gestione di una rubrica telefonica** (esercizio complesso) Data una rubrica dei propri contatti nel formato usato da Google (vedi esempio [rubricaGoogle.csv](rubricaGoogle.csv)), discutere come sia meglio memorizzarla e poi scrivere una funzione che preso in ingresso il nome del file in cui è memorizzata la rubrica, una stringa `s` (parte del nome) ed il nome `n` di un campo, restituisce la lista di coppie [nome completo, valore del campo `n`] per tutti i contatti il cui nome contiene la stringa `s`.

In [None]:
from tester import tester_fun

def infoContatto(file,nome,campo):
    """MODIFICARE IL CONTENUTO DI QUESTA FUNZIONE PER SVOLGERE L'ESERCIZIO"""

tester_fun(infoContatto,["rubricaGoogle.csv","Stilton","Given Name"],[['Geronimo Stilton', 'Geronimo'], ['Tea Stilton', 'Tea']])
tester_fun(infoContatto,["rubricaGoogle.csv","Mouse","Given Name"],[['Mickey Mouse', 'Mickey'], ['Minnie Mouse', 'Minnie']])
tester_fun(infoContatto,["rubricaGoogle.csv","paperino","Phone 1 - Value"],[['paolino paperino', '+1 1111111']])
