# Tipi di dati e funzioni primitive di Python

## Dati primitivi
Sino a questo punto del corso abbiamo usato essenzialmente quattro tipi di dati primitivi:

* `int`: numeri interi
* `float`: numeri "con la virgola" (più precisamente in "virgola mobile" con precisione numerica a 64 bit)
* `bool`: i valori logici True e False
* `NoneType`: è il tipo associato alla parola chiave `None` che abbiamo usato come simbolo di fine lista

Durante l'esecuzione di un programma è sempre possibile controllare il tipo di dato di un oggetto o di una variabile usando la funzione primitiva (o **builtin**) `type`.

**ESEMPIO:**

In [1]:
a = 3
print(type(a))

<class 'int'>


In [2]:
b = 3.2
print(type(b))

<class 'float'>


In [3]:
c = a == b
print(c, type(c))


False <class 'bool'>


In [4]:
print(type(None))

<class 'NoneType'>


Tuttavia, in Python i tipi delle variabili sono definiti durante l'esecuzione di un programma (si dice a "runtime"), e i risultati di operazioni tra tipi diversi sono possibili attraverso delle conversioni di tipi implicite.

**ESEMPIO:**

In [5]:
print(type(a), type(b), type(a/b))

<class 'int'> <class 'float'> <class 'float'>


In [6]:
print(type(c), type(c+1))

<class 'bool'> <class 'int'>


Quando un tipo di dati viene convertito ad un altro tipo di dati si effettua un **cast**.

## Le stringhe
Per rappresentare una sequenza di caratteri possiamo usare un oggetto di tipo **stringa**, ovvero un dato composto di tipo `str`:

In [7]:
a = "Vorrei, ma non posto!"

In [8]:
print(a)

Vorrei, ma non posto!


In [9]:
print(type(a))

<class 'str'>


Attenzione che una stringa è una semplice sequenza di caratteri:

In [10]:
a = '123'
b = '321'
c = a + b
d = 3 * a

In [11]:
type(c)

str

Quanto vale la variabile `c`?

In [12]:
print('Valore:', c, '- Tipo:', type(c))

Valore: 123321 - Tipo: <class 'str'>


In [13]:
print('Valore:', d, '- Tipo:', type(d))

Valore: 123123123 - Tipo: <class 'str'>


Gli operatori aritmetici sono stati ridefiniti per i dati di tipo stringa in modo tale che:

1. l'operatore di somma effettua la CONCATENAZIONE di due stringhe
2. l'operatore di moltiplicazione, se richiamato con un intero $n$ e una stringa, RIPETE (o concatena) la stringa $n$ volte.

In questi due casi, in termini tecnici si dice che l'operatore è **overloaded**: funziona in modo diverso in base al tipo di dati che gli viene passato.

NOTA: Se si utilizza l'operatore di moltiplicazione tra due stringhe, o si utilizza un qualsiasi operatore aritmetico che non è stato ridefinito, si ottiene un `TypeError`:

In [15]:
a = 3
b = 'ciao'
a*b

'ciaociaociao'

In [16]:
a-b

TypeError: unsupported operand type(s) for -: 'int' and 'str'

Il controllo dei tipi degli oggetti viene chiamato **Type Checking** e dipende dal [Type System](https://en.wikipedia.org/wiki/Type_system) definito dal linguaggio di programmazione in uso. Il type system di Python viene chiamato *dinamico* in quanto controllo i tipi degli oggetti durante l'esecuzione dei programmi, e non è necessario specificare il tipo di dati direttamente nel codice.

Le stringhe sono uno dei diversi tipi di dati di Python che rappresentano delle **SEQUENZE** (in questo caso sequenze di caratteri). Alcune operazioni sono comuni per tutti i tipi di sequenze:

* Si può usare la funzione `len(X)` che prende in input una sequenza e restituisce la lunghezza della sequenza. Esempio: `len('abc')` è pari a 3.
* Gli elementi della sequenza possono essere **indicizzati** (in modo simile all'uso della funzione `Nth` vista nell'esercitazione 3). Il primo elemento della sequenza ha indice 0. Se si usa un numero negativo, si inizia a contare dalla fine della sequenza.

In [17]:
'abc'[0]

'a'

In [18]:
'abc'[-1]

'c'

* È possibile estrarre delle sotto sequenze con un'operazione di *slicing*. Se `s` è una stringa, l'espressione `s[start:end]` restituisce la sotto stringa di `s` che inizia all'indice `start` e termina all'indice `end-1`.

In [19]:
a = "Vorrei, ma non posto!"
print(a[8:14])

ma non


Il secondo indice `end` non è compreso in modo tale che l'espressione `s[0:len(s)]` abbia il valore che uno si aspetta. Quest'ultima espressione è equivalente a `s[:]`. 

Se il primo indice viene omesso, di default assume il valore 0.

In [20]:
a[:6]

'Vorrei'

Se il secondo indice viene omesso, prende il valore di default `len(s)`.

In [21]:
a[1:]

'orrei, ma non posto!'

* Per le sequenze è possibile controllare se un elemento appartiene ad una sequenza usando la sintassi: `<elemento> in <sequenza>` che è un predicato che restituisce True o False:

In [22]:
'z' in a

False

In [23]:
# Distingue le maiuscole (case sensitive)
'v' in a

False

In [24]:
'V' in a

True

### Leggere stringhe in input
È possibile prendere in input una stringa da tastiera usando il comando `input`:

In [25]:
n = input("Quanti anni hai? ")

Quanti anni hai? 3


In [26]:
print(n)

3


In [27]:
type(n)

str

È possibile anche leggere un file di testo e memorizzare tutto il suo contenuto in un'unica stringa usando i due comandi:

* `filehandle = open(filename, mod, encoding)`: la funzione apre il file con nome "filename"  in modalità "mod" e restituisce un riferimento al file "filehandle". Le modalità di apertura di un file sono: 'r'=lettura, 'w'=scrittura, 'a'=aggiunta. Il tipo di encoding serve per specificare il formato del file di testo; per file che contengono caratteri speciali (i.e., le lettere accentate italiane) si consiglia di usare encoding "utf-8". Si consiglia di leggere la [documentazione completa di open](https://docs.python.org/3/library/functions.html#open).

* `s = filehandle.read()`: legge tutto il file a cui fa riferimento `filehandle` e ne memorizza il contenuto nella stringa `s`.

**ESEMPIO:** Si controlli di avere il file "canzone.txt" nella directory corrente (usare il comando `ls`), e si eseguano i comandi seguenti:

In [28]:
fh = open('./canzone.txt', 'r', encoding="utf-8")
s = fh.read()
print(s)

Io lo so che cosa pensa tutta questa gente 
questo è vuoto dentro ma è pieno di sé 
Tutto il giorno non fa niente sta a letto con l’influencer 
“Ti chiedo una foto si ma non è per me” 
Poi ti insulto tanto per farci su due chiacchiere

Citazioni su Baudelaire, anche se non so chi è 
Sono poco docile 
Non ho il sangue nobile 
So che qui chi ti disprezza compra i followers 
Comunque vada cara tu sei la mia Intifada 
Comunista con il Rolex di rifondazione Prada 
Con te peso le parole in un messaggio ho messo qualche spazio in più, che faccio? Lascio? 

Ti conosco da sempre, ma non ti ho mai capita 
E’ meglio così 
Sconosciuti da una vita 
E ogni giorno è per sempre, ogni giorno è finita 
Ma è bello così 
Sconosciuti da una vita 

Ricordo le canzoni, mai gli anniversari 
Ho un lavoro straordinario ma che impone straordinari 
Troppa gente pensa che sia sempre in ferie 
Si fa viaggi strani 
Io più conosco esseri umani più amo gli animali 
Vogliono solo fare foto, siamo dei trofei nei display

In [29]:
print(len(s.split(' ')))

372


In [30]:
print(s.replace('\n','').split(' '))

['Io', 'lo', 'so', 'che', 'cosa', 'pensa', 'tutta', 'questa', 'gente', 'questo', 'è', 'vuoto', 'dentro', 'ma', 'è', 'pieno', 'di', 'sé', 'Tutto', 'il', 'giorno', 'non', 'fa', 'niente', 'sta', 'a', 'letto', 'con', 'l’influencer', '“Ti', 'chiedo', 'una', 'foto', 'si', 'ma', 'non', 'è', 'per', 'me”', 'Poi', 'ti', 'insulto', 'tanto', 'per', 'farci', 'su', 'due', 'chiacchiereCitazioni', 'su', 'Baudelaire,', 'anche', 'se', 'non', 'so', 'chi', 'è', 'Sono', 'poco', 'docile', 'Non', 'ho', 'il', 'sangue', 'nobile', 'So', 'che', 'qui', 'chi', 'ti', 'disprezza', 'compra', 'i', 'followers', 'Comunque', 'vada', 'cara', 'tu', 'sei', 'la', 'mia', 'Intifada', 'Comunista', 'con', 'il', 'Rolex', 'di', 'rifondazione', 'Prada', 'Con', 'te', 'peso', 'le', 'parole', 'in', 'un', 'messaggio', 'ho', 'messo', 'qualche', 'spazio', 'in', 'più,', 'che', 'faccio?', 'Lascio?', 'Ti', 'conosco', 'da', 'sempre,', 'ma', 'non', 'ti', 'ho', 'mai', 'capita', 'E’', 'meglio', 'così', 'Sconosciuti', 'da', 'una', 'vita', 'E', '

In [31]:
print(s.lower().replace('\n','').split(' '))

['io', 'lo', 'so', 'che', 'cosa', 'pensa', 'tutta', 'questa', 'gente', 'questo', 'è', 'vuoto', 'dentro', 'ma', 'è', 'pieno', 'di', 'sé', 'tutto', 'il', 'giorno', 'non', 'fa', 'niente', 'sta', 'a', 'letto', 'con', 'l’influencer', '“ti', 'chiedo', 'una', 'foto', 'si', 'ma', 'non', 'è', 'per', 'me”', 'poi', 'ti', 'insulto', 'tanto', 'per', 'farci', 'su', 'due', 'chiacchierecitazioni', 'su', 'baudelaire,', 'anche', 'se', 'non', 'so', 'chi', 'è', 'sono', 'poco', 'docile', 'non', 'ho', 'il', 'sangue', 'nobile', 'so', 'che', 'qui', 'chi', 'ti', 'disprezza', 'compra', 'i', 'followers', 'comunque', 'vada', 'cara', 'tu', 'sei', 'la', 'mia', 'intifada', 'comunista', 'con', 'il', 'rolex', 'di', 'rifondazione', 'prada', 'con', 'te', 'peso', 'le', 'parole', 'in', 'un', 'messaggio', 'ho', 'messo', 'qualche', 'spazio', 'in', 'più,', 'che', 'faccio?', 'lascio?', 'ti', 'conosco', 'da', 'sempre,', 'ma', 'non', 'ti', 'ho', 'mai', 'capita', 'e’', 'meglio', 'così', 'sconosciuti', 'da', 'una', 'vita', 'e', '

In Python è anche molto semplice leggere delle pagine web e memorizzarle in una stringa. Per fare questo si deve usare la libreria `urllib.request` nel modo seguente:

In [32]:
import urllib.request
with urllib.request.urlopen('http://matematica.unipv.it/gualandi/programming/') as response:
   pagina_corso = str(response.read())

print(pagina_corso.split(' '))

["b'<!DOCTYPE", 'html>\\n<html', 'lang="it">\\n', '', '', '<head>\\n', '', '', '', '', '', '<meta', 'charset="utf-8"', '/>\\n', '', '', '', '', '', '', '<meta', 'http-equiv="X-UA-Compatible"', 'content="IE=edge">\\n', '', '', '', '', '', '', '<meta', 'name="viewport"', 'content="width=device-width,', 'initial-scale=1.0,', 'minimum-scale=1.0">\\n', '', '', '', '', '', '', '<meta', 'name="description"', 'content="Sito', 'per', 'il', 'corso', 'di', 'Programmazione', '1,', 'corso', 'introduttivo', 'alla', 'programmazione', 'per', 'matematici.">\\n\\n', '', '', '', '', '', '<title>Programmazione', '1</title>\\n', '', '', '', '', '', '<link', 'rel="stylesheet"', 'href="mypage.css"', '/>\\n', '', '', '', '', '', '<script>\\n', '', '', '', '', '', '', '', '', "(function(i,s,o,g,r,a,m){i[\\'GoogleAnalyticsObject\\']=r;i[r]=i[r]||function(){\\n", '', '', '', '', '', '', '', '', '', '', '', '', '', '', '(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new', 'Date();a=s.createElement(o),\\n', '', '',

Per maggiori dettagli per la lettura di pagine web, si consiglia leggere la documentazione della libraria [urllib](https://docs.python.org/3/howto/urllib2.html).

### Definizione di procedure su stringhe

**ESERCIZIO:** Scrivere una funzione che prende in input una stringa e stampi a video un carattere alla volta.

In [35]:
def SinglePrint(s):
    if len(s) > 0:
        head, tail = s[0], s[1:]
        print(head, end=' # ')
        SinglePrint(tail)

SinglePrint('abcde')

for t in 'abcde':
    print (t, end = ' - ')

a # b # c # d # e # a - b - c - d - e - 

In [36]:
def SinglePrint2(s):
    def Helper(i, n):
        if i < n:
            print(s[i], end=' # ')
            Helper(i+1, n)
    Helper(0, len(s))
SinglePrint2(a)

V # o # r # r # e # i # , #   # m # a #   # n # o # n #   # p # o # s # t # o # ! # 

Per semplificare la scrittura di procedure che devono essere applicate a ciascun elemento di una sequenza si introduce la **SINTASSI** seguente:

```
for <elemento> in <sequenza>:
    <body>  # in cui si usa l'elemento
```

e quindi possiamo scrivere:

In [37]:
for c in 'abcde':
    print(c, end=' # ')

a # b # c # d # e # 

**NOTA:** Il comando `print` ha due parametri opzionali:

1. `end`: specifica il carattere da usare per terminare la stampa della stringa. Di default è uguale al carattere di ritorno a capo `\n`.
2. `sep`: specifica il carattere da usare per separare più stringhe. Di default è uguale ad uno spazio.

In [38]:
print('uno','due','tre', sep='-->', end='!!!')

uno-->due-->tre!!!

### Funzioni builtin per le stringhe
I seguenti metodi sono tutti molto utili e restituiscono delle nuove stringhe lasciando la stringa iniziale immutata:

* `s.count(s1)`: conta qualche volte la stringa `s1` è contenuta in `s`
* `s.find(s1)`: restituisce l'indice della stringa `s` in cui ha trovato per la prima volta la stringa `s1`; altrimenti restituisce -1
* `s.rfind(s1)`: come sopra, ma inizia dalla fine di `s` (la `r` sta per `reversed`)
* `s.lower()`: converte tutte le lettere in minuscolo
* `s.upper()`: converte tutte le lettere in maiuscolo
* `s.replace(old,new)`: sostituisce tutte le sotto stringhe uguali a `old` in `s` con la stringa `new`
* `s.strip()`: rimuove tutti i caratteri blanks iniziali e finali dalla stringa `s`
* `s.rstrip()`: rimuove tutti i caratteri blanks finali dalla stringa `s`
* `s.split(d)`: suddivide la stringa in sotto stringhe usando il carattere `d` come separatore

In [None]:
'ciao'.upper()

In [39]:
'  ciao - - '.rstrip()

'  ciao - -'

In [40]:
'  ciao - - '.strip()

'ciao - -'

In [41]:
int('c')

ValueError: invalid literal for int() with base 10: 'c'

### Conversione di caratteri in interi e di interi in caratteri
In Python non esiste un tipo di dati specifico per identificare un singolo carattere. Tuttavia è possibile convertire un carattere nel suo corrispondente [codice ASCII](https://en.wikipedia.org/wiki/ASCII) usando la funzione `ord(s)` in cui `s` è una stringa di lunghezza 1.

**ESEMPIO:** Stampa a video dei codici ASCII per le lettere minuscole dell'alfabeto:

In [42]:
for c in 'abcdefghijklmnopqrstuvwxyz'.upper():
    print((c, ord(c)), end=', ')

('A', 65), ('B', 66), ('C', 67), ('D', 68), ('E', 69), ('F', 70), ('G', 71), ('H', 72), ('I', 73), ('J', 74), ('K', 75), ('L', 76), ('M', 77), ('N', 78), ('O', 79), ('P', 80), ('Q', 81), ('R', 82), ('S', 83), ('T', 84), ('U', 85), ('V', 86), ('W', 87), ('X', 88), ('Y', 89), ('Z', 90), 

**ESERCIZIO:** Una [palindrome](https://it.wikipedia.org/wiki/Palindromo) è una sequenza di caratteri che si legge allo stesso modo in entrambi i sensi. Scrivere un predicato che prende in input una stringa e restituisce `True` se la stringa è una palindrome, e `False` altrimenti. Testare il predicato scritto con le stringhe seguenti.

In [51]:
s1 = "aibofobia"
s2 = "satorarepotenetoperarotas"
s3 = "aiboifobia"

def Palindromo(S):
    for i in range(len(S)):
        if i >= len(S)-i:
            return True
        if S[i] != S[-i-1]:
            return False
            
    
        
Palindromo(s3)

False

## Le tuple
Le tuple, come le stringhe, sono delle sequenze *non modificabili* di elementi. A differenza delle stringhe non abbiamo nessun vincolo particolare sul **tipo** degli elementi che appaiono nella sequenza, e possono anche essere tutti diversi tra loro.

In [52]:
t = (1, 2.3, 'cool!', False)
print(t)

(1, 2.3, 'cool!', False)


La "coppia" che abbiamo usato per costruire la nostra libreria `pairslist` è un caso particolare di tupla con lunghezza pari a due.

Sulle tuple, essendo delle SEQUENZE, possiamo applicare gli stessi operatori di base che abbiamo visto per le stringhe:

In [53]:
# Uso della funzione `len`
print(len(t))

4


In [54]:
# Accesso diretto ad un elemento
print(t[2])

cool!


In [55]:
# Gli operatori di slicing
print(t[1:2])

(2.3,)


In [56]:
# Test di appartenenza
print('c' in t)
print('2.3' in t)

False
False


In [57]:
# Supporto del costrutto <for>
for e in t:
    print(e)

1
2.3
cool!
False


In [58]:
# Concatenazione
t2 = ('prova', 'prova')
print('concatenazione:', t+t2)

concatenazione: (1, 2.3, 'cool!', False, 'prova', 'prova')


In [59]:
# Repetition
print('repetition:',t2*3)

repetition: ('prova', 'prova', 'prova', 'prova', 'prova', 'prova')


**NOTA:** Per definire una tuple di lunghezza pari a uno, ovvero di un singolo elemento, bisogna usare la strana sintassi `(1,)`: si noti la virgola dopo l'uno.

In [61]:
a=(1)
b=(1,)
print(type(a), type(b))
print (a, b)

<class 'int'> <class 'tuple'>
1 (1,)


**ESERCIZIO 2:** Scrivere una funzione che prende in input due tuple e restituisce una tupla che contiene gli elementi che sono sia nella prima che nella seconda tupla. Scrivere anche una funzione di test che comprenda qualche caso significativo.

In [66]:
def Intersect(As, Bs):
    Rs = tuple()
    for i in As:
        if i in Bs and not i in Rs:
            Rs = Rs + (i,)
    return Rs

def TestZero():
    if Intersect((2,3,4,2,1,2,7), (2,3,2,3,4)) == (2, 3, 4):
        return 'ok'
    return 'failed'

print('Test zero: '+TestZero())
# Intersect((2,3,4,2,1,2,7), (2,3,2,3,4): (2, 3, 4)

Test zero: ok


In [67]:
t[1]

2.3

In [68]:
t[1] = 3

TypeError: 'tuple' object does not support item assignment

In [69]:
'abcba'[2] = 'd'

TypeError: 'str' object does not support item assignment

**NOTA:** Le stringhe e le tuple sono dei tipi i oggetto non modificabili, ovvero sono dei dati *read only*.

## Le liste
Le **liste** di Python sono delle sequenze di elementi come le tuple, ma a differenza di quest'ultime, possono essere modificate. La sintassi per gestire le liste è simile a quelle delle tuple: la differenza principale consiste nell'usare le parentesi tonde invece delle quadre:

In [70]:
Ls = [1, 2.3, 'cool!', False]
print(type(Ls))


<class 'list'>


In [71]:
Ls[1] = 33.3

In [72]:
print(Ls)

[1, 33.3, 'cool!', False]


In [73]:
# Lista vuota
print(len([]), type([]))

0 <class 'list'>


Anche per le liste possiamo usare tutte le funzioni che vengono solitamente usate in Python per le sequenze di elementi:

In [74]:
# Uso della funzione `len`
print(len(Ls))
# Accesso diretto ad un elemento
print(Ls[2])
# Gli operatori di slicing
print(Ls[1:2])
# Test di appartenenza
print('c' in Ls)
print('2.3' in Ls)
# Supporto del costrutto <for>
for e in Ls:
    print(e)
# Concatenazione
L2 = ['prova', 'prova']
print('concatenazione:', Ls+L2)
# Repetition
print('repetition:',L2*3)

4
cool!
[33.3]
False
False
1
33.3
cool!
False
concatenazione: [1, 33.3, 'cool!', False, 'prova', 'prova']
repetition: ['prova', 'prova', 'prova', 'prova', 'prova', 'prova']


### Il problema di *aliasing*
Si consideri l'esempio seguente, ripreso dal Capitolo 5 del libro di riferimento.

In [75]:
Techs = ['MIT', 'Caltech']
Ivys = ['Harvard','Yale','Penn']
U1 = [Techs, Ivys]
U2 = [['MIT', 'Caltech'], ['Harvard','Yale','Penn']]
print(U1 == U2)
print(id(U1) == id(U2)) # la funzione id() restituisce l'identificativo unico di un oggetto Python

True
False


In [76]:
Techs.append('Standford')
print(U1 == U2)

False


In [77]:
U1[0].remove('Standford')
print(Techs)

['MIT', 'Caltech']


**NOTA:** abbiamo due percorsi diversi che portano allo stesso oggetto di tipo lista: il primo attraverso il nome della lista `Techs`, il secondo attraverso il primo elemento della lista `U1`.  Basta modificare uno dei due, che il cambiamento si riflette sull'altro: si parla in questo caso di **side effect**, in quanto si potrebbero introdurre degli effetti non desiderati, difficili da individuare. Notare che problemi di questo tipo non si hanno con strutture dati di tipo *read only*.

**ESERCIZIO 3:** (*obiettivo: intuire il vantaggio di poter avere anche oggi non mutabili*)

Si scriva una funzione che prenda in input due **liste** e che rimuove dalla prima lista ogni elemento che compare nella seconda lista. La funzione non ritorna nulla, ma **modifica** la prima lista data in input. Si può usare il metodo `L.remove(e)` che rimuove dalla lista `L` il primo elemento uguale a `e`.

In [78]:
Ls = [2,3,4,1,5,1]
Ls.remove(1)
print(Ls)

[2, 3, 4, 5, 1]


Completare la funzione seguente:

In [82]:
def RimuoviDuplicati(As, Bs):
    for i in Bs:
        for t in range(As.count(i)):
            As.remove(i)
    pass

L1 = [2, 4, 2, 5, 6, 6, 3, 2, 9, 4]
L2 = [2, 4, 7]
RimuoviDuplicati(L1, L2)
print('L1 =', L1)

L1 = [5, 6, 6, 3, 9]


### List comprehensions
Quando abbiamo definito i plot di alcune semplici funzioni, abbiamo usato direttamente una sintassi di Python che permette di creare in modo molto semplice delle list: le **list comprehensions**. Esempi:

In [83]:
S = [x**2 for x in range(10)]
V = [2**i for i in range(13)]
M = [x for x in S if x % 2 == 0]

In [84]:
print(S)
print(V)
print(M)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096]
[0, 4, 16, 36, 64]


La stessa sintassi si può usare per le stringhe:

In [85]:
Ls = "Vorrei, ma non posto!"
Ls = Ls.split(' ')
print(Ls)

['Vorrei,', 'ma', 'non', 'posto!']


In [86]:
As = [(len(s), s.upper(), s.lower()) for s in Ls]
print(As)

[(7, 'VORREI,', 'vorrei,'), (2, 'MA', 'ma'), (3, 'NON', 'non'), (6, 'POSTO!', 'posto!')]


## Dizionari
I dizionari sono una struttura dati molto utilizzati in Python. Sono delle strutture dati che corrispondono a delle liste di coppie **(key, value)**. I dizionari sono degli oggetti **mutabili** come le liste, ma non sono una sequenza ordinata, e quindi non possono essere indicizzati con dei numeri interi.

La **key** viene utilizzata come chiave per indicizzare un **value**. Per esempio:

`Dict["hello"] = "ciao"`

Abbiamo la chiave "hello" utilizzata per indicizzare l'elemento "ciao" nel dizionario Dict. Per semplicità, potete pensare ai dizionari a come dei vettori di elementi indicizzati da altri oggetti **immutabili**, come ad esempio delle stringhe.

**ESEMPIO:**

In [87]:
# Creo un dizionario vuoto
Vocabolario = dict()
print(type(Vocabolario))

<class 'dict'>


In [88]:
Vocabolario["keep"] = "stai"
Vocabolario["calm"] = "sereno"
print("Enrico,", Vocabolario["keep"], Vocabolario["calm"])

Enrico, stai sereno


In [89]:
# E` possibile enumerare i dizionari con un ciclo for
Vocabolario["hello"] = "ciao"
for key in Vocabolario:
    print("chiave:", key, "- valore:", Vocabolario[key])

chiave: keep - valore: stai
chiave: calm - valore: sereno
chiave: hello - valore: ciao


### Metodi utili sui dizionari
I seguenti metodi sono molto utili per usare i dizionari:

* `len(d)`: restituisce il numero di elementi nel dizionario `d`
* `d.keys()`: restituisce una vista delle chiavi del dizionario `d`
* `d.values()`: restituisce una vista dei valori del dizionario `d`
* `key in d`: restituisce `True` se la chiave `key` è nel dizionario `d`
* `d.get(key, value)`: restituisce `d[key]` se `key` è in `d`, altrimenti restituisce il valore `value`
* `d[key] = value`: associa il valore `value` alla chiave `key` nel dizionario `d`
* `del d[key]`: rimuove la chiave `k` dal dizionario `d`
* `for key in d`: itera sulle chiavi del dizionario `d`

**ESERCIZIO 4:** Per ogni carattere (stringa di lunghezza 1) della canzone contenuta nel file "canzone.txt", scrivere:

1. una funzione `ContaCaratteri(c)` che conti il numero di volte che ciascun carattere appare nel testo e restituisce un dizionario dove si ha una "chiave" per ogni carattere e un "valore" pari al numero di volte che il carattere appare nella stringa. Rimuovere la punteggiatura, gli spazi vuoti, e i caratteri speciali. 

2. una funzione `CalcolaFrequenza(d)` che prende in input un dizionario con i conteggi dei caratteri, calcola la frequenza di ciascun carattere, e restituisce un dizionario dove si ha una "chiave" per ogni carattere e un "valore" pari alla frequenza con cui il carattere appare nel testo.

In [1]:
def ContaCaratteri(s):
    # Costruttore di un dizionario vuoto
    D = {}
    # Ciclo su tutti caratteri della stringa
    for c in s:
        if c in D:
            D[c] += 1
        else:
            D[c] = 1
    return D

def CalcolaFrequenza(D):
    F = {}
    count = 0
    for key in D:
        count += D[key]
    for key in D:
        F[key] = D[key]/count
    # Da completare, esercizio
    return F

fh = open('./canzone.txt', 'r', encoding="utf-8")
s = fh.read()
for c in ',?\n”“ ’':
    s = s.replace(c,'')
D = ContaCaratteri(s.lower())


{'i': 180, 'o': 182, 'l': 59, 's': 97, 'c': 92, 'h': 26, 'e': 143, 'a': 168, 'p': 42, 'n': 127, 't': 92, 'u': 51, 'q': 7, 'g': 34, 'è': 14, 'v': 25, 'd': 44, 'r': 82, 'm': 54, 'é': 2, 'f': 22, 'z': 11, 'b': 10, 'w': 3, 'x': 1, 'ù': 3, 'ì': 6, 'y': 3, 'k': 1, 'ò': 1}
