# Strutture Dati

Una **struttura dati** è un formato specializzato per organizzare, processare, recuperare e memorizzare i dati. Esistono molteplici strutture dati, sia semplici che complesse, progettate per organizzare i dati in modo tale da soddisfare particolari requisiti. Le strutture dati sono utili per accedere e lavorare con i dati di cui si ha bisogno nella maniera più appropriata.

## Liste

Le **liste** sono utilizzate per memorizzare contemporanemanete molteplici elementi in una singolare variabile; vengono definite utilizzato le parentesi quadre, `[...]`. Per creare una lista vuota basta usare `[]`.

In [None]:
vuota = []
vuota

In [None]:
a = 'arancia'
b = 'banana'
c = 'ciliegia'

In [None]:
frutta = ['arancia', 'banana', 'ciliegia']

In [None]:
frutta

In [None]:
type(frutta)

Una lista può anche contenere differenti tipi di dato.

In [None]:
mix = ['ciao', 200, [True, 0.2]]

In [None]:
mix

Come gli altri tipi sequenziali, ad esempio le stringhe, anche le liste possono essere soggette ad operazioni di indexing e slicing.

In [None]:
frutta[0]

In [None]:
frutta[1:]

A differenza delle stringhe, che sono *immutabili*, le liste sono un tipo *mutabili*, dunque è possibile modificarne il contenuto.

In [None]:
frutta[0] = 'ananas'
frutta

In [None]:
'ananas'[0] = 'c'

In [None]:
'ananas'.replace('s', 'c')

È possibile utilizzare anche la direttiva `list()` per definire una lista.

In [None]:
list([0, 1, 2, 3])

Quando usata su una stringa produce la lista dei caratteri della stringa:

In [None]:
list('ananas')

### `len(object)`

Il metodo `len()` resituisce la lunghezza (il numero di elementi) di un oggetto. L'argomento può essere una sequenza (ad esempio una stringa o una lista) oppure una collezione (ad esempio un dizionario o un insieme).

In [None]:
len(frutta)

In [None]:
len('ananas')

In [None]:
len(4)

### Metodi di `list`

Le liste sono ordinate, ovvero gli elementi hanno un ordine definito, e tale ordine non viene cambiato. Nel caso in cui vengano aggiunti nuovi elementi ad una lista, questi verranno piazzati alla fine della lista stessa.

`list.append(x)` aggiunge un elemento alla fine della lista.

In [None]:
frutta.append('pesca')

In [None]:
frutta

`list.pop(i)` rimuove l'elemento della lista nella posizione indicata e lo restituisce. Se nessun indice viene indicato, rimuove e restituisce l'ultimo elemento nella lista.

In [None]:
frutta.pop(1)

In [None]:
frutta

Mentre `list.append(x)` aggiunge l'elemento ala fine della lista, `list.insert(i, x)` lo aggiunge in posizione i.

In [None]:
frutta.insert(1, 'banana')

In [None]:
frutta

## Tuple

Le **tuple** sono utilizzate per memorizzare più elementi in una singola variabile. Sono definite da parentesi tonde, `(...)`, e i loro elementi sono ordinati, immutabili e consentono duplicati.

In [None]:
medaglie = ('oro', 'argento', 'bronzo')

In [None]:
medaglie

In [None]:
type(medaglie)

In [None]:
mix = (2, 'ciao', (True, 0.3))

In [None]:
mix

È possibile anche utilizzare la funzione `tuple()` per definire una tupla.

In [None]:
tuple(('oro', 'argento', 'bronzo'))

Anche se le tuple sembrano simili alle liste, in realtà sono utilizzate in modi e per scopi differenti. Le tuple sono immutabili e di solito contengono sequenze eterogenee di elementi a cui si accede tramite operazioni di *unpacking* e *indexing*. Le liste sono mutabili, i loro elementi sono di solito omogenei e vi si accede in maniera iterativa.

In [None]:
medaglie[0]

In [None]:
medaglie[1:]

In [None]:
medaglie[0] = "legno"

Di default se si assegnano pià valori ad una variabile ad essa viene asseganta la tupla contenente i valori specificati.

In [None]:
brand = 'Apple', 'Samsung', 'LG'

In [None]:
brand

Al contrario assegnado una tupla a più variabili di possono *spacchettare* i valori che essa contiene.

In [None]:
apple, samsung, lg = brand

In [None]:
apple

### `zip(lista_1, ..., lista_n)`

La funzione integrata `zip()` itera parallelamente su più liste (che sono oggetti *iterabili*), producendo tuple aventi un elemento preso da ognuna delle liste.

In [None]:
medaglie = ['oro', 'argento', 'bronzo']
piazzamenti = [1, 2, 3]

`zip` non restituisce direttamente una lista ma un oggetto di tipo zip. Per rendere il risultato una lista si può usare la direttiva `list()`.

In [None]:
type(zip(medaglie, piazzamenti))

In [None]:
list(zip(medaglie, piazzamenti))

In [None]:
piazzamenti = [1, 2, 3, 4]
premio = [1000, 500, 200]
list(zip(medaglie, piazzamenti, premio))

## Insiemi

Un **insieme** (*set*) è una struttura dati non-ordinata, non-indicizzata e immutabile che non accetta duplicati. Gli utilizzi più comuni riguardano il cosiddetto test di appartenenza e l'eliminazione di elementi duplicati. Gli insiemi supportano operazioni matematiche, come l'unione, l'intersezione, la differenza e la differenza simmetrica. Gli insiemi si definiscono con le parentesi graffe, `{...}`.

In [None]:
frutta = {'arancia', 'banana', 'ciliegia', 'arancia'}

In [None]:
frutta

In [None]:
frutta[0]

È possibile definire un insieme utilizzando la funzione `set()`.

In [None]:
set(('arancia', 'banana', 'ciliegia', 'arancia'))

In [None]:
['arancia', 'banana', 'ciliegia', 'arancia']

In [None]:
('arancia', 'banana', 'ciliegia', 'arancia')

### Test di Appartenenza

Un **test di appartenenza** controlla se uno specifico elemento sia contenuto all'interno di una sequenza, come stringhe, liste, tuple o insiemi. Uno dei principali vantaggi nell'utilizzare gli insiemi in Python è che essi sono ottimizzati per questa tipologia di test.

L'operatore `in` funziona con tipi sequenziali: è utilizzato per controllare se un elemento è presente in un oggetto. L'operatore restituisce un valore booleano: `True` se l'elemento viene trovato, `False` in caso contrario.

In [None]:
'arancia' in frutta

In [None]:
'pesca' in frutta

In [None]:
'arancia' in ['arancia', 'banana', 'ciliegia', 'arancia']

In [None]:
'pesca' in ('arancia', 'banana', 'ciliegia', 'arancia')

In [None]:
'b' in 'ciao'

### Operazioni sugli Insiemi

L'*unione* viene eseguita utilizzando l'operatore `|` oppure il metodo `set.union()`.

In [None]:
numeri_primi = {1, 2, 3, 5, 7}
numeri_dispari = {1, 3, 5, 7, 9}

In [None]:
# Unione
numeri_primi | numeri_dispari

L'unione è un'operazione simmetrica.

In [None]:
numeri_dispari | numeri_primi

In [None]:
numeri_primi.union(numeri_dispari)

L'*intersezione* viene eseguita utilizzando l'operatore `&` oppure il metodo `set.intersection()`.

In [None]:
# Intersezione
numeri_primi & numeri_dispari

In [None]:
numeri_primi.intersection(numeri_dispari)

La *differenza insiemistica* viene eseguita utilizzando l'operatore `-` oppure il metodo `set.difference()`.

In [None]:
# Differenza insiemistica
numeri_primi - numeri_dispari

In [None]:
numeri_primi.difference(numeri_dispari)

La differenza insiemistica **non** è simmetrica:

In [None]:
numeri_dispari - numeri_primi

La *differenza simmetrica* che corrisponde a *unione* - *intersezione* viene eseguita utilizzando l'operatore `^` oppure il metodo `set.symmetric_difference()`.

In [None]:
# Differenza Simmetrica
numeri_primi ^ numeri_dispari

In [None]:
numeri_dispari ^ numeri_primi

In [None]:
numeri_primi.symmetric_difference(numeri_dispari)

## Dizionari

Un **dizionario** è utilizzato per memorizzare valori in un formato *chiave: valore* ed è definito da parentesi graffe, `{chiave: valore}`. A differenza dalle sequenze come le liste, che sono indicizzate da una serie di numeri, i dizionari sono indicizzati dalle chiavi, che possono essere di qualsiasi tipo immutabile e con il vincolo di dover essere uniche.

In [None]:
capitali = {'Italia': 'Roma'}

In [None]:
capitali[0]

In [None]:
capitali['Italia']

In [None]:
capitali = {'Italia': 'Roma', 'Francia': 'Parigi', 'Spagna': 'Madrid'}

In [None]:
capitali['Spagna']

È possibile definire un dizionario anche con la funzione `dict()`.

In [None]:
auto = dict([('brand', 'Fiat'), ('modello', 'Panda'), ('anno', 2000)])

In [None]:
auto

In [None]:
{'Italia': 'Roma', 'Francia': 'Parigi', 'Italia': 'Torino'}

È possibile accedere agli elementi di un dizionario utilizzando le chiavi tra parentesi quadre.

### Metodi dei dizionari

`dict.keys()` restituisce un oggetto contenente le chiavi del dizionario.

In [None]:
capitali.keys()

`dict.values()` restituisce un oggetto contenente i valori del dizionario.

In [None]:
capitali.values()

`dict.items()` restituisce un oggetto contenente le tuple chiave-valore.

In [None]:
capitali.items()

Un metodo rapido per creare un dizionario partendo da due liste della stessa lunghezza è utilizzare `zip`.

In [None]:
paesi = ['Italia', 'Francia', 'Spagna']
città  = ['Roma', 'Parigi', 'Madrid']
dict(zip(paesi, città))

## Moduli

Un **modulo** Python contiene un insieme di funzioni raggruppate per utilizzo e significato che possono essere incluse nel nostro programma. Per avere accesso alle funzioni contenute all'interno di un modulo utilizziamo il comando `import module`. Una volta importato le funzioni del modulo possono essere chaimate 
tramite `module.func()`.

## Modulo `os`

Il modulo `os` fornisce la possibilità di intereagire con le funzionalità del sistema operativo su cui viene eseguito Python.

In [None]:
import os

`os.getcwd()` restituisce una stringa rappresentante la cartella di lavoro corrente.

In [None]:
os.getcwd()

`os.listdir(path='.')` restituisce una lista contenente i nomi delle voci presenti nel percorso indicato. Dove '.' indica la cartella corrente.

In [None]:
os.listdir('.')

In [None]:
os.listdir(os.getcwd())

In [None]:
os.listdir('data')

In [None]:
os.listdir('../lezione-01/')

Occorre sempre fornire o il percorso assoluto (dalla directory root) oppure il percorso relativo a partiredalla directory in cui ci si trova. 

In [None]:
os.listdir('lezione-01/')

## `open(path, mode)`

È spesso richiesto di interagire con i file presenti sul proprio computer. Per far ciò in Python possiamo usare la funzione integrata `open()` che apre un file e restituisce il corrispondente oggetto file.

In [None]:
file = open('data/levitating.txt')

Il metodo `read()` legge e restituisce tutto il file. 

Il metodo `readline()` legge e restituisce una linea del file di testo.

In [None]:
file.readline()

In [None]:
file.readline()

In [None]:
file.read()

La funzione `read` esaurisce il file, chiamandola una seconda volta si ottiene una stringa vuota.

In [None]:
file.read()

Il metodo `close()` chiude il file.

In [None]:
file.close()

In [None]:
file.read()

È importante ricordarsi di chiudere i file una volta finito di usarli. Per ovviare a questo fatto si può usare il comando `with`.

Il comando `with` è utilizzato per racchiudere l'esecuzione di un blocco di codice e si assicura che non vengano lasciate inavvertitamente risorse aperte.

In [None]:
with open('data/levitating.txt', 'r') as file:
    text = file.readline()
    print(text)
    print('ciao, sono dentro al with')

print('fuori dal blocco with')
file.readline()

Tuttavia avendo assegnato il valore di una linea alla variabile `text` questa è disponibile anche una volta che il file è stato chiuso.

In [None]:
text

In [None]:
file.read()

Il metodo `write()` si occupa di scrivere gli oggetti forniti come parametri sul file di riferimento. Il metodo `writelines()` scrive, invece, una lista di linee sul file; i separatori di linea (`\n`) non sono aggiunti automaticamente, dunque è consigliato inserirne uno alla fine di ogni linea.

In [None]:
# w sta per write, se il file non esiste viene creato
print(os.listdir('data'))
with open('data/esempio.txt', 'w') as file:
    file.write("Prima riga\n")
    file.writelines(["Seconda linea\n", "Terza linea\n"])
print(os.listdir('data'))

In [None]:
# r sta per read, il file deve già esistere
print(os.listdir('data'))
print()
with open('data/esempio.txt', 'r') as file:
    print(file.read())

## Modulo `json`

**JSON** (JavaScript Object Notation) è un formato di dati semplice da leggere e scrivere per gli essere umani, ma anche facile da generare e processare per le macchine. Un JSON è costituito da due strutture: 
- una collezione di coppie nomi/valori
- una lista ordinata di valori.

In Python, il modulo `json` rende semplice analizzare un file JSON. Per caricare un file con estensione .json, utilizziamo il comando `json.load()`.

In [None]:
import jsoninsiemi

In [None]:
with open('data/billboard.json', 'r') as file:
    top10 = json.load(file)

In [None]:
top10

# Esercizi

Scrivi un programma che esegua le seguenti istruzioni:
- Crea una `lista` che contenga i primi dieci numeri interi a partire da `1`.
- Copia `lista` in `nuova_lista` ed agggiungi `11` alla fine .
- Assegna `-1` al secondo elemento di `nuova_lista`.
- Assegna a `selezione` gli elementi di `nuova_lista` dal terzo al settimo.
- Aggiunge a `selezione` il numero `13` alla fine.
- Stampa `lista`, `nuova_lista` e `selezione` e i loro `id`.

Genera una lista contenente soltanto i nomi delle capitali dal seguente dizionario: `{'Italia': 'Roma', 'Francia': 'Parigi', 'Spagna': 'Madrid'}`

Definire due variabili che contengano gli insiemi dati da:
- I capoluoghi di Provincia che iniziano per B: (Bari, Belluno, Benevento, Bergamo, Biella, Bologna, Bolzano, Brescia, Brindisi).
- I capoluoghi di Regione.

Trovare e stampare:
- L'intersezione dei due insiemi (Capoluoghi di Regione che iniziano per B)
- La differenza del primo meno il secondo (Capoluoghi di Provincia che iniziano per B e non sono Capoluoghi di Regione)
- La differenza del secondo meno il primo (Capoluoghi di Regione che non iniziano per B)

Generare:

- una lista di tuple ognuna del tipo: `(nome_film, numero_film, numero_libro_tratto)`.
- un dizionari con chiavi `numero_film` e valori `nome_film`.

Per i film della saga degli Hunger Games.

Scrivere un programma che 
- crea un file dal nome `incipit.txt`.
- scrive sul file le prima terzina dell'Inferno (un verso per riga).
- legge le righe del file appena scritto una alla volta e le aggiunge a una lista vuota. 

Creare un file .json contenente i dati riguardanti tre titoli azionari a scelta: per ognuno di questi indicaare nome, simbolo, industria ed ultimo prezzo di chiusura. Salva il file con il nome `stocks.json` usando il metodo `json.dump(json, file)`.