# Python - Lezione 6: Gestione dei file
Gestire i file di testo in Python è semplice e basta utilizzare la funziona *built-in* `open` la quale (per file in lettura) richiede solo un parametro che rappresenta il *path* del file da aprire. Se il file non esiste verrà generata un'eccezione.

In [1]:
path = "esempio.txt"

In [2]:
f = open(path)

Una volta aperto il file, possiamo usare il `for` (ricordiamo in Python questo è un *for-each*) che ci darà, ad ogni iterazione, una riga del file.

In [3]:
for riga in f:
    print(riga)

Id,nome,cognome,punti

1,andrea,rossi,0

2,giorgio,verdi,23

3,gino,fumagalli,28

5,andrea,marchese,12

4,giovanni,parenti,12



**Attenzione** dall'output si nota come il carattere *new line* presente alla fine di una riga del file **non** viene eliminato durante la lettura. Per questo motivo l'ouput sopra contiente due caratteri di *new line*: uno presente nel file e uno inserito dalla funzione `print`.

Terminato l'utilizzo del file (sia in lettura che in scrittura), è bene sempre procedere alla chiusra del file utilizzato, in Python questo avviene con la funzione `close` che accetta il *descrittore di file* restituito dalla funzione `open`.

In [4]:
f.close()

Per aprire un file in lettura bisogna usare un secondo parametro della funzione `open` che è una stringa, per la scrittura questa stringa deve contere il carattere `w` (*write*). È anche possibile usare il secondo parametro per apire file in lettura utilizzando una stringa con il carattere `r` (*read*).

Per scrivere una stringa su un file di testo aperto in scrittura, si usa il metodo `write` del descrittore di file restituito da `open`. **Attenzione** che in questo caso `write` **non** inserisce automaticamente un *new line* come `print`.

Il codice sotto crea una copia esatta del file `esempio.txt` chiamando questa copia `scrittura.csv`.

In [6]:
f = open("esempio.txt", "r") # apre 'esempio.txt' in lettura (r -> read)
out_path = "scrittura.csv"
fo = open(out_path, "w") # apre 'scrittura.csv' in scrittura (w -> write)
for riga in f:
    fo.write(riga)
# Sempre chiudere i file
fo.close()
f.close()

## Processing
Quando si lavora con i file (ma non solo) è comodo avere delle funzioni o dei metodi che ci permettano di fare alcune operazioni molto frequenti.

### Eliminare caratteri spazio
Il metodo `strip()` delle stringhe Python permette di eliminare tutti i caratteri spazio (compresi tab, new line, ...) che si trovano all'inizio e alla fine della stringa. L'esempio sotto mostra il contenuto del file nel path memorizzato nella variabile `path` (vedi sopra) con un sola *new line* (quello inserito da `print`). Si noti la differenza con l'output visto in precedenza.

In [7]:
f = open(path)
for riga in f:
    print(riga.strip())
f.close()

Id,nome,cognome,punti
1,andrea,rossi,0
2,giorgio,verdi,23
3,gino,fumagalli,28
5,andrea,marchese,12
4,giovanni,parenti,12


In [8]:
# Altro esempio di strip
s = "   del testo\t\n"
print(s, len(s))
print(s.strip(), len(s.strip()))

   del testo	
 14
del testo 9


### Dividere una stringa
Spesso serve dividere una stringa in parti utilizzando un qualche *separatore*, a questo scopo le stringhe Python offrono il metodo `strip` che accetta come parametro la **stringa** (ricordiamo che in Python non esistono i *char*) che sarà usata come sepearatore. Nell'esempio sotto il separatore è il carattere `:` (due punti).

In [9]:
s2 = "1:antony:cuomo"

In [10]:
print(s2.split(":"))

['1', 'antony', 'cuomo']


**Attenzione** il metodo `split` restituisce una *lista di stringhe* con un elemento nella lista per ogni elemento separato nella stringa.

Utilizzando `split` possiamo dividere i vari *campi* presente nel file di esempio che stiamo utilizzando dove i campi sono separati da una virgola.

In [11]:
matrice = []
f = open(path)
for riga in f:
    lista = riga.strip().split(",")
    matrice.append(lista)
f.close()

In [12]:
print(matrice)

[['Id', 'nome', 'cognome', 'punti'], ['1', 'andrea', 'rossi', '0'], ['2', 'giorgio', 'verdi', '23'], ['3', 'gino', 'fumagalli', '28'], ['5', 'andrea', 'marchese', '12'], ['4', 'giovanni', 'parenti', '12']]


Nell'esempio sopra abbiamo usato il metodo `append` delle liste che **modifica la lista** aggiungendo quello che viene passato come un nuovo elemento nella lista. L'esempio sopra crea una *lista di liste* che possiamo vedere utilizzando il `for`.

In [33]:
for lista in matrice:
    print(lista)

['Id', 'nome', 'cognome', 'punti']
['1', 'andrea', 'rossi', '0']
['2', 'giorgio', 'verdi', '23']
['3', 'gino', 'fumagalli', '28']
['5', 'andrea', 'marchese', '12']
['4', 'giovanni', 'parenti', '12']


Questa *lista di lista* può essere utilizzata quasi come un array bidimensionale: con due indici possiamo accedere ad uno specifico elemento.

In [13]:
matrice[0][0]

'Id'

In [14]:
matrice[1][1]

'andrea'

In [15]:
matrice[2][2]

'verdi'

Tuttavia usando un solo indice otteniamo un'intera "riga" della nostra "matrice".

In [16]:
print(matrice[2])

['2', 'giorgio', 'verdi', '23']


Quando usiamo due indici, il secondo indica l'elemento all'interno della lista selezionata dal primo indice.

In [17]:
['2', 'giorgio', 'verdi', '23'][2]

'verdi'

In [18]:
print(matrice[0][1])

nome


In [19]:
unaLista = matrice[2]
print(unaLista)

['2', 'giorgio', 'verdi', '23']


### L'inverso di `split`
Le stringhe Python anche un ulteriore metodo molto utile che è chiamato `join` e che si aspetta come input una stringa. Questo metodo crea e restituisce una nuova stringa che è la concatenazione degli elementi della lista (che perciò devono essere stringhe) separata dal contenuto della stringa su cui il metodo viene chiamato.

Nel seguente esempio, gli elementi di `unaLista` vengono concatenati separandoli da un carattere `TAB`

In [20]:
out = "\t".join(unaLista)
print(out)

2	giorgio	verdi	23


In questo altro esempio il separatore è la stringa ` <-> `

In [21]:
out = " <-> ".join(unaLista)
print(out)

2 <-> giorgio <-> verdi <-> 23


Facendo agire prima `join` e poi `split` si vede come le due sono funzioni "inverse" nel senso che una fa il contrario dell'altra (ovviamente con gli opportuni parametri)

In [22]:
",".join(unaLista).split(",")

['2', 'giorgio', 'verdi', '23']