# Gestione file e directory (2^ parte)
<sub>(https://realpython.com )</sub>

### Filename Pattern Matching
Quando si esplora il contenuto di una directory spesso lo si fa cercando uno specifico nome di file. In Python esistono delle funzioni e dei metodi proprio per questo scopo.

- `endswith()` e `startswith()` sono metodi per le stringhe
- `fnmatch.fnmatch()`
- `glob.glob()`
- `pathlib.Path.glob()`

In [None]:
# metodo endwith()
import os
for f_name in os.listdir('tmp'):
    if f_name.endswith('.txt'):
        print(f_name)

La funzione `fnmatch.fnmatch()` fornisce funzionalità più avanzate per il _matching_ quali per esempio l'uso di _wildcard_ come **\*** e **?**

In [None]:
import os
import fnmatch
for file_name in os.listdir('tmp'):
     if fnmatch.fnmatch(file_name, '*.txt'):
         print(file_name)

Un altro modulo utile al _filename pattern matching_ è il `.glob()` .  
(in sistemi _UNIX-like_ _globbing_ è la lista con i nomi contenenti _wildcard_ come **?** e **\*** ) .

In [None]:
import glob
glob.glob('./tmp/*.py')

`glob` rende semplice anche cercare ricorsivamente dei nomi di file

In [None]:
import glob
for file in glob.iglob('**/*.py', recursive=True):
    print(file)

`.iglob` come è facile immaginare ritorna un _iteratore_

Infine vediamo come eseguire la ricerca di nomi di file con il modulo `pathlib` il quale contiene dei metodi simili a quelli visti negli esempi sopra

In [None]:
from pathlib import Path
p = Path('.')
for name in p.glob('./tmp/*.p*'):
     print(name)

#### Ricapitolando

quanto visto fino ad ora:

**Funzione** | **Descrizione**
:--- | :---
**`startswith()`** | Verifica se una stringa inizia con un pattern specificato e ritorna True o False
**`endswith()`** | Verifica se una stringa finisce con un pattern specificato e ritorna True o False
**`fnmatch.fnmatch(filename, pattern)`** | Verifica se un nome file corrisponde al _pattern_ e ritorna True o False
**`glob.glob()`** | Ritorna una lista di nomi che corrispondono al _pattern_
**`pathlib.Path.glob()`** | Cerca le corrispondenze nei nomi di file e ritorna un oggetto corrispondente

***

### Scorrere Directory ed elaborare File

Un'operazione abbastanza comune sulle directory e sui file è quella di scorrere lungo un albero di directory per fare determinate operazioni sui file. Andiamo a conoscere ancora un'altra funzione del modulo `os` la `os.walk()` . Questa permette di scorrere dall'alto verso il basso un albero di directory e viceversa; vediamo alcuni esempi:

In [None]:
import os
for dirpath, dirnames, files in os.walk('.'): # per default os.walk scorre top-down
    print(f'\n--- Found directory: {dirpath} ---')
    for file_name in files:
        print(file_name)

`os.walk()` ritorna 3 valori:

- il nome della directory corrente
- una lista delle directory sotto la corrente
- una lista dei file nella directory corrente

Per scorrere l'albero in senso _bottom-up_ si usa la sintassi:  
```os.walk('.', topdown=False)```

***

### Cancellare File e Directory

E' possibile fare pulizia(cancellare) file e directory utilizzando i metodi forniti da `os`, `shutil` e `pathlib`.  

**Cancellare file**  
Per cancellare un file possiamo usare `pathlib.Path.unlink()`, `os.remove()`, o `os.unlink()`.

(os.remove() e os.unlink() semanticamente sono uguali).

In [None]:
import os

data_file = 'to_be_deleted.txt'
try:
 os.remove(data_file)
except FileNotFoundError :
    print('File non trovato. CREARE PRIMA')
#p = Path('./to_be_deleted.txt')
#p.touch()

un altro esempio

In [None]:
import os

data_file = 'to_be_deleted.txt'

# If the file exists, delete it
if os.path.isfile(data_file):
    os.remove(data_file)
else:
    print(f'Errore: {data_file} il file non esiste. CREARE PRIMA')

Infine vediamo come cancellare il file con `pathlib.Path.unlink()`

In [None]:
from pathlib import Path

data_file = Path('./to_be_deleted.txt')

try:
    data_file.unlink()
except FileNotFoundError as e:
    print(f'Error: {data_file} : {e.strerror}')
    print('CREARE PRIMA')

Vediamo ora come **cancellare le directory** con tre diverse funzioni:  

- **`os.rmdir()`**
- **`pathlib.Path.rmdir()`**
- **`shutil.rmtree()`**

Per cancellare una singola directory, purchè vuota, usare `os.rmdir()` o `pathlib.rmdir()`

In [None]:
import os
os.mkdir('Folder_da_cancellare') # necessaria per l'esempio successivo

In [None]:
import os

trash_dir = './Folder_da_cancellare'

try:
    os.rmdir(trash_dir)
except OSError as e:
    print(f'Error: {trash_dir} : {e.strerror}')

in alternativa si può usare `pathlib.rmdir()`

In [None]:
from pathlib import Path

trash_dir = Path('./Folder_da_cancellare')

try:
    trash_dir.rmdir()
except OSError as e:
    print(f'Error: {trash_dir} : {e.strerror}')

Come **cancellare un intero albero di directory** anche se contentente ancora files

In [None]:
from pathlib import Path

Path('Folder_da_cancellare/file.txt').touch() #necessario per il succ. esempio

In [None]:
import shutil

trash_dir = './Folder_da_cancellare'

try:
    shutil.rmtree(trash_dir)
except OSError as e:
    print(f'Error: {trash_dir} : {e.strerror}')

Ci sono a volte situazioni dove si vuole cancellare delle dir in modo ricorsivo. Questo lo si può fare utilizzando uno dei metodi visti prima in congiunzione con la funzione `os.walk()`:

In [None]:
import os

try:
    os.mkdir('Folder_da_cancellare') # necessaria per l'esempio successivo
except FileExistsError :
    print('Dir esistente')
os.makedirs('Folder_da_cancellare/tmp1/tmp2/tmp3') # necessaria per l'esempio successivo

In [None]:
import os

for dirpath, dirnames, files in os.walk('./Folder_da_cancellare', topdown=False):
    try:
        os.rmdir(dirpath)
    except OSError as ex:
        pass

#### Ricapitolando

le ultime funzioni incontrate:

**Funzione** | **Descrizione**
:--- | :---
**`os.remove()`** | Cancella un file ma non cancella directory
**`os.unlink()`** | è identica a os.remove(). Cancella solo singoli file
**`pathlib.Path.unlink()`** | Cancella un file ma non cancella directory
**`os.rmdir()`** | Cancella una directory vuota
**`pathlib.Path.rmdir()`** | Cancella una directory vuota
**`shutil.rmtree()`** | Cancella un intero albero directory e può essere usata per cancellare anche directory non vuote


***

### Copiare, Spostare e rinominare file e directory
Python con le sue "_batterie incluse_" dispone del modulo `shutil`. **shutil** sta per "shell utilities". Questo modulo supporta un numero di operazioni di alto livello su file e directory: copia, archiviazione, e come già visto cancellazione.

Come **copiare** i file

In [None]:
import shutil

src = 'tmp/Hello.txt'
dst = 'tmp/Untitled Folder'
shutil.copy(src, dst)

**`shutil.copy`** copia un singolo file ed i suoi permessi ma non gli altri metadati.
Utilizzando la funzione **`.copy2()`** si possono anche conservare i metadati del file copiato, quali _last access time_, _permission bits_, _last modification time_, e altri _flags_

Come **copiare directory**  
Mentre con `shutil.copy()` copiamo solo un singolo file, con **`shutil.copytree(src, dst)`** possiamo copiare una intera directory ed anche il suo contenuto.

In [None]:
import shutil
shutil.copytree('folder_2', 'folder_3')

`shutil.copytree()` è un ottimo sistema per fare un backup dei file

Come **spostare** file e/o directory  
Per spostare un singolo file o un'intera directory in un'altra posizionde del file system:

In [None]:
import shutil
shutil.move('folder_1/', 'folder_backup/')

Come **rinominare** file e directory
`os.rename()` svolge proprio questo compito:
```
import os
os.rename('test.txt', 'prova.txt')
```

oppure con il modulo `pathlib`:
```
from pathlib import Path
data_file = Path('data_01.txt')
data_file.rename('data.txt')
```

***

### Archiviare(comprimere) file
Gli archivi compressi, comunemente conosciuti come (.zip o .tar su sistemi Linux/Unix) sono un modo molto conveniente di archiviare più file.  
Python permette di gestire(creare, leggere, scrivere) questi tipi di archivi con il modulo **`zipfile`**.  
Vediamo come:

**Leggere ZIP Files**

In [None]:
import zipfile
with zipfile.ZipFile('file_esempio/libri.zip', 'r') as zipobj:
    print(zipobj.namelist())

La funzione `zipfile.ZipFile` ritorna un oggetto di tipo `ZipFile` che può successivamente essere utilizzato con le diverse funzioni fornite dal modulo. Per esempio la `.namelist()` ritorna una lista di nome dei file contenuti nell'archivio.  
Se volessi conoscere le informazioni sui file potremmo chiamare la `.getinfo()`, oppure la `.file_size()` per avere la dimensione originale in _bytes_ .  


In [None]:
import zipfile
with zipfile.ZipFile('file_esempio/libri.zip', 'r') as zipobj:
    cheat_info = zipobj.getinfo('libri/python-cheat-sheet.pdf')
    #zipobj.getinfo('libri/python-cheat-sheet.pdf')
    print(cheat_info.file_size) 

In [None]:
cheat_info.date_time #data ultima modifica

In [None]:
cheat_info.compress_size #dimensione del file dopo compressione

In [None]:
cheat_info.filename # mostra il path completo del file

**Estrarre archivi** _zippati_  
**`.extract()`** estrae un file  
**`.extractall()`** estrae più file  
Entrambe i metodi decomprimono ed estraggono i file nella directory corrente; comunque entrambi prendono un _path_ come parametro opzionale per specificare un'altra dir(se non esiste, viene creata).

In [None]:
import os
import zipfile

os.chdir('file_esempio')

data_zip = zipfile.ZipFile('libri.zip', 'r')

#Estraggo un singolo file
data_zip.extract('python-cheat-sheet.pdf')
print(os.listdir('.'))

#estraggo tutti i file in una dir diversa
data_zip.extractall(path='estratti/')
print(os.listdir('.'))

print(os.listdir('estratti/'))

data_zip.close()

Se il file archivio è protetto da password allora possiamo passare alla funzione `.extractall()` un secondo parametro  
```
pwd_zip.extractall(path='estratti/', pwd='indovina')
```

Come **creare archivi** _zippati_  
Per creare un archivio compresso ".zip" è sufficiente aprire un oggetto ZipFile in modalità`(w)` ed aggiungerci tutti i file che si vuole archiviare.

In [None]:
import zipfile
import os

os.chdir('file_esempio')

da_zippare = ['Do_androids_dream_of_electric_sheep.pdf', 'La_Svastica_Sul_Sole.pdf']
with zipfile.ZipFile('new.zip', 'w') as new_zip:
     for name in da_zippare:
         new_zip.write(name)

Se volessimo aggiungere nuovi file all'appena creato 'new.zip' dovremmo aprirlo in modalità `(a)`
```
with zipfile.ZipFile('new.zip', 'a') as new_zip:
     new_zip.write('starwars.txt')
     new_zip.write('lafondazione.txt')
```

Solo un breve accenno agli archivi `.tar` che possono essere manipolati con modalità simili a quanto visto per gli "zip" ma richiamando il modulo **`tarfile`**  
```
import tarfile

with tarfile.open('example.tar', 'r') as tar_file:
    print(tar_file.getnames())
```

***

### Leggere File
Python supporta la lettura di dati da più file contemporaneamente attraverso il modulo `fileinput`.  

Questo modulo consente di _ciclare_ nel contenuto di uno o più file di testo facilmente e rapidamente. Di seguito un esempio di come fare:

In [None]:
#
# Per eseguirlo aprire un terminale
# e lanciare il programma prova.py con i seguenti argomenti:
# 
#       $ python3 prova.py primo.txt secondo.txt
#
import fileinput
import sys

files = fileinput.input()

for line in files:
    if fileinput.isfirstline():
        print(f"\n--- Leggo da {fileinput.filename()} ---")
    print(' -> ' + line, end='')
print()

Ma guardate come è più semplice ed elegante leggere file multipli con il modulo `pathlib.Path`

In [None]:
from pathlib import Path
contenuto = [] #inizializzo una lista vuota

for fname in Path('esempi').rglob('*.py'):
    with open(fname, 'r') as f:
        contenuto.append(f.read())
print(contenuto)



### File temporanei

Esiste anche il modulo `tempfile` per la creazione e gestione di file temporanei. Vedi la [documentazione ufficiale](https://docs.python.org/3.7/library/tempfile.html) 

***

### PULIZIA DIRS TEMPORANEE CREATE

In [None]:
import os

try:
    os.removedirs('./prima')
except FileNotFoundError as exc:
    print('Dir non esistente')
    
try:
    os.removedirs('./quarta/quinta/sesta')
except FileNotFoundError as exc:
    print('Dir non esistente')
    
try:
    os.removedirs('folder_3')
except FileNotFoundError as exc:
    print('Dir non esistente')