# Gestione file e directory (1^ parte)
<sub>(https://realpython.com )</sub>

### Leggere e scrivere su file

Scrivere e leggere dati su file in Python è abbastanza semplice. Prima di tutto bisogna sempre aprire i file con la modalità appropriata all'operazione da compiere.  

Di seguito un esempio di come aprire un file e leggere il suo contenuto con il costrutto **`with open(…) as …`**

In [1]:
with open('file_esempio/testo.txt', 'r') as f:
    data = f.read()
print(data)

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.


La funzione **`open()`** prende come argomenti il nome del file e la modalità. **`r`** apre il file in sola _lettura_ . Se volessimo aprirlo in scrittura dovremmo usare la modalità **`w`** 

In [1]:
with open('file_esempio/nuovo_testo.txt', 'w') as f:
    data = 'lucatortuga.com è il mio blog'
    f.write(data)
with open('file_esempio/nuovo_testo.txt', 'r') as f:
    data = f.read()
print(data)

lucatortuga.com è il mio blog


Negli esempi appena visti la `open()` apre o legge il file creando un oggetto `f` .

Altre modalità utilizzabili sono:

- `r` Apre il file di testo in lettura.  L'operazione parte dall'inizio del file.
- `w` Azzera il contenuto del file se esiste, oppure crea il file di testo in scrittura. L'operazione parte dall'inizio del file.
- `a` Apre il file in scrittura. Il file è creato se non esiste.  L'operazione parte dalla fine del file. Le successive scritture saranno sempre appese alla attuale fine file, a prescindere da qualsiasi altra operazione di puntamento(`fseek()` o simili).
- `r+` Apre il file di testo in lettura e scrittura.  L'operazione parte dall'inizio del file.
- `w+` Apre il file di testo in lettura e scrittura.  Il file è creato se non esiste, altrimenti viene azzerato.  L'operazione parte dall'inizio del file.
- `a+` Apre il file in lettura e scrittura. Il file è creato se non esiste.  L'operazione parte dalla fine del file. Le successive scritture saranno sempre appese alla attuale fine file, a prescindere da qualsiasi altra operazione di puntamento(`fseek()` o simili).

![modes](img/file_modes.png)

Se non si usa il construtto `with` è bene allora richiamare al termine delle operazioni sul file la funzione **`f.close()`**; questa chiude il file ed immediatamente libera tutte le risorse di sistema utilizzate da quest'ultimo.

***

### Ottenere l'elenco di una dir

Al fine di ottenere l'elenco del contenuto di una directory ci serviamo del modulo **`os`** che come vedremo è uno dei più utili per interagire con il nostro _file system_ . Questo modulo ha tra le sue funzioni la **`os.scandir()`** che ritorna un oggetto _iterable_ che punta agli indici degli elementi della directory. Vediamo un esempio  

- Elenco delle Subdirectories

In [1]:
import os
indici = os.scandir('./img')
type(indici)

posix.ScandirIterator

A questo punto è possibile iterare per vedere il contenuto della directory

In [4]:
import os

with os.scandir('./img') as indici:
    for idx in indici:
        print(idx.name)

slicing_4.png
slicing_2.png
.DS_Store
04_plot_overview1.svg
slicing_3.png
slicing_1.png
03_subset_columns.svg
05_newcolumn_1.svg
slicing_0.png
08_concat_row1.svg
file_modes.png
03_subset_rows.svg
03_subset_columns_rows1.svg


Qui sopra `os.scandir()` è stata usata insieme al costrutto `with ... as:` ; sotto invece è stata usata all'interno di una _list comprehension_ con ovviamente lo stesso risultato.

In [5]:
lista = [idx for idx in os.scandir('./img')]
print(lista)
print('-----')
for i in range(len(lista)): print(lista[i].name)    

[<DirEntry 'slicing_4.png'>, <DirEntry 'slicing_2.png'>, <DirEntry '.DS_Store'>, <DirEntry '04_plot_overview1.svg'>, <DirEntry 'slicing_3.png'>, <DirEntry 'slicing_1.png'>, <DirEntry '03_subset_columns.svg'>, <DirEntry '05_newcolumn_1.svg'>, <DirEntry 'slicing_0.png'>, <DirEntry '08_concat_row1.svg'>, <DirEntry 'file_modes.png'>, <DirEntry '03_subset_rows.svg'>, <DirEntry '03_subset_columns_rows1.svg'>]
-----
slicing_4.png
slicing_2.png
.DS_Store
04_plot_overview1.svg
slicing_3.png
slicing_1.png
03_subset_columns.svg
05_newcolumn_1.svg
slicing_0.png
08_concat_row1.svg
file_modes.png
03_subset_rows.svg
03_subset_columns_rows1.svg


### `pathlib`
Un altro modo di ottenere l'elenco della directory. 

In [2]:
from pathlib import Path

indici = Path('./img') #crea un oggetto PosixPATH o WindowsPATH(dir(indici)

for idx in indici.iterdir():
    print(idx.name)

slicing_4.png
slicing_2.png
.DS_Store
slicing_3.png
slicing_1.png
slicing_0.png
meme.jpg
file_modes.png


Gli oggetti restituiti dal **`Path`** sono _PosixPath_ o _WindowsPath_ a secondo del sistema operativo utilizzato.

Gli oggetti della `pathlib.Path()` hanno un metodo `.iterdir()` per creare un iteratore di tutti i file e directory contenuti. Ogni _item_ prodotto dal metodo contiene informazioni sul file o directory(nome, attributi).

Nell'esempio sopra si chiama la `pathlib.Path()` alla quale si passa come argomento un _path_ ad una directory (la mia _img_ ). Quindi si richiama il metodo `iterdir()` per ottenere la lista di tutti i file e subdirectory.

Il modulo `pathlib` offre molte funzioni per semplificare le più comuni operazioni sui path.
Un ulteriore beneficio è la riduzione del numero di moduli da importare per la manipolazione del file system.

Vediamo ancora qualche esempio

In [7]:
dir(Path)

['__bytes__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__fspath__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rtruediv__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '__truediv__',
 '_accessor',
 '_cached_cparts',
 '_closed',
 '_cparts',
 '_drv',
 '_format_parsed_parts',
 '_from_parsed_parts',
 '_from_parts',
 '_hash',
 '_init',
 '_make_child',
 '_make_child_relpath',
 '_opener',
 '_parse_args',
 '_parts',
 '_pparts',
 '_raise_closed',
 '_raw_open',
 '_root',
 '_str',
 'absolute',
 'anchor',
 'as_posix',
 'as_uri',
 'chmod',
 'cwd',
 'drive',
 'exists',
 'expanduser',
 'glob',
 'group',
 'home',
 'is_absolute',
 'is_block_device',
 'is_char_device',
 'is_dir',
 'is_fifo',
 'is_file',
 'is_mount',
 'is_reserved',
 'is_socket',
 

In [4]:
from pathlib import Path
path = Path.cwd()
print(path)
print((path / 'tmp').is_dir())
print((path / '1_0_Intro_OOP.ipynb').is_file())

/Users/luca/ownCloud/Seminario Python/DAY2
True
False


***

In Python ci sono diversi modi per ottenere lo stesso risultato, dipende molto dalle proprie abitudini di codifica, dal tipo di problema da risolvere, dal livello di conoscenze del linguaggio.  
Quanto visto sopra potrebbe essere fatto anche con il modulo `os.path`

In [9]:
import os

basepath = 'tmp/'
lista = [idx for idx in os.scandir('./tmp')]
for i in range(len(lista)):
    if os.path.isfile(os.path.join(basepath, lista[i].name)): 
        print(lista[i].name)

pluto.py
pippo.py
hello.txt


allo stesso modo cambiando `.isfile` con `isdir` andiamo a selezionare solo le directory

***

### Creare Directory
Entrambi i moduli `os` e `pathlib` hanno funzioni per creare le directory:

- `os.mkdir()` crea una singola dir
- `pathlib.Path.mkdir()` crea una o più dir
- `os.makedirs()` crea più dir

Vediamo qualche esempio

In [10]:
import os

os.mkdir('new_dir')

Se la dir esiste già l'interprete genera un errore _FileExistsError_

In [11]:
# Creare una dir con il modulo pathlib
from pathlib import Path

p = Path('dir_esempio')
p.mkdir()

Se la directory esiste e vogliamo evitare l'errore _FileExistsError_ possiamo usare il`try...except`

In [6]:
from pathlib import Path

p = Path('dir_esempio')
try:
    p.mkdir()
except FileExistsError as exc:
    print(exc)

[Errno 17] File exists: 'dir_esempio'


Per creare directory multiple:

In [8]:
import os

os.makedirs('./prima/seconda/terza')

FileExistsError: [Errno 17] File exists: './prima/seconda/terza'

In [9]:
import pathlib

p = pathlib.Path('./quarta/quinta/sesta')
p.mkdir(parents=True) #crea le  dir parenti necessarie a completare il path

***

***

### PULIZIA DIRS TEMPORANEE CREATE

In [16]:
import os
import shutil
try:
    #os.removedirs('./prima')
    shutil.rmtree('./prima')
except FileNotFoundError as exc:
    print('Dir non esistente')
    
try:
    os.removedirs('./quarta/quinta/sesta')
except FileNotFoundError as exc:
    print('Dir non esistente')
try:
    os.rmdir('./new_dir')
except FileNotFoundError as exc:
    print('Dir non esistente')
try:
    os.rmdir('./dir_esempio')
except FileNotFoundError as exc:
    print('Dir non esistente')

OSError: [Errno 66] Directory not empty: './prima'