# Manipolazione files
## Gestione dei percorsi (`path`) con `pathlib`

Importiamo l'oggetto `Path` dal modulo `pathlib`

In [76]:
from pathlib import Path

Proviamo a vedere le funzionalità dell'oggetto `Path`

In [77]:
help(Path)

Help on class Path in module pathlib:

class Path(PurePath)
 |  Path(*args, **kwargs)
 |
 |  PurePath subclass that can make system calls.
 |
 |  Path represents a filesystem path but unlike PurePath, also offers
 |  methods to do system calls on path objects. Depending on your system,
 |  instantiating a Path will return either a PosixPath or a WindowsPath
 |  object. You can also instantiate a PosixPath or WindowsPath directly,
 |  but cannot instantiate a WindowsPath on a POSIX system or vice versa.
 |
 |  Method resolution order:
 |      Path
 |      PurePath
 |      builtins.object
 |
 |  Methods defined here:
 |
 |  __enter__(self)
 |
 |  __exit__(self, t, v, tb)
 |
 |  __init__(self, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |
 |  absolute(self)
 |      Return an absolute version of this path by prepending the current
 |      working directory. No normalization or symlink resolution is performed.
 |
 |      Use resolve() to get the 

Possiamo, per esempio, ottenere il percorso corrente `cwd`: current working directory

In [78]:
Path.cwd()

PosixPath('/workspaces/2024_25-OC-INFO-LIBE/Manipolazione-Files')

Creiamo un oggetto `Path` per la directory `data`.

`./` indica la directory corrente


In [79]:
data_path=Path('./data/') 
print(f"Percorso assoluto: {data_path.absolute()}")
print(f"Lista dei file: {list(data_path.iterdir())}")

Percorso assoluto: /workspaces/2024_25-OC-INFO-LIBE/Manipolazione-Files/data
Lista dei file: [PosixPath('data/file.csv'), PosixPath('data/file.txt')]


Creiamo un percorso sul file `testo.txt` contenuto della directory `data`.
Ci basta concatenare il nostro percorso `data_path` con il nome del file `testo.txt`

In [80]:
file = data_path / 'file.txt'
print(f"Percorso assoluto: {file.absolute()}")
print(f"Esiste? {file.exists()}")
print(f"È un file? {file.is_file()}")
print(f"È una cartella? {file.is_dir()}")
print(f"Parent assoluto: {file.parent.absolute()}")
print(f"Parent relativo: {file.parent}")
print(f"Nome del file: {file.name}")
print(f"Estensione del file: {file.suffix}")
print(f"Cartella del file: {file.parent}")
print(f"Nome del file senza estensione: {file.stem}")

Percorso assoluto: /workspaces/2024_25-OC-INFO-LIBE/Manipolazione-Files/data/file.txt
Esiste? True
È un file? True
È una cartella? False
Parent assoluto: /workspaces/2024_25-OC-INFO-LIBE/Manipolazione-Files/data
Parent relativo: data
Nome del file: file.txt
Estensione del file: .txt
Cartella del file: data
Nome del file senza estensione: file


Per aprire il file in scrittura:

In [81]:
with file.open('w') as f:
    f.write("Hello, World!\n") # Utilizzimao il carattere di escape \n per andare a capo
    f.write("Seconda riga\n")
    

Per aprire il file in lettura:

In [82]:
with file.open( 'r') as f:
    print(f.read())

Hello, World!
Seconda riga



Opppure leggiamo il testo direttamente 

In [83]:
print(file.read_text())

Hello, World!
Seconda riga



In [84]:
file.write_text("Nuovo contenuto\nSeconda riga\n")
print(file.read_text())

Nuovo contenuto
Seconda riga



In [85]:
for line in file.read_text().split('\n'):
    print(line)

Nuovo contenuto
Seconda riga



In [86]:
with file.open('r') as f:
    lines=f.readlines()

print(lines)
print(lines[0])

['Nuovo contenuto\n', 'Seconda riga\n']
Nuovo contenuto



In [87]:
import pandas as pd

In [88]:
csv= data_path / 'file.csv'

df= pd.DataFrame({'a':[1,2,3], 'b':[4,5,6]})
df.to_csv(csv, index=False)

In [92]:
df1=pd.read_csv(csv)
df1

Unnamed: 0,a,b
0,1,4
1,2,5
2,3,6


In [90]:
import pickle as pkl

pkl_file= data_path / 'file.pkl'
df= pd.DataFrame({'a':[1,2,3], 'b':[4,5,6]})
df.to_pickle(pkl_file)


In [91]:
df1=pd.read_pickle(pkl_file)
df1

Unnamed: 0,a,b
0,1,4
1,2,5
2,3,6


In [101]:
import yaml

yaml_file= data_path / 'file.yaml'
df= {'a':[1,2,3, {'nome': "Nome", 'cognome': "Cognome"}], 'b':[4,5,6]}
with yaml_file.open('w') as f:
    yaml.dump(df, f)
yaml_file

PosixPath('data/file.yaml')

In [102]:
yaml_file.read_text()

'a:\n- 1\n- 2\n- 3\n- cognome: Cognome\n  nome: Nome\nb:\n- 4\n- 5\n- 6\n'