<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

* lire et écrire un fichier est très facile en Python
* ouvrir un fichier pour créer un objet "fichier"
* `open('mon_fichier.txt', 'r')`
  * `'r'` ouvre le fichier en lecture (défaut),
  * `‘w’` en écriture,
  * `‘a’` en écriture à la suite (*append*),

### utilisez un `with`

* prenez l'habitude de **toujours utiliser un context manager** 

In [None]:
# on n'a pas encore étudié l'instruction with
# mais je vous conseille de toujours procéder comme ceci

# avec with on n'a pas besoin de fermer e fichier
with open('temporaire.txt', 'w') as f:
    for i in 10, 20, 30:
        f.write(f'{i} {i**2}\n')

In [None]:
!cat temporaire.txt

# lecture

* l'objet fichier est un **itérable** lui-même
* on peut faire un `for` dessus

In [None]:
# lire un fichier texte ligne par ligne
# on ne peut pas faire plus compact et lisible !

# remarquez aussi:
# open() sans le mode ⇔ open('r')

with open('temporaire.txt') as f:
    for line in f:
        print(f"-- {line}", end='') 

# fichiers texte ou binaire

* ajouter `'b'` au mode pour ouvrir **en binaire**
  * pas de décodage
  * travaille alors à base de **`bytes`** et non de `str`

In [None]:
# j'ai besoin d'un objet bytes
# rappelez vous la section sur Unicode
text = "noël en été\n"
binaire = text.encode(encoding="utf-8")

binaire

In [None]:
# remarquez le 'b' dans le mode d'ouverture

with open('temporaire.bin', 'wb') as out_file:
    # je peux du coup écrire un objet bytes
    out_file.write(binaire)

In [None]:
!cat temporaire.bin

In [None]:
# pareil en lecture, le mode avec un 'b'
# va faire que read() retourne un objet bytes

with open('temporaire.bin', 'rb') as in_file:
    binaire2 = in_file.read()

In [None]:
# et donc on retombe bien sur nos pieds
binaire2 == binaire

# le module `pathlib`

## objectifs

* simplifier la gestion des noms de fichier 
* pour rendre le code plus concis
* et donc plus lisible
* sous-titre: *object-oriented filesystem paths*

## présentation du module

* voir [documentation complète](https://docs.python.org/3/library/pathlib.html)
* et notamment un diagramme des classes 
  * `purepath` : manipulation sans le filesystem
  * `path` : par exemple pour globbing (résoudre '*')
* dispo dans librairie standard depuis python-3.4
  * et aussi dans pypi, donc pour 2.7
* ne gère pas
  * les objets fichier (s'arrête à `open`)
  * les urls

## un exemple

* orienté objet
* le sujet devient plus visible
* **NB**: un objet `Path` est immutable

In [None]:
# avec os.path
import os.path

config_dir = "/etc/apache2"
if os.path.isdir(config_dir):
    print("OUI")

In [None]:
# avec pathlib
from pathlib import Path

config_path = Path("/etc/apache2")
if config_path.is_dir():
    print("OUI")

## l'opérateur `/`

* la fin de `os.path.join`

In [None]:
# un chemin absolu
prefix = Path("/etc")
# le chemin absolu du directory courant
dot = Path.cwd()
# ou du homedir
home = Path.home()
# un nom de ficher
filename = Path("apache")

# Path / Path -> Path bien sûr
type(prefix / filename)

In [None]:
# Path / str -> Path
type(prefix / "apache2")

In [None]:
# str / Path -> Path
type("/etc" / Path("apache2"))

In [None]:
# On peut chainer le tout sans parenthèse 
# si le premier (à gauche) est un Path

type(prefix / "apache2" / "modules.d")

In [None]:
# mais bien sûr str / str -> TypeError
try:
    "/etc" / "apache2"
except Exception as e:
    print("OOPS", e)

## décorticage

* remplacement de `basename` et `dirname` et similaires

In [None]:
# un chemin vers le directory 'filepath-globbing' dans ce répertoire

absolute = Path.cwd()
relative = Path(".")

globbing = absolute / "filepath-globbing"

# retrouver le string
str(globbing)

In [None]:
globbing.parts

In [None]:
# basename
globbing.name

In [None]:
# dirname
globbing.parent

In [None]:
list(globbing.parents)

In [None]:
# parce qu'on l'a construit à partir de cwd() qui est absolu
globbing.is_absolute()

In [None]:
Path("globbing").is_absolute()

In [None]:
# ancien abspath()
globbing.resolve()

In [None]:
list(globbing.parents)[-2]

In [None]:
# ancien relpath()
# juste pour rendre le notebook utilisable partout (windows?)
level1 = list(globbing.parents)[-2]
print("level1", level1)
# chez moi level1 vaut "/Users"
globbing.relative_to(level1)

## pattern-matching

In [None]:
# est-ce que le nom de mon objet Path 
# a une certaine forme ?

globbing.match("**/slides/*")

In [None]:
globbing.match("**/*globbing*")

## pattern-matching

recherche dans un répertoire

In [None]:
# un répertoire qui contient quelques fichiers
!ls filepath-globbing/**

In [None]:
# à présent c'est plus intéressant
# avec des chemins relatifs
globbing = Path(".") / "filepath-globbing"

list(globbing.glob("*"))

In [None]:
list(globbing.glob("*[0-9]"))

In [None]:
list(globbing.glob("**"))

In [None]:
list(globbing.glob("**/*[0-9]"))

In [None]:
str(globbing)

## voir aussi

* `exists`, `is_dir`, `is_file` ...
* `stat` / `lstat` / `owner` pour les détails comme taille, permissions...
* `rename`, `unlink`, `rmdir` 
* `iterdir` (`os.listdir`, mais pas `os.walk`)
* `glob` - `rglob` 
* `open` / `{read,write}_{text_bytes}` / : wrappers 
* à nouveau: [documentation complète](https://docs.python.org/3/library/pathlib.html)

## remplacement pour

* le plus gros de `os.path`
* certaines choses de `os`
* `glob.glob`
* `fnmatch`
* contient un wrapper pour `open`