<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

In [None]:
from plan import plan; plan("type", "fichier")

# les fichiers

* lire et écrire un fichier est très facile en Python
* ouvrir un fichier pour créer un objet "fichier"
* `open('mon_fichier.txt', 'r')`
  * `'r'` ouvre le fichier en lecture (défaut),
  * `‘w’` en écriture,
  * `‘a’` en écriture à la suite (*append*),

### utilisez un `with`

* prenez l'habitude de **toujours utiliser un context manager** 

In [None]:
# on n'a pas encore étudié l'instruction with
# mais je vous conseille de toujours procéder comme ceci

# avec with on n'a pas besoin de fermer e fichier
with open('data/tmp.txt', 'w') as f:
    for i in 10, 20, 30:
        f.write('{} {}\n'.format(i, i**2))

In [None]:
!cat data/tmp.txt

### sans context manager

In [None]:
# dans du (très) vieux code, vous pourrez voir

f = open('data/tmp.txt', 'w')
for i in 10, 20, 30:
    f.write('{} {}\n'.format(i, i**2))
f.close()

avantage du `with`: 

* pas besoin de fermer
* même en cas de gros souci (exception)

# lecture

* l'objet fichier est un **itérable** lui-même
* on peut faire un `for` dessus

In [None]:
# lire un fichier texte ligne par ligne
# on ne peut pas faire plus compact et lisible !

# remarquez aussi:
# open() sans le mode ⇔ open('r')

with open('data/tmp.txt') as f:
    for line in f:
        print(f"-- {line}", end='')

### lecture

* pour anticiper un peu:
  * si je voulais compter les lignes ?
* (on en reparlera au sujet des itérations)

In [None]:
# ne défigurez pas votre code juste pour 
# avoir un indice de boucle, utilisez enumerate
with open('data/tmp.txt') as f:
    for lineno, line in enumerate(f):
        print(f"{lineno+1}: {line}", end='')

### lecture par ligne

* `F.readlines()`
  * retourne un itérateur sur les lignes
  * équivalent  (mais moins performant) à itérer sur F directement

In [None]:
with open('data/tmp.txt', 'r') as in_file:
    for line in in_file.readlines():
        print(line, end='')

### autres méthodes sur les fichiers

* `F.read(size)` lit `size` octets
 * si `size` n’est pas spécifié, lit tout le fichier
 * retourne une chaîne de caractères `str` contenant ce qui a été lu
* `F.readline()` lit une seule ligne
  * la chaîne retournée contient `\n` à la fin
* `F.write('mon texte\n')`
  * écrit (ici une ligne) dans le fichier
* `F.writelines(sequence)`
  * écrit une séquence dans un fichier, le saut de ligne doit être explicite avec `\n` 

### autres méthodes sur les fichiers

* `F.flush()`
  * force l’écriture dans le fichier en vidant le cache
* `F.close()`
  * vide le cache et ferme le fichier
  * on utilise maintenant les context manager
* [le module `io` : https://docs.python.org/3/library/io.html](https://docs.python.org/3/library/io.html)

### fichiers texte - épilogue

un fichier sera en mode texte si le mode ne contient pas `b`:

* le décodage et l’encodage sont automatiques lorsqu’on lit ou écrit, resp, dans le fichier
* on obtiendra toujours un objet `str` en lecture et on ne pourra écrire qu’un objet `str`
* les fins de lignes sont automatiquement converties en '\n' pour être indépendant de l’OS

### Ies modes

principalement:

    * 'r' pour lire (read)
    * 'w' pour écrire et écraser (write)
    * 'a' pour écrire à la fin (append)
    * '+' si on souhaite lire **et** écrire
se reporter à la documentation    

# fichiers texte ou binaire

* ajouter `'b'` au mode pour ouvrir **en binaire**
  * pas de décodage
  * travaille alors à base de **`bytes`** et non de `str`

In [None]:
# j'ai besoin d'un objet bytes
# rappelez vous la section sur Unicode
text = "noël en été\n"
binaire = text.encode(encoding="utf-8")

binaire

In [None]:
# remarquez le 'b' dans le mode d'ouverture

with open('data/tmp2.txt', 'wb') as out_file:
    # je peux du coup écrire un objet bytes
    out_file.write(binaire)

In [None]:
!cat data/tmp2.txt

In [None]:
# pareil en lecture, le mode avec un 'b'
# va faire que read() retourne un objet bytes

with open('data/tmp2.txt', 'rb') as in_file:
    binaire2 = in_file.read()

In [None]:
# et donc on retombe bien sur nos pieds
binaire2 == binaire

# fichiers binaires - épilogue

on peut ouvrir un fichier Python en mode binaire 

* en utilisant les modes `'rb'`, `'wb'`, `'ab'`, `'r+b'`, `'w+b'`, `'a+b'`
* on obtiendra toujours un objet `bytes` en lecture et on ne pourra écrire qu’un objet `bytes`
* il n’y aura aucun encodage ni aucune conversion de fin de ligne (auberge espagnole)

In [None]:
with open('data/une-charogne.txt') as texte:
   x = texte.read()
type (x), len(x)

In [None]:
with open('data/une-charogne.txt', 'rb') as binaire:
   y = binaire.read()
type (y), len(y)

# encodages

* vous remarquez qu'on a souvent appelé `open()` sans préciser l'encodage
* l’encodage par défaut pour un fichier ouvert en mode texte est celui retourné par: 

In [None]:
import locale 
locale.getpreferredencoding(False)

* appeler `open()` sans préciser l'encodage peut être risqué
  * dépend des réglages sur la machine cible
* il vaut mieux toujours être **explicite** et préciser l'encodage

In [None]:
with open('data/tmp.txt', 'r', encoding='utf8') as in_file:
    print(in_file.read())

* le problème est toutefois de moins en moins aigü
  * Windows, MacOS et Linux à présent configurés par défaut pour UTF-8
* si vous avez encore du `cp1252` (vieux Windows) ou des ISO-latin15 (Unix)
  * je vous recommande de transcoder tout ça !

# fichiers spéciaux

* `sys.stdout`, `sys.stdin`, `sys.stderr`
  * sortie, entrée et erreur standard 
  * accessibles donc au travers du module `sys`

In [None]:
import sys
sys.stdout

### exercice

[filesdate](exos/format-filedates.ipynb)