## **Manipulation de fichiers en Python:** **texte en gras** **texte en gras**

Dans cette nouvelle partie, nous allons découvrir un nouveau moyen de stocker des données de façon durable pour les manipuler par la suite en les stockant dans des fichiers.

Python peut être utilisé pour lire les données de différents endroits, y compris les bases de données et les fichiers.On retrouve souvent l'utilisation de deux types de fichiers :.txt .Csv et Il est possible d'importer et d'exporter des fichiers en utilisant la fonctionnalité intégrée de Python ou le package CSV.

# **Création d’un fichier et écriture**:

Il est alors temps de nous lancer, de créer notre propre fichier. Pour cela, deux moyens s’offrent à nous. Le premier, c’est créer bêtement un fichier texte dans lequel on rentre nos données manuellement. Le second, c’est de créer ce même fichier depuis Python, cela aura pour avantage de nous permettre une génération pseudo-aléatoire (l’aléatoire en informatique est une notion bien délicate).
Bien sûr, vous avez aussi la possibilité d’utiliser un fichier que vous aurez généré

La création d’un fichier nécessite de connaitre les trois modes d’ouverture d’un fichier depuis Python:

# r :Ouverture du fichier en mode lecture uniquement
# w	:Ouverture du fichier en mode écriture seulement
# a :Ouverture du fichier en mode ‘append’, c’est-à-dire que l’on ajoute du
# contenu en fin de fichier

# Remarque:

Mais quelle est donc la différence entre le mode ‘w’ – write – et ‘a’ – append ?
En fait, la différence réside dans l’idée que le mode écriture permet d’écrire dans le fichier en écrasant ce qu’il contient déjà. Le mode ajout quant à lui permet de rajouter du contenu en fin de fichier, en préservant ce qui est déjà enregistré.

L’ouverture d’un fichier en Python s’effectue à l’aide de la commande suivante

# **Par exemple:**

In [None]:
file = open("donnees_meteo.txt", "w")

Dès que la fonction open() est introduite, je tiens à introduire la fonction close(). Il est nécessaire de ranger le fichier que l'on a édité de la même manière que l'on range un livre dans la bibliothèque. La fonction close permet d'effectuer cette action de manière précise, voici comment l'utiliser :

In [None]:
# Et en exécutant cette commande on peut vérifier que le fichier "donnees_meteo.txt" a bien été crée
!ls

donnees_meteo.txt  sample_data


In [None]:
file.close()

En reprenant la notation introduite pour l’ouverture du fichier.
Pour écrire dans le fichier, cela reste relativement facile en utilisant la fonction ‘write’ à bon escient de la manière suivante :

## On ne peut éditer un livre fermé et ranger!
Attention à ce détail, l'analogie entre le fichier et un livre que vous avez faite tout à l'heure est très bonne.
Peut-on écrire dans un livre fermé et ranger dans la bibliothèque (Bien sûr que non!).<br/>
La fonction "open" que vous avez utiliser tout à l'heure retourne un objet de type **"file"** (_io.TextIOWrapper instance) qui est retourné avec le statut "**open**" donc ouvert à l'écriture et la méthode close de ce genre d'objet permet de changer ce statut à "**closed**" ainsi de fermer le livre et de le ranger, ainsi toute les modifications que vous voulez faire dans votre fichier devront être fait avant d'appeler la méthode "**file.close()**"

In [None]:
file.write("Hello world" )

ValueError: I/O operation on closed file.

On peut alors utiliser les caractères « \n » et « \r » pour insérer des retours à la ligne / retour chariot afin de formater un minimum notre fichier.

# **\n** ( Nouvelle ligne): Permet de revenir à la ligne

# **\r** ( Retour chario): Renvoie le curseur d’écriture en début de ligne

Pour résumer cette première partie, voilà le code qui m’a permis de créer un fichier « premier_fichier.txt » dans le même répertoire que mon script Python.

In [None]:
file = open("premier_fichier.txt", "w")
file.write("Hello world !")
file.close()

In [None]:
# Vous pouvez vérifier que cette ligne à bien été écrite dans le fichier en le reouvrant ou avec la commande "cat"
!cat premier_fichier.txt

Hello world !

In [None]:
# En reouvrant le fichier en mode lecture!
file = open("premier_fichier.txt", "r")
content = file.read()
print(content)

Hello world !


# **Lecture d’un fichier**
Une grande partie de l'information en biologie est stockée sous forme de texte dans des fichiers. Pour traiter cette information, vous devez le plus souvent lire ou écrire dans un ou plusieurs fichiers. Python possède pour cela de nombreux outils qui vous simplifient la vie.

# **Méthode .readlines()**

Vous êtes donc désormais en mesure de créer et d’éditer un fichier mais l’utilité serait bien faible si l’on ne pouvait pas le lire à nouveau ensuite. La méthode de lecture d’un fichier est très semblable à celle de l’écriture. L’idée est toujours d’ouvrir le fichier puis de travailler dessus. Cependant, il n’est pas forcément très facile de traiter les données qui arrivent du fichier. On récupère le plus souvent une chaine de texte brute contenant l’ensemble du fichier, dans le meilleur des cas un tableau contenant chacune des lignes. L’objectif est alors d’effectuer un pré-traitement permettant de formater correctement les données.

Ainsi, pour ce tutoriel, j’ai décidé de vous montrer de quelle manière on pouvait passer d’un fichier semblable au suivant dans sa structure :

In [None]:
# ça c'est un cas parfait où vous pouvez utiliser un doc string par exemple
# Rappelez vous que si vous ne les déclarer pas comme étant des chaînes de caractères, l'interpreêteur python considérera chaque valeur ici comme des noms de variables
content = """
Numero_du_point, abscisse, ordonnée
Numero_du_point, abscisse, ordonnée
Numero_du_point, abscisse, ordonnée
Numero_du_point, abscisse, ordonnée
"""
file = open("mesures_altitude.txt", "w")
file.write(content)
file.close()

In [None]:
!cat mesures_altitude.txt

cat: mesures_altitude.txt: No such file or directory


A un simple tableau contenant chacune des lignes et les présentant sous la forme d’une liste [Numero_du_point, abscisse, ordonnée]. Si l’exemple n’est pas général, j’ai pensé que c’était cependant un cas qui se présentait assez souvent. En effet, lors de l’enregistrement des données, par exemple depuis l’Arduino, on est en fait assez libre de la manière de le faire. On peut ainsi insérer facilement un séparateur (, ; . ! etc…) entre les différentes valeurs, ce qui permettra alors de retrouver plus aisément ensuite la liste originale des valeurs.

Partant donc d’un fichier semblable à celui présenté ci-dessus, on se propose de l’ouvrir en mode écriture :

In [None]:
fichier = open("mesures_altitude.txt", "r") # Je vous laisse le soin de pouvoir interprêter cette erreur, c'est basique vous verrez

Désormais, on a alors accès à l’intégralité des fonctions liées aux fichiers sur Python. On a alors un choix à faire. On peut choisir de lire l’intégralité du fichier et de stocker son contenu dans une variable sous la forme d’une chaine de caractères, ou alors on peut lire chacune des lignes et les stocker dans une liste que nous pourrons parcourir par la suite. C’est la second méthode que j’ai choisi ici mais vous pourrez utiliser la première à l’aide de la structure suivante et en utilisant astucieusement les quelques fonctions que je présenterai par la suite :

In [None]:
contenu = fichier.read()

Pour adopter ma méthode, on utilisera plus simplement la structure suivante

In [None]:
lignes = fichier.readlines()

Alors, chaque ligne sera stockée dans une grande liste et sera terminé par un classique « \n » spécifiant un retour à la ligne. On a alors l’avantage de pouvoir itérer, c’est-à-dire parcourir, chacune des lignes en utilisant la structure suivante :

In [None]:
for ligne in lignes:   # Faire quelque chose


Et je vous propose alors simplement d’afficher la ligne courante de la manière suivante :

In [None]:
for ligne in lignes:
  print(ligne)

Vous remarquerez alors la présence d’un double retour à la ligne (retour à la ligne + saut de ligne) à chaque affichage.

In [None]:
point_1, 9, 10

point_2, 6, 8

point_3, 1, 5

point_4 6, 1

point_5 9, 0

Pour gérer cela, je dois vous présenter la fonction replace() s’appliquant à une chaine de caractère. Elle s’utilise en spécifiant deux arguments. Le premier est le bout de chaine de caractère à remplacer. On peut aussi spécifier une expression régulière mais le sujet est alors bien trop vaste pour être détaillé ici. Le second argument quant à lui constitue la chaine de caractère de remplacement, c’est-à-dire celle qui viendra se substituer au bout de chaine de caractère que l’on souhaite remplacer.

Dans notre cas, le double retour à la ligne est en fait causé par le « \n » dont je vous ai parlé auparavant. On peut résoudre ce problème à l’aide de la structure suivante :

In [None]:
for ligne in lignes :
   ligne = ligne.replace ("\n", " ")
   print(ligne)

et l’on obtient alors dans mon cas l’affichage suivant :

In [None]:
point_1, 9, 10
point_2, 6, 8
point_3, 1, 5
point_4, 6, 1
point_5, 9, 0

Enfin, j’ai parlé au début de récupérer les points sous la forme d’une liste [numero, x, y]. Etant donné que mon fichier est correctement formaté, on peut directement utiliser la fonction split() qui s’utilise en spécifiant un argument, le séparateur, autour duquel on viendra « découper » notre chaine. Dans mon cas, le séparateur est « , » (j’insiste sur l’espace suivant la virgule). On utilise alors la syntaxe suivante pour former notre liste :

In [None]:
for ligne in lignes:
   ligne = ligne.replace('\n', '')
   donnees = ligne.split(', ')
   print(donnees)

Ici, j’ai fait le choix d’afficher les données mais l’on pourrait tout autant poursuivre le traitement (d’autant qu’à ce moment précis, donnees contient mes données sous la forme de 3 chaines de caractères, bien peu utile pour du traitement mathématique par exemple. On peut alors convertir les chaines de caractères à l’aide des classique fonctions de conversion de type (int(), float(), etc…)

Il nous reste alors à mettre en place un traitement des données, ce sera précisément l’étude que nous mènerons dans de prochains tutoriels.