# Lecture et écriture de fichiers

Il existe de nombreux modules Python qui permettent de lire des fichiers de données; le choix de l'un ou l'autre va dépendre grandement du format de fichiers.
En général, vous allez utiliser des fichiers au format csv (pour "Comma Separated Values") où les données sont stockées sous forme de tableau dont les colonnes sont séparées par des virgules.

## Lecture de fichiers

Pour ce type de fichiers, on peut utiliser le module ```pandas```.

In [1]:
import pandas
# lecture du fichier par pandas
data = pandas.read_csv("../data/simple_meteo.csv") 
print("Noms des colones:") # affichage des noms de chacune des colonnes
for name in data.columns:
    print("  ", name)
print("Données dans le fichier:") # affichage du tableau de données
print(data)
temperature = data["Paris Temperature"].to_list() # extraction des températures 
# et conversion en liste python
print("Nombre de températures:", len(temperature))
print("Deux premières températures:", temperature[0:2])


ModuleNotFoundError: No module named 'pandas'

La variable ```data``` est un objet ```DataFrame``` et contient alors toutes les données extraites du fichier ```simple_meteo.csv``` qui se trouve dans le sous-dossier ```data/appendix``` [^location].
Cette variable se comporte presque comme un dictionnaire, mais avec quelques fonctions supplémentaires.
On peut récupérer les noms des colonnes grâce à ```data.columns```: cela permet ensuite de récupérer les données plus facilement.

On peut alors utilser plusieurs méthodes: 

- transformer les "colonnes" de données en liste: ```to_list()```,
- ajouter des nouvelles données avec la méthode ```append(autre_données, ignore_index=True)``` (voir [ici](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.append.html) pour plus de détails.}

## Ecriture de fichiers

Il est possible de sauvegarder des ```DataFrame``` dans des fichiers au format csv avec ```pandas``` en utilisant la fonction ```to_csv```:

In [None]:
data.to_csv("../data/new_meteo.csv")

Avec cette méthode, la lecture du fichier pourra se faire avec ```pandas``` sans problème.

[^location]: Il est important de faire attention à l'endroit d'où on exécute le script Python: en effet, si on change d'endroit, le chemin du fichier donné à la fonction ```read_csv``` ne peut ne plus correspondre à un fichier existant.
Dans Jupyter Notebook, le chemin à donner est relatif à l'endroit où se trouve le notebook.
Pour choisir l'endroit d'où l'on exécute le script python dans Spyder, on utilise la barre de chemin en haut à gauche.