# 8.2 CSV Files

De nombreuses données scientifiques sont stockées au format de fichier **valeurs séparées par des virgules** (CSV), un fichier texte délimité qui utilise une virgule pour séparer les valeurs. C'est un format très utile qui permet de stocker de grands tableaux de données (chiffres et texte) en texte brut. Chaque ligne (ligne) des données constitue un enregistrement de données et chaque enregistrement se compose d'un ou plusieurs champs, séparés par des virgules. Il peut également être ouvert à l'aide de Microsoft Excel et visualiser les lignes et les colonnes.

Python possède son propre module csv qui peut gérer la lecture et l'écriture du fichier csv, vous pouvez voir les détails dans la [documentation](https://docs.python.org/3/library/csv.html). Mais nous n’allons pas présenter ici ce module csv. Au lieu de cela, nous utiliserons le package numpy pour gérer le fichier csv car nous lirons souvent le fichier csv directement dans un tableau numpy.

### Écrivez et ouvrez un fichier CSV

Voyons un exemple simple de génération de 100 lignes et 5 colonnes de données.

In [1]:
import numpy as np

In [2]:
data = np.random.random((100,5))

In [3]:
np.savetxt('test.csv', data, fmt = '%.2f', delimiter=',', header = 'c1, c2, c3, c4, c5')

Nous générons d’abord les données aléatoires pour 100 lignes et 5 colonnes à l’aide de la fonction *np.random* et les attribuons à la variable *data*. Nous utilisons la fonction *np.savetxt* pour enregistrer les données dans un fichier csv. Nous pouvons voir que les 3 premiers arguments sont les mêmes que ceux utilisés dans la section précédente, mais ici nous définissons l'argument délimiteur sur ',', ce qui indique que nous voulons séparer les données par une virgule.

Nous pouvons ouvrir le fichier csv à l'aide de Microsoft Excel.

![Open_csv](images/11.02.01-Write_csv.png "Ouvrir le fichier csv à l'aide de Microsoft Excel")

On peut également ouvrir le fichier csv à l'aide d'un éditeur de texte, on peut voir que les valeurs sont séparées par des virgules.

![Open_csv_text](images/11.02.02-Open_csv_text.png "Ouvrir le fichier csv à l'aide d'un éditeur de texte")

### Lire un fichier CSV

Comme auparavant, nous pouvions lire le fichier csv à l'aide de la fonction *np.loadtxt*. Lisons le fichier csv que nous venons d'enregistrer sur le disque dans une variable *my_csv* et affichons les 5 premières lignes. Notez ici que nous utilisons à nouveau le *délimiteur* pour spécifier que les données du fichier sont séparées par des virgules.

In [4]:
my_csv = np.loadtxt('./test.csv', delimiter=',')
my_csv[:5, :]

array([[0.84, 0.99, 0.56, 0.24, 0.71],
       [0.33, 0.8 , 0.32, 0.28, 0.83],
       [0.89, 0.19, 0.25, 0.63, 0.84],
       [0.08, 0.49, 0.76, 0.34, 0.69],
       [0.66, 0.65, 0.73, 0.48, 0.12]])

### Au-delà de Numpy

Numpy est très pratique pour gérer les fichiers csv, mais il existe certainement plus de packages capables de gérer les fichiers csv. Le package *Pandas* est très populaire et peut facilement gérer les données tabulaires du Dataframe. Vous pouvez le consulter si vous souhaitez en savoir plus.