# Importation de données depuis des fichiers CSV

On souhaite importer des données numériques contenues dans des fichiers CSV à l'aide de Numpy. Nous pouvons utiliser pour cela la fonction `loadtxt` ([documentation de loadtxt](https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html))

Commençons par un fichier CSV nommé `data1.csv` et contenant des nombre entiers signés. On utilise la commande Unix `cat` pour afficher le contenu du fichier

In [None]:
!cat data1.csv

On constate alors que le séparateur de champ est ici la virgule. Pour ouvrir le fichier CSV et le placer dans un tableau de type ndarray, il faut indiquer à la fonction `loadtxt` le nom du fichier à ouvrir. Par défaut, le séparateur de champ est l'espace donc il faut indiquer ici également le séparateur de champ. On affiche ensuite le tableau numpy pour s'assurer que les données ont bien été importées.

In [None]:
import numpy as np
valeurs1 = np.loadtxt('data1.csv', delimiter=',')
valeurs1

Regardons maintenant le fichier `data2.csv`, dans lequels certaines lignes ont été marquées comme « commentées » grâce à l'ajout du caractère # en début de ligne. Ce caractère est très courant pour marquer un commentaire.

In [None]:
!cat data2.csv

Ouvrons ce fichier CSV et plaçons les données qu'il contient dans `valeurs2` :

In [None]:
valeurs2 = np.loadtxt('data2.csv', delimiter=',')
valeurs2

Remarquez que les lignes commentées ont été automatiquement ignorées lors de l'importation. Si jamais le symbole utilisé pour commenter les lignes n'est pas #, prenons par exemple le symbole « ; », alors il suffit d'ajouter dans l'appel de la fonction `loadtxt` le paramètre supplémentaire `comments=';'`. Facile, non ?

Terminons par un dernier cas où le fichier CSV contient une en-tête avec des données à ignorer, mais non précédées du caractère #. Voici un exemple avec le fichier data3.csv :

In [None]:
!cat data3.csv

Les trois premières lignes ne sont clairement pas des données à importer, et il faut les « passer » (skip en anglais). On importera alors avec la ligne suivante :

In [None]:
valeurs3 = np.loadtxt('data3.csv', delimiter=',', skiprows=3)
valeurs3

L'importation s'est correctement déroulée, et les trois premières lignes ont été correctement ignorées lors de l'importation.

Voilà, vous savez maintenant l'essentiel pour importer des données CSV dans Jupyter et Numpy !