# Un module pour traiter le format CSV

## Argument

Les fonctions natives de Python suffisent pour manipuler du CSV. Pour autant, elles imposent des traitements intermédiaires pour obtenir des données exploitables.

In [None]:
with open('./data/covid.csv') as f:
    # Nb of admissions to hospital
    hosp = 0
    for idx, line in enumerate(f):
        # Skip the first line (metadata)
        if idx == 0: continue
        # Delimiting data
        data = line.split(';')
        # Sum of admissions to hospital
        if data[1] == '2': hosp += int(data[3])

Deux opérations sont communes au format CSV :
- le retrait de la ligne d’en-tête ;
- la séparation des données par un délimiteur.

Pour l’écriture des fichiers, la problématique est similaire : les données doivent être correctement formatées.

Ces arguments et d’autres ont motivé la [PEP 305](https://www.python.org/dev/peps/pep-0305) sur l’interface des fichiers CSV.

## Opérations sans en-tête

Le module `csv` se charge comme les autres avec le mot-clé `import`.

In [None]:
import csv

La lecture d’un fichier CSV se fait au moyen d’une méthode `reader()` qui renvoie un objet itérable. L’appel de la méthode nécessite de spécifier un paramètre `delimiter` si le séparateur n’est pas la virgule.

In [None]:
with open('./data/covid-no-header.csv') as csvfile:
    reader = csv.reader(csvfile, delimiter=';')
    for line in reader:
        print(line)

De la même manière, l’écriture s’effectue à l’aide d’une méthode `writer()` qui instancie un objet chargé de convertir les données qu’on lui confie en chaînes correctement formatées :

In [None]:
with open('./data/the-little-cat.csv', 'w') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')

Et pour transmettre les données, utiliser une méthode `writerow()` pour chaque enregistrement :

In [None]:
with open('./data/the-little-cat.csv', 'w') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')
    writer.writerow(['Le', 'DET', 'le'])
    writer.writerow(['petit', 'ADJ', 'petit'])
    writer.writerow(['chat', 'NC', 'chat'])
    writer.writerow(['est', 'V', 'être'])
    writer.writerow(['mort', 'ADJ', 'mort'])
    writer.writerow(['.', 'PONCT', '.'])