# Un module pour traiter le format CSV

## Argument

Les fonctions natives de Python suffisent pour manipuler du CSV. Pour autant, elles imposent des traitements intermédiaires pour obtenir des données exploitables.

In [None]:
with open('./data/covid.csv') as f:
    # Nb of admissions to hospital
    hosp = 0
    for idx, row in enumerate(f):
        # Skip the first line (metadata)
        if idx == 0: continue
        # Delimiting data
        data = row.split(';')
        # Sum of admissions to hospital
        if data[1] == '2': hosp += int(data[3])

Deux opérations sont communes au format CSV :
- le retrait de la ligne d’en-tête ;
- la séparation des données par un délimiteur.

Pour l’écriture des fichiers, la problématique est similaire : les données doivent être correctement formatées.

Ces arguments et d’autres ont motivé la [PEP 305](https://www.python.org/dev/peps/pep-0305) sur l’interface des fichiers CSV.

## Charger le module

Le module `csv` se charge comme les autres avec le mot-clé `import`.

In [None]:
import csv

## Opérations sans en-tête

### Lecture d’un fichier

La lecture d’un fichier CSV se fait au moyen d’une méthode `reader()` qui renvoie un objet itérable. L’appel de la méthode nécessite de spécifier un paramètre `delimiter` si le séparateur n’est pas la virgule.

In [None]:
with open('./data/covid-no-header.csv') as csvfile:
    reader = csv.reader(csvfile, delimiter=';')
    for row in reader:
        print(row)

### Écriture d’un fichier

De la même manière, l’écriture s’effectue à l’aide d’une méthode `writer()` qui instancie un objet chargé de convertir les données qu’on lui confie en chaînes correctement formatées :

In [None]:
with open('./data/the-little-cat.csv', 'w') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')

Et pour transmettre les données, utiliser une méthode `writerow()` pour chaque enregistrement :

In [None]:
with open('./data/the-little-cat.csv', 'w') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')
    writer.writerow(['Le', 'DET', 'le'])
    writer.writerow(['petit', 'ADJ', 'petit'])
    writer.writerow(['chat', 'NC', 'chat'])
    writer.writerow(['est', 'V', 'être'])
    writer.writerow(['mort', 'ADJ', 'mort'])
    writer.writerow(['.', 'PONCT', '.'])

## Opérations avec des en-têtes

### Lire un fichier avec un en-tête

Le module `csv` met à disposition un constructeur de classe spécifique `DictReader()` pour associer, dans un dictionnaire, les données avec des clés composées grâce à un paramètre `fieldnames`. Par défaut, `fieldnames` considère les valeurs de la première ligne du fichier comme les étiquettes des données.

In [None]:
with open('./data/covid.csv') as csvfile:
    reader = csv.DictReader(csvfile, delimiter=';')
    for row in reader:
        if row['sexe'] == '2':
            print(f"{row['jour']} : Dép. {row['dep']} (Réa : {row['rea']}, décès : {row['dc']})")

### Imposer un en-tête

Si un fichier ne comporte pas d’en-tête, on peut en spécifier un via une liste.

In [None]:
with open('./data/covid-no-header.csv') as csvfile:
    fieldnames = ['department', 'sex', 'date', 'admissions', 'intensive_care', 'deaths', 'recovery']
    reader = csv.DictReader(csvfile, delimiter=';', fieldnames=fieldnames)
    for row in reader:
        if row['sex'] == '2':
            print(f"{row['date']} : Dép. {row['department']} (Réa : {row['intensive_care']}, décès : {row['deaths']})")

### Créer un fichier avec un en-tête

Là encore, le module `csv` fournit un constructeur de classe particulier `DictWriter()` pour créer un fichier à partir d’un dictionnaire en lui spécifiant l’intitulé des clés via le paramètre `fieldnames` qui cette fois-ci est obligatoire.

In [None]:
with open('./data/the-little-cat.csv', 'w') as csvfile:
    fieldnames = ['word', 'pos', 'lemma']
    writer = csv.DictWriter(csvfile, delimiter='\t', fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'word': 'Le', 'pos': 'DET', 'lemma': 'le'})
    writer.writerow({'word': 'petit', 'pos':  'ADJ', 'lemma':  'petit'})
    writer.writerow({'word': 'chat', 'pos':  'NC', 'lemma':  'chat'})
    writer.writerow({'word': 'est', 'pos':  'V', 'lemma':  'être'})
    writer.writerow({'word': 'mort', 'pos':  'ADJ', 'lemma':  'mort'})
    writer.writerow({'word': '.', 'pos':  'PONCT', 'lemma':  '.'})