# Cours - Traitement des données en table
# Fiche 2 - Le format CSV, traitement avec Python

**Table des matières**

1. Introduction
2. Représentation en Python
3. Importer un fichier CSV en python
4. Exporter vers un fichier CSV




## 1. Introduction
Nous allons nous intéresser aux données stockées au format CSV (Comma Separated Values) et dont le traitement sera réalisé par un programme en python.


Le format CSV n'est pas standardisé mais les données sont organisées de la manière suivante :

- une ligne avec les descripteurs ;
- les colonnes sont généralement séparées par :
    - une virgule (cas le plus courant, notation anglaise) ;
    - un point-virgule (pour libérer la virgule de séparation la partie décimale en français) ;
    - tout autre caractère selon le besoin (tabulation, espace, | (pipe) ...).
- il n'y a pas d'espace entre les caractères de séparation ;
- les informations de type texte peuvent être encadrées par des guillemets (pour faire la différence avec les données de type nombre lors de l'importation dans un tableur).



**Exemple :**

Table
    
|nom    | prenom      | date_naissance | age | taille|
|:-:    |:-:          |:-:             |:-:  | :-:   |
|Durand | jean-Pierre | 23/05/1985     | 35  | 1.85  |
|Dupont | Christophe  | 15/12/1967     | 53  | 1.7   |
|Terta  | Henry       | 12/06/1978     | 42  | 1.67  |  
    
    
Fichier CSV 1

    nom;prenom;date_naissance;age;taille
    Durand;Jean-Pierre;23/05/1985;35;1.85
    Dupont;Christophe;15/12/1967;53;1.7
    Terta;Henry;12/06/1978;42;1.67
    
Fichier CSV 2
    
    "nom";"prenom";"date_naissance";"age";"taille"
    "Durand";"Jean-Pierre";"23/05/1985";35;1.85
    "Dupont";"Christophe";"15/12/1967";53;1.7
    "Terta";"Henry";"12/06/1978";42;1.67

    
Fichier CSV 3
       
    "nom";"prenom";"date_naissance";"age";"taille"
    "Durand";"Jean-Pierre";"23/05/1985";35;1,85
    "Dupont";"Christophe";"15/12/1967";53;1,7
    "Terta";"Henry";"12/06/1978";42;1,67
    
Fichier CSV 4

    nom;prenom;date_naissance;age;taille
    Durand;Jean-Pierre;23/05/1985;35;1,85
    Dupont;Christophe;15/12/1967;53;1,7
    Terta;Henry;12/06/1978;42;1,67
    
Fichier CSV 5
    
    nom,prenom,date_naissance,age,taille
    Durand,Jean-Pierre,23/05/1985,35,1.85
    Dupont,Christophe,15/12/1967,53,1.7
    Terta,Henry,12/06/1978,42,1.67   
    
    

## 2. Représentation en python

On peut représenter en python les fichiers CSV de différentes manières.

Une solution est la suivante :

In [1]:
personnes = [{'nom': 'Durand', 'prenom': 'Jean-Pierre', 'date_naissance': '23/05/1985', 'age': '35', 'taille': '1.85'}, 
         {'nom': 'Dupont', 'prenom': 'Christophe', 'date_naissance': '15/12/1967', 'age': '53', 'taille': '1.7'}, 
         {'nom': 'Terta', 'prenom': 'Henry', 'date_naissance': '12/06/1978', 'age': '42', 'taille': '1.67'}]

La variable personnes est une liste de dictionnaires.

On peut trouver d'autres organisations comme par exemple la bibliothèque Pandas qui utilise une structure du type un dictionnaire de listes).

## 3. Importer un fichier CSV en python


Pour importer les données des fichiers CSV, nous utiliserons le module csv.

In [2]:
import csv

Le module pprint est pratique pour afficher des structures de données imbriquées.

In [3]:
from pprint import pprint

**Importer un fichier : solution 1** 

In [4]:
def lireCSV1():
    with open('names.csv', newline='') as fichierCSV:
        lecteur = csv.DictReader(fichierCSV)
        for ligne in lecteur:
            pprint(ligne)



lireCSV1()

FileNotFoundError: [Errno 2] No such file or directory: 'names.csv'

**Remarque :**

- fichierCSV : variable qui pointe sur le fichier sur le disque dur de l'ordinateur.
- lecteur    : variable qui pointe sur les données en mémoire.
- ligne      : partie des données qui correspond à un enregistrement(p-uplets) 

**Importer un fichier : solution 2** 

In [4]:
def lireCSV2():
    with open('names.csv', newline='') as fichierCSV:
        lecteur = csv.DictReader(fichierCSV)
        return [dict(ligne) for ligne in lecteur]

lireCSV2()

[{'nom': 'Durand',
  'prenom': 'Jean-Pierre',
  'date_naissance': '23/05/1985',
  'age': '35',
  'taille': '1.85'},
 {'nom': 'Dupont',
  'prenom': 'Christophe',
  'date_naissance': '15/12/1967',
  'age': '53',
  'taille': '1.7'},
 {'nom': 'Terta',
  'prenom': 'Henry',
  'date_naissance': '12/06/1978',
  'age': '42',
  'taille': '1.67'}]

La liste par compréhension permet de renvoyer une liste de dictionnaires comme cela a été vu dans la fiche1_table_python.ipynb.

Lors de l'importation, on peut ajouter des paramètres comme :

- le délimiteur
- l'encodage
- encadrement ou pas du texte par des guillemets



**Exemple :**

Code qui permet de lire le fichier passwd sous linux.


In [None]:
import csv
def lectureOptions():
    with open('passwd', newline='') as f:
        reader = csv.reader(f, delimiter=':', encoding='utf-8', quoting=csv.QUOTE_NONE)
        for row in reader:
            print(row)

**Exercice :**

Écrire une fonction qui :
    
- importe le fichier villes_virgule.csv
- affiche les 5 premiers enregistrements
- compte le nombre d'enregistrements

## 4. Exporter vers un fichier CSV

Lors de l'export on donne l'ordre des colonnes dans une liste.


**Exemple 1:**

In [None]:
def exportCSV1():
    with open('sortie.csv', 'w', newline='') as csvfile:
        fieldnames = ['nom', 'prenom']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        writer.writeheader()
        writer.writerow({'prenom': 'Lucie', 'nom': 'Lafitte'})
        writer.writerow({'prenom': 'Lucien', 'nom': 'Lafargue'})
        writer.writer
    return None
exportCSV1()

Résultat, contenu CSV :
    
    nom,prenom
    Lafitte,Lucie
    Lafargue,Lucien
    
**Exemple 2:**
    

In [None]:
def exportCSV2(table, nomFichier, ordre):
    with open(nomFichier , 'w', newline='') as fichierCSV:
        dico = csv.DictWriter(fichierCSV, fieldnames=ordre)
        #table = eval(nom)
        dico.writeheader()   # 1ère ligne, descripteurs (attributs)
        for ligne in table:
            dico.writerow(ligne)
    return None

# ---- test de la fonction ----
table2 = [{'Nom': 'Paul', 'Anglais': 10, 'NSI': 15, 'Math': 10},
          {'Nom': 'Marie', 'Anglais': 15, 'NSI': 12, 'Math': 18},
          {'Nom': 'Alice', 'Anglais': 11, 'NSI': 15, 'Math': 18}]

ordre = ['Nom', 'Anglais', 'NSI', 'Math']

exportCSV2(table2, 'sortie2.csv', ordre)

Résultat, contenu CSV :

    Nom,Anglais,NSI,Math
    Paul,10,15,10
    Marie,15,12,18
    Alice,11,15,18
    

**Exercice**

Modifier le programme précédent pour obtenir l'affichage suivant :

    NSI,Anglais,Nom,Math
    15,10,Paul,10
    12,15,Marie,18
    15,11,Alice,18