# Gérer des données dans des fichiers csv

## CSV ?
* CSV = Comma Separator Values
* Mais en pratique, on peut aussi gérer les fichiers avec d'autres séparateurs si on le désire (tsv = Tabulation Separator Values, ...)
* Des fichiers permettant de communiquer facilement avec une base de données (résultat de l'export d'une table) ou un tableur
* Structure : un tableau à 2 dimensions ; une liste de lignes


In [3]:
import csv # étape 1 avant toute manipulation : nécessaire pour la gestion de fichiers csv -- 1 seul import

## Ecriture

In [4]:
# Préparation des paramètres de l'opération
nom_fichier= "essai.csv" # Le fichier qui va être écrit (écrasé)
a_ecrire = [[ "rouge", 2, 3], [1, 6], [ ], [3.5, "bleu"]] # Les données à écrire

In [5]:
file_descriptor = open( nom_fichier, "w", encoding="utf-8" ) # ouverture du fichier
csv_writer = csv.writer(file_descriptor, dialect="unix", delimiter = ";") # Création objet gérant l'écriture
            # dialect "unix" évite l'insertion de lignes vides
# Écriture ligne par ligne
for row in a_ecrire : # pour chaque liste de la liste de listes
    csv_writer.writerow( row ) # écriture de la liste
file_descriptor.close() # fin de l'écriture

Pour voir ce qu'il s'est passé, le mieux est d'ouvrir le fichier CSV avec un tableur. Mais on peut aussi le charger.

In [None]:
# %load essai.csv
"rouge";"2";"3"
"1";"6"

"3.5";"bleu"


Comme l'écriture de fichier csv est la même d'un fichier à un autre, on peut écrire une fonction. Que vous pourrez utiliser !

In [7]:
def ecrire_liste_dans_fichier_csv( a_ecrire, nom_fichier, delim = ";"):
    """
    Ecrit la liste de listes a_ecrire dans le fichier nommé nom_fichier 
    au format csv en utilisant delim comme delimiter (par défaut ;)
    Données :
        a_ecrire : liste de listes
        nom_fichier : chaîne de caractères
        delim : chaîne de caractères de longueur 1
    Pas de résultat
    Précondition : package csv et sys importé
    """
    try:
        file_descriptor = open( nom_fichier, "w", encoding="utf-8" ) 
        csv_writer = csv.writer(file_descriptor, dialect="unix", delimiter = delim) 
            # dialect "unix" évite l'insertion de lignes vide
        for row in a_ecrire : 
            csv_writer.writerow( row ) 
        file_descriptor.close() # fin de l'écriture
    except:
        print("Problème de fichier : ", sys.exc_info()[0])
            #permet de retourner des informations sur l'erreur générée

In [8]:
ecrire_liste_dans_fichier_csv(a_ecrire, "essai2.csv")

## Lecture

In [9]:
def lire_fichier_csv( nom_fichier, delim = ";" ):
    """
    La fonction lire_fichier_csv 
       retourne le contenu du fichier de nom nom_fichier
       sous forme d'une liste de listes.
    Le fichier est supposé être au format csv avec comme délimiteur delim (; par défaut)
    Données :
        nom_fichier : une chaîne de caractères désignant le nom du fichier à ouvrir
        delim : chaîne de caractères de longueur 1
    Résultat :
        liste de listes de chaînes de caractères
    Précondition : package csv et sys importé
    """
    try:
        file_descriptor = open( nom_fichier, "r", encoding="utf-8" ) 
        csv_reader = csv.reader(file_descriptor, delimiter = delim)
        res = []
        for ligne in csv_reader:
            res.append(ligne)
        file_descriptor.close()
        return res
    except:
        print("Problème de fichier : ", sys.exc_info()[0])
        return []

In [10]:
t = lire_fichier_csv("essai312.csv")

NameError: name 'sys' is not defined

In [11]:
import sys

In [12]:
t = lire_fichier_csv("essai.csv")

In [13]:
t

[['rouge', '2', '3'], ['1', '6'], [], ['3.5', 'bleu']]

Les fichiers issus de tableur et de base de données sont souvent mieux structurés avec toutes les lignes de même longueur.

**A faire** : ranger les fonctions de manipulation dans un fichier contenant aussi les import de csv et de sys pour ré-exploitation ultérieure

Notons que pour des données très grosses, ne rentrant pas en mémoire centrale, l'approche de ces fonctions ne sera pas suffisante.