# Format de données

Dans ce TP, nous allons mettre en œuvre les fonctionnalités liées aux fichiers pour écrire des fonctions de sauvegarde et de chargement de données dans différents formats.

## Travail préliminaire

Dans un travail préliminaire, il vous est demandé de produire un code permettant de transformer un structure de données de type dictionnaire où les valeurs associées à chaque clé $k$ sont des listes $l_k$ de même taille $n$, en une liste de taille $n$ dont tous les éléments sont des dictionnaires de clés $k$ et pour lesquelles les valeurs associées sont les différentes valeurs des listes $l_k$.

Ainsi votre code devra par exemple être capable de transformer la structure suivante :

    {"colonne 1":[12, 36, 32], "colonne 2":[25.4, 78.2, 46.2], "colonne 3":['A', 'B', 'C]}
    
en la structure de données suivante :

    [
        {"colonne 1":12, "colonne 2":25.4, "colonne 3":'A'},
        {"colonne 1":36, "colonne 2":78.2, "colonne 3":'B'},
        {"colonne 1":32, "colonne 2":46.2, "colonne 3":'C'}
    ]
    
Il devra également être opérant sur la structure de donnée suivante :

    {"Nom": ['Shannon', 'Turing', 'Lovelace'], "Prénom":['Claude', 'Alan', 'Ada']}
    
pour la transformer en 
    
    [
        {"Nom":'Shannon', "Prénom":'Claude'},
        {"Nom":'Turing', "Prénom":'Alan'},
        {"Nom":'Lovelace', "Prénom":'Ada'}
    ]


In [11]:
d={"colonne 1":[12, 36, 32], "colonne 2":[25.4, 78.2, 46.2], "colonne 3":['A', 'B', 'C']}
s=[
    {"Nom":'Shannon', "Prénom":'Claude'},
    {"Nom":'Turing', "Prénom":'Alan'},
    {"Nom":'Lovelace', "Prénom":'Ada'}
]

In [19]:
def tranf(dic):
   return [{i:dic.get(i)[j] for i in dic } for j in range(len(list(dic.values())[0]))]

In [20]:
a=tranf(d)

In [21]:
a

[{'colonne 1': 12, 'colonne 2': 25.4, 'colonne 3': 'A'},
 {'colonne 1': 36, 'colonne 2': 78.2, 'colonne 3': 'B'},
 {'colonne 1': 32, 'colonne 2': 46.2, 'colonne 3': 'C'}]

In [22]:
type(d.keys())

dict_keys

## Le format CSV

CSV est l'acronyme de *Comma Separated Values* qui signifie *valeurs séparées par des virgules*. C'est un format utilisé pour sauvegarder des données tabulaires. Il s'agit d'un format texte. La première ligne contient les intitulés (chaînes de caractères) des colonnes séparées par des virgules.
Les lignes suivantes du fichier représentent les différents lignes du tableau de données. Au sein de chaque ligne, les valeurs correspondant aux colonnes sont séparées par des vigules.

Le fichier [exemple.csv](exemple.csv) montre un exemple de fichier avec le format `.csv`.

Ecrire la fonction de sauvegarde dans un fichier `.csv` pour les deux types de structures de données utilisés précédemment (dictionnaire de listes, liste de dictionnaires).

In [25]:
import pandas as pd
def fich_dic(dic):
    import csv 
    with open('test.csv', 'w', newline='') as f:
        writer=csv.DictWriter(f,list(dic.keys()))
        writer.writeheader()
        for i in tranf(d):
            writer.writerow(i)
fich_dic(d)

In [26]:
def fich_list_dic(dic):
    import csv 
    with open('test1.csv', 'w', newline='') as f:
        head=list(dic[0].keys())
        writer=csv.DictWriter(f,head)
        writer.writeheader()
        for i in dic:
            writer.writerow(i)
fich_list_dic(s)

Ecrire des fonctions de chargement, c'est-à-dire de lecture des fichiers csv. 

Dans une version initiale, l'ensemble des données seront lues comme des chaînes de caractères. Dans une seconde version, le type de la données devra être interprété de sa syntaxe, en se limitant aux données de type chaînes de caractères et numériques.

In [7]:
def chargement(s):
    f=open(s,'r')
    s=f.readline()
    while s:
        print(s.split(','))
        s=f.readline()
chargement('exemple.csv')

['Prenom', ' Nom', ' Email', ' Age', ' Ville\n']
['Robert', ' Lepingre', ' bobby@exemple.com', ' 41', ' Paris\n']
['Jeanne', ' Ducoux', ' jeanne@exemple.com', ' 32', ' Marseille\n']
['Pierre', ' Lenfant', ' pierre@exemple.com', ' 23', ' Rennes']


In [27]:
def chargement2(s):
    f=open(s,'r')
    s=f.readline()
    while s:
        s=[int(i) if i.strip().isnumeric() else i for i in s.split(',')]
        print(s)
        s=f.readline()
chargement2('exemple.csv')

['Prenom', ' Nom', ' Email', ' Age', ' Ville\n']
['Robert', ' Lepingre', ' bobby@exemple.com', 41, ' Paris\n']
['Jeanne', ' Ducoux', ' jeanne@exemple.com', 32, ' Marseille\n']
['Pierre', ' Lenfant', ' pierre@exemple.com', 23, ' Rennes']


### Optionnel

Ecrire les variantes suivantes : 
- La variante française dans laquelle les valeurs sont séparées par des points-virgules et la virgule est utilisée à la place du point comme séparateur entre la partie entière et la partie fractionnaire des données numériques.
- Le format TSV (ou TAB) dans lequel le caractère de séparation des valeurs n'est ni le point, ni le point-virgule, mais la tabulation

In [41]:
def getSep(s):
    m=max(len(s.split(' ')),len(s.split(',')),len(s.split(';')))
    if m==len(s.split(' ')):
        res=' '
    elif m==len(s.split(',')):
      res=','
    else:
        res=';'
    return res

In [27]:
def csvfrench(s):
    f=open(s,'r')
    s=f.readline()
    sep=getSep(s)
    s=s.split(sep)   
    while s:
        s=[int(i) if i.strip().isnumeric() else i for i in s.split(sep)]
        s=[float(i.replace('.',',')) if ',' else i for i in s]
        print(s)
        s=f.readline()
csvfrench('fichiers/test_fr.csv')

FileNotFoundError: [Errno 2] No such file or directory: 'fichiers/test_fr.csv'

## JSON

Le format JSON (pour *JavaScript Object Notation*) est un format léger pour l'échange de données. Il est notamment documenté sur le [site officiel](https://www.json.org/).

Les objets JSON sont délimités par des accolades et contiennent des données membres. Les données membres sont des couples clés-valeurs, séparés par des virgules. Les clés sont des chaînes de caractères délimités par des guillemets `"`. Les valeurs peuvent être des données numériques, des chaines de caractères délimitées par des guillemets `"`, d'autres objets (comme définis précédemment) ou des tableaux. Un tableau est une liste de valeurs séparées par des virgules et délimitée par des crochets `[` et `]`.

Implémentez une fonction de sauvegarde d'une structure de données de type dictionnaire au format JSON ainsi qu'une fonction de chargement. 

Prenez en main le module `json` de python qui permet aisément la sauvegarde via la méthode `json.dump()` et le chargement via la méthode `json.load()` ou `json.loads()`.