# TD 2D : Sérialisation


* [Sérialisation](#def)
* [DataFrame](#df)
* [Exercice 1 : sérialisation d'un gros dataframe](#exo1)


<h3 id="def">Sérialisation</h3>

La [sérialisation](http://fr.wikipedia.org/wiki/S%C3%A9rialisation) désigne l'action de sauvegarder un objet dans un fichier telle qu'il est représentée dans la mémoire de l'ordinateur. De cette façon, la relecture de l'objet en question est plus rapide. La difficulté réside dans la sérialisation d'objets composites comme une liste qui contient un dictionnaire qui contient une liste d'autres listes. Sans rentrer dans le détail de l'implémentation, la plupart des objets en Python sont sérialisables ainsi qu'un objet composé de ces objets. Cela s'effectue avec le module [pickle](https://docs.python.org/3.4/library/pickle.html).

In [3]:
import pickle
l = [ {3:"4"}, "4", -5.5, [6, None]]
with open("objet_serialise.bin", "wb") as f :
    pickle.dump(l, f)

Puis on récupère les données :

In [4]:
with open("objet_serialise.bin", "rb") as f :
    obj = pickle.load(f)
obj

[{3: '4'}, '4', -5.5, [6, None]]

<h3 id="df">DataFrame</h3>

Il existe une méthode spécifique pour les DataFrame : [to_pickle](http://pandas-docs.github.io/pandas-docs-travis/io.html?highlight=to_pickle#pickling) qu'on relie avec la méthode [read_pickle](http://pandas-docs.github.io/pandas-docs-travis/io.html?highlight=read_pickle#pickling).

In [5]:
import pandas
df = pandas.DataFrame( [ {"name":"xavier", "school":"ENSAE"},
                         {"name":"antoine", "school":"ENSAE"} ] )
df.to_pickle("df_serialize.bin")

Puis on relit le fichier :

In [6]:
df2 = pandas.read_pickle("df_serialize.bin")
df2

Unnamed: 0,name,school
0,xavier,ENSAE
1,antoine,ENSAE


<h3 id="exo1">Exercice 1 : sérialisation d'un gros dataframe</h3>

On veut comparer le temps de chargement du même dataframe depuis un fichier texte et depuis un contenant le dataframe sérialisé. Dans un premier temps, on génère un gros dataframe qu'on sauve sous fichier texte puis on le sérialise. On compare ensuite les temps de chargement.