# Serialización con Pickle y Shelve

Qué es serializar? Convertir un objeto de Python en una secuencia de bits "transmisible".

Python incluye en la librería estándar dos módulos que nos ayudan con la tarea de serializar/deserializar un objeto, `pickle` y `shelve`.

## Pickle

![Pickle](../imagenes/pickle.png)

Con `pickle` podemos convertir cualquier objeto simple en una serie de bytes. Todo es tan simple como

In [2]:
import pickle 

import pprint # esto es para que se vea bonito por pantalla

data = [{'a': 'A', 'b': 2, 'c': 3.0}]
print('DATA:', end=' ')
pprint.pprint(data)

# Esto es lo importante!
data_string = pickle.dumps(data)
# Así quedan los datos después de picklearlos
print('PICKLE: {!r}'.format(data_string))

DATA: [{'a': 'A', 'b': 2, 'c': 3.0}]
PICKLE: b'\x80\x03]q\x00}q\x01(X\x01\x00\x00\x00aq\x02X\x01\x00\x00\x00Aq\x03X\x01\x00\x00\x00bq\x04K\x02X\x01\x00\x00\x00cq\x05G@\x08\x00\x00\x00\x00\x00\x00ua.'


El string de bytes que obtuvimos previamente se puede luego enviar por la red, guardar en un archivo, etc. De esta manera podemos *persistir* un objeto más allá de una sesión de trabajo o la corrida de un programa.

Para hacer el proceso opuesto, es decir, recuperar los datos de un pickle, hacemos lo siguiente

In [4]:
data2 = pickle.loads(data_string)
print('RECUPERADO : ', end=' ')
pprint.pprint(data2)

print('LO MISMO? :', (data is data2))
print('IGUAL?:', (data == data2))

RECUPERADO :  [{'a': 'A', 'b': 2, 'c': 3.0}]
LO MISMO? : False
IGUAL?: True


Fíjense que dice que es igual pero que no es lo mismo. Es decir, si bien los valores son idénticos, los espacios en memoria que ocupan `data` y `data2` son diferentes (esto es, son objetos distintos).

Podemos guardar varios pickles en un archivo, pero debemos recordar el orden en el que los guardamos para recuperarlos.

In [23]:
with open('pickles', 'wb') as pks:
    pickle.dump('hola', pks)
    pickle.dump('que', pks)
    pickle.dump('tal', pks)

with open('pickles', 'rb') as pks:    
    data = pickle.load(pks)
    print(data)
    data = pickle.load(pks)
    print(data)
    data = pickle.load(pks)
    print(data)



hola
que
tal


Para solucionar el problema de `pickle` con varios archivos, es que existe `shelve`. Básicamente imaginen que es un `dict` de pickles. 

In [7]:
import shelve

with shelve.open('spam') as db:
    db['eggs'] = 'eggs'
    db['bird'] = 'albatross'
    db['2'] = 4

ave = None
with shelve.open('spam') as db:
    ave = db['bird']
    
print(ave)

albatross


Una última aclaración. Tanto `pickle` como `shelve` no realizan ninguna clase de control sobre lo que deserializan. El contenido de lo serializado es ejecutado, por lo que si alguien malintencionado agrega código a los pickles o shelves, el intérprete ejecutará ese código. Por eso se utilizan otros formatos más seguros para serialización como `json`.