# 序列化和反序列化

程序运行过程中，所有变量都是在内存中操作的。当程序执行完毕并结束退出后，变量占有的内存就被操作系统回收了。因此，我们需要将某些数据持久化存储到磁盘中，下次运行的时候从磁盘中读取相关的数据。

- 我们将变量从内存中变成可以存储或传输的过程，称为**序列化**，在Python中叫做pickling，在其他语言中叫做serialization、marshaling、flatterning等等。
- 反之，把变脸内容从序列化的对象重新读取到内存中的过程，则称为**反序列化**，在Python中叫做unpickling。

# 用二进制形式实现序列化和反序列化——`pickle`模块

Python2中有两个模块进行序列化和反序列化操作，即`pickle`和`cPickle`，其中`cPickle`是用C语言实现的序列化方式，而`pickle`则使用Python语言实现的序列化方式。Python3中将二者统一为`pickle`。

为了保证序列化和反序列化的程序在Python2和Python3环境中均能运行，可以使用以下方法导入模块。

In [9]:
try:
    import cPickle as pickle
except ImportError:
    import pickle

## 序列化操作

In [40]:
import pickle

# 此处定义一个字典对象
d1 = dict(name='Sean', age=29, score=100)
# 调用pickle模块中的dumps()函数进行序列化处理
d1_pickle = pickle.dumps(d1)

# 也可以调用pickle模块中的dump()函数将内容序列化后，写入文件
with open('dump_pickle.txt', 'wb') as f:
    pickle.dump(d1, f)

In [41]:
d1

{'age': 29, 'name': 'Sean', 'score': 100}

In [42]:
d1_pickle

b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x04\x00\x00\x00Seanq\x02X\x03\x00\x00\x00ageq\x03K\x1dX\x05\x00\x00\x00scoreq\x04Kdu.'

In [43]:
with open('dump_pickle.txt', 'rb') as f:
    print(f.read())

b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x04\x00\x00\x00Seanq\x02X\x03\x00\x00\x00ageq\x03K\x1dX\x05\x00\x00\x00scoreq\x04Kdu.'


## 反序列化操作

In [51]:
# 调用pickle模块中的loads()函数进行反序列化处理
pickle.loads(d1_pickle)

{'age': 29, 'name': 'Sean', 'score': 100}

In [46]:
# 从之前序列化得到的dump_pickle.txt文件中读取内容
with open('dump_pickle.txt', 'rb') as f:
    d1_unpickle = pickle.load(f)
    
print('Name is %s.' % d1_unpickle['name'])

Name is Sean.


# 用JSON实现序列化和反序列化

JSON是一种在所用编程语言中都通用的文件标准（key-value对）。Python数据结构与JSON有非常完美的兼容。如果有一个比较结构化的数据需要被序列化，并且想要在别的地方被其他语言读懂，则可以用JSON来实现。

## 序列化操作

In [47]:
import json

# 定义字典对象
d2 = dict(name='Kroos', age=32, score=150)
# 调用json模块中的dumps()函数进行序列化处理
d2_json = json.dumps(d2)

# 也可以调用json模块中的dump()函数将内容序列化后，写入文件
with open('dump_json.txt', 'w') as f:
    json.dump(d2, f)

{"name": "Kroos", "age": 32, "score": 150}


In [48]:
d2

{'age': 32, 'name': 'Kroos', 'score': 150}

In [49]:
d2_json

'{"name": "Kroos", "age": 32, "score": 150}'

In [50]:
with open('dump_json.txt', 'r') as f:
    print(f.read())

{"name": "Kroos", "age": 32, "score": 150}


## 反序列化操作

In [52]:
# 调用json模块中的loads()函数进行反序列化处理
json.loads(d2_json)

{'age': 32, 'name': 'Kroos', 'score': 150}

In [53]:
# 从之前序列化得到的dump_json.txt文件中读取内容

with open('dump_json.txt', 'r') as f:
    d1_unjson = json.load(f)
    
print('Name is %s.' % d2_unjson['name'])

Name is Kroos.
