# 12. 持久化 - pickle

# pickle
- Python 对象序列化
- 模块 pickle 实现了对一个 Python 对象结构的二进制序列化和反序列化
- “pickling”是将 Python 对象及其所拥有的层次结构转化为一个字节流的过程，而“unpickling”是相反的操作，会将（来自一个 binary file 或者 bytes-like object 的）字节流转化回一个对象层次结构
- pickling（和 unpickling）也被称为“序列化”,“编组”或者“平面化”。
    - 为了避免混乱，也可采用术语“封存 (pickling)”和“解封 (unpickling)”
- 序列化（持久化、落地）：把程序运行中的信息保存在磁盘上
- 反序列化：序列化的逆过程
- pickle 模块**并不安全**，只应该对信任的数据进行unpickle操作
- 在处理不信任数据时，更安全的序列化格式如 json 可能更为适合
- 需要导入

In [1]:
import pickle

## dump()
- dump()：序列化，将对象 obj 封存以后的对象写入已打开的 file object file
- 格式：pickle.dump(obj, file, protocol=None, *, fix_imports=True, buffer_callback=None)
    - obj：需要封存的对象
    - file：该参数必须有一个 write() 方法，该 write() 方法要能接收字节作为其唯一参数
    - protocol：可选参数，是一个整数，告知 pickler 使用指定的协议
        - 可选择的协议范围从 0 到 HIGHEST_PROTOCOL
        - 如果没有指定，这一参数默认值为 DEFAULT_PROTOCOL
        - 指定一个负数就相当于指定 HIGHEST_PROTOCOL
    - 如果 fix_imports 为 True 且 protocol 小于 3，pickle 将尝试将 Python 3 中的新名称映射到 Python 2 中的旧模块名称，因此 Python 2 也可以读取封存的数据流
    - buffer_callback：
        - 如果 buffer_callback 为 None（默认情况），缓冲区视图（buffer view）将会作为 pickle 流的一部分被序列化到 file 中
        - 如果 buffer_callback 不为 None，那它可以用缓冲区视图调用任意次
            - 如果某次调用返回了 False 值（例如 None），则给定的缓冲区是 带外的，否则缓冲区是带内的（例如保存在了 pickle 流里面）
        - 如果 buffer_callback 不是 None 且 protocol 是 None 或小于 5，就会报错

## load()
- load()：反序列化，从已打开的 file object 文件 中读取封存后的对象，重建其中特定对象的层次结构并返回
- 格式：pickle.load(file, *, fix_imports=True, encoding="ASCII", errors="strict", buffers=None)
    - 参数 file 必须有三个方法：
        - read() 方法：接受一个整数参数
        - readinto() 方法：接受一个缓冲区作为参数
        - readline() 方法：不需要参数
    - 可选的参数是 fix_imports, encoding 和 errors，用于控制由Python 2 生成的 pickle 流的兼容性
    - buffers：
        - 如果 buffers 为 None（默认值），则反序列化所需的所有数据都必须包含在 pickle 流中
        - 如果 buffers 不为 None，则每次 pickle 流引用 带外 缓冲区视图时，消耗的对象都应该是可迭代的启用缓冲区的对象

In [4]:
# 序列化 示例

age = 19

with open(r'pickle测试.txt', 'wb') as f:
    pickle.dump(age, f)

In [5]:
# 反序列化 示例

with open(r'pickle测试.txt', 'rb') as f:
    age = pickle.load(f)
    print(age)

19


In [6]:
# 序列化 示例

a = [23, 'ihaku', " love 冰冰", [175, 50]]

with open(r'pickle测试.txt', 'wb') as f:
    pickle.dump(a, f)

In [7]:
# 反序列化 示例

with open(r'pickle测试.txt', 'rb') as f:
    a = pickle.load(f)
    print(a)

[23, 'ihaku', ' love 冰冰', [175, 50]]
