### pickle模块实现持久化存储

python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的**对象信息**保存到文件中去，永久存储；通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象。

- pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。

- pickle模块只能在python中使用，python中几乎所有的数据类型（列表，字典，集合，类等）都可以用pickle来序列化，

- pickle序列化后的数据，可读性差，人一般无法识别。

### 基本接口

>pickle.dump(obj, file, [,protocol])
- 注解：将对象obj保存到文件file中去。序列化
- protocol为序列化使用的协议版本，0：ASCII协议，所序列化的对象使用可打印的ASCII码表示；1：老式的二进制协议；2：2.3版本引入的新二进制协议，较以前的更高效。其中协议0和1兼容老版本的python。protocol默认值为0。如果为负值或HIGHEST_PROTOCOL，则使用最高的协议版本。
- file：对象保存到的类文件对象。file必须有write()接口， file可以是一个以'w'方式打开的文件或者一个StringIO对象或者其他任何实现write()接口的对象。如果protocol>=1，文件对象需要是二进制模式打开的。

>pickle.load(file)
- 注解：从file中读取一个字符串，并将它重构为原来的python对象。反序列化
- file:类文件对象，有read()和readline()接口。

### 用例一：
``` python
# Save the data for easy access
pickle_file = r'C:\Users\duanz\Desktop\github_repositories\Data\notMNIST.pickle'
if not os.path.isfile(pickle_file):
    print('Saving data to pickle file...')
    try:
        with open(r'C:\Users\duanz\Desktop\github_repositories\Data\notMNIST.pickle', 'wb') as pfile:
            pickle.dump(
                {
                    'train_dataset': train_features,
                    'train_labels': train_labels,
                    'valid_dataset': valid_features,
                    'valid_labels': valid_labels,
                    'test_dataset': test_features,
                    'test_labels': test_labels,
                },
                pfile, pickle.HIGHEST_PROTOCOL)
    except Exception as e:
        print('Unable to save data to', pickle_file, ':', e)
        raise

print('Data cached in pickle file.')
#####################################################################################################
# Reload the data
pickle_file = r'C:\Users\duanz\Desktop\github_repositories\Data\notMNIST.pickle'
with open(pickle_file, 'rb') as f:
  pickle_data = pickle.load(f)
  train_features = pickle_data['train_dataset']
  train_labels = pickle_data['train_labels']
  valid_features = pickle_data['valid_dataset']
  valid_labels = pickle_data['valid_labels']
  test_features = pickle_data['test_dataset']
  test_labels = pickle_data['test_labels']
  del pickle_data  # Free up memory

print('Data and modules loaded.')
```

### 用例二

In [3]:
#使用pickle模块将数据对象保存到文件

import pickle

data1 = {'a': [1, 2.0, 3, 4+6j],
         'b': ('string', u'Unicode string'),
         'c': None}

selfref_list = [1, 2, 3]
selfref_list.append(selfref_list)

output = open('pickle_example.pkl', 'wb')

# Pickle dictionary using protocol 0.
pickle.dump(data1, output)

# Pickle the list using the highest protocol available.
pickle.dump(selfref_list, output, -1)

output.close()

In [4]:
#使用pickle模块从文件中重构python对象

import pprint, pickle

pkl_file = open('pickle_example.pkl', 'rb')

data1 = pickle.load(pkl_file)
pprint.pprint(data1)

data2 = pickle.load(pkl_file)
pprint.pprint(data2)

pkl_file.close()

{'a': [1, 2.0, 3, (4+6j)], 'b': ('string', 'Unicode string'), 'c': None}
[1, 2, 3, <Recursion on list with id=2006703027208>]


### 用例三：保存一个自定义的对象

In [7]:
import pickle  
class Person:  
    def __init__(self,n,a):  
        self.name=n  
        self.age=a  
    def show(self):  
        print(self.name+"_"+str(self.age))  
aa = Person("JGood", 2)  
aa.show()  
f=open('pickle_example01.txt','wb')  
pickle.dump(aa,f,0)  
f.close()  
#del Person  
f=open('pickle_example01.txt','rb')  
bb=pickle.load(f)  
f.close()  
bb.show()  

JGood_2
JGood_2


### 清空pickler的备忘
>clear_memo()
- 清空pickler的“备忘”。使用Pickler实例在序列化对象的时候，它会“记住”已经被序列化的对象引用，所以对同一对象多次调用dump(obj)，pickler不会“傻傻”的去多次序列化。