# pickle

- 일반적인 텍스트를 파일로 저장할 경우에는 파일 입출력을 이용
- 그러나 리스트형이나 클래스와 같이 텍스트 형태가 아닌 자료형은 일반적인 파일 입출력이 불가능
- 텍스트 이외의 자료형을 파일로 저장힉 위해서 pickle을 사용, 즉 모든 파이썬 데이터 객체를 저장하고 읽어오기가 가능

- pickle : 파이썬에서는 개체를 파일에 저장한다는 의미를 갖는다. 
    - 객체상태를 저장 -> 이진파일로 변환 저장 -> 전달 -> 복원
    - 장점 
        - 파이썬 기본데이터 객체 및 사용자 클래스를 저장한다.
        - 서로 참조 되는 객체까지의 관계도 저장한다.
        - 재귀적인 관계도 처리된다.
        - 디버깅을 설계하고 문제가 생겼을 때 텍스트 에디터로 복구를 쉽게 할 수 있다.
    - 단점 
        - 파일의 용량이 크다. / 처리 속도가 느리다.
- cPickle : Pickle의 단점을 보안한 모듈
    - 3.4ver 이 후 윈도우 cPickle이 pickle로 병합 

1. import pickle or cPickle
2. dump(object, file)를 이용해서 파일로 객체를 출력한다.
3. dumps(object) -> string 문자열로 객체를 출력한다.
4. load(file) -> object : 파일에서 객체를 리턴 받는다.
5. loads(string) -> object 문자열에서 객체를 리턴한다.

In [1]:
import pickle

In [2]:
help(pickle)

Help on module pickle:

NAME
    pickle - Create portable serialized representations of Python objects.

MODULE REFERENCE
    https://docs.python.org/3.8/library/pickle
    
    The following documentation is automatically generated from the Python
    source files.  It may be incomplete, incorrect or include features that
    are considered implementation detail and may vary between Python
    implementations.  When in doubt, consult the module reference at the
    location listed above.

DESCRIPTION
    See module copyreg for a mechanism for registering custom picklers.
    See module pickletools source for extensive comments.
    
    Classes:
    
        Pickler
        Unpickler
    
    Functions:
    
        dump(object, file)
        dumps(object) -> string
        load(file) -> object
        loads(string) -> object
    
    Misc variables:
    
        __version__
        format_version
        compatible_formats

CLASSES
    builtins.Exception(builtins.BaseException)
     

In [9]:
# 피클링 작업을 해보자.

book = {'java' : 30000, 'jsp' : 35000, 'oracle' : 40000, '파이썬' : 28000} # 딕셔너리형
list = ['abcd', 90, 90.8] # 리스트형
Tuple = (book, list)

print(Tuple)

# f를 ptest라는 이름의 파일로 wb로 쓰겠다
f = open('ptest.txt', 'wb') # 바이너리 파일 쓰기
pickle.dump(Tuple, f) # 파일에 객체를 저장
f.close()

f = open('ptest.txt', 'rb') # 바이너리 파일 읽기
res01, res02 = pickle.load(f)
print(res01)
print(res02)

({'java': 30000, 'jsp': 35000, 'oracle': 40000, '파이썬': 28000}, ['abcd', 90, 90.8])
{'java': 30000, 'jsp': 35000, 'oracle': 40000, '파이썬': 28000}
['abcd', 90, 90.8]


In [10]:
class Address :
    def __init__(self, name, addr, tel) :
        self.name = name
        self.addr = addr
        self.tel = tel
        
    def prn(self) :
        print('%10s%10s%20s\n'%(self.name, self.addr, self.tel))
        
if __name__ == '__main__' :
    no01 = Address('홍길동', '서울', '02-000-0000')
    with open('address.txt', 'wb') as f :
        pickle.dump(no01, f)
    with open('address.txt', 'rb') as f :
        res = pickle.load(f)
        res.prn()

       홍길동        서울         02-000-0000



In [4]:
help(open)

Help on built-in function open in module io:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
    Open file and return a stream.  Raise OSError upon failure.
    
    file is either a text or byte string giving the name (and the path
    if the file isn't in the current working directory) of the file to
    be opened or an integer file descriptor of the file to be
    wrapped. (If a file descriptor is given, it is closed when the
    returned I/O object is closed, unless closefd is set to False.)
    
    mode is an optional string that specifies the mode in which the file
    is opened. It defaults to 'r' which means open for reading in text
    mode.  Other common values are 'w' for writing (truncating the file if
    it already exists), 'x' for creating and writing to a new file, and
    'a' for appending (which on some Unix systems, means that all writes
    append to the end of the file regardless of the current seek position

## 객체 단위 파일 입출력 : 지속 모듈 중의 하나로 파이썬 객체를 저장하는 모듈을 말한다.
1. DBM 관련 모듈 : anydbm, dbm, gdbm, dbhash, dumbdbm 등 시스템에 따라서 관련된 모듈 dict형
2. marshal 모듈 : 파이썬의 객체를 이진 포맷으로 저장(재귀적인 dict, list객체 사용 불가)
    - .pyc 파일의 컴파일된 코드를 쓰고 읽어들이는데 사용된다.
3. shelve 모듈 : dict형식으로 데이터를 접근하는 dbm 모듈 중 anydbm과 동일하지만 임의 파이썬 객체가 value로 사용할 수 있다.
    - 내부에서 dict형 인터페이스를 위해 anydbm모듈을 사용하고 객체 저장을 위해 cPickle 모듈을 이용한다.
    
from pickle import Pickler, Unpickler