# Pickle:  Serializando Objetos Python

## $ whoami  
Emanuel Lima  
Estagiário no Centro de Computação do IFUSP  

## O que é Pickling?  
 * Pickling é o ato de serializar ou deserializar objetos Python  
 * Serializar é transformar esses objetos em memória em um stream de bites que pode ser salvo em disco ou enviado por uma rede.  
 * Deserializar é o processo inverso.  
 * Exemplo: Num jogo simples, você pode salvar o progresso do seu personagem serializando uma instância de uma classe Jogador que contém todas as informações de um estado específico do jogo, como vida, quantidade de moedas, etc. Ao reiniciar o jogo, você deserializa o objeto a partir do arquivo de salvamento e retoma de onde parou.  

## Usando o Pickle  
### Exemplo Simples:  Serializando um Dicionário  

In [21]:
import pickle

In [22]:
dic = {1: "A", 2: "B", 3: "C", 4: "D", 5: "E"}
with open("dicio.pickle", "wb") as pickled_obj:
    pickle.dump(dic, pickled_obj)

In [23]:
!ls

dicio.pickle  LICENSE.md  pickle.ipynb	README.md  smaller_file


In [24]:
!cat dicio.pickle

�}q (KX   AqKX   BqKX   CqKX   DqKX   Equ.

### Deserializando um dicionário:  

In [25]:
with open("dicio.pickle", "rb") as pickle_off:
    dic_from_pickle = pickle.load(pickle_off)
print(dic_from_pickle)

{1: 'A', 2: 'B', 3: 'C', 4: 'D', 5: 'E'}


## O que eu posso serializar facilmente?  
* Booleanos
* Inteiros
* Floats
* Números Complexos
* Strings (Normal e Unicode) 
* Tuplas
* Listas
* Sets
* Dicionários que contem outros objetos serializáveis
* Classes e Funções

## E não tão facilmente?  
* Generators
* Funções Lambda 

## Pickle vs JSON:  
* JSON é um formato de serialização de texto (ele devolve texto UTF-8, geralmente), enquanto que Pickle é um formato de serialização binário;
* JSON é legível por humanos, enquanto que Pickle não é;
* JSON é interoperável e muito usado fora do ecossistema Python, enquanto que o Pickle é específico para ambientes Python;
* JSON, por default, consegue representar apenas uma parte dos tipos built-in do Python, enquanto que o Pickle consegue serializar um número grande de tipos e classes customizadas. 

## Observações:  
* Serialização é uma noção mais "primitiva" que persistência. Embora o pickle leia e escreva arquivos, ele não lida bem com questões mais complicadas, como acesso concorrente a objetos persistentes. 
* O pickle consegue transformar um objeto complexo em um stream de bytes e consegue transformar um stream de bytes em um objeto com a mesma estrutura interna. Daí, o uso mais imediato é salvar objetos em arquivos, mas também é possível enviá-los por uma rede ou guardá-los em um banco de dados.  

## Algumas Exceptions  
* Pickle.PicklingError: Essa exception ocorre quando se tenta usar pickle em objetos não suportados.  
* Pickle.UnpicklingError: Essa exception ocorre quando se tenta usar pickle em arquivos corrompidos.  

## Comprimindo arquivos Pickle:  
* Se você estiver serializando objetos muito grandes, pode ser útil comprimi-los.
* Mas para objetos muito pequenos você não verá diferença nenhuma.
* Vejamos como comprimir usando o módulo bzip2.

In [26]:
import bz2
dic = {1: "A", 2: "B", 3: "C", 4: "D", 5: "E"}
compressed_file = bz2.BZ2File('smaller_file', 'w')
pickle.dump(dic, compressed_file)
compressed_file.close()

## Vantagens:  
* Ajuda a salvar dados complicados.
* Fácil de usar, não precisa de muitas linhas de código.
* Dados salvos não são legíveis. Isso proporciona alguma segurança.

## Desvantagens:  

* Outras linguagens não conseguem deserializar arquivos pickle. 
* Existem riscos de segurança ao deserializar dados de fontes maliciosas.  

# Perguntas?    
  
https://emanuellima1.github.io   
https://www.linkedin.com/in/emanuellima1/  