# Pickle:  Serializando Objetos Python

## $ whoami  
Emanuel Lima  
Graduando em Física - USP  
Estagiário no Centro de Computação do IFUSP  

## O que é Pickling?  
 * Pickling é o ato de serializar ou deserializar objetos Python.  
 * Serializar é transformar em um stream de bites esses objetos que podem ser salvos em disco ou enviados por uma rede.  
 * Deserializar é o processo inverso.  
 * Exemplo: Num jogo simples, você pode salvar o progresso do seu personagem serializando uma instância de uma classe Jogador que contém todas as informações de um estado específico do jogo, como vida, quantidade de moedas, etc. Ao reiniciar o jogo, você deserializa o objeto a partir do arquivo de salvamento e retoma de onde parou.  

## Usando o Pickle  
### Exemplo Simples:  Serializando para String  

In [None]:
import pickle

In [None]:
lista = ["Maçã", 42, {'A': 1, 'B': 2}, 3.14]

dump = pickle.dumps(lista)
print(dump)

In [None]:
objeto = pickle.loads(dump)
print(objeto)

### Exemplo Simples: Serializando um Dicionário

In [None]:
dic = {1: "A", 2: "B", 3: "C", 4: "D", 5: "E"}
with open("dicio.pickle", "wb") as pickled_obj:
    pickle.dump(dic, pickled_obj)

In [None]:
!ls

In [None]:
!cat dicio.pickle

### Deserializando um dicionário:  

In [None]:
with open("dicio.pickle", "rb") as pickle_off:
    dic_from_pickle = pickle.load(pickle_off)
print(dic_from_pickle)

## O que eu posso serializar facilmente?  
* Booleanos
* Inteiros
* Floats
* Números Complexos
* Strings (Normal e Unicode) 
* Tuplas
* Listas
* Sets
* Dicionários que contem outros objetos serializáveis
* Classes e Funções

## E não tão facilmente?  
* Generators
* Funções Lambda 

## Serializando suas próprias classes

In [None]:
class Jogador:
    def __init__(self, nome, vida, moedas):
        self.nome = nome
        self.vida = vida
        self.moedas = moedas

    def __str__(self):
        return f"Meu nome é {self.nome}, estou com {self.vida} de vida e {self.moedas} de moedas."

In [None]:
ezio = Jogador("Ezio da Firenze", 100, 576)
kerrigan = Jogador("Queen of Blades", 100, 345)

print(ezio)
print(kerrigan)

In [None]:
with open("players.pickle", "wb") as players_dump:
    pickle.dump(ezio, players_dump)
    pickle.dump(kerrigan, players_dump)

In [None]:
!ls

In [None]:
!cat players.pickle

### Deserializando

In [None]:
with open("players.pickle", "rb") as players_load:
    ezio_loaded = pickle.load(players_load)
    kerrigan_loaded = pickle.load(players_load)

In [None]:
print(ezio_loaded)
print(kerrigan_loaded)

## Pickle vs JSON:  
* JSON é um formato de serialização de texto, enquanto que Pickle é um formato de serialização binário;
* JSON é legível por humanos, enquanto que Pickle não é;
* JSON é interoperável e muito usado fora do ecossistema Python, enquanto que o Pickle é específico para ambientes Python;
* JSON, por default, consegue representar apenas uma parte dos tipos built-in do Python, enquanto que o Pickle consegue serializar um número grande de tipos e classes customizadas. 

## E se a gente tentasse serializar os jogadores com JSON?

In [None]:
import json

In [None]:
ezio_json = json.dumps(ezio)

## Observações:  
* Serialização é uma noção mais "primitiva" que persistência. Embora o pickle leia e escreva arquivos, ele não lida bem com questões mais complicadas, como acesso concorrente a objetos persistentes. 
* O pickle consegue transformar um objeto complexo em um stream de bytes e consegue transformar um stream de bytes em um objeto com a mesma estrutura interna. Daí, o uso mais imediato é salvar objetos em arquivos, mas também é possível enviá-los por uma rede ou guardá-los em um banco de dados.  

## Algumas Exceptions  
* Pickle.PicklingError: Essa exception ocorre quando se tenta usar pickle em objetos não suportados.  
* Pickle.UnpicklingError: Essa exception ocorre quando se tenta usar pickle em arquivos corrompidos.  

## Comprimindo arquivos Pickle:  
* Se você estiver serializando objetos muito grandes, pode ser útil comprimi-los.
* Mas para objetos muito pequenos você não verá diferença nenhuma.
* Vejamos como comprimir usando o módulo bzip2.

In [None]:
import bz2
dic = {1: "A", 2: "B", 3: "C", 4: "D", 5: "E"}
compressed_file = bz2.BZ2File('smaller_file', 'w')
pickle.dump(dic, compressed_file)
compressed_file.close()

## Vantagens:  
* Ajuda a salvar dados complicados.
* Fácil de usar, não precisa de muitas linhas de código.

## Desvantagens:  

* Outras linguagens podem não conseguir deserializar arquivos pickle. 
* Existem riscos de segurança ao deserializar dados de fontes maliciosas.  

## Segurança?  
* O Pickle objetiva nos deixar serializar qualquer objeto do Python. A pergunta que fica é: e se nós serializarmos um objeto subprocess.Popen?
* Se conseguirmos, conseguiremos executar qualquer comando do shell!
* O ponto é que o pickle permite que qualquer objeto declare como ele deve ser serializado usando um método \_\_reduce__ que, de modo bem básico, deve retornar uma tupla que contém uma classe e uma outra tupla com argumentos desta classe.
* No processo de deserialização, o pickle vai invocar a classe serializada com os argumentos passados!
* Vejamos como isso funciona num exemplo bem simples no terminal:  

### É por isso, crianças, que nunca se deve deserializar pickles de fontes desconhecidas

# Perguntas?    
  
https://emanuellima1.github.io   
https://github.com/emanuellima1/pickle  
https://www.linkedin.com/in/emanuellima1/  