# `pickle`

O módulo `pickle` do Python permite **serializar** e **desserializar** objetos Python, ou seja, converter objetos em bytes para armazenamento ou transmissão e restaurá-los depois.  

## O que é Serialização (Pickling) e Desserialização (Unpickling)?

- **Serialização** (Pickling) → Converte um objeto Python em uma sequência de bytes para ser armazenado ou transmitido.  
- **Desserialização** (Unpickling) → Converte essa sequência de bytes de volta no objeto original.  

Isso é útil para armazenar estados de objetos, trocar dados entre programas e salvar sessões.  


In [8]:
import os
import pickle

file="dados.pkl"
dados = {"nome": "Alice", "idade": 30, "cidade": "São Paulo"}

In [4]:
# Salvando em um arquivo
with open(file, "wb") as f:
    pickle.dump(dados, f)

print("Dados salvos com sucesso!")

# - `wb` → Modo **write binary**, necessário para arquivos `pickle`.  
# - `pickle.dump(objeto, arquivo)` → Serializa e salva no arquivo.  

Dados salvos com sucesso!


In [5]:
# Lendo do arquivo
dados_carregados={}
if os.path.exists(file):
    with open(file, "rb") as f:
        dados_carregados=pickle.load(f)
print("Dados recuperados:", dados_carregados)

# - `rb` → **Read binary**, para ler arquivos `pickle`.  
# - `pickle.load(arquivo)` → Recupera o objeto original.  

Dados recuperados: {'nome': 'Alice', 'idade': 30, 'cidade': 'São Paulo'}


In [9]:
# Serializa para bytes
dados_serializados = pickle.dumps(
    ["banana", "maçã", "uva"]
)

# Desserializa
print(pickle.loads(dados_serializados))

# - `pickle.dumps(objeto)` → Retorna os dados serializados como `bytes`.
# - `pickle.loads(bytes_serializados)` → Recupera os dados a partir dos bytes.

['banana', 'maçã', 'uva']


## O Que Pode e o Que Não Pode Ser Serializado?

✅ **O que pode ser serializado?**:

- Tipos básicos: `int`, `float`, `str`, `list`, `tuple`, `dict`, `set`.  
- Objetos de classes definidas pelo usuário (com restrições).  

❌ **O que não pode ser serializado?**:

- **Arquivos abertos** (`open("arquivo.txt")`).  
- **Sockets, conexões de banco de dados** e outros objetos do sistema.  
- **Funções e classes** (salvo com módulos extras).  

In [10]:
f = open("meuarquivo.txt", "w")

with open("dados.pkl", "wb") as arq:
    pickle.dump(f, arq)  # Gera erro: TypeError: cannot pickle '_io.TextIOWrapper' object

TypeError: cannot pickle '_io.TextIOWrapper' object

## Serializando Objetos de Classes Próprias

Se você tiver uma classe personalizada, pode serializar/deserializar objetos dela:


In [13]:
class Pessoa:
    def __init__(self, nome, idade):
        self.nome = nome
        self.idade = idade

pessoa = Pessoa("Carlos", 25)

# Serializar objeto
with open("pessoa.pkl", "wb") as f:
    pickle.dump(pessoa, f)

# Desserializar objeto
with open("pessoa.pkl", "rb") as f:
    pessoa_carregada = pickle.load(f)

print(f"Nome: {pessoa_carregada.nome}, Idade: {pessoa_carregada.idade}")

# - 📌 **Isso funciona porque `pickle` salva o estado do objeto e não sua implementação**.  
# - ⚠️ **Se o código da classe mudar depois de salvar, pode haver problemas ao recarregar**.  


Nome: Carlos, Idade: 25


## Evitando Ataques de Segurança

O `pickle` **NÃO É SEGURO** para carregar arquivos de fontes desconhecidas. 

Um atacante pode injetar código malicioso que será executado ao desserializar.


In [None]:
class Ataque:
    def __reduce__(self):
        return (os.system, ("echo HACKED!",))  # Executa comando no sistema


# Criando um objeto malicioso
exploit = pickle.dumps(Ataque())

# Salvando o exploit
with open("exploit.pkl", "wb") as f:
    f.write(exploit)

# Carregando o exploit (simula um ataque)
with open("exploit.pkl", "rb") as f:
    hacker_carregada = pickle.load(f)  # Isso executa "echo HACKED!" no sistema
print(hacker_carregada)

0


### Como evitar?

Se precisar carregar `pickle` de fontes externas, use o **módulo `pickle.load()` com `restricting` (`safe_load`)** ou prefira `json` para dados simples.  


## Alternativas ao Pickle

| Alternativa | Quando Usar?                         | Prós                    | Contras                             |
| ----------- | ------------------------------------ | ----------------------- | ----------------------------------- |
| `json`      | Estruturas simples (`dict`, `list`)  | Leve e seguro           | Não salva classes/objetos complexos |
| `shelve`    | Armazenar múltiplos objetos em disco | Simples e prático       | Baseado em `pickle`, não seguro     |
| `msgpack`   | Alternativa binária ao `json`        | Mais eficiente que JSON | Menos compatível                    |

## Resumo

- ✔ **`pickle` é útil para armazenar objetos Python complexos**.  
- ✔ **Usado para salvar estados, cache e comunicação entre processos**.  
- ❌ **Não deve ser usado para carregar dados de fontes não confiáveis**.  
- 💡 **Para dados simples, `json` pode ser uma alternativa melhor**.  
