# Сериализация

## Определение

Это способ преобразования структуры данных в линейную форму, которую можно сохранить или передать по сети

Иное название - marshalling

## Форматы сериализации

* Текстовые (XML, JSON, YAML, CSV) - имеют схему документа
* Бинарные

## Библиотеки Python

* marhsal
* json
* yml
* pickle

### pickle:

Для сериализации:
.dump
.dumps

Для десериализации:
.load
.loads

In [None]:
# Пример 1

import pickle

class example_class:
    a_number = 35
    a_string = "hey"
    a_list = [1, 2, 3]
    a_dict = {"first": "1", "second": "2"}
    a_tuple = (2, 3, 4)

my_object = example_class()

picked_obj = pickle.dumps(my_object)

print(f"This picked object:\n{picked_obj}")

my_object.dict = None

unpicked_obj = pickle.loads(picked_obj)

In [None]:
# Пример 2

import pickle

data = {...}

with open("data.pickled", "wb") as file:
    pickle.dump(data, file)

# При чтении "wb" => "rb", а dump => load

## Несериализированные объекты

1. С большой вложенностью
2. Лямбда-функции
3. Генераторы
4. Модули
5. Файловые объекты
6. Сетевые объекты
7. Подключения к базам данных
8. Фреймы стека

In [None]:
# Пример 3

import pickle, dill

square = lambda x: x*x

my_pickle = pickle.dumps(square) # выдаст ошибку

my_dill = dill.dumps(square) # сработает

In [None]:
# Пример 4 - интерактивная оболочка

# Сохранение сессии
>>> square = lambda x: x*x
>>> a = square(100)
>>> import math
>>> b = sqrt(a)
>>> import dill
>>> dill.dump_session("test.pke")
>>> exit

# Загрузка сессии:
>>> import dill
>>> dill.load_session

In [None]:
# Пример 5

import pickle

class foobar:
    def __init__(self):
        self.a = 35
        self.b = "test"
        self.c = lambda x: x*x
        
    def __getstate__(self):
        attributes = self.__dict__.copy()
        del attributes['c']
        return attributes

In [None]:
# Пример 6

import pickle

class foobar:
    def __init__(self):
        self.a = 35
        self.b = "test"
        self.c = lambda x: x*x

    def __setstate__(self, state):
        self.__dict__ = state
        self.c = lambda x: x*x

## Цифровые подписи

Нужны для того, чтобы проверять код и не запускать вредоносный код

* hashlib
* hmac

In [None]:
# Сжатие данных

import bz2

pickled = _.dumps()

copressed = bz2.compress(pickled)