# TestNote_30_Сериализация

Среда или требования к инференсу модели для вашего проекта могут быть устроены так, что потребуют реализации на другом языке программирования, отличном от Python. Например, если компания разрабатывает десктопное приложение, то для внедрения модели её потребуется «перевести» на Java или C++. Как это сделать?

В таких случаях используется генерация файла формата PMML (Predictive Model Markup Language). 

**Определение: PMML**

PMML — это XML-диалект, который используется для описания статистических моделей и моделей data science. PMML-совместимые приложения позволяют легко обмениваться моделями данных между собой. Разработка и внедрение PMML осуществляется IT-консорциумом Data Mining Group.

На момент подготовки данного материала актуальная версия спецификации — 4.4. Подробнее с ней можно ознакомиться на официальном сайте http://dmg.org/pmml/v4-4/GeneralStructure.html

К сожалению, далеко не все библиотеки машинного обучения (в том числе sklearn) поддерживают возможность сохранения обученной модели в указанном формате. Хорошая новость заключается в том, что можно использовать сторонние библиотеки. Одной из самых популярных является Nyoka https://open-source.softwareag.com/nyoka/. 

Давайте сохраним модель из предыдущего блока в формат PMML.

Для установки можно использовать систему управления пакетами pip:

In [2]:
!pip install --user nyoka==4.2.1

Collecting nyoka==4.2.1
[?25l  Downloading https://files.pythonhosted.org/packages/fe/91/e7dc53dd8a7e33aaced50a57c4392cb6f7330fc289d87d283a6252e9e71c/nyoka-4.2.1-py3-none-any.whl (331kB)
[K     |████████████████████████████████| 337kB 3.0MB/s eta 0:00:01
Installing collected packages: nyoka
Successfully installed nyoka-4.2.1


Рассмотрим пример работы с библиотекой:

In [3]:
from nyoka import skl_to_pmml
from sklearn.preprocessing import MinMaxScaler
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_diabetes

X, y = load_diabetes(return_X_y=True)
cols = load_diabetes()['feature_names']

scaler = MinMaxScaler()
pipe = Pipeline([  
            ('Scaling', MinMaxScaler()),
            ('Linear', LinearRegression())
        ])

# Тренировка пайплайна, включающего линейную модель и нормализацию признаков
pipe.fit(X, y)

# Сохраним пайплайн в формате pmml в файл pipe.pmml
skl_to_pmml(pipeline=pipe, col_names=cols, pmml_f_name="./models/pipe.pmml")

In [7]:
!cat ./models/pipe.pmml

<?xml version="1.0" encoding="UTF-8"?>
<PMML xmlns="http://www.dmg.org/PMML-4_4" version="4.4">
    <Header copyright="Copyright (c) 2018 Software AG" description="Default Description">
        <Application name="Nyoka" version="4.2.1"/>
        <Timestamp>2021-08-31 19:18:01.049057</Timestamp>
    </Header>
    <DataDictionary numberOfFields="11">
        <DataField name="age" optype="continuous" dataType="double"/>
        <DataField name="sex" optype="continuous" dataType="double"/>
        <DataField name="bmi" optype="continuous" dataType="double"/>
        <DataField name="bp" optype="continuous" dataType="double"/>
        <DataField name="s1" optype="continuous" dataType="double"/>
        <DataField name="s2" optype="continuous" dataType="double"/>
        <DataField name="s3" optype="continuous" dataType="double"/>
        <DataField name="s4" optype="continuous" dataType="double"/>
        <DataField name="s5" optype="continuous" dataType="double"/>
        <

Таким образом, в файле содержится вся информация для того, чтобы пайплайн мог быть использован на любом языке программирования.

В разработке моделей на основе нейронных сетей сегодня наиболее распространен формат ONNX (Open Neural Network Exchange).

**Определение: ONNX**

ONNX (Open Neural Network Exchange) — это открытый стандарт для обеспечения совместимости моделей машинного обучения. Он позволяет разработчикам искусственного интеллекта использовать модели с различными инфраструктурами, инструментами, средами исполнения и компиляторами.


Стандарт поддерживается совместно компаниями Microsoft, Amazon, Facebook и другими партнерами как проект с открытым исходным кодом.

**Информация на будущее**

Часто стандарт ONNX и его библиотеки используют для конвертации из одного фреймворка в другой (например, из Pytorch в Tensorflow для использования в продакшне). Для конвертации различных фреймворков (не только DL) в формат ONNX и обратно существует ряд библиотек: 

- ONNX-Tensorflow https://github.com/onnx/onnx-tensorflow
- Tensorflow-ONNX https://github.com/onnx/tensorflow-onnx
- Keras-ONNX https://github.com/onnx/keras-onnx
- Sklearn-ONNX https://github.com/onnx/sklearn-onnx
- …и другие.

Также в рамках стандарта ONNX есть инструмент ONNX-runtime https://github.com/microsoft/onnxruntime. Он служит для ускорения инференса Python-моделей, а также инференса на других языках, например Java, C++.

В дополнение: 
- Документация по работе с Pickle https://docs.python.org/3/library/pickle.html
- Документация по работе с Joblib https://joblib.readthedocs.io/en/latest/

**Задание для продвинутых (необязательно, но рекомендуется)**

Для выполнения этого задания вам понадобится ознакомиться с документацией http://onnx.ai/sklearn-onnx/api_summary.html.

В задаче ниже мы обучаем модель sklearn, конвертируем ее в ONNX и делаем инференс через ONNX-runtime.

Дополните код ниже недостающими элементами:

In [9]:
!pip install --user onnxruntime

Collecting onnxruntime
[?25l  Downloading https://files.pythonhosted.org/packages/19/7d/fb6da206e9b161dd49a1f3095a52bde5ad96b505868769041cb04652267d/onnxruntime-1.8.1-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (4.5MB)
[K     |████████████████████████████████| 4.5MB 3.1MB/s eta 0:00:01
Collecting flatbuffers
  Downloading https://files.pythonhosted.org/packages/3d/d0/26033c70d642fbc1e35d3619cf3210986fb953c173b1226709f75056c149/flatbuffers-2.0-py2.py3-none-any.whl
Installing collected packages: flatbuffers, onnxruntime
Successfully installed flatbuffers-2.0 onnxruntime-1.8.1


In [11]:
!pip install --user skl2onnx

Collecting skl2onnx
[?25l  Downloading https://files.pythonhosted.org/packages/fb/3d/6c8f1f1499f38b172810e44f62eddf1c3effc90be7899cfaa8a7657bf980/skl2onnx-1.9.2-py2.py3-none-any.whl (240kB)
[K     |████████████████████████████████| 245kB 3.2MB/s eta 0:00:01
[?25hCollecting onnxconverter-common>=1.6.1
[?25l  Downloading https://files.pythonhosted.org/packages/42/f5/82c29029a643dd4de8e0374fe2d5831f50ca58623dd1ee41e0b8df8a7d71/onnxconverter_common-1.8.1-py2.py3-none-any.whl (77kB)
[K     |████████████████████████████████| 81kB 4.1MB/s  eta 0:00:01
Collecting onnx>=1.2.1
[?25l  Downloading https://files.pythonhosted.org/packages/fa/f4/4dd2fb863294a39c03d3adb9aacfaa543f64e8d9c07ed98739b5bf413dfe/onnx-1.10.1-cp36-cp36m-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (12.3MB)
[K     |████████████████████████████████| 12.3MB 11.6MB/s eta 0:00:01   |███████████                     | 4.3MB 6.8MB/s eta 0:00:02
Installing collected packages: onnx, onnxconverter-common, skl2onnx
Successfully 

In [15]:
import onnxruntime as rt 
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from skl2onnx import convert_sklearn
from skl2onnx.common.data_types import FloatTensorType


# загружаем данные
X, y = load_boston(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=7)
print(X_train.shape, X_test.shape)

# обучаем модель
model = LinearRegression()
model.fit(X_train, y_train)

# делаем инференс моделью на тесте
test_pred = model.predict(X_test)
print('sklearn model predict:\n', test_pred)

# конвертируем модель в onnx формат
initial_type = [('float_input', FloatTensorType([None, X_train.shape[1]]))]
model_onnx = convert_sklearn(model, initial_types=initial_type)

# сохраняем модель в файл
with open("./models/model.onnx", "wb") as f:
    f.write(model_onnx.SerializeToString())

# Делаем инференс на тесте через onnxruntime
sess = rt.InferenceSession("./models/model.onnx")
input_name = sess.get_inputs()[0].name
label_name = sess.get_outputs()[0].name
test_pred_onnx = sess.run([label_name], {input_name:  X_test.astype(np.float32)})[0].reshape(-1)
print('onnx model predict:\n',test_pred_onnx) 

AttributeError: module 'google.protobuf.descriptor' has no attribute '_internal_create_key'