# 様々な環境での推論：ONNX、Menohの活用

前章まではChainerを用いての学習済みモデルの作成方法・推論の実行方法を解説しました。  
推論時にも言語はPython、ディープラーニングのフレームワークはChainerという同じ環境を想定していました。  

しかし、実務で推論を行う上ではそのような環境がない可能性もあります。  
そこで本章では `ONNX` （オニキス）と呼ばれるパッケージを使用して、異なるフレームワークを使用して推論を実行する方法について解説していきます。  
また、`Menoh`（メノウ）を使用して他言語での推論方法もお伝えします。

## ONNXとは？

`ONNX` とは **Open Neural Network eXchange** の略で、Deep Learningモデルを様々なフレームワーク間で交換するためのフォーマットです。  

ONNXを使用することによって、Chainerで学習させたモデルを他のフレームワークでも利用することができます。  

多様なフレームワークが用いられる実務では重要な仕組みになります。  

### ONNXフォーマットの対応状況  

ONNXは全てのDeep Learningのフレームワークに対応していません。  
現在のフォーマット対応状況は[公式のGitHubページ](https://github.com/onnx/tutorials)から確認することができます。  

2019年1月現在では下記のようになっています。  


| Framework / tool                                             | Installation                                                 | Exporting to ONNX (frontend)                                 | Importing ONNX models (backend)                              |
| ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| [Caffe2](http://caffe2.ai/)                                  | [part of caffe2 package](https://github.com/pytorch/pytorch/tree/master/caffe2/python/onnx) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/Caffe2OnnxExport.ipynb) | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxCaffe2Import.ipynb) |
| [PyTorch](http://pytorch.org/)                               | [part of pytorch package](http://pytorch.org/docs/master/onnx.html) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/PytorchOnnxExport.ipynb), [Extending support](https://github.com/onnx/tutorials/blob/master/tutorials/PytorchAddExportSupport.md) | coming soon                                                  |
| [Cognitive Toolkit (CNTK)](https://www.microsoft.com/en-us/cognitive-toolkit/) | [built-in](https://docs.microsoft.com/en-us/cognitive-toolkit/setup-cntk-on-your-machine) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/CntkOnnxExport.ipynb) | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxCntkImport.ipynb) |
| [Apache MXNet](http://mxnet.incubator.apache.org/)           | part of mxnet package [docs](http://mxnet.incubator.apache.org/api/python/contrib/onnx.html) [github](https://github.com/apache/incubator-mxnet/tree/master/python/mxnet/contrib/onnx) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/MXNetONNXExport.ipynb) | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxMxnetImport.ipynb) |
| [Chainer](https://chainer.org/)                              | [chainer/onnx-chainer](https://github.com/chainer/onnx-chainer) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/ChainerOnnxExport.ipynb) | coming soon                                                  |
| [TensorFlow](https://www.tensorflow.org/)                    | [onnx/onnx-tensorflow](https://github.com/onnx/onnx-tensorflow) and [onnx/tensorflow-onnx](https://github.com/onnx/tensorflow-onnx) | [Exporting](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxTensorflowExport.ipynb) | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxTensorflowImport.ipynb) [experimental] |
| [Apple CoreML](https://developer.apple.com/documentation/coreml) | [onnx/onnx-coreml](https://github.com/onnx/onnx-coreml) and [onnx/onnxmltools](https://github.com/onnx/onnxmltools) | [Exporting](https://github.com/onnx/onnxmltools)             | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxCoremlImport.ipynb) |
| [SciKit-Learn](http://scikit-learn.org/)                     | [onnx/onnxmltools](https://github.com/onnx/onnxmltools)      | [Exporting](https://github.com/onnx/onnxmltools)             | n/a                                                          |
| [ML.NET](https://github.com/dotnet/machinelearning/)         | [built-in](https://docs.microsoft.com/en-us/dotnet/api/microsoft.ml.models.onnxconverter.convert?view=ml-dotnet#definition) | [Exporting](https://github.com/dotnet/machinelearning/blob/master/test/Microsoft.ML.Tests/OnnxTests.cs) | [Importing](https://github.com/dotnet/machinelearning/blob/master/test/Microsoft.ML.OnnxTransformTest/OnnxTransformTests.cs#L186) |
| [Menoh](https://github.com/pfnet-research/menoh)             | [pfnet-research/menoh](https://github.com/pfnet-research/menoh) | n/a                                                          | [Importing](https://github.com/onnx/tutorials/blob/master/tutorials/OnnxMenohHaskellImport.ipynb) |
| [MATLAB](https://www.mathworks.com/)                         | [onnx converter on matlab central file exchange](https://www.mathworks.com/matlabcentral/fileexchange/67296) | [Exporting](https://www.mathworks.com/help/deeplearning/ref/exportonnxnetwork.html) | [Importing](https://www.mathworks.com/help/deeplearning/ref/importonnxnetwork.html) |
| [TensorRT](https://developer.nvidia.com/tensorrt)            | [onnx/onnx-tensorrt](https://github.com/onnx/onnx-tensorrt)  | n/a                                                          | [Importing](https://github.com/onnx/onnx-tensorrt/blob/master/README.md) |

Chainerでは現在 `Exporting` （Chainerの学習済みモデルをONNXのフォーマットに変換すること）のみが可能です。　 
しかし、 `Importing` も開発中のためゆくゆくは利用可能となる予定です。  

### ONNXの使用上の注意点

ONNXを使用する上ではいくつか注意するポイントがあります。  

#### Deep Learningフレームワーク間でのExport/Importのフォーマット対応

前項でも解説したように、ONNXでは対応しているフォーマットに違いがあります。  
そのため、全てのフレームワークに相互互換がないと言うことに注意しましょう。  

例えば、ChainerからExportは実行することができますが、ExportしたものはPyTorchにはImportを行うことができません。  
（上記は将来的には解消される予定です。）


#### Deep Learningフレームワークのパーツレベルでの対応

こちらの問題点はあまり気にする必要はありませんが、稀にONNX側でサポートしていない関数などが存在する場合があります。  

サポートしている関数などを確認するには[公式のドキュメント](https://github.com/onnx/onnx/blob/master/docs/Operators.md)を確認してください。  

## ONNXの使用方法

Chainerの学習済みモデルをONNXのフォーマットに変換する方法を解説します。  

今回はChainerの中で学習済みモデルとして用意されているVGG16のモデルを使用します。  

In [0]:
import chainer
import chainer.functions as F
import chainer.links as L

In [2]:
# VGG16モデルの読み込み
model = L.VGG16Layers()

Downloading from https://www.robots.ox.ac.uk/%7Evgg/software/very_deep/caffe/VGG_ILSVRC_16_layers.caffemodel...
Now loading caffemodel (usually it may take few minutes)


In [3]:
# VGG16のアーキテクチャーの確認
model.available_layers

['conv1_1',
 'conv1_2',
 'pool1',
 'conv2_1',
 'conv2_2',
 'pool2',
 'conv3_1',
 'conv3_2',
 'conv3_3',
 'pool3',
 'conv4_1',
 'conv4_2',
 'conv4_3',
 'pool4',
 'conv5_1',
 'conv5_2',
 'conv5_3',
 'pool5',
 'fc6',
 'fc7',
 'fc8',
 'prob']

### ONNXのフォーマットに変換

ONNXのフォーマットに変換する際には `onnx-chainer` を使用します。  
Google Colabratory内にはデフォルトで用意されていないので `pip` を使用してインストールしましょう。 

In [4]:
!pip install onnx-chainer

Collecting onnx-chainer
  Downloading https://files.pythonhosted.org/packages/88/7a/dbd770f51d82a8a37ee4f3bb3a1bbf83be456edb4f69fab6475971a22712/onnx-chainer-1.3.0a1.tar.gz
Collecting onnx>=1.3.0 (from onnx-chainer)
[?25l  Downloading https://files.pythonhosted.org/packages/99/26/753bca1bc4e7e254d34da82f5b2e213ca9b32cbeb2d9e305fec4abcfebf7/onnx-1.4.1-cp36-cp36m-manylinux1_x86_64.whl (6.9MB)
[K    100% |████████████████████████████████| 6.9MB 4.4MB/s 
Collecting typing-extensions>=3.6.2.1 (from onnx>=1.3.0->onnx-chainer)
  Downloading https://files.pythonhosted.org/packages/0f/62/c66e553258c37c33f9939abb2dd8d2481803d860ff68e635466f12aa7efa/typing_extensions-3.7.2-py3-none-any.whl
Collecting typing>=3.6.4 (from onnx>=1.3.0->onnx-chainer)
  Downloading https://files.pythonhosted.org/packages/4a/bd/eee1157fc2d8514970b345d69cb9975dcd1e42cd7e61146ed841f6e68309/typing-3.6.6-py3-none-any.whl
Building wheels for collected packages: onnx-chainer
  Running setup.py bdist_wheel for onnx-chainer 

In [0]:
import onnx_chainer

Chainerは **Define-by-Run** というスタイルを採用しているため、ネットワーク構造は実際にデータを渡してフォワード計算を行うまで決定されていません。  
そのため、 `ONNX-Chainer` ではダミーの入力変数を準備して、ONNXの形式に変換時にその値を渡してあげる必要があります。  

推論の際にはバッチサイズ、行、列の `shape` の入力変数を用いたのと同様の形かつ、データ型も `float32型`  のダミーの変数 `x` を渡します。  

VGG16モデルは224×224の3チャネルのインプットを想定しています。  

In [6]:
# ダミー変数の準備
import numpy as np
_x = np.zeros((1, 3, 224, 224), dtype=np.float32)
_x.shape

(1, 3, 224, 224)

In [0]:
# 推論モードに切り替え
chainer.config.train = False

# ONNXのフォーマットに変換
onnx_model = onnx_chainer.export(model, _x, filename='convnet.onnx')

In [8]:
!ls

convnet.onnx  sample_data


このようにして学習済みモデルをONNXのフォーマットに変換することができました。  

続いてはこちらを他のフレームワークのフォーマットにImportします。  

### Caffe2で推論

先ほどChainerで作成し、ONNXの形式で保存したモデルを読み込みCaffe2で推論を行います。  

その前に`pytorch` をインストールしておく必要があります。  
（pytorchは `caffe2` のモジュールをインポートするために必要になります。）


In [9]:
!pip install torch torchvision

Collecting torch
[?25l  Downloading https://files.pythonhosted.org/packages/7e/60/66415660aa46b23b5e1b72bc762e816736ce8d7260213e22365af51e8f9c/torch-1.0.0-cp36-cp36m-manylinux1_x86_64.whl (591.8MB)
[K    100% |████████████████████████████████| 591.8MB 27kB/s 
tcmalloc: large alloc 1073750016 bytes == 0x61c20000 @  0x7f5061f862a4 0x591a07 0x5b5d56 0x502e9a 0x506859 0x502209 0x502f3d 0x506859 0x504c28 0x502540 0x502f3d 0x506859 0x504c28 0x502540 0x502f3d 0x506859 0x504c28 0x502540 0x502f3d 0x507641 0x502209 0x502f3d 0x506859 0x504c28 0x502540 0x502f3d 0x507641 0x504c28 0x502540 0x502f3d 0x507641
[?25hCollecting torchvision
[?25l  Downloading https://files.pythonhosted.org/packages/ca/0d/f00b2885711e08bd71242ebe7b96561e6f6d01fdb4b9dcf4d37e2e13c5e1/torchvision-0.2.1-py2.py3-none-any.whl (54kB)
[K    100% |████████████████████████████████| 61kB 22.8MB/s 
Collecting pillow>=4.1.1 (from torchvision)
[?25l  Downloading https://files.pythonhosted.org/packages/85/5e/e91792f198bbc5a0d7d3055

In [0]:
# Caffe2のパッケージの中にONNXを使用するモジュールがあります
import caffe2
from caffe2.python.onnx import backend
from caffe2.python.onnx.helper import save_caffe2_net

#### 推論用のデータの準備

In [0]:
# ダミーの変数を用意
x = np.random.randn(1, 3, 224, 224).astype(np.float32)

In [12]:
x.shape

(1, 3, 224, 224)

#### Caffe2モデルで推論の実行

In [0]:
# 保存済みONNXモデルの読み込み
import onnx
onnx_model = onnx.load("convnet.onnx")

In [0]:
# Caffe2で推論できる状態に準備
prepared_backend = backend.prepare(onnx_model)

In [0]:
# Caffe2での推論の実行
caffe_output = prepared_backend.run(x)

### ONNX出力したChainerのモデルをCaffe2形式で保存

先ほどはChainerのモデルをONNXのフォーマットに変換し、そしてCaffe2を使用して推論を行いました。  

本項ではそのONNXのモデルをCaffe2のフォーマットで保存します。  

In [0]:
# ONNXモデルをCaffe2モデルに変換
init_net, predict_net = backend.Caffe2Backend.onnx_graph_to_caffe2_net(onnx_model, device='CPU')

In [0]:
# Caffe2モデルの保存
save_caffe2_net(init_net , 'caffemodel_init.pb', output_txt=False)
save_caffe2_net(predict_net , 'caffemodel_predict.pb', output_txt=False)

In [18]:
!ls

caffemodel_init.pb  caffemodel_predict.pb  convnet.onnx  sample_data


Caffe2の特徴の1つとしてモバイル対応が強化されているという点があります。  

このようにChainerで作成したモデルをCaffe2モデルに変換することによって、モバイルにも対応させることが可能になりました。

## Menohで他言語で推論

前節では異なるフレームワークを使用しての推論方法をお伝えしました。  
本節では`Menoh`（メノウ）を使用しての他言語での推論方法を解説します。  

Menohは学習済みのディープラーニングのモデルをONNX形式から読み込んで動作させる推論専用のライブラリです。  
本章では`Ruby`言語を使用しての推論方法を紹介します。  
（本章はRubyの使用経験がある方を対象にしているため、Ruby言語についての解説は最少となっています。）  

Menohは`Ruby`のみならずその他の言語もサポートしています。  
`C#`, `Go`, `Haskell`, `Node.js`, `Rust`などです。  
その他の使用方法には関しては[こちらのGitHubのページ](https://github.com/pfnet-research/menoh)を参照してください。　　

### Ruby-Menohの環境構築

まずは環境構築の方法を確認します。  

#### Rubyのインストール

もし、RubyをこちらのチュートリアルにRuby未経験で試される方はこちらの節に従い、環境を整えてください。

**Windowsの場合**  

[こちら](https://rubyinstaller.org/downloads/)からダウンロード


**Macの場合**  

初期状態でインストール済み


#### Menohのインストール

Menohをインストールして環境を構築しましょう。  

```bash
gem install bundler
gem install rake-compiler
```

```bash
gem install menoh
```

しかし、現状ではWindowsでもMacでも下記のエラーが出てしまい、インストールがうまくいきません。  

```bash
menoh_ruby.h:4:10: fatal error: menoh/menoh.h: No such file or directory
 #include <menoh/menoh.h>
          ^~~~~~~~~~~~~~~
compilation terminated.
make: *** [Makefile:244: menoh_ruby.o] エラー 1

make failed, exit code 2
```

そのため、Dockerを使用した環境構築が一番無難でしょう。  
（Dockerはコンテナ型の仮想技術を提供するオープンソフトウェアです。詳しくは[公式のドキュメント](https://docs.docker.com/)を確認してください。）  

今回はこちらの方法でお伝えします。  

```bash
export IMAGE_VERSION=0.0.0 # please specify version
sudo -E docker build -t menoh-ruby:$IMAGE_VERSION `pwd`
```

ビルドには30分程度かかりました。
これで`menoh-ruby`という名前のdocker imageが完成します。

作業用のディレクトリに移動したあと、  

```Bash
sudo -E docker run -it --name menoh-ruby-test -v $(pwd):/opt/menoh-ruby --entrypoint /bin/bash menoh-ruby:$IMAGE_VERSION
```

上記のコマンドでdockerコンテナを立ち上げます。
コンテナから抜けるには下記のコマンドを使用します。

```bash
exit
```

しかし、コンテナを抜けると同時にコンテナが停止してしまうため、  
再度コンテナに入るためには下記のコマンドを使用します。  

```bash
sudo -E docker start -i menoh-ruby-test
```

正しく、menohがインストールされているかを確認してみましょう。

```ruby
root@1d042df46a8f:/opt/menoh-ruby# irb
irb(main):001:0> require 'menoh'
=> true
irb(main):002:0> exit
```

### Rubyで推論

menohの環境構築ができると、まずはうまく動作するか確認します。  

[こちら](https://github.com/pfnet-research/menoh-ruby/blob/63019b80bcea44fcb30c8ec46ae6315d5a2101a7/example/example_vgg16.rb)のスクリプトを`example_vgg16.rb`という名前で保存して、実行してみましょう。

```bash
ruby example_vgg16.rb
```

使用するonnxの学習済みモデル（VGG16）とテスト用の画像２枚が`data`フォルダにダウンロードされ、推論結果が以下のように表示されると成功です。  

```bash
=== Result for ./data/Light_sussex_hen.jpg ===
n01514859 hen : 0.9506610035896301
n01514668 cock : 0.04745088890194893
n01807496 partridge : 0.0012374237412586808
n01797886 ruffed grouse, partridge, Bonasa umbellus : 0.00024278569617308676
n01847000 drake : 6.84420665493235e-05
=== Result for ./data/honda_nsx.jpg ===
n04285008 sports car, sport car : 0.5454844236373901
n04037443 racer, race car, racing car : 0.4156607687473297
n03100240 convertible : 0.020360812544822693
n02974003 car wheel : 0.012692754156887531
n03444034 go-kart : 0.003139265812933445
```

このようにRubyを使用して、推論することができました。  

Rubyで推論する際はこのスクリプトを参考に進めればよいのですが、主要部分の確認を行っておきます。  
（モデルや画像のデータセットのダウンロードは省略します。）  

Rubyでの画像を扱うライブラリとして[RMagick](https://github.com/rmagick/rmagick)を使用し、またMenohの読み込みも行っています。

```ruby
require 'rmagick'
require 'menoh'
```

前半では画像の読み込みやモデルに関する情報の設定を行います。  

データセットはRubyの配列（Array）形式で指定します。  

```ruby
# load dataset
image_list = [
  './data/Light_sussex_hen.jpg',
  './data/honda_nsx.jpg'
]
```

画像サイズもVGG16で使用されているサイズを指定しています。

```ruby
input_shape = {
  channel_num: 3,
  width: 224,
  height: 224
}
```

データセットの準備では以下の処理を行っています。

1. `image_list` から順番に画像を読み込み、`image_filepath` に格納
2. RMagickで画像の読み込み。画像の読み込み後にArrayの形式となるため、`.first` で要素として取得
3. 読み込んだ画像を上記で指定したサイズに変更
4. 各RGBごと（`'RGB'.split('')`）に繰り返し
5. 画像の各要素ごとに繰り返し
6. 要素が16bitで扱われているため、256で割って8bitの値に補正し、offsetの値を引く正規化処理

```ruby
# prepare dataset
image_set = [
  {
    name: CONV1_1_IN_NAME,
    # 1
    data: image_list.map do |image_filepath|
      # 2
      image = Magick::Image.read(image_filepath).first
      # 3
      image = image.resize_to_fill(input_shape[:width], input_shape[:height])
      # 4
      'RGB'.split('').map do |color|
        # 5
        image.export_pixels(0, 0, image.columns, image.rows, color).map do |pix|
          # 6
          pix / 256 - rgb_offset[color.to_sym]
        end
      end.flatten
    end.flatten
  }
]
```

本章では様々なフレームワーク、言語での推論方法を解説しました。  
これで環境に左右されることを抑え、学習済みモデルを使用することができます。  