facebookresearch/segment-anything のエンコーダー/デコーダーをONNXに変換し、推論するサンプルです。
推論スクリプトは、前処理、後処理を含めPyTorch依存の処理は使用しない方針です。
Demo.mp4
Colaboratoryでノートブックを開き、上から順に実行してください。
Colaboratoryノートブックで変換したONNXファイルを「onnx_model」ディレクトリに格納し、
以下コマンドでデモを起動してください。
左クリックでプロンプト座標を追加、右クリックでプロンプト座標を削除します。
また、キーボード1~3で、クリック時に追加する座標のタイプを変更します(1:対象座標、2:非対象座標、3:対象バウンディングボックス)
python demo.py
- --image
画像ファイルの指定
デフォルト:sample.png - --encoder
エンコーダーONNXファイルのパス
デフォルト:onnx_model/vit_b_encoder.onnx - --decoder
デコーダーONNXファイルのパス
デフォルト:onnx_model/vit_b_decoder.onnx
サンプルの画像はぱくたそ様の「トゲトゲのサボテンとハリネズミ」を使用しています。
Segment-Anything-Model-ONNX-Sample is under Apache-2.0 license.
高橋かずひと(https://twitter.com/KzhtTkhs)