概述

nncase仅提供Python APIs, 用于在x86_64、amd64平台上编译/推理深度学习模型。nncase-v2中将不再支持k210和k510的编译和推理，如有需要请使用nncase-v1。

nncase-v2 python APIs

安装

nncase工具链compiler部分包括nncase和KPU插件包

nncase 和KPU插件包均在nncase github release发布。
nncase-v2版本依赖dotnet-7.0。

Linux平台可以直接使用pip进行nncase和KPU插件包在线安装，Ubuntu环境下可使用 apt安装 dotnet。

pip install --upgrade pip
pip install nncase
pip install nncase-kpu

# nncase-2.x need dotnet-7
sudo apt-get install -y dotnet-sdk-7.0

Windows平台仅支持nncase在线安装，nncase-kpu需要在nncase github release手动下载安装。

用户若没有Ubuntu环境, 可使用nncase docker(Ubuntu 20.04 + Python 3.8 + dotnet-7.0)

$ cd /path/to/nncase_sdk
$ docker pull ghcr.io/kendryte/k230_sdk
$ docker run -it --rm -v `pwd`:/mnt -w /mnt ghcr.io/kendryte/k230_sdk /bin/bash -c "/bin/bash"

查看版本信息

root@469e6a4a9e71:/mnt# python3
Python 3.8.10 (default, May 26 2023, 14:05:08)
[GCC 9.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import _nncase
>>> print(_nncase.__version__)
2.1.0-4a87051

编译模型和推理示例

k230模型编译推理参考Jupyter脚本：User_guide，脚本中包含了单输入和多输入的示例。

如果在Docker中运行Jupyter脚本，可以参考以下命令，之后在浏览器窗口打开即可。

docker run -it --rm --privileged=true -p 8889:8889 --name Kendryte -v `pwd`:/mnt -w /mnt ghcr.io/kendryte/k230_sdk  /bin/bash -c "/bin/bash

pip install jupyterlab

jupyter-lab --ip 0.0.0.0 --allow-root

在执行脚本之前需要根据自身需求修改以下内容：

compile_kmodel函数中 compile_options,ptq_options相关信息

compile_options详细信息见CompileOptions

ptq_options详细信息见PTQTensorOptions
compile kmodel single input(multiple inputs)部分

修改 model_path和 dump_path，用于指定模型路径和编译期间文件生成路径。

修改 calib_data的实现，数据格式见注释。
run kmodel(simulate)部分，修改 input_data的实现，数据格式见注释。

推理结束后，会在 dump_path路径下生成 kmodel、输出结果和编译期间的文件。

开发板推理相关流程

详见K230_docs

nncase 编译模型APIs

CompileOptions

功能描述

CompileOptions类, 用于配置nncase编译选项各属性说明如下

属性名称	类型	是否必须	描述
target	string	是	指定编译目标, 如'cpu', 'k230'
dump_ir	bool	否	指定是否dump IR, 默认为False
dump_asm	bool	否	指定是否dump asm汇编文件, 默认为False
dump_dir	string	否	前面指定dump_ir等开关后, 这里指定dump的目录, 默认为""
input_file	string	否	onnx模型超过2GB时，用于指定参数文件路径，默认为""

preprocess	bool	否	是否开启前处理，默认为False。以下参数仅在 `preprocess=True`时生效
input_type	string	否	开启前处理时指定输入数据类型，默认为"float"。当 `preprocess`为 `True`时，必须指定为"uint8"或者"float32"
input_shape	list[int]	否	开启前处理时指定输入数据的shape，默认为[]。当 `preprocess`为 `True`时，必须指定
input_range	list[float]	否	开启前处理时指定输入数据反量化后的浮点数范围，默认为[ ]。当 `preprocess`为 `True`且 `input_type`为 `uint8`时，必须指定
input_layout	string	否	指定输入数据的layout，默认为""
swapRB	bool	否	是否在 `channel`维度反转数据，默认为False
mean	list[float]	否	前处理标准化参数均值，默认为[0,0,0]
std	list[float]	否	前处理标准化参数方差，默认为[1,1,1]
letterbox_value	float	否	指定前处理letterbox的填充值，默认为0
output_layout	string	否	指定输出数据的layout, 默认为""

前处理流程说明

目前暂不支持自定义前处理顺序，可以根据以下流程示意图，选择所需要的前处理参数进行配置。

graph TD;

    NewInput("NewInput\n(shape = input_shape\ndtype = input_type)") -->a(input_layout != ' ')-.Y.->Transpose1["transpose"] -.->b("SwapRB == True")-.Y.->SwapRB["SwapRB"]-.->c("input_type != float32")-.Y.->Dequantize["Dequantize"]-.->d("input_HW != model_HW")-.Y.->LetterBox["LetterBox"] -.->e("std not empty\nmean not empty")-.Y.->Normalization["Normalization"]-.->OldInput-->Model_body-->OldOutput-->f("output_layout != ' '")-.Y.->Transpose2["Transpose"]-.-> NewOutput;
	a--N-->b--N-->c--N-->d--N-->e--N-->OldInput; f--N-->NewOutput;

	subgraph origin_model
		OldInput; Model_body ; OldOutput;
	end

Loading

参数说明：

input_range为输入数据类型为定点时，反量化后的浮点数范围。

a. 输入数据类型为uint8，range为[0,255]，input_range为[0,255]，则反量化的作用只是进行类型转化，将uint8的数据转化为float32，mean和 std参数仍然按照[0,255]的数据进行指定。

b. 输入数据类型为uint8，range为[0,255]，input_range为[0,1]，则反量化会将定点数转化为浮点数[0,1]，mean和 std参数需要按照0~1的数据进行指定。
```
graph TD;
	NewInput_uint8("NewInput_uint8 \n[input_type:uint8]") --input_range:0,255 -->dequantize_0["Dequantize"]--float range:0,255--> OldInput_float32
	NewInput_uint81("NewInput_uint8 \n[input_type:uint8]") --input_range:0,1 -->dequantize_1["Dequantize"]--float range:0,1--> OldInput_float32
```
Loading
input_shape为输入数据的shape，layout为 input_layout，现在支持字符串（"NHWC"、"NCHW"）和index两种方式作为 input_layout，并且支持非4D的数据处理。

当按照字符串形式配置 input_layout时，表示输入数据的layout；当按照index形式配置 input_layout时，表示输入数据会按照当前配置的 input_layout进行数据转置，即 input_layout为 Transpose的 perm参数。

graph TD;
	subgraph B
    	NewInput1("NewInput: 1,4,10") --"input_layout:"0,2,1""-->Transpose2("Transpose perm: 0,2,1") --> OldInput2("OldInput: 1,10,4");
    end
	subgraph A
    	NewInput --"input_layout:"NHWC""--> Transpose0("Transpose: NHWC2NCHW") --> OldInput;
    	NewInput("NewInput: 1,224,224,3 (NHWC)") --"input_layout:"0,3,1,2""--> Transpose1("Transpose perm: 0,3,1,2") --> OldInput("OldInput: 1,3,224,224 (NCHW)");
	end

Loading

`output_layout`同理

graph TD;
subgraph B
    OldOutput1("OldOutput: 1,10,4,5,2") --"output_layout: "0,2,3,1,4""--> Transpose5("Transpose perm: 0,2,3,1,4") --> NewOutput1("NewOutput: 1,4,5,10,2");
    end
subgraph A
    OldOutput --"output_layout: "NHWC""--> Transpose3("Transpose: NCHW2NHWC") --> NewOutput("NewOutput\nNHWC");
    OldOutput("OldOutput: (NCHW)") --"output_layout: "0,2,3,1""--> Transpose4("Transpose perm: 0,2,3,1") --> NewOutput("NewOutput\nNHWC");
    end

Loading

动态shape参数

详见动态shape参数说明

代码示例

实例化CompileOptions，配置各属性的值。

compile_options = nncase.CompileOptions()

compile_options.target = "cpu" #"k230"
compile_options.dump_ir = True  # if False, will not dump the compile-time result.
compile_options.dump_asm = True
compile_options.dump_dir = "dump_path"
compile_options.input_file = ""

# preprocess args
compile_options.preprocess = False
if compile_options.preprocess:
    compile_options.input_type = "uint8" # "uint8" "float32"
    compile_options.input_shape = [1,224,320,3]
    compile_options.input_range = [0,1]
    compile_options.input_layout = "NHWC" # "NHWC"
    compile_options.swapRB = False
    compile_options.mean = [0,0,0]
    compile_options.std = [1,1,1]
    compile_options.letterbox_value = 0
    compile_options.output_layout = "NHWC" # "NHWC"

ImportOptions

功能描述

ImportOptions类, 用于配置nncase导入选项，各属性说明如下

属性名称	类型	是否必须	描述
output_arrays	string	否	输出名称

代码示例

实例化ImportOptions, 配置各属性的值

# import_options
import_options = nncase.ImportOptions()
import_options.output_arrays = 'output' # Your output node name

PTQTensorOptions

功能描述

PTQTensorOptions类, 用于配置nncase PTQ选项，各属性说明如下

字段名称	类型	是否必须	描述
calibrate_method	string	否	量化校正方法，默认为'NoClip'，可选'Kld'。使用量化时必须配置
samples_count	int	否	校正集数量。使用量化时必须配置
finetune_weights_method	string	否	微调权重方法，默认为'NoFineTuneWeights'。可选 'UseSquant'
quant_type	string	否	数据量化类型，默认为'uint8'。可选'int8','int16'
w_quant_type	string	否	权重量化类型，默认为'uint8'。可选'int8','int16'

dump_quant_error	bool	否	是否生成量化损失，默认为False。在 `dump_ir=True`时生效
dump_quant_error_symmetric_for_signed	bool	否	是否生成使用范围对称的量化损失，默认为True。在 `dump_ir=True`时生效
quant_scheme	string	否	量化配置文件路径，默认为“ ”。在 `dump_ir=True`时生效
quant_scheme_strict_mode	bool	否	是否严格按照quant_scheme执行量化，默认为False。在 `quant_scheme`不为空时生效
export_quant_scheme	bool	否	是否导出量化配置文件，默认为False。在 `dump_ir=True`时生效
export_weight_range_by_channel	bool	否	导出量化配置文件时，是否按照channel统计权重的范围，默认为False。在 `dump_ir=True`时生效

量化配置文件相关详细信息见Mix Quant

set_tensor_data()

功能描述

设置校正数据

接口定义

set_tensor_data(calib_data)

输入参数

参数名称	类型	是否必须	描述
calib_data	List[List[np.ndarray]]	是	校正数据

返回值

N/A

代码示例

# If model has multiple inputs, calib_data format is "[[x1, x2,...], [y1, y2,...], ...]"
# e.g. Model has three inputs (x, y, z), the calib_data is '[[x1, x2, x3],[y1, y2, y3],[z1, z2, z3]]'

calib_data = [[np.random.rand(1, 3, 224, 224).astype(np.float32), np.random.rand(1, 3, 224, 224).astype(np.float32)]]

# ptq_options
ptq_options = nncase.PTQTensorOptions()
ptq_options.samples_count = len(calib_data[0])
ptq_options.set_tensor_data(calib_data)

Compiler

功能描述

Compiler类, 用于编译神经网络模型

代码示例

compiler = nncase.Compiler(compile_options)

import_tflite()

功能描述

导入tflite模型

接口定义

import_tflite(model_content, import_options)

输入参数

参数名称	类型	是否必须	描述
model_content	byte[]	是	读取的模型内容
import_options	ImportOptions	是	导入选项

返回值

N/A

代码示例

model_content = read_model_file(model)
compiler.import_tflite(model_content, import_options)

import_onnx()

功能描述

导入onnx模型

接口定义

import_onnx(model_content, import_options)

输入参数

参数名称	类型	是否必须	描述
model_content	byte[]	是	读取的模型内容
import_options	ImportOptions	是	导入选项

返回值

N/A

代码示例

model_content = read_model_file(model)
compiler.import_onnx(model_content, import_options)

use_ptq()

功能描述

设置PTQ配置选项

接口定义

use_ptq(ptq_options)

输入参数

参数名称	类型	是否必须	描述
ptq_options	PTQTensorOptions	是	PTQ配置选项

返回值

N/A

代码示例

compiler.use_ptq(ptq_options)

compile()

功能描述

编译神经网络模型

接口定义

compile()

输入参数

N/A

返回值

N/A

代码示例

compiler.compile()

gencode_tobytes()

功能描述

生成代码字节流

接口定义

gencode_tobytes()

输入参数

N/A

返回值

bytes[]

代码示例

kmodel = compiler.gencode_tobytes()
with open(os.path.join(infer_dir, 'test.kmodel'), 'wb') as f:
    f.write(kmodel)

nncase 推理模型APIs

除了编译模型APIs, nncase还提供了推理模型的APIs, 在PC上可推理前面编译生成的kmodel, 用来验证nncase推理结果和相应深度学习框架的runtime的结果是否一致等.

MemoryRange

功能描述

MemoryRange类, 用于表示内存范围，各属性说明如下

属性名称	类型	是否必须	描述
location	int	否	内存位置, 0表示input, 1表示output, 2表示rdata, 3表示data, 4表示shared_data
dtype	python数据类型	否	数据类型
start	int	否	内存起始地址
size	int	否	内存大小

代码示例

实例化MemoryRange

mr = nncase.MemoryRange()

RuntimeTensor

功能描述

RuntimeTensor类, 用于表示运行时tensor，各属性说明如下

属性名称	类型	是否必须	描述
dtype	int	否	tensor的数据类型
shape	list	否	tensor的形状

from_numpy()

功能描述

从numpy.ndarray构造RuntimeTensor对象

接口定义

from_numpy(py::array arr)

输入参数

参数名称	类型	是否必须	描述
arr	numpy.ndarray	是	numpy.ndarray对象

返回值

RuntimeTensor

代码示例

data = np.random.rand(1, 3, 224, 224).astype(np.float32)
tensor = nncase.RuntimeTensor.from_numpy(data)

copy_to()

功能描述

拷贝RuntimeTensor

接口定义

copy_to(RuntimeTensor to)

输入参数

参数名称	类型	是否必须	描述
to	RuntimeTensor	是	RuntimeTensor对象

返回值

N/A

代码示例

sim.get_output_tensor(i).copy_to(to)

to_numpy()

功能描述

将RuntimeTensor转换为numpy.ndarray对象

接口定义

to_numpy()

输入参数

N/A

返回值

numpy.ndarray对象

代码示例

arr = sim.get_output_tensor(i).to_numpy()

Simulator

功能描述

Simulator类, 用于在PC上推理kmodel，各属性说明如下

属性名称	类型	是否必须	描述
inputs_size	int	否	输入个数
outputs_size	int	否	输出个数

代码示例

实例化Simulator

sim = nncase.Simulator()

load_model()

功能描述

加载kmodel

接口定义

load_model(model_content)

输入参数

参数名称	类型	是否必须	描述
model_content	byte[]	是	kmodel字节流

返回值

N/A

代码示例

sim.load_model(kmodel)

get_input_desc()

功能描述

获取指定索引的输入的描述信息

接口定义

get_input_desc(index)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输入的索引

返回值

MemoryRange

代码示例

input_desc_0 = sim.get_input_desc(0)

get_output_desc()

功能描述

获取指定索引的输出的描述信息

接口定义

get_output_desc(index)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输出的索引

返回值

MemoryRange

代码示例

output_desc_0 = sim.get_output_desc(0)

get_input_tensor()

功能描述

获取指定索引的输入的RuntimeTensor

接口定义

get_input_tensor(index)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输入tensor的索引

返回值

RuntimeTensor

代码示例

input_tensor_0 = sim.get_input_tensor(0)

set_input_tensor()

功能描述

设置指定索引的输入的RuntimeTensor

接口定义

set_input_tensor(index, tensor)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输入RuntimeTensor的索引
tensor	RuntimeTensor	是	输入RuntimeTensor

返回值

N/A

代码示例

data = [np.random.rand(1, 3, 224, 224).astype(np.float32)]
sim.set_input_tensor(0, nncase.RuntimeTensor.from_numpy(data[0]))

get_output_tensor()

功能描述

获取指定索引的输出的RuntimeTensor

接口定义

get_output_tensor(index)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输出RuntimeTensor的索引

返回值

RuntimeTensor

代码示例

output_arr_0 = sim.get_output_tensor(0).to_numpy()

set_output_tensor()

功能描述

设置指定索引的输出的RuntimeTensor

接口定义

set_output_tensor(index, tensor)

输入参数

参数名称	类型	是否必须	描述
index	int	是	输出RuntimeTensor的索引
tensor	RuntimeTensor	是	输出RuntimeTensor

返回值

N/A

代码示例

sim.set_output_tensor(0, tensor)

run()

功能描述

运行kmodel推理

接口定义

run()

输入参数

N/A

返回值

N/A

代码示例

sim.run()

Files

USAGE_v2.md

Latest commit

History

USAGE_v2.md

File metadata and controls

概述

nncase-v2 python APIs

安装

查看版本信息

编译模型和推理示例

开发板推理相关流程

nncase 编译模型APIs

CompileOptions

功能描述

前处理流程说明

动态shape参数

代码示例

ImportOptions

功能描述

代码示例

PTQTensorOptions

功能描述

set_tensor_data()

功能描述

接口定义

输入参数

返回值

代码示例

Compiler

功能描述

代码示例

import_tflite()

功能描述

接口定义

输入参数

返回值

代码示例

import_onnx()

功能描述

接口定义

输入参数

返回值

代码示例

use_ptq()

功能描述

接口定义

输入参数

返回值

代码示例

compile()

功能描述

接口定义

输入参数

返回值

代码示例

gencode_tobytes()

功能描述

接口定义

输入参数

返回值

代码示例

nncase 推理模型APIs

MemoryRange

功能描述

代码示例

RuntimeTensor

功能描述

from_numpy()

功能描述

接口定义

输入参数

返回值

代码示例

copy_to()

功能描述

接口定义

输入参数

返回值

代码示例