带bias的linear层转onnx，为什么转换成Gemm+Add？ #20

ZipengFeng · 2021-06-08T06:00:19Z

测试函数为：
test/test_onnx.py/test_linear()

onnx结果：

带bias的linear层转换成Gemm+Add，不带bias的linear层转换成Gemm。其中Gemm的bias都是为1维。

是否应该改为：
带bias的linear层转换成Gemm，其中gemm的bias为oc维；
不带bias的linear层转换成Gemm， bias为空？

lixiangyin666 · 2021-06-08T08:07:02Z

目前，目前我们的mgeconvert是基于dump出的细粒度cpp图的，由于python层linear的实现是matmul + add，导致dump出的mge的op也是matmul + add，从而导致转到onnx也是matmul + add。
针对这个问题，我们在caffe转换器中加了pattern match以解决conv+bias, linear + bias的问题，见代码，后续我们重构一下，在解析mge层实现这种策略以支持onnx等其他框架。
另外，我们正在开发更高层表达的traced module以彻底解决这些问题

ZipengFeng closed this as completed Jul 20, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

带bias的linear层转onnx，为什么转换成Gemm+Add？ #20

带bias的linear层转onnx，为什么转换成Gemm+Add？ #20

ZipengFeng commented Jun 8, 2021

lixiangyin666 commented Jun 8, 2021

带bias的linear层转onnx，为什么转换成Gemm+Add？ #20

带bias的linear层转onnx，为什么转换成Gemm+Add？ #20

Comments

ZipengFeng commented Jun 8, 2021

lixiangyin666 commented Jun 8, 2021