端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案 #1363

Xsx93 · 2024-02-08T06:17:21Z

背景：我在探索paraformer在端侧上部署方法，我希望通过RK框架调用NPU进行推理。RK框架只支持fp16精度的模型进行推理。
FP16的表示范围[-65504 ~ 66504]，FP32表示范围[-3.4×10^{38},3.4×10^{38}],因此FP32模型直接转RK模型，在推理过程中会出现溢出（NAN）。

我采用了FUNASR教程：https://github.com/alibaba-damo-academy/FunASR/blob/v0.8.8/funasr/export/README.md ，进行INT8量化，然而该方案是动态量化，在真正计算时仍会逆量化为fp32。
问题：

请问是否有真正的fp16模型或者finetune训练方案？

LauraGPT · 2024-02-28T12:49:00Z

Maybe you could ref to this code: 33f2d46

Xsx93 · 2024-03-05T07:38:45Z

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

Text2-m · 2024-03-21T05:44:19Z

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

请问，你做到端侧的方案是什么？

Xsx93 · 2024-03-25T01:38:12Z

Maybe you could ref to this code: 33f2d46

请问一下，怎么具体使用这两句代码？scale的大小是多少？

请问，你做到端侧的方案是什么？

2pass方案

Xsx93 added the question Further information is requested label Feb 8, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案 #1363

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案 #1363

Xsx93 commented Feb 8, 2024

LauraGPT commented Feb 28, 2024

Xsx93 commented Mar 5, 2024

Text2-m commented Mar 21, 2024

Xsx93 commented Mar 25, 2024

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案 #1363

端侧化，paraformer转RK框架，跪求fp16模型或者finetune训练方案 #1363

Comments

Xsx93 commented Feb 8, 2024

LauraGPT commented Feb 28, 2024

Xsx93 commented Mar 5, 2024

Text2-m commented Mar 21, 2024

Xsx93 commented Mar 25, 2024