PyTorch 转 TFLite 使用 int8 量化 #274

Tongsen99 · 2023-12-22T10:30:06Z

converter = TFLiteConverter(
model,
dummy_input,
tflite_path=output_path,
strict_symmetric_check=True,
quantize_target_type='int8',
quantize_input_output_type = 'int8',
fuse_quant_dequant = True,
)
中 dummy_input 需要是 int8 类型吗？如果设置了 int8 类型会报 RuntimeError: expected scalar type Char but found Float；如果设置了 float32 类型会报 AssertionError: Unsupported types: input_type: float32, quantize_input_type: int8。
请问怎样能够解决这个问题，完整实现 PyTorch 转 TFLite 使用 int8 量化（包括输入输出）呢？

The text was updated successfully, but these errors were encountered:

peterjc123 · 2023-12-22T13:16:48Z

如果需要静态量化（qat或者ptq）请按照examples/quantization下面的样例代码来（你直接把浮点的模型传入TFLiteConverter是不能直接得到静态量化的模型的）,如果是动态量化，参考examples/converter/dynamic.py

Tongsen99 · 2023-12-22T14:55:22Z

我使用的就是 examples/converter/dynamic.py 中的代码，然后我换了一个分类模型，希望得到 int8 量化后的 tflite。修改了需要传入的 dummy_input，dummy_input = torch.ones((1, 3, 64, 64))，但是设置 dummy_input 为 int8 或 float32 类型都会报错。

peterjc123 · 2023-12-23T00:56:16Z

dynamic.py下面还有一系列参数你没抄全
以及下面这两个参数是给全量化使用的，动态量化不要加这些参数
quantize_input_output_type = 'int8',
fuse_quant_dequant = True,

peterjc123 · 2023-12-23T01:05:19Z

我使用的就是 examples/converter/dynamic.py 中的代码，然后我换了一个分类模型，希望得到 int8 量化后的 tflite。修改了需要传入的 dummy_input，dummy_input = torch.ones((1, 3, 64, 64))，但是设置 dummy_input 为 int8 或 float32 类型都会报错。

你这里int8量化如果是指的全量化模型，你要用examples/quantization下的qat.py或者post.py
关于不同量化技术的比较，可以看tflite的介绍

https://www.tensorflow.org/lite/performance/post_training_quantization?hl=zh-cn

简言之动态量化是weight only量化
静态量化是weight activation都一起量化了
全量化比较快，而且适用于npu等各个芯片
或者你可以安装一下netron，跑我们的样例代码，打开生成后的模型，就可以看出两个量化模式有什么区别了

Update: 重新看了你的第一条帖子，你要int8的量化输入输出，那你肯定需要的是全量化，请按照全量化的代码样例来走，谢谢

peterjc123 added the question Further information is requested label Dec 22, 2023

peterjc123 closed this as completed Jan 1, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PyTorch 转 TFLite 使用 int8 量化 #274

PyTorch 转 TFLite 使用 int8 量化 #274

Tongsen99 commented Dec 22, 2023

peterjc123 commented Dec 22, 2023

Tongsen99 commented Dec 22, 2023

peterjc123 commented Dec 23, 2023 •

edited

peterjc123 commented Dec 23, 2023 •

edited

PyTorch 转 TFLite 使用 int8 量化 #274

PyTorch 转 TFLite 使用 int8 量化 #274

Comments

Tongsen99 commented Dec 22, 2023

peterjc123 commented Dec 22, 2023

Tongsen99 commented Dec 22, 2023

peterjc123 commented Dec 23, 2023 • edited

peterjc123 commented Dec 23, 2023 • edited

peterjc123 commented Dec 23, 2023 •

edited

peterjc123 commented Dec 23, 2023 •

edited