WOQ: Optimize quantization of activation (#2584) · intel/intel-extension-for-pytorch@05d0764 · GitHub

Commit

WOQ: Optimize quantization of activation (#2584)

Browse files

* WOQ: Optimize quantization per-tensor/per-block of activation for lowp-mode=INT8

* Refine threshold of activation size to parallelize quantization

Loading branch information

Xia-Weiwen committed Feb 7, 2024

1 parent 444d17e commit 05d0764