各类深度模型的优化器的应用和性能对比,包括tvm、tf-tensorrt、tensorrt等。
keras_model_optimizer.py: 将keras版resnet-50模型分别进行tvm、tf-tensorrt、pure-tensorrt优化并比较推理速度。
pytorch_model_optimizer.py: 将pytorch版resnet-50模型进行pure-tensorrt优化并比较推理速度,包括tensorrt int8校准量化实现。
trt:tensorrt框架库
- trt_converter.py:pytorch转tensorrt模型转换器,隐藏中间的onnx过渡细节。
- trt_inferer.py:可以部署到线上服务支持并发的推理框架,包括一个单trt引擎worker简单推理框架和一个多trt引擎worker的推理框架。