#

model-serving

Here are 5 public repositories matching this topic...

openvinotoolkit / model_server

A scalable inference server for models optimized with OpenVINO™

kubernetes machine-learning cloud ai deep-learning inference edge dag model-serving serving openvino

Updated May 27, 2024
C++

intel / xFasterTransformer

intel inference transformer xeon llama model-serving llm chatglm qwen

Updated May 27, 2024
C++

alibaba / rtp-llm

RTP-LLM: Alibaba's high-performance LLM inference engine for diverse applications.

inference llama gpt model-serving llm llmops llm-serving

Updated May 22, 2024
C++

SABER-labs / Drogon-torch-serve

Serve pytorch / torch models using Drogon

rest cpp torch pytorch model-serving model-server drogon libtorch torch-serve torch-server

Updated Sep 25, 2022
C++

canhld94 / HeteroServing

Serving object detection models on different hardware.

deep-learning gpu object-detection tensorrt inference-engine model-serving intel-fpga openvino

Updated Mar 31, 2022
C++

Improve this page

Add a description, image, and links to the model-serving topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the model-serving topic, visit your repo's landing page and select "manage topics."