如何调用Triton Inference Server的接口？ #1215

realcarlos · 2024-03-22T13:54:52Z

例行检查

[] 我已确认目前没有类似 issue
[] 我已确认我已升级到最新版本
[] 我已完整查看过项目 README，已确定现有版本无法满足需求
[] 我理解并愿意跟进此 issue，协助测试和提供反馈
[] 我理解并认可上述内容，并理解项目维护者精力有限，不遵循规则的 issue 可能会被无视或直接关闭

功能描述
Triton Inference Server服务启动后，是在8000端口
curl -X POST localhost:8000/v2/models/vllm_model/generate
-d '{"text_input": "What is Triton Inference Server?", "parameters": {"stream": false, "temperature": 0}}'

应用场景
one-api应该如何调用？

songquanpeng · 2024-03-24T14:21:46Z

需要进行适配，这个有待之后处理，期待 PR：https://github.com/triton-inference-server/server

realcarlos added the enhancement New feature or request label Mar 22, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何调用Triton Inference Server的接口？ #1215

如何调用Triton Inference Server的接口？ #1215

realcarlos commented Mar 22, 2024 •

edited

Loading

songquanpeng commented Mar 24, 2024

如何调用Triton Inference Server的接口？ #1215

如何调用Triton Inference Server的接口？ #1215

Comments

realcarlos commented Mar 22, 2024 • edited Loading

songquanpeng commented Mar 24, 2024

realcarlos commented Mar 22, 2024 •

edited

Loading