Skip to content

[bug] 语音服务几乎不可用 #762

@4965898

Description

@4965898

详细描述这个 Bug

最新版本中虽然有了语音功能,但几乎不可用。
我试过调用百炼、硅基流动、智谱等平台的语音模型,均不可用
原因如下:
语音模型与对话模型地址不一样,而BaseURL会自动补全地址且不能强制使用自定义,这样反而使得调用语音模型的专有地址不可用,如硅基流动使用https://api.siliconflow.cn/v1/audio/transcriptions才能调用语音模型;百炼则是:dashscope.aliyuncs.com/api-ws/v1/realtime
因此无论是TTS还是STT均无法使用。

NoteGen 版本

v0.22.3

操作系统

Windows

报错日志

No response

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions