基于浏览器的按轮语音对话示例:语音识别与合成走阿里云百炼;对话层使用 OpenAI 兼容 HTTP,可接百炼 Qwen 或本机 OpenClaw Gateway。
npm install
cp .env.example .env # 编辑填入密钥与模型
npm run dev浏览器打开 http://localhost:5173。首次使用请在页面完成声音复刻后再进行语音对话。
- 开发计划与实现说明(完整) — 需求与架构定案、目录结构、API、环境变量、排错与扩展方向
- 环境变量模板:
.env.example
Vite + React(前端)· Fastify + TypeScript(后端)· 百炼 Fun-ASR / Qwen TTS VC / 声音复刻 · ffmpeg 音频预处理
本地已 git init 并完成首次提交(main 分支)。本机未安装 gh CLI,需你在 GitHub 网页创建仓库后自行关联远程并推送:
- 打开 github.com/new,新建仓库(不要勾选 “Add a README”,避免与本地冲突)。
- 在项目根目录执行(把 URL 换成你的仓库地址):
cd g:\project\0001_AI\ttsStt
git remote add origin https://github.com/你的用户名/仓库名.git
git push -u origin main若使用 SSH:git remote add origin git@github.com:你的用户名/仓库名.git
推送前请确认 .env 未入库(已在 .gitignore 中);切勿将 API Key 提交到 GitHub。