作业项目:调研、基准测试并原型化本地语音识别部署方案,支持 Mac 和 Windows+GPU。详见 title/title.txt。
- 调研可在边缘设备本地运行的开源 STT/ASR 后端
- 在真实硬件上进行基准测试(性能 vs 资源占用)
- 开发演示 GUI(Electron + React),支持模型对比测试
- 记录 AI 辅助开发全过程
- Phase 1 — 调研文档(docs/01-research.md)
- Phase 2 — 基准测试方案与脚本(docs/02-benchmark-plan.md)
- Phase 3 — 基准测试结果(docs/03-benchmark-results.md)
- Phase 4 — Electron + React 演示 GUI(app/)
- 持续进行 — AI 协作开发过程日志(docs/04-process-log.md)
| 路径 | 用途 |
|---|---|
| docs/ | 调研、基准测试方案/结果、AI 过程日志 |
| benchmark/ | 基准测试脚本 |
| models/ | 统一适配层(各 ASR 后端的统一接口) |
| app/ | Electron + React 演示 GUI |
| samples/ | 测试音频(仅小文件;大体积数据不提交) |
| 后端 | 状态 |
|---|---|
| whisper.cpp | ✅ 进入 Phase 2 — 主选 |
| faster-whisper | ✅ 进入 Phase 2 — 次选(Windows+GPU) |
| openai-whisper | 仅作精度参考基准 |
| Voxtral (Mistral) | 暂 skip(本地部署路径待确认) |
| Qwen3-ASR | 超出边缘范围(最小模型 1.5 GB) |