Skip to content

v0.3.1 — 英→中配音模式(克隆原音色·跟随原片节奏)· 语速校准 · doctor 预检

Choose a tag to compare

@worldwonderer worldwonderer released this 22 Jun 01:49
· 8 commits to main since this release
2ae220e

新增

  • 英语视频 → 中文配音 · 保留原音色 (#47):编排器新增 --edit-mode dub。用自然语言触发即可把英文视频翻译成中文、并用原说话人的音色克隆配音(mimo-v2.5-tts-voiceclone,同一个 MIMO_API_KEY,纯 stdlib + ffmpeg,无 GPU、无新厂商)。和解说一样一次暂停、由 Agent 写稿(dub_script.json):逐句忠实翻译、跟随原片节奏——每句放在原声被说出的时间、按该句区间贴合时长,不整体提速、不提前结束,原声怎么走配音就怎么走(替换原声而非叠加)。v1:单说话人、整轨替换(暂不保留背景音乐)。

改进

  • 语速基准校准 (#45):speech_rate 默认 3.5 → 3.9(实测 mimo-tts 中位,旧值系统性偏低 ~10-17%),并支持 SPEECH_RATE / SPEECH_SAFETY_MARGIN 环境变量覆盖(5 个 skill 一致);字数预算与 7:3 覆盖率判定更贴近真实语速。
  • 超时长截断不再静默 (#45):解说超出片段时长触发的句末截断会输出提示日志,便于发现并改写。
  • doctor 预检能力清单 (#45):--doctor 新增 ready / blocked / degraded / 可选升级 分组汇总,每项附可执行建议。

完整对比v0.3.0...v0.3.1