v0.2.2:原声留白字幕校对 · 解说原声自然衔接 · 剪辑不切断台词
让分块解说的成片更连贯、更好看。
主要更新
- 原声留白也烧字幕,且可由 Agent 校对。 解说块之间留给原声的留白不再字幕空白——会烧上原声台词,并用
「」与解说区分开。优先采用 Agent 校对过的original_subtitles.json(订正 ASR 错字与人名、只保留真正出声的台词);缺省时退回保守的 ASR 兜底(按句归到它所在的留白、跳过太密读不完的行)。修复了早先把没说出口的原声、整段 ASR 塞进小留白的过度渲染问题。 - 解说与原声自然衔接。 原声留白前的解说块把原声引出来,留白后的解说块接住原声刚呈现的内容——不再各说各的(评审新增
disjoint_handoff检查)。 - 剪辑不再切断一句台词(cut 模式)。 片段结尾会向后吸附到最近的自然停顿(
silence_periods.json,上限 2 秒),让原声把话说完;选片 brief 也提示在完整句尾收口。 - 字幕烧录预检(快速失败)。 缺少带 libass(
subtitles滤镜)的 ffmpeg 时,整条流程开跑前就报错并给出处置,而不是跑完理解 / VLM / ASR / TTS、到最后渲染才炸。 - 成片时直接给出解说评审入口(建议性,硬门禁仍是
validate.py);并修正文档——字幕烧录是默认开启(用--no-burn-subtitles关闭)。
已在 庆余年 EP01 → 5 分钟解说短片上端到端验证。完整记录见 CHANGELOG.md。合入 PR:#20 #21 #22。