v0.3.0 — 长视频更稳 · 跨语言更干净 · 剪辑更顺眼 · 新增解说导航与压缩
本轮聚焦长视频稳定性、跨语言成片质量与剪辑观感,并新增解说导航与成片压缩工具。合并自 #28–#39,外加发布前评审修复。
新增
- VLM 断点续传 + 429 自愈(#33)— 逐场景缓存 + 限流降并发重试;长视频遇到偶发限流不再从头重跑。
FOREIGN_SOURCE_AUDIO(#34)— 跨语言解说时把解说下的原声压到近静音,消除「怪音」。SCENE_CUT_SNAP(#35)— 把剪辑边界吸附到原片硬切点,消除剪辑点闪烁。OUTPUT_CRF/OUTPUT_PRESET/OUTPUT_MAX_HEIGHT(#36)— 成片压缩参数(demo 119MB → 16.9MB)。- 咨询性
inspect+ 故事板(#28、#29)— 只读导航(state / clip-map / 缩略图总览),缺失即降级、绝不阻断流程。
变更
修复
发布前评审修复
- #36 健壮性:奇数
OUTPUT_MAX_HEIGHT会产生奇数高度令 libx264 崩溃(空成片)→ 现强制宽高偶数;OUTPUT_CRF=0(无损)被误当假值改成 18 → 现原样保留(对 diff 做对抗式评审 + 实跑 ffmpeg 复现验证)。 - CI 缺口:inspect 测试组只在
scripts/test.sh,而 CI 跑的是scripts/test.py,#28 的 22 个测试从未在 CI 运行 → 已接入运行器。 - #33 Windows CI:两处续传缓存测试未带
encoding="utf-8",在 Windows cp1252 下崩溃 → 合并前已修。
其他
全量测试(每个 skill 独立进程,三平台 CI 通过):understanding 133 · cut 31 · voiceover 29 · assemble 129 · script 61 · orchestrator 59 · inspect 22。
Full Changelog: v0.2.3...v0.3.0