Skip to content

v0.3.0 — 长视频更稳 · 跨语言更干净 · 剪辑更顺眼 · 新增解说导航与压缩

Choose a tag to compare

@worldwonderer worldwonderer released this 19 Jun 18:21
· 18 commits to main since this release
9a2c1c9

本轮聚焦长视频稳定性、跨语言成片质量与剪辑观感,并新增解说导航与成片压缩工具。合并自 #28#39,外加发布前评审修复。

新增

  • VLM 断点续传 + 429 自愈#33)— 逐场景缓存 + 限流降并发重试;长视频遇到偶发限流不再从头重跑。
  • FOREIGN_SOURCE_AUDIO#34)— 跨语言解说时把解说下的原声压到近静音,消除「怪音」。
  • SCENE_CUT_SNAP#35)— 把剪辑边界吸附到原片硬切点,消除剪辑点闪烁。
  • OUTPUT_CRF / OUTPUT_PRESET / OUTPUT_MAX_HEIGHT#36)— 成片压缩参数(demo 119MB → 16.9MB)。
  • 咨询性 inspect + 故事板#28#29)— 只读导航(state / clip-map / 缩略图总览),缺失即降级、绝不阻断流程。

变更

  • review.py 自动按成片/原片时间轴评审(#31)· ASR 默认分段 30→15s(#32)· 自带字幕在不遮挡时也显示(#37)。

修复

  • cut 模式 pass2 简报 int/str scene_id 崩溃(#30)· 原声留白字幕滞后(#32)。

发布前评审修复

  • #36 健壮性:奇数 OUTPUT_MAX_HEIGHT 会产生奇数高度令 libx264 崩溃(空成片)→ 现强制宽高偶数;OUTPUT_CRF=0(无损)被误当假值改成 18 → 现原样保留(对 diff 做对抗式评审 + 实跑 ffmpeg 复现验证)。
  • CI 缺口:inspect 测试组只在 scripts/test.sh,而 CI 跑的是 scripts/test.py#28 的 22 个测试从未在 CI 运行 → 已接入运行器。
  • #33 Windows CI:两处续传缓存测试未带 encoding="utf-8",在 Windows cp1252 下崩溃 → 合并前已修。

其他

  • demo 换成《悠长假日》第一集 2 分钟解说(#38)+ README demo 链接(#39)。

全量测试(每个 skill 独立进程,三平台 CI 通过):understanding 133 · cut 31 · voiceover 29 · assemble 129 · script 61 · orchestrator 59 · inspect 22。

Full Changelog: v0.2.3...v0.3.0