Skip to content

v1.1.0

Choose a tag to compare

@yoqu yoqu released this 06 Jun 14:21
· 54 commits to main since this release

🎬 灵机剪影 v1.1.0

本版本是 v1.0.1 以来的一次大版本更新:渲染引擎整体从 HyperFrames 迁移到 Remotion,并带来卡片风格模板库、多 Provider TTS 音色体系、AI 卡片增量流式呈现等多项新能力。

Added

  • AI 卡片增量流式呈现与自动落轨:一键分析从「批处理结尾一次性出现」改为增量呈现——规划完成即铺出每个分段的骨架占位卡,每张卡片生成完即就地填充为真实卡片并自动落轨(进入时间线),无需手动「上轨」;取消 / 报错时保留已生成并落轨的卡片,仅清理剩余 pending 骨架。配套 analyze-progress-bridge 把卡片生命周期经 IPC 增量回传渲染端(src/store/ai.tssrc/store/timeline.tssrc/lib/analyze-progress-bridge.tssrc/remotion/ai-card-render-plan.ts)。
  • 卡片生成父子任务嵌套进度task-progress 支持父子任务模型,TaskProgressPanel / 一键流水线嵌套渲染单卡子任务,长流程中可逐张看到实时进度。
  • 段落卡 / 图片卡「风格模板库」:内置 10 个系统预设风格(swiss-grid、nyt-data、xhs-pastel、mono-bold、soft-apple、dark-graph、hand-sketch、film-leak、cyber-glitch 等),支持全局 / 项目 / 单卡三级选择,每个风格附带零 LLM、秒开的静态预览 demo(src/lib/card-style-presets/StyleLibraryPanelStylePresetPreview)。
  • 多 Provider TTS 与克隆音色体系:TTS 设置从单一 MiniMax 升级为可扩展的多 Provider + 音色库,支持 MiniMax T2A v2 与 Xiaomi MiMo(含 mimo-v2.5-tts-voiceclone 克隆音色:参考音频 Base64 上传),旧配置自动迁移为默认 Provider / 默认音色(TTSProviderDialogTTSVoiceDialogtts-settings.tstts-provider-runner.ts)。
  • MiMo TTS 表现力增强 + 长文本分块合成:口播模板新增 TTS 字段,AI 句级打标驱动情绪/语气变化,长文本分块合成并按块生成字幕,缓解「声音太平」(xiaomi-mimo-tts.tstts/mimo-annotate.tstts/mimo-style.tstts-chunking.tsmedia-concat.ts)。
  • 预览音频预载src/remotion/preview-audio-preload.ts 在预览前预载音频,减少播放抖动。
  • MiniMax 关思考走 Anthropic 端点:新增 @langchain/anthropic,MiniMax 关闭 thinking 时改走 Anthropic 端点(OpenAI 端点会忽略 enable_thinking)。

Changed

  • 渲染引擎从 HyperFrames 切换为 Remotion:预览改用 @remotion/player,导出改用 @remotion/bundler + @remotion/renderer(自带 Chrome Headless Shell + ffmpeg)。TimelineData 仍是唯一数据源,经 buildRenderPlan 编译为 Remotion 组件树(src/remotion/electron/remotion/)。
  • AI Motion Card 改为自由 Remotion TSX:LLM 产出 motionCard.tsx(default export 函数组件),主进程用 esbuild 编译为 CJS,经 inputProps.compiledCards 注入,由 CardHost 在 Remotion 上下文内求值;预览与导出共用同一份编译产物。motion.* 提示词同步改版为帧驱动(useCurrentFrame/interpolate/spring)。
  • 风格库并入「项目统一风格」:移除自由文本 project.style,项目统一风格完全由所选风格预设承载,消除「自由文本 + 风格预设」两套重叠概念,配置入口收敛为「只选模板」。
  • 时间线播放体验:拖动播放头时暂停 / 松手续播,缩放与定位时把播放头居中,修复预览中字幕与卡片的显隐时机。

Removed

  • 移除 hyperframes / @hyperframes/player 依赖与相关代码(src/hyperframes/composition.tsHyperframesPreviewPlayerelectron/hyperframes-cli.tselectron/hyperframes-runtime-preflight.tshyperframes-runtime-preflight IPC)。
  • 移除自由文本 project.style 及其 {{projectStylePrompt}} / {{projectStylePromptBlock}} 提示词注入路径。

Fixed

  • 分段时间漂移 / 溢出:规划分段重锚定到字幕真实时间轴(单调匹配 + 丢弃越界段),杜绝卡片时间漂移与溢出。
  • 时间线大量空白:新卡片时长默认铺满所在 segment(此前固定 5s)。
  • 重复触发内容卡片分析:头部按钮禁用 + 重入锁,消除多条并发进度。
  • pipeline 适配register.ts 适配 Zod4 z.record 二参,ToolResult 结构兼容 CallToolResult

Migration

  • 旧工程的 motionCard.html(HTML+GSAP)加载时降级为占位并标记 needsRegeneration,不崩溃;Inspector 提示重新生成为 Remotion 卡片。