简体中文 | English
面向 VTake 的 Agent 技能(skills)——将本地视频转换为 由 AI 编排的、卡片式的二次剪辑视频。
通过开放的 skills CLI 分发。
技能按约定从 skills/<name>/SKILL.md 自动发现。
| 名称 | 功能 |
|---|---|
vtake-cut |
本地视频 → 元数据 + 转写文本 → Agent 设计的 HTML 卡片 → 渲染为 MP4。Agent 在对话中逐张编写卡片 HTML,组装出带 GSAP 时间轴的合成画面,并通过 hyperframes 渲染输出。 |
AI 会读懂视频内容,自动为每段画面选配视觉风格——内置多套调好的风格,也可一键换装:
从左到右、从上到下:杂志 · 极简 · 聚光 · 几何 · 白板 · 终端 · 瑞士 · 小红书 · 学术
# 全局安装(在所有项目可用 → ~/.claude/skills/vtake-cut/)
npx -y skills add notedit/vtake-skills --skill vtake-cut --yes --global
# 项目内安装
npx -y skills add notedit/vtake-skills --skill vtake-cut --yes
# 先列出本仓库的全部技能
npx skills add notedit/vtake-skills --list然后在你的 Agent 中调用,例如在 Claude Code 中执行:
/vtake-cut <video.mp4>
除以下几项外,技能本身是自包含的;这些依赖会按需解析:
@notedit/vtakeCLI——提供extract/transcribe/doctor,通过npx -y @notedit/vtake@latest …调用(已发布到 npm,首次调用会自动下载)。hyperframesCLI——负责渲染,通过npx hyperframes render调用。- 系统
ffmpeg/ffprobe——音频/元数据提取所必需。 - macOS 渲染:强烈建议设置
export PRODUCER_BROWSER_GPU_MODE=hardware。
可选的 ELEVEN_API_KEY 可启用直连 ElevenLabs 的 ASR;未设置时 CLI 会回退到
有速率限制的 https://vtake.app/api/transcribe 代理(每个 IP 每分钟 3 次请求)。
技能内容:见 LICENSE。内置的字体(Inter / Caveat / Virgil / LXGW WenKai TC,均为 OFL)与 GSAP 保留其各自上游的许可证。

