Skip to content

notedit/vtake-skills

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

vTake — 不剪画面,剪知识

vtake-skills

简体中文 | English

website skills CLI npm license author

面向 VTake 的 Agent 技能(skills)——将本地视频转换为 由 AI 编排的、卡片式的二次剪辑视频。

▶️ 效果演示在 X 上观看 demo 视频

通过开放的 skills CLI 分发。 技能按约定从 skills/<name>/SKILL.md 自动发现。

技能列表

名称 功能
vtake-cut 本地视频 → 元数据 + 转写文本 → Agent 设计的 HTML 卡片 → 渲染为 MP4。Agent 在对话中逐张编写卡片 HTML,组装出带 GSAP 时间轴的合成画面,并通过 hyperframes 渲染输出。

风格预览

AI 会读懂视频内容,自动为每段画面选配视觉风格——内置多套调好的风格,也可一键换装:

vTake 内置的卡片风格:杂志 / 极简 / 聚光 / 几何 / 白板 / 终端 / 瑞士 / 小红书 / 学术

从左到右、从上到下:杂志 · 极简 · 聚光 · 几何 · 白板 · 终端 · 瑞士 · 小红书 · 学术

安装

# 全局安装(在所有项目可用 → ~/.claude/skills/vtake-cut/)
npx -y skills add notedit/vtake-skills --skill vtake-cut --yes --global

# 项目内安装
npx -y skills add notedit/vtake-skills --skill vtake-cut --yes

# 先列出本仓库的全部技能
npx skills add notedit/vtake-skills --list

然后在你的 Agent 中调用,例如在 Claude Code 中执行:

/vtake-cut <video.mp4>

运行时依赖

除以下几项外,技能本身是自包含的;这些依赖会按需解析:

  • @notedit/vtake CLI——提供 extract / transcribe / doctor,通过 npx -y @notedit/vtake@latest … 调用(已发布到 npm,首次调用会自动下载)。
  • hyperframes CLI——负责渲染,通过 npx hyperframes render 调用。
  • 系统 ffmpeg / ffprobe——音频/元数据提取所必需。
  • macOS 渲染:强烈建议设置 export PRODUCER_BROWSER_GPU_MODE=hardware

可选的 ELEVEN_API_KEY 可启用直连 ElevenLabs 的 ASR;未设置时 CLI 会回退到 有速率限制的 https://vtake.app/api/transcribe 代理(每个 IP 每分钟 3 次请求)。

许可证

技能内容:见 LICENSE。内置的字体(Inter / Caveat / Virgil / LXGW WenKai TC,均为 OFL)与 GSAP 保留其各自上游的许可证。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages