Releases: BillLucky/echocut
BGM pack v1 (74 royalty-free tracks)
Full background-music pack for echocut (74 royalty-free tracks, ~385MB). The repo ships a curated starter set (01–08); run npm run fetch-bgm to pull the full pack into assets/bgm/.
echocut v0.1.0 — local-first video CLI / 本地优先视频命令行工具
🇬🇧 English below · 🇨🇳 中文见下半部分
🇬🇧 echocut v0.1.0 — local-first video CLI
Turn raw footage into brand-ready, platform-optimized video — with one command.
No cloud upload, no editor, no timeline. Everything runs on your own machine.
echocut burn talk.mp4 --cut-fillers
# → talk_burn.mp4 (subtitles + title + brand band + cover + fade) + cover.jpg + subtitles.srt + publish.mdWhat it does
A single echocut burn <video> runs a 7-stage local pipeline:
- Extract audio — ffprobe + ffmpeg, with high-pass + loudness normalization for cleaner ASR.
- Transcribe — word-level ASR; long audio is chunked, cached and resumable.
- Cut fillers / silence (optional) — physically trims "um" and dead air; video, audio and subtitles stay in sync.
- Discover emphasis — a local LLM finds per-video keywords to highlight.
- Captions + metadata — typo correction + auto headline/subline (or pass your own).
- Burn subtitles — large readable captions + title + your
@brandcapsule, hardware-encoded. - Cover + CTA + BGM — brand cover, end fade, CTA card, optional background music.
Highlights
- 🎬 Word-level subtitle burn-in — WhisperX (cross-platform CPU/CUDA) or Qwen3/MLX (Apple Silicon).
- 🖼️ Brand cover + CTA card, and your
@brandcapsule on every frame (your traceable mark). - ✂️ Filler / silence cutting at the video-track level — perfectly in sync.
- 🎯 Highlights — slice a long video into shareable clips (
highlights/hls→hmk). - 📐 Any aspect ratio — vertical / landscape / square / 4:3 auto-fit;
--obsmode for "face on top + screen below" recordings. - 📤 Publish kit — titles, descriptions and hashtags for multiple platforms.
- 🌏 Multi-brand — every brand is one JSON file.
- ⚡ Built for long videos — chunked transcription with resume, cross-run transcript cache, hardware encode/decode on Apple Silicon.
Install
git clone https://github.com/<you>/echocut.git && cd echocut
npm install
python3 -m venv .venv && .venv/bin/pip install -r requirements.txt
npm run fetch-fonts # downloads the default CJK font (Noto Sans SC, OFL)
npm link
echocut doctor # environment self-checkRequirements: Node.js 18+, Python 3.11+, FFmpeg, and Ollama
(ollama pull qwen3.5:9b) for the LLM features. Works cross-platform via WhisperX;
the fastest ASR (qwen3, mlx) is Apple-Silicon-only and falls back to WhisperX elsewhere.
Docs
- README — quickstart, features, output-layout diagrams (vertical / landscape / OBS).
- docs/CLI.md — full, agent-friendly command reference: every command, every
burnflag, brand design guide. - CONTRIBUTING.md — dev setup (bilingual).
- 简体中文文档 — README.zh-CN.md.
License & status
- Apache-2.0. Default CJK font Noto Sans SC (SIL OFL 1.1, downloaded at setup).
The optional Remotion render path is licensed separately and is not required
by the default FFmpeg pipeline. npm run check+ 393 unit tests pass. No personal/brand/customer data —
brands ship asexample/_templateonly.
🇨🇳 echocut v0.1.0 — 本地优先的视频命令行工具
一条命令,把原始素材变成品牌化、适配各平台的成片。 不上云、不用剪辑器、不用时间线,全程在你自己的机器上跑。
echocut burn talk.mp4 --cut-fillers
# → talk_burn.mp4(字幕 + 标题 + 品牌带 + 封面 + 淡出)+ cover.jpg + subtitles.srt + publish.md它做什么
一条 echocut burn <视频> 跑完 7 步本地流水线:
- 抽音轨 —— ffprobe + ffmpeg,前置高通滤波 + 响度归一,提升识别率。
- 转写 —— 词级 ASR;长音频自动分块、缓存、断点续跑。
- 切口水 / 静默(可选)—— 视频轨道级切除「嗯/啊」和长静默,音视频字幕完全同步。
- 发现爆点词 —— 本地 LLM 找出每条视频的高亮关键词。
- 字幕 + 元数据 —— 错别字校正 + 自动标题/副标题(也可自己传)。
- 烧录字幕 —— 大字号可读字幕 + 标题 + 你的
@品牌胶囊,硬件编码。 - 封面 + CTA + BGM —— 品牌封面、片尾淡出、CTA 卡片、可选背景音乐。
亮点
- 🎬 词级字幕烧录 —— WhisperX(跨平台 CPU/CUDA)或 Qwen3/MLX(Apple Silicon)。
- 🖼️ 品牌封面 + CTA 卡片,
@品牌胶囊画在每一帧(可溯源的品牌印记)。 - ✂️ 切口水 / 切静默 —— 视频轨道级,完全同步。
- 🎯 精华切片 —— 把长视频切成可分享的短片(
highlights/hls→hmk)。 - 📐 任意画幅 —— 竖屏 / 横屏 / 方屏 / 4:3 自适应;
--obs模式适配「上脸下屏」录制。 - 📤 宣发包 —— 多平台标题、描述、话题标签。
- 🌏 多品牌 —— 每个品牌一份 JSON 文件。
- ⚡ 为长视频而生 —— 分块转写带断点续跑、跨运行转写缓存、Apple Silicon 硬件编解码。
安装
git clone https://github.com/<你>/echocut.git && cd echocut
npm install
python3 -m venv .venv && .venv/bin/pip install -r requirements.txt
npm run fetch-fonts # 下载默认中文字体(Noto Sans SC,OFL 开源许可)
npm link
echocut doctor # 环境自检依赖: Node.js 18+、Python 3.11+、FFmpeg,LLM 功能需 Ollama
(ollama pull qwen3.5:9b)。通过 WhisperX 跨平台可用;最快的 qwen3 / mlx 仅
Apple Silicon,其他平台自动回退 WhisperX。
文档
- README —— 快速上手、能力一览、输出布局图(竖屏 / 横屏 / OBS)。
- docs/CLI.md —— 完整、对 agent 友好的命令手册:每个命令、
burn全 flag、品牌设计指南。 - CONTRIBUTING.md —— 开发环境搭建(中英双语)。
- English docs —— README.md。
许可与状态
- Apache-2.0。 默认中文字体 Noto Sans SC(SIL OFL 1.1,安装时下载)。可选的
Remotion 渲染路径单独授权,默认 FFmpeg 流水线不依赖它。 npm run check+ 393 项单元测试全过。无任何个人/品牌/客户数据 —— 品牌只随附
example/_template。