Skip to content

Releases: BillLucky/echocut

BGM pack v1 (74 royalty-free tracks)

03 Jun 09:32

Choose a tag to compare

Full background-music pack for echocut (74 royalty-free tracks, ~385MB). The repo ships a curated starter set (01–08); run npm run fetch-bgm to pull the full pack into assets/bgm/.

echocut v0.1.0 — local-first video CLI / 本地优先视频命令行工具

31 May 08:43

Choose a tag to compare

🇬🇧 English below · 🇨🇳 中文见下半部分


🇬🇧 echocut v0.1.0 — local-first video CLI

Turn raw footage into brand-ready, platform-optimized video — with one command.
No cloud upload, no editor, no timeline. Everything runs on your own machine.

echocut burn talk.mp4 --cut-fillers
# → talk_burn.mp4 (subtitles + title + brand band + cover + fade) + cover.jpg + subtitles.srt + publish.md

What it does

A single echocut burn <video> runs a 7-stage local pipeline:

  1. Extract audio — ffprobe + ffmpeg, with high-pass + loudness normalization for cleaner ASR.
  2. Transcribe — word-level ASR; long audio is chunked, cached and resumable.
  3. Cut fillers / silence (optional) — physically trims "um" and dead air; video, audio and subtitles stay in sync.
  4. Discover emphasis — a local LLM finds per-video keywords to highlight.
  5. Captions + metadata — typo correction + auto headline/subline (or pass your own).
  6. Burn subtitles — large readable captions + title + your @brand capsule, hardware-encoded.
  7. Cover + CTA + BGM — brand cover, end fade, CTA card, optional background music.

Highlights

  • 🎬 Word-level subtitle burn-in — WhisperX (cross-platform CPU/CUDA) or Qwen3/MLX (Apple Silicon).
  • 🖼️ Brand cover + CTA card, and your @brand capsule on every frame (your traceable mark).
  • ✂️ Filler / silence cutting at the video-track level — perfectly in sync.
  • 🎯 Highlights — slice a long video into shareable clips (highlights / hlshmk).
  • 📐 Any aspect ratio — vertical / landscape / square / 4:3 auto-fit; --obs mode for "face on top + screen below" recordings.
  • 📤 Publish kit — titles, descriptions and hashtags for multiple platforms.
  • 🌏 Multi-brand — every brand is one JSON file.
  • Built for long videos — chunked transcription with resume, cross-run transcript cache, hardware encode/decode on Apple Silicon.

Install

git clone https://github.com/<you>/echocut.git && cd echocut
npm install
python3 -m venv .venv && .venv/bin/pip install -r requirements.txt
npm run fetch-fonts          # downloads the default CJK font (Noto Sans SC, OFL)
npm link
echocut doctor               # environment self-check

Requirements: Node.js 18+, Python 3.11+, FFmpeg, and Ollama
(ollama pull qwen3.5:9b) for the LLM features. Works cross-platform via WhisperX;
the fastest ASR (qwen3, mlx) is Apple-Silicon-only and falls back to WhisperX elsewhere.

Docs

  • README — quickstart, features, output-layout diagrams (vertical / landscape / OBS).
  • docs/CLI.md — full, agent-friendly command reference: every command, every burn flag, brand design guide.
  • CONTRIBUTING.md — dev setup (bilingual).
  • 简体中文文档 — README.zh-CN.md.

License & status

  • Apache-2.0. Default CJK font Noto Sans SC (SIL OFL 1.1, downloaded at setup).
    The optional Remotion render path is licensed separately and is not required
    by the default FFmpeg pipeline.
  • npm run check + 393 unit tests pass. No personal/brand/customer data —
    brands ship as example / _template only.

🇨🇳 echocut v0.1.0 — 本地优先的视频命令行工具

一条命令,把原始素材变成品牌化、适配各平台的成片。 不上云、不用剪辑器、不用时间线,全程在你自己的机器上跑。

echocut burn talk.mp4 --cut-fillers
# → talk_burn.mp4(字幕 + 标题 + 品牌带 + 封面 + 淡出)+ cover.jpg + subtitles.srt + publish.md

它做什么

一条 echocut burn <视频> 跑完 7 步本地流水线:

  1. 抽音轨 —— ffprobe + ffmpeg,前置高通滤波 + 响度归一,提升识别率。
  2. 转写 —— 词级 ASR;长音频自动分块、缓存、断点续跑。
  3. 切口水 / 静默(可选)—— 视频轨道级切除「嗯/啊」和长静默,音视频字幕完全同步。
  4. 发现爆点词 —— 本地 LLM 找出每条视频的高亮关键词。
  5. 字幕 + 元数据 —— 错别字校正 + 自动标题/副标题(也可自己传)。
  6. 烧录字幕 —— 大字号可读字幕 + 标题 + 你的 @品牌 胶囊,硬件编码。
  7. 封面 + CTA + BGM —— 品牌封面、片尾淡出、CTA 卡片、可选背景音乐。

亮点

  • 🎬 词级字幕烧录 —— WhisperX(跨平台 CPU/CUDA)或 Qwen3/MLX(Apple Silicon)。
  • 🖼️ 品牌封面 + CTA 卡片,@品牌 胶囊画在每一帧(可溯源的品牌印记)。
  • ✂️ 切口水 / 切静默 —— 视频轨道级,完全同步。
  • 🎯 精华切片 —— 把长视频切成可分享的短片(highlights / hlshmk)。
  • 📐 任意画幅 —— 竖屏 / 横屏 / 方屏 / 4:3 自适应;--obs 模式适配「上脸下屏」录制。
  • 📤 宣发包 —— 多平台标题、描述、话题标签。
  • 🌏 多品牌 —— 每个品牌一份 JSON 文件。
  • 为长视频而生 —— 分块转写带断点续跑、跨运行转写缓存、Apple Silicon 硬件编解码。

安装

git clone https://github.com/<>/echocut.git && cd echocut
npm install
python3 -m venv .venv && .venv/bin/pip install -r requirements.txt
npm run fetch-fonts          # 下载默认中文字体(Noto Sans SC,OFL 开源许可)
npm link
echocut doctor               # 环境自检

依赖: Node.js 18+、Python 3.11+、FFmpeg,LLM 功能需 Ollama
(ollama pull qwen3.5:9b)。通过 WhisperX 跨平台可用;最快的 qwen3 / mlx
Apple Silicon,其他平台自动回退 WhisperX。

文档

  • README —— 快速上手、能力一览、输出布局图(竖屏 / 横屏 / OBS)。
  • docs/CLI.md —— 完整、对 agent 友好的命令手册:每个命令、burn 全 flag、品牌设计指南。
  • CONTRIBUTING.md —— 开发环境搭建(中英双语)。
  • English docs —— README.md。

许可与状态

  • Apache-2.0。 默认中文字体 Noto Sans SC(SIL OFL 1.1,安装时下载)。可选的
    Remotion 渲染路径单独授权,默认 FFmpeg 流水线不依赖它。
  • npm run check + 393 项单元测试全过。无任何个人/品牌/客户数据 —— 品牌只随附
    example / _template