Podcast2Markdown

将播客音频智能转换为结构化 Markdown 文章。

功能特性

🎙️ 本地音频转录：使用 whisper.cpp 本地推理，支持 CUDA GPU 加速
🤖 AI 文章生成：调用 Minimax API 自动整理转录内容为结构化 Markdown
📄 Markdown 导出：一键下载生成的文章为 Markdown 文件
⚡ 异步处理：任务队列管理，支持进度跟踪

技术栈

前端: Next.js 14 + Tailwind CSS
后端: Next.js API Routes (Node.js)
数据库: SQLite + Prisma ORM
语音转录: whisper.cpp (本地 CUDA 加速)
文章生成: Minimax (MiniMax-M2.7)

快速开始

1. 环境要求

Node.js 18+
Git
C/C++ 编译工具 (CMake)
可选: NVIDIA GPU + CUDA Toolkit (用于 GPU 加速)

2. 安装依赖

npm install

3. 编译 whisper.cpp

Windows (PowerShell):

# 自动构建（推荐）
powershell ./scripts/build-whisper.ps1

# 指定模型大小
powershell ./scripts/build-whisper.ps1 large   # 大模型（3.1GB，高质量）
powershell ./scripts/build-whisper.ps1 small   # 小模型（466MB，快速）

# CPU 版本（无 GPU）
powershell ./scripts/build-whisper.ps1 -CPU

构建脚本会自动下载模型文件。

4. 配置环境变量

创建 .env 文件：

# Whisper 本地转录配置
WHISPER_MODEL_PATH=whisper.cpp/models/ggml-large-v3.bin
WHISPER_USE_CUDA=1

# MINIMAX API（文章生成）
MINIMAX_API_KEY=your_minimax_api_key
MINIMAX_API_BASE=https://api.minimaxi.com/v1

# 数据库
DATABASE_URL="file:./dev.db"

5. 初始化数据库

npx prisma generate
npx prisma db push

6. 启动开发服务器

npm run dev

访问 http://localhost:3000

使用说明

上传音频：在首页选择音频文件（支持 MP3、WAV、M4A 等格式）
等待转录：系统自动调用 whisper.cpp 进行转录，显示进度
查看结果：转录完成后自动调用 Minimax 生成 Markdown 文章
下载文章：点击"下载 Markdown"按钮导出文件

项目结构

src/
├── app/
│   ├── api/           # API 路由
│   │   ├── upload/    # 音频上传
│   │   ├── transcribe/# 提交转录任务
│   │   ├── task/      # 查询任务状态
│   │   ├── generate/  # 重新生成文章
│   │   └── export/    # Markdown 导出
│   ├── layout.tsx     # 根布局
│   └── page.tsx       # 首页（上传+结果展示）
├── lib/
│   ├── prisma.ts      # Prisma 客户端
│   ├── whisper.ts     # whisper.cpp 调用封装
│   └── minimax.ts     # Minimax API 调用
└── types/
    └── index.ts       # 类型定义

whisper.cpp/           # whisper.cpp 源码和编译输出
├── build/            # 编译后的二进制
├── models/           # 模型文件
└── samples/          # 测试音频

scripts/               # 构建脚本
├── build-whisper.ps1 # Windows 构建脚本
└── build-whisper.sh  # Unix 构建脚本

常用命令

命令	说明
`npm run dev`	启动开发服务器
`npm run build`	构建生产版本
`npm run whisper:build`	构建 whisper.cpp
`npm run build:addon`	编译 Node.js 原生插件
`npx prisma studio`	打开数据库管理界面
`npx prisma db push`	同步数据库 schema

文档

设计文档 - 功能设计和技术架构
实现文档 - 详细实现说明
部署指南 - 部署和配置说明

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
docs		docs
prisma		prisma
scripts		scripts
src		src
.gitignore		.gitignore
AGENT.md		AGENT.md
README.md		README.md
binding.gyp		binding.gyp
next.config.mjs		next.config.mjs
package-lock.json		package-lock.json
package.json		package.json
postcss.config.mjs		postcss.config.mjs
tailwind.config.ts		tailwind.config.ts
tsconfig.json		tsconfig.json
实现.md		实现.md
设计.md		设计.md
部署.md		部署.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Podcast2Markdown

功能特性

技术栈

快速开始

1. 环境要求

2. 安装依赖

3. 编译 whisper.cpp

4. 配置环境变量

5. 初始化数据库

6. 启动开发服务器

使用说明

项目结构

常用命令

文档

许可证

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Podcast2Markdown

功能特性

技术栈

快速开始

1. 环境要求

2. 安装依赖

3. 编译 whisper.cpp

4. 配置环境变量

5. 初始化数据库

6. 启动开发服务器

使用说明

项目结构

常用命令

文档

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages