曾用名:SlideFlow AI(截图与视频中可能显示旧名称)
输入主题、大纲或素材,AI 帮你生成专业演示文稿
我们已部署线上体验版本,欢迎试用!
🔗 体验地址:http://223.6.255.214/ 【中国大陆】 🔗 体验地址:http://47.77.231.44/ 【海外】
📮 需要内测邀请码?请联系作者获取!
🆕 📄 支持上传参考文档 - 项目报告、数据分析、会议纪要等,AI会自动提取要点辅助生成
🆕 📊 支持插入图表素材 - 上传Excel表格或截图,AI直接嵌入对应页面
🆕 💬 素材描述功能 - 为每个素材添加说明,AI理解更精准
🗜️ 图片压缩优化 - 生成的PPT图片自动压缩为JPEG格式(质量85%),文件体积减少60%以上,前端加载更快
🎉 生成完成提示 - PPT生成完成后弹出提示窗口,快速下载ZIP/PDF或进入微调模式
⏳ 上传加载优化 - 素材上传过程中显示加载动画,上传完成前禁止关闭弹窗,避免误操作
🔄 重新生成动画 - 单页重新生成时显示遮罩动画,清晰展示当前状态
📁 文件格式验证 - 母版和Logo上传增加格式校验,仅支持PNG/JPG/WebP/GIF,不支持EMF/SVG等矢量格式
💡 格式提示优化 - 上传区域显示明确的格式说明,避免用户上传不支持的文件类型
📝 每页主旨设置 - 选择具体页数后,可为每一页单独设置主旨/主题,AI生成更精准的大纲
✏️ 大纲预览编辑 - 大纲生成后右侧预览区可直接编辑标题和内容,点击「应用编辑」同步到大纲
🎯 图片微调模式 - 图片生成后点击页面进入微调模式,仅修改指定部分,其他元素保持不变
🔢 页码显示控制 - 高级设置→布局设置中可选择隐藏页码
🚀 一键生成 - 输入主题或想法,AI 自动生成完整 PPT,从大纲到设计一气呵成
🎙️ 语音转写 - 支持上传会议录音,AI 自动转写并整理成结构化演示文稿
📄 文档理解 - 上传PDF/Word/PPT/Excel文档,AI自动提取关键信息
📊 素材嵌入 - 为指定页面上传图表、截图、数据表格,AI直接嵌入PPT
🎨 多种风格 - 内置商务简约、酷炫技术等预设风格,支持完全自定义
🖼️ AI 绘图 - 基于 Google Gemini 图像生成模型,为每页生成专业级配图
📝 实时协作 - 交互式修改大纲和设计,AI 理解你的反馈并即时调整
🎯 精准控制 - 自定义配色、字体、页数、Logo,满足企业 VI 需求
intro.mp4
┌─────────────────────────────────────────────────────────────────┐
│ Step 1: 📝 输入你的想法 │
│ ───────────────────────────────────────────────────────────── │
│ "帮我做一个关于2026年AI发展趋势的PPT, │
│ 面向投资人,需要数据支撑,10页左右" │
│ │
│ 💡 可上传会议录音,AI 自动转写整理 │
│ 📄 可上传参考文档(PDF/Word/PPT/Excel),AI 自动提取要点 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ Step 2: 🎨 选择风格 & 配置参数 │
│ ───────────────────────────────────────────────────────────── │
│ • 风格预设:商务简约 / 酷炫技术 / 自定义 │
│ • 内容丰富度:内容丰富 / 简约风格 / 跟随整体 │
│ • 页数控制:自动判断 或 指定 1-20 页 │
│ • 高级设置:配色方案 / 字体 / Logo / 母版 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ Step 3: 📋 AI 生成大纲(可修改) │
│ ───────────────────────────────────────────────────────────── │
│ 第1页:封面 - 2026 AI趋势展望 │
│ 第2页:市场规模 - 万亿级赛道 │
│ 第3页:技术突破 - 多模态与Agent │
│ ... │
│ │
│ ✏️ 不满意?告诉 AI 你的修改意见,实时调整 │
│ 📊 可为指定页面上传图表素材(图片/Excel/粘贴的表格片段),生成时自动嵌入 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ Step 4: 🎯 AI 生成设计方案(可修改) │
│ ───────────────────────────────────────────────────────────── │
│ 为每一页生成详细的设计理念和视觉方案: │
│ • 页面布局结构 │
│ • 配色运用说明 │
│ • 图表/图形建议 │
│ │
│ ✏️ 不满意?继续对话调整,直到满意为止 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ Step 5: 🖼️ AI 逐页生成 PPT 图片 │
│ ───────────────────────────────────────────────────────────── │
│ 🎨 正在生成第 3/10 页... │
│ ████████████████░░░░░░░░░░░░ 50% │
│ │
│ 📊 上传的素材会自动嵌入对应页面 │
│ ✏️ 单页不满意?点击缩略图,输入修改意见重新生成 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ Step 6: 📥 下载成品 │
│ ───────────────────────────────────────────────────────────── │
│ • ZIP 打包下载(所有图片) │
│ • PDF 一键导出 │
│ • 使用 WPS【PDF转PPT】工具进一步编辑 │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ Frontend │
│ React 18 + 响应式设计 + 深色/浅色主题 │
└─────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────┐
│ Backend │
│ FastAPI + Python 3.10+ + 异步架构 │
└─────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────┐
│ AI Services │
│ Google Gemini (文本生成 + 图片生成) │
│ 科大讯飞 iFlytek (语音转写) │
└─────────────────────────────────────────────────────────────────┘
- Python 3.10+
- Node.js 18+
- Google Gemini API Key
# 1. 克隆项目
git clone https://github.com/tonyqinatcmu/SlideBot.AI.git
cd SlideBot.AI
# 2. 安装后端依赖
pip install -r requirements.txt
# 3. 配置环境变量
cp .env.example .env
# 编辑 .env 文件,填入你的 API Key
# 4. 安装前端依赖并构建
cd frontend
npm install
npm run build
cd ..
# 5. 启动服务
python server.py访问 http://localhost:8001 开始使用! 默认邀请码为"VISITOR", 可以修改invite_codes.json文件。
在 .env 文件中配置以下参数:
# Google Gemini API (必需)
GEMINI_API_KEY=your_gemini_api_key
# 科大讯飞语音转写 (可选,用于录音转写功能)
IFLYTEK_APP_ID=your_iflytek_app_id
IFLYTEK_API_SECRET=your_iflytek_api_secret
# 服务配置
PORT=8001
HOST=0.0.0.0| 服务 | 用途 | 获取地址 |
|---|---|---|
| Google Gemini | 文本/图像生成 | Google AI Studio |
| 科大讯飞 | 语音转写(可选) | 讯飞开放平台 |
slidebot/
├── server.py # 后端主程序(FastAPI路由)
├── requirements.txt # Python 依赖
├── .env.example # 环境变量示例
├── .gitignore # Git 忽略配置
├── LICENSE # MIT 开源协议
├── invite_codes.json # 邀请码配置
│
├── modules/ # 后端模块(模块化架构)
│ ├── __init__.py # 模块导出
│ ├── config.py # 配置常量(API密钥、路径等)
│ ├── prompts.py # AI提示词模板
│ ├── models.py # Pydantic数据模型
│ ├── asr.py # 科大讯飞语音转写
│ ├── invite_codes.py # 邀请码管理
│ ├── session.py # 会话状态管理
│ ├── gemini_api.py # Gemini API调用封装
│ └── visit_counter.py # 访问计数器
│
├── frontend/ # React 前端
│ ├── src/
│ │ ├── App.js # 主组件(包含所有UI逻辑)
│ │ └── index.js # 入口文件
│ ├── public/
│ │ ├── index.html
│ │ └── wps-tip.png # WPS 提示图
│ └── package.json
│
├── docs/ # 文档资源
│ └── images/ # README 截图
│
├── outputs/ # 生成的图片输出(自动创建)
├── references/ # 上传的参考文件(自动创建)
├── audio/ # 录音文件(自动创建)
└── records/ # 使用记录(自动创建)
| 功能 | 描述 |
|---|---|
| 🤖 智能大纲 | 根据输入自动生成结构化PPT大纲,支持实时修改 |
| 🎨 风格设计 | AI为每页生成详细的设计方案和视觉理念 |
| 🖼️ 图片生成 | 使用Gemini生成专业级配图,支持2K/4K分辨率 |
| 📝 实时迭代 | 对话式交互,随时调整内容和设计 |
| 📥 多格式导出 | 支持ZIP打包和PDF一键导出 |
| 功能 | 描述 |
|---|---|
| 🎙️ 录音转写 | 上传会议录音,AI自动转写并整理成PPT |
| 🏢 母版支持 | 上传企业母版图片,保持VI一致性 |
| 🎯 自定义配色 | 灵活配置主色、辅助色、强调色 |
| 📝 自定义字体 | 中英文字体分别设置 |
| 📊 内容丰富度 | 数据丰富/简约风格自由切换 |
| 🌙 深色模式 | 支持深色/浅色主题切换 |
- 智能大纲生成与迭代修改
- AI 设计风格生成
- Gemini 图片逐页生成
- 录音转写整理成 PPT
- 自定义配色、字体、Logo
- ZIP / PDF 多格式导出
- 素材上传 - 支持用户上传 PDF、Word、PPT、Excel、图片等素材,AI 自动提取整理
- 演讲稿生成 - 除 PPT 外,为用户生成配套的演讲稿 / 讲稿
- 风格持久化 - 保存用户的个性化风格偏好,下次使用自动加载
# 后端开发(热重载)
uvicorn server:app --reload --port 8001
# 前端开发
cd frontend
npm start推荐使用以下方式部署:
# 生产环境部署
uvicorn server:app --host 0.0.0.0 --port 8001
# 或使用 Docker(可自行编写 Dockerfile)配合 Nginx 反向代理和 Systemd 服务管理可实现更稳定的生产环境部署。
我们欢迎所有形式的贡献!
- Fork 本项目
- 创建你的特性分支 (
git checkout -b feature/AmazingFeature) - 提交你的更改 (
git commit -m 'Add some AmazingFeature') - 推送到分支 (
git push origin feature/AmazingFeature) - 开启一个 Pull Request
本项目采用 MIT License 开源协议。
- Google Gemini - 多模态AI模型
- 科大讯飞 - 语音转写服务
- FastAPI - 现代高性能Python Web框架
- React - 用户界面构建库
如果这个项目对你有帮助,请给我们一个 Star ⭐
| 📧 邮箱 | 💬 微信 | |
|---|---|---|
| tonyqinatcmu@gmail.com | ![]() |
| 📧 邮箱 | 💬 微信 | |
|---|---|---|
| jobtj@sina.com | ![]() |
欢迎交流探讨 AI、产品设计、创业等话题!









