AI 驱动的 B 站热点分析与评论洞察系统,自动生成与迭代适配文生视频(Text-to-Video)的高质量 Prompt。内置 FastAPI 后端与 Streamlit 控制台,支持 Qwen3-VL 与 Qwen-Plus,提供一键启动与标准化工程结构。
English TL;DR: AI-powered Bilibili hotspot mining + comment insights → generate/iterate production-ready prompts for text-to-video workflows. FastAPI backend + Streamlit console, with big-tech style project scaffolding.
- 智能热点搜索:按关键词抓取 B 站热门视频,采用可调权重的热度公式排序
- 多模态视频分析:集成 Qwen3-VL 模型,自动分析视频内容并生成英文 Prompt 与中文标题
- 评论挖掘与迭代:从评论区提炼视觉优化建议,使用 Qwen-Plus 模型产出新版本 Prompt
- 智能代理系统:基于 LangGraph 构建的 AI 大脑,支持 Qwen3-VL 和 Qwen-Plus 模型
- 流式思考过程:实时显示 AI 的思考过程和工具调用,支持详细/简洁模式切换
- 多工具集成:支持热点搜索、Prompt 生成、视频生成等多种工具调用
- 交互式优化:基于用户反馈优化现有 Prompt
- 创意扩展:基于基础 Prompt 生成多个创意变体
- 版本迭代:支持 Prompt 的版本管理和迭代追踪
- Flow 浏览器自动化:支持 Google Flow 的浏览器自动化生成
- Veo 3 API 集成:支持 Veo 3 API 的视频生成
- 批量生成:支持同时选择多个 Prompt 进行批量视频生成
- 端口灵活配置:支持自定义 API 端口和代理设置
- B 站授权登录:扫码登录获取 B 站数据访问权限
- 实时队列监控:Flow 任务队列状态实时监控
- 标准化工程结构:完整的项目脚手架和开发工具链
ai_video_agent/
├─ agent/ # 核心业务逻辑
│ ├─ brain/ # AI 大脑与工具系统
│ │ ├─ core.py # LangGraph 代理核心
│ │ ├─ tools.py # 可用工具定义
│ │ └─ system_prompt.md # 系统提示词
│ ├─ collectors/ # 数据采集模块
│ │ └─ bilibili.py # B 站数据采集
│ ├─ enhancers/ # 能力增强模块
│ │ ├─ analyze_video.py # AISet 视频分析
│ │ └─ prompt_expander.py # Prompt 扩展
│ ├─ generators/ # 视频生成器
│ │ ├─ flow_automator.py # Flow 浏览器自动化
│ │ └─ veo_api.py # Veo 3 API 集成
│ ├─ graph/ # 流程图与状态管理
│ ├─ hotspot/ # 热点发现逻辑
│ ├─ interactive/ # 交互优化
│ ├─ iterators/ # 版本迭代
│ ├─ miners/ # 评论挖掘与洞察
│ ├─ prompt/ # Prompt 编排与 Schema
│ ├─ registry/ # 索引与注册
│ ├─ reports/ # 报表输出
│ └─ utils/ # 工具方法
├─ cli/ # 命令行接口
├─ config/ # 配置文件
│ ├─ default.yaml # 默认配置
│ └─ logging.yaml # 日志配置
├─ docs/ # 项目文档
├─ prompts/ # 生成的 Prompt 文件
├─ scripts/ # 开发工具脚本
├─ tests/ # 测试文件
├─ app.py # Streamlit 前端入口
├─ main.py # FastAPI 后端入口
├─ run_app.ps1 # 一键启动脚本
├─ pyproject.toml # 项目配置
└─ requirements.txt # 依赖列表
- 操作系统:Windows 10/11(已适配 UTF-8 控制台)
- Python:3.10+
- 浏览器:Chrome(用于 Flow 自动化)
- 推荐:使用 Conda 虚拟环境
# 创建虚拟环境(推荐)
conda create -n ai_video_agent python=3.10 -y
conda activate ai_video_agent
# 安装依赖
pip install -r requirements.txt
# 安装开发工具(可选)
pip install -r requirements-dev.txt
# 在项目根目录执行
.\run_app.ps1启动脚本会自动:
- 启动带调试端口的 Chrome 浏览器
- 启动 FastAPI 后端服务(端口 8001)和Html页面
- 启动 Streamlit 前端界面(端口 8501)
- 在 Chrome 中打开前端界面和 Flow 页面
如果需要分别控制服务:
# 终端1:启动后端
uvicorn main:app --reload --host 0.0.0.0 --port 8001
# 终端2:启动前端
streamlit run app.py启动后在 Web 界面中配置以下 API 密钥:
- Qwen-Plus API Key:用于评论分析和 Prompt 优化
- AISet API Keys:支持多个密钥轮询,用于视频分析
- Veo API Key:用于 Veo 3 视频生成
- FastAPI:现代、快速的 Web 框架
- LangGraph:AI 代理工作流管理
- LangChain:LLM 应用开发框架
- Uvicorn:ASGI 服务器
- Streamlit:快速构建数据应用
- 实时流式输出:SSE 技术实现 AI 思考过程展示
- AISet 2.5 Flash:Google 多模态模型,用于视频分析
- Qwen-Plus Chat/Reasoner:深度求索模型,用于文本分析和推理
- yt-dlp:视频下载工具
- browser-cookie3:浏览器 Cookie 管理
- requests:HTTP 请求库
- Selenium:浏览器自动化(主要)
- WebDriver Manager:自动管理浏览器驱动
- psutil:系统进程检测
- pyperclip:剪贴板操作
GET /api/health- 健康检查GET /api/keys/get- 获取 API 密钥状态POST /api/keys/update- 更新 API 密钥GET /api/auth/get-qr-code- 获取 B 站登录二维码GET /api/auth/poll-qr-code- 轮询登录状态
POST /api/hotspot/search- 搜索热点视频POST /api/hotspot/generate-from-link- 从链接生成 Prompt
GET /api/prompt/list- 获取 Prompt 列表DELETE /api/prompt/delete- 删除 PromptPOST /api/prompt/refine- 交互式优化 PromptPOST /api/prompt/expand- 创意扩展
POST /api/generate/video- Flow 浏览器自动化生成POST /api/generate/veo- Veo 3 API 生成GET /api/flow/queue_status- 获取 Flow 队列状态
POST /api/agent/chat_stream- 流式 AI 对话与工具调用
curl -X POST "https://api.veo3api.ai/api/v1/veo/generate" \
-H "Authorization: Bearer aa7f8e5e5f1432aaf0687981ed3xxxxx" \
-H "Content-Type: application/json" \
-d '{
"prompt": "中景呈现身着深红色僧袍的德引大师(武盟盟主),双手合十于胸前,背景为古色古香的寺庙建筑(灰瓦、红柱、绿植点缀),阳光柔和洒在僧袍与庭院中,营造古朴武林氛围。自然光为主,柔和侧光勾勒僧袍纹理与人物轮廓,背景稍暗突出主体。台词:我的小徒弟已到",
"model": "veo3",
"aspectRatio": "16:9",
"watermark": "MyBrand"
}'
curl --request GET \
--url 'https://api.veo3api.ai/api/v1/veo/record-info?taskId=f43139821edccd335a3e36028d7097dc' \
--header 'Authorization: Bearer aa7f8e5e5f1432aaf0687981ed3xxxxx'
curl "https://generativelanguage.googleapis.com/v1beta/models/aiset-2.0-flash:generateContent" \
-H 'Content-Type: application/json' \
-H 'X-goog-api-key: AIzaSyAb4nC0MblSopIqUrxmaCeJ5XBROW9jJ1g' \
-x "http://100.64.0.3:7890" \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain how AI works in a few words"
}
]
}
]
}'
curl -X POST https://ark.cn-beijing.volces.com/api/v3/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer 7894fd85-505f-401b-b267-fbfe764xxxxx" \
-d '{
"model": "doubao-seedream-4-0-250828",
"prompt": "Generate 3 images of a girl and a cow plushie happily riding a roller coaster in an amusement park, depicting morning, noon, and night.",
"image": ["https://ark-doc.tos-ap-southeast-1.bytepluses.com/doc_image/seedream4_imagesToimages_1.png"],
"sequential_image_generation": "auto",
"sequential_image_generation_options": {
"max_images": 3
},
"response_format": "url",
"size": "2K",
"stream": false,
"watermark": false
}'
- 在"授权登录"标签页完成 B 站登录
- 在"热点发现"标签页输入关键词搜索热门视频
- 选择感兴趣的视频进行 AISet 分析
- 系统自动生成英文 Prompt 和中文标题
- 在"单视频迭代"标签页选择基础 Prompt 和视频链接
- 系统自动分析评论并生成优化建议
- 在"交互式优化"标签页基于反馈进一步优化
- 使用"创意扩展"生成多个变体
- 在"视频生成"标签页选择生成方式(Flow 或 Veo)
- 选择要生成的 Prompt(支持批量选择)
- 配置相关参数(端口、URL 等)
- 提交生成任务并监控进度
- 在右侧"AI 助手"面板选择模型
- 开启"显示详细思考过程"查看 AI 工作流程
- 通过自然语言与 AI 交互,AI 会自动调用相应工具
创建 .env 文件并添加您的大模型密钥。
大模型密钥的获取地址:https://aiqianji.cn
在 .env 文件中配置:
# https://aiqianji.cn/panel/model_price
AISET_API_KEY=your_aiset_key
AISET_BASE_URL=https://aiqianji.cn/v1
TEXT_MODEL=qwen-plus
VISION_MODEL=qwen3-vl-plus
# https://veo3api.ai/
VEO_API_KEY=your_veo_key
BILI_COOKIE=your_bilibili_cookie- 后端端口:默认 8001,可在启动脚本中修改
- 前端端口:默认 8501,可在启动脚本中修改
- Chrome 调试端口:默认 9222,用于 Flow 自动化
支持 HTTP 代理配置,适用于需要科学上网的环境。
.\scripts\format.ps1pytest# 后端开发
uvicorn main:app --reload --port 8001
# 前端开发
streamlit run app.py-
控制台中文乱码
- 启动脚本已自动设置 UTF-8 编码
- 如仍有问题,手动执行:
chcp 65001
-
Chrome 自动化失败
- 确保 Chrome 已安装
- 检查调试端口是否被占用
- 尝试重启 Chrome 或使用不同端口
-
API 密钥错误
- 检查
.env文件中的密钥格式 - 确认密钥有效性和权限
- 检查
-
依赖安装失败
- 确认 Python 版本 >= 3.10
- 尝试使用国内镜像源
- 逐个安装依赖包排查问题
-
Playwright 相关错误
- 项目使用 Selenium,不需要安装 Playwright
- 如果看到 Playwright 相关错误,请忽略或从 requirements.txt 中移除
- 后端日志:控制台输出
- 前端日志:Streamlit 界面底部
- 详细日志:
config/logging.yaml配置
- 更细粒度的评论情感/主题聚类
- 多供应商 API 密钥管理与自动调度
- Prompt 质量评估指标与 A/B 测试
- 任务编排可视化与失败重试机制
- 一键部署(Docker)与在线 Demo
- 多平台支持(macOS、Linux)
- 插件系统与第三方集成
- 企业级功能与权限管理
欢迎提交 Issue 和 Pull Request!
- 代码遵循
pyproject.toml中的 Black/Isort/Flake8 规范 - 新增功能请添加相应的测试用例
- 提交前请运行代码格式化和测试
- 使用 GitHub Issues 报告 Bug
- 提供详细的错误信息和复现步骤
- 包含系统环境信息
本项目采用 MIT 许可证。详见 LICENSE 文件。
感谢以下开源项目的支持:
- LangChain - LLM 应用开发框架
- FastAPI - 现代 Web 框架
- Streamlit - 数据应用框架
- Selenium - 浏览器自动化
- MangoAgent - 原项目地址
⭐ 如果这个项目对你有帮助,请给个 Star!
Made with ❤️ by ai_video_agent Team

