简体中文 | English
RedForge AI 是一个证据优先的 AI 红队评估框架,面向 LLM 应用、RAG 系统、AI Agent、工具调用、记忆机制和模型供应链风险。
它不是简单的 jailbreak prompt 列表,而是帮助团队在授权范围内运行测试活动、记录可复现证据、评估发现、生成报告,并支持修复后的回归验证。
RedForge 不是 C2 框架,不是通用 Web 扫描器,也不会证明“系统绝对安全”。它是一个用于授权 AI 安全评估的受控测试框架。
- 范围受控的评估活动:显式配置 target、allow-host、attack budget 和授权范围。
- 证据优先:记录 payload、模型响应、RAG 检索内容、工具调用、记忆变更、副作用、评估理由和报告引用。
- AI 原生风险面:prompt injection、jailbreak、RAG poisoning、tool abuse、memory poisoning、泄漏/抽取抗性检查、配置漂移、多 Agent 信任边界。
- CLI 与服务模式:可直接命令行运行,也可启动 FastAPI 控制面。
- 可扩展架构:公开 plugin 接口、target adapter、attack pack、report 和 schema。
make setup # 检查 Python、uv 和项目虚拟环境
make demo # 运行本地授权 demo campaign
uv run redforge doctor
open "$(uv run redforge latest-report --path-only --format html)"demo 成功时,你会看到:
- 终端输出
HTML_REPORT: artifacts/reports/<campaign_id>.html - 报告里有结果表、finding 卡片、payload、trace、原始响应、replay 命令和修复建议
- trace 文件写入
artifacts/traces/<campaign_id>.jsonl
- Python 3.11+
uv
git clone https://github.com/Aimer-zero/redforge-ai.git
cd redforge-ai
make setup
make demo也可以运行 smoke 脚本:
./scripts/demo_mvp.sh查看最新报告路径:
uv run redforge latest-report --path-only --format html
uv run redforge latest-campaign
uv run redforge campaign-status导出 campaign:
uv run redforge export-campaign
uv run redforge export-campaign <campaign_id> --out redforge-campaign.zipmake test # ruff + migration gates + pytest
make build # 构建所有 workspace packages
make clean # 清理生成物和缓存
make api # 启动 API 服务
make smoke-api # API smoke test
make agent # 启动内置 vulnerable demo agent默认生成物目录:
artifacts/
campaigns/ campaign summaries
traces/ JSONL evidence traces
payloads/ replayable payload files
reports/ Markdown and HTML reports
这些文件可能包含目标响应和测试证据,分享前请先审查。
完整示例见:
uv run redforge run-http \
--url https://example.test/chat \
--allow-host example.test \
--attack-budget 5复制 .env.example,然后参考 docs/openai_compatible_target.md。
OPENAI_API_KEY=sk-... uv run redforge run-openai \
--base-url https://api.openai.com/v1 \
--model gpt-5 \
--allow-host api.openai.com \
--attack-catalog datasets/seed_attacks/default.md也可以通过环境变量配置默认 provider:
export REDFORGE_OPENAI_MODEL="gpt-5"
export REDFORGE_ANTHROPIC_MODEL="claude-sonnet-4-6"
export REDFORGE_GEMINI_MODEL="gemini-3.1-pro-preview"uv run uvicorn redforge_api.main:app --host 127.0.0.1 --port 8000常用接口:
GET /healthPOST /v1/campaigns/local-demo/runPOST /v1/campaigns/openai-compatible/runPOST /v1/campaigns/custom-http/runGET /campaignsGET /campaigns/{campaign_id}GET /campaigns/{campaign_id}/reportGET /campaigns/{campaign_id}/trace?limit=20
flowchart LR
CLI["CLI"] --> Control["Control Plane"]
API["FastAPI Service"] --> Control
Worker["Worker"] --> Engine["Campaign Engine"]
Control --> Engine
Engine --> Scope["Scope Guard"]
Engine --> Attacks["Attack Packs"]
Engine --> Targets["Target Adapters"]
Engine --> Eval["Evaluators"]
Targets --> Obs["Observations"]
Obs --> Evidence["Evidence Trace"]
Eval --> Evidence
Evidence --> Reports["Reports"]
Plugins["External Plugins"] --> Attacks
Plugins --> Targets
主要 package:
packages/redforge-core 核心模型、scope guard、证据、指标、报告
packages/redforge-plugins plugin SDK、registry、loader、capabilities
packages/redforge-attacks-basic 公开基础 attack pack
packages/redforge-targets target adapters 和 demo runtime
packages/redforge-engine campaign 编排、评估器、记忆、规划
packages/redforge-control projects、findings、live sessions、CI/policy services
packages/redforge-api FastAPI service
packages/redforge-cli CLI entrypoints
packages/redforge-worker worker process
更多细节见 docs/architecture.md。
公开基础目录位于:
datasets/seed_attacks/default.mddatasets/seed_attacks/default.json
真实目标测试必须显式设置 scope,例如 target ID、allowed hosts、allowed suites、allowed tools、attack budget 和授权信息。
uv run redforge run --config redforge.example.ymlredforge.example.yml 包含 target、scope、attack budget、suites、CI gate、report 和 artifact retention 示例。
uv run redforge report serve --open
uv run redforge report open latest这个公开仓库只包含可复用的开源运行时:scope 控制、campaign 执行、target adapter、证据 trace、报告、plugin 接口和公开基础 attack pack。
不包含:
- 私有客户集成
- 比赛/竞赛专用实现
- 企业私有 attack pack
- 私有部署 overlay
- 破坏性或无授权范围的自动化能力
| 适合使用 RedForge | 不适合使用 RedForge |
|---|---|
| 对自己拥有、运营或明确授权的 AI 系统做安全评估 | 扫描未授权第三方系统 |
| 在 allow-host 和预算限制内运行 campaign | C2、持久化、越权利用或破坏性操作 |
| 生成证据、报告、replay 和修复回归验证 | 声称系统“绝对安全” |
| 团队 triage prompt injection、RAG、tool、memory、agent 风险 | 未审查就上传敏感目标证据 |
推荐流程:明确书面授权 → 注册 target → 设置 --allow-host → 运行有限预算 campaign → 本地审查 artifacts → triage findings → 修复后 replay 验证。
uv run ruff check .
uv run python scripts/check_migration_gates.py
uv run pytest -q贡献说明见 CONTRIBUTING.md,安全报告说明见 SECURITY.md。
RedForge 目前处于 early preview。公开 API、schema 和 CLI 命令在稳定版本前可能变化。当前仓库适合从源码运行、本地 demo、实验和授权评估工作流。
- LINUX DO — 开发者与开源社区。
RedForge AI 使用 Apache License, Version 2.0。详见 LICENSE。