多领域 GitHub 研究系统（MVP）

这个仓库已经从“单一 games 的 GitHub 游戏项目自动研究系统”升级为“可扩展到多领域的 GitHub 研究系统 MVP”。

当前依然保留一个统一的 github-watch 服务，但配置、prompt、规则和数据输出已经按 domain 分层，后续可以继续扩展新的研究领域。

当前支持的 domain

games
image-processing
short-video
finance
infra

运行前提

Windows 11
Docker Desktop（启用 WSL2）
WSL2 Ubuntu
宿主机已安装 Ollama

目录结构

.
├─ compose/
├─ config/
│  ├─ repos/
│  ├─ prompts/
│  └─ pipelines.yaml
├─ data/
│  └─ github-watch/
│     ├─ raw/<domain>/
│     ├─ normalized/<domain>/
│     ├─ reports/daily/
│     ├─ reports/weekly/
│     ├─ reports/by-domain/
│     ├─ embeddings/
│     ├─ training-samples/
│     └─ state/
├─ github-watch/
│  └─ app/
│     ├─ exporters/
│     └─ domain_rules/
├─ scripts/
├─ start.ps1
├─ stop.ps1
└─ backup.ps1

GitHub token 放哪

先复制环境文件：

Copy-Item .\compose\.env.example .\compose\.env

然后编辑 compose/.env，至少填写：

GITHUB_TOKEN
OLLAMA_BASE_URL 或 OLLAMA_HOST
OLLAMA_MODEL_OVERRIDE（可选，调试时才填写）
POSTGRES_PASSWORD
N8N_BASIC_AUTH_PASSWORD

Ollama 地址支持自动判定：当 OLLAMA_BASE_URL 与 OLLAMA_HOST 都未设置时， github-watch 会自动区分“宿主机直跑”与“容器内运行”并选择默认地址（并带可达性兜底）。

宿主机 Ollama 怎么启动

ollama serve
ollama list
ollama pull qw-14b

持久化角色模型（推荐）

项目已支持基于 qw-14b 的 5 个持久化角色模型（见 ollama/modelfiles/）：

gh-research-qw-14b
gh-games-qw-14b
gh-image-qw-14b
gh-video-qw-14b
gh-finance-qw-14b

先构建角色模型（Windows）：

.\ollama\build-models.ps1

WSL/Linux/macOS：

bash ./ollama/build-models.sh

为什么用 Modelfile 持久化角色

角色定义随模型别名保存，重启 Ollama 后仍可直接 ollama run <alias>
避免每次请求拼大段临时 prompt，行为更稳定
便于长期维护：角色调整集中在 ollama/modelfiles/*.Modelfile

临时 prompt 覆盖 vs 持久角色

持久角色：通过 Modelfile 固化“长期人格/风格/关注点”
临时覆盖：通过环境变量或代码参数短期改写 system prompt，适合调试
两者可叠加：默认走角色模型，必要时再临时覆盖

domain 自动选模型

映射文件：config/ollama_models.yaml

games -> gh-games-qw-14b
image-processing -> gh-image-qw-14b
short-video -> gh-video-qw-14b
finance -> gh-finance-qw-14b
infra -> gh-research-qw-14b
default -> gh-research-qw-14b

若某个 domain 未配置，自动回退到 default。

如何切换默认模型

直接修改 config/ollama_models.yaml 中的 default 即可。

环境变量临时覆盖点

OLLAMA_MODEL_OVERRIDE：强制覆盖所有 domain 的模型（调试用，推荐）
OLLAMA_MODEL：历史兼容覆盖变量（不推荐长期使用）
OLLAMA_SYSTEM_PROMPT：临时覆盖 system prompt（调试用）
OLLAMA_NUM_CTX / OLLAMA_TEMPERATURE / OLLAMA_TOP_P / OLLAMA_REPEAT_PENALTY

只想先用一个通用模型

在 compose/.env 设置：

OLLAMA_MODEL_OVERRIDE=gh-research-qw-14b

这样会覆盖 domain 映射，所有 domain 都走同一个通用模型。

第一次如何启动整套系统

.\start.ps1

如何只单独运行 github-watch

docker compose --env-file .\compose\.env -f .\compose\docker-compose.yml run --rm github-watch python -m app.main

生成物重点看这里：

data/github-watch/raw/<domain>/
data/github-watch/normalized/<domain>/
data/github-watch/reports/daily/
data/github-watch/reports/by-domain/
data/github-watch/state/

如何新增一个新的 domain

新建 config/repos/<new-domain>.yaml
新建 config/prompts/repo_summary_<new-domain>.md
在 github-watch/app/domain_rules/ 增加对应规则文件
如果需要更强输出，可在 exporter 层补该 domain 的特殊导出逻辑
若要独立角色模型，再增加 ollama/modelfiles/ + config/ollama_models.yaml 映射

当前实现是轻量 MVP，不需要新增服务，也不需要新增容器。

如何每天定时跑

推荐 Windows 任务计划程序，每天执行：

docker compose --env-file E:\aiauto\compose\.env -f E:\aiauto\compose\docker-compose.yml run --rm github-watch python -m app.main

完整任务计划程序配置示例见：WINDOWS_TASK_SCHEDULER_GITHUB_WATCH.md

如何迁移到新电脑

安装 Docker Desktop + WSL2 + Ollama
拷贝整个项目目录
还原备份压缩包
重新填写 compose/.env
执行 .\start.ps1

哪些目录最重要必须备份

compose/
config/
data/github-watch/
data/openwebui/
data/qdrant/
data/postgres/
data/redis/
data/n8n/

一键备份：

.\backup.ps1

当前哪些 exporter 只是预留 stub

github-watch/app/exporters/qdrant_exporter.py（stub：仅创建目录并记录日志，不写入远端 Qdrant）
github-watch/app/exporters/training_exporter.py（stub：仅保证 placeholder.jsonl 存在）

当前只有 markdown_exporter.py 在实际输出链路中生效。

最小验收清单

启动后最小检查项（目录、日报文件、服务地址）见：ACCEPTANCE_CHECKLIST.md

容错说明

某个 repo 不存在、重命名、权限不足、API 异常时，不会中断整批任务
Ollama 不可用时，会自动退回基础文本摘要
没有 Qdrant / Postgres / Redis，也可以先只验证最小日报链路

废弃说明

旧的单文件 config/repos.yaml 已废弃，改为 config/repos/*.yaml
旧的 data/github-watch/raw/*.json 与 normalized/*.json 顶层输出结构已废弃，改为按 domain 分目录

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.codex		.codex
compose		compose
config		config
data		data
github-watch		github-watch
scripts		scripts
.gitignore		.gitignore
ACCEPTANCE_CHECKLIST.md		ACCEPTANCE_CHECKLIST.md
AGENTS.md		AGENTS.md
README.md		README.md
VALIDATION.md		VALIDATION.md
WINDOWS_TASK_SCHEDULER_GITHUB_WATCH.md		WINDOWS_TASK_SCHEDULER_GITHUB_WATCH.md
backup.ps1		backup.ps1
start.ps1		start.ps1
stop.ps1		stop.ps1
中文说明.md		中文说明.md
工作流.md		工作流.md
提交信息乱码修复说明.md		提交信息乱码修复说明.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

多领域 GitHub 研究系统（MVP）

当前支持的 domain

运行前提

目录结构

GitHub token 放哪

宿主机 Ollama 怎么启动

持久化角色模型（推荐）

为什么用 Modelfile 持久化角色

临时 prompt 覆盖 vs 持久角色

domain 自动选模型

如何切换默认模型

环境变量临时覆盖点

只想先用一个通用模型

第一次如何启动整套系统

如何只单独运行 github-watch

如何新增一个新的 domain

如何每天定时跑

如何迁移到新电脑

哪些目录最重要必须备份

当前哪些 exporter 只是预留 stub

最小验收清单

容错说明

废弃说明

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

多领域 GitHub 研究系统（MVP）

当前支持的 domain

运行前提

目录结构

GitHub token 放哪

宿主机 Ollama 怎么启动

持久化角色模型（推荐）

为什么用 Modelfile 持久化角色

临时 prompt 覆盖 vs 持久角色

domain 自动选模型

如何切换默认模型

环境变量临时覆盖点

只想先用一个通用模型

第一次如何启动整套系统

如何只单独运行 github-watch

如何新增一个新的 domain

如何每天定时跑

如何迁移到新电脑

哪些目录最重要必须备份

当前哪些 exporter 只是预留 stub

最小验收清单

容错说明

废弃说明

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages