全球人才智库(MVP):采集 → 清洗/消歧 → 标签 → 向量化(BGE-M3)→ Milvus Lite → FastAPI。
完整说明见 docs/目录结构说明.md;路径默认审阅人见 .github/CODEOWNERS 与 .github/负责人说明.md。
apps/api/ # FastAPI 服务(Milvus Lite 与 SQLite 路径由配置指向 data/)
apps/web/ # 前端(Vite + React,开发代理 /api、/health → FastAPI)
pipeline/ # 离线数据处理与批任务
packages/paperhunt_core/ # API 与 pipeline 共用代码(可选)
deploy/docker/ # 生产/集成用镜像与 Compose(开发环境见 .dev-docker/)
data/ # 本机持久化:原始数据、SQLite、Milvus Lite、模型权重、缓存(大文件不进 git)
docs/ # 方案与目录说明等文档
.github/ # CODEOWNERS、CI 等 GitHub 配置
cd apps/api
python -m venv .venv && source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
uvicorn app.main:app --reload --host 0.0.0.0 --port 8000健康检查:http://127.0.0.1:8000/health
在仓库根目录执行:
docker compose -f deploy/docker/compose.yaml up --builddata/sqlite、data/milvus、data/models、data/cache 会挂载到容器内 /var/lib/paperhunt/ 下对应子目录;应用内请用环境变量 PAPERHUNT_DATA_DIR(或后续 config)统一解析路径。
cd apps/web && npm install && npm run dev默认 http://127.0.0.1:5173,通过 Vite 将 /api、/health 代理到 http://127.0.0.1:8000。与 .dev-docker 中容器内前后端同时启动的行为一致(见 .dev-docker/README.md)。