Skip to content

v0.0.3

Choose a tag to compare

@lm041520 lm041520 released this 12 Jun 18:31
· 72 commits to main since this release
a62f1f3

Comet(彗记)v0.0.3 发布说明 —— 群英

发布日期: 2026年6月13日 | 版本代号: 群英(QunYing · A Council of Minds)

Comet v0.0.3 在 v0.0.2「懂你的心情」基础上,把产品从「一个助手」拓展成「一个可定制、有记忆、能多角色协作的智能体平台」。这一版围绕三条主线展开:知识与能力的治理化——知识库分库管理、技能(Skills)把提示词/工具/知识库打包成可挂载的任务能力;记忆的智能化——反思引擎归纳出「AI 眼中的你」、对话每轮主动召回相关记忆与洞察、跨会话也能接着聊、今日回顾长出一句前瞻关怀;交互的丰富化——划词追问、对话分享、语音输入,以及压轴的多 Agent 群聊。当多个角色可以在同一个群里被主持人调度着各抒己见、还能看图查资料,Comet 不再只是「一个懂你的助手」,而是「一席为你召集的群英」。


🚀 一、核心升级概览

1. 角色与技能 🎭

  • 对话人格(角色卡):为同一个助手维护多组「人设」——组名、头像、人格提示词、采样温度各自独立,一键切换当前生效人格。对话时注入该人格的 system prompt 与温度,让 AI「换个角色陪你聊」。头像显隐为用户级开关。
  • Skills 技能:比角色卡更聚焦的「任务能力包」——专属任务提示词 + 工具白名单 + 可选绑定知识库 + 快捷开场 / few-shot 示例,打包成一个可在对话内即时挂载的单元,与角色卡叠加生效(角色卡定「我是谁」,技能定「现在做什么」)。内置「知识库学习 / 股票分析 / 翻译润色」三个模板一键添加;任务提示词带专属「一键优化」(聚焦任务、不写人设)。

2. 多知识库 📚

  • 分库管理 + 检索开关:知识库从「一个大库」升级为多库分类管理,文档/图片归属到具体库;每个库可单独决定「是否参与对话检索」(chat_enabled)。对话时只检索「已启用检索」的库集合,避免无关资料污染回答。
  • ES 多库过滤 + 平滑迁移:在 Elasticsearch 的 chunk 上加 kb_id(keyword)做精确多库过滤;针对旧索引 kb_id 被动态映射成 text、无法原地改类型的问题,启动自检自动 reindex 重建(临时索引中转、幂等)。配套存量回填脚本,为老用户建默认库并归入存量资料。

3. 记忆智能 🧠

  • 反思引擎 Reflection —— AI 眼中的你:定期回看用户最重要/最高频的实体与代表性陈述,用 LLM 归纳出 3~6 条画像级「洞察」(Insight),落成 Neo4j 高层节点并向量化。按主题(theme)收敛 upsert、记录归纳来源(DERIVED_FROM 溯源边);双触发——每天凌晨定时 + 萃取攒够新实体增量触发。让 AI 第一次能说出「这是一位持续精进的后端工程师」。
  • 记忆主动召回:对话每轮用当前问题召回相关洞察 + 实体事实(余弦门控节流),拼成「关于用户的已知信息」背景块注入提示词,让模型开口前就带着对用户的了解,而不必每次靠工具临时查。性能上做了查询向量单次复用、两路并行、整体超时,绝不拖累对话首字延迟。
  • 跨会话上下文:开关开启后,注入最近其他会话的标题 + 最后几轮原始片段,跨会话也能自然接着聊(与主动召回互补——一个给近期对话语境,一个给长期画像事实)。默认关,按需开。
  • AI 主动关心:今日回顾在客观汇总之外,长出一句结合情绪、洞察与最近在意之事的「前瞻关怀」,像惦记着你的朋友;点「聊聊」可带着这个话题直接开聊(AI 主动开场,模型能接住)。

4. 交互增强 💬

  • 划词追问:选中 AI 回答里的任意片段,浮出「追问 / 解释」,一点即把片段以引用形式预填进输入框,补完再发,省去复制粘贴。
  • 对话分享:把一段对话生成快照式只读分享链接,任何人无需登录即可查看;原对话后续怎么变都不影响已分享的快照。支持自定义标题、设过期(永久 / 7 天 / 30 天)、取消、「我的分享」管理。头像与图片在创建时压缩成内联图片冻结进快照,公开页零鉴权直接显示;群聊分享按发言人区分。
  • ASR 语音输入:对话/群聊输入框支持语音说话转文字。双路设计——浏览器自带识别免费开箱即用,配置云端 ASR 模型(DashScope Paraformer / OpenAI Whisper)则更准更稳;转写结果填入输入框待确认,不自动发送。

5. 多 Agent 群聊(压轴)👥

  • 多角色群聊:拉 2~5 个角色卡进一个群,像微信群一样对话。用户每发一句,由一个「主持人」LLM 根据各角色人设智能判断该谁接话、按什么顺序发言,角色之间还能互相附和或反驳——靠「带发言人前缀的对话记录 + 一轮内动态累加」实现真正的「接话」而非各说各的。
  • @ 指定:消息里 @ 某角色,跳过主持人,只让被点名的角色回复。
  • 群级工具 + 看图分析:可选开启全群工具(知识库/记忆/联网/MCP),每个角色发言时能查资料;支持带图,每个角色用多模态模型看同一张图发言——发一张股票走势图,让各角色站在不同角度、结合实时行情各自分析。群聊同样可分享。

6. 体验与工程打磨 🔧

  • 当前日期注入:把「今天是哪天 + 时效性引导」写进系统提示词,解决「问今天股票却答去年信息」——模型知道「现在」是何时,才会对实时问题主动联网。
  • 图片记忆与分享修复:对话里上传的图片正式落进消息、刷新历史不再丢失,分享时也能在公开页显示。
  • 全局弹窗与输入框美化:统一弹窗圆角、标题、按钮与内部输入框样式;对话/群聊输入区视觉统一、手机端单行紧凑适配。
  • 「Agent 配置」更名「角色配置」:菜单与入口文案更贴近实际用途。

本版后端为每个功能补齐了「设计与八股」归档文档(docs/releasev0.0.3设计与八股/),按功能逐篇沉淀后端设计、数据模型、核心实现与面试问答。


🧭 未来展望

Comet v0.0.3 把「懂你」推进到「为你召集一群懂行的人」。记忆层借由反思引擎产出画像级洞察、主动召回与跨会话上下文,让 AI 从「记得事实」走向「理解这个人」;角色卡与技能让助手可被精细定制成不同身份与任务专家;而多 Agent 群聊则第一次让多个角色在同一语境里协作推理——主持人调度、接话式上下文、群级工具与看图分析,让「多智能体协作」从概念变成可用的日常功能。

下一步,这套「群英」能力还可以更进一步:让群聊角色拥有各自的记忆与立场、引入更复杂的辩论与共识机制、让主动关心延伸为基于长期画像的主动建议。当一个助手既能化身你想聊的人、又能召集一席各有所长的智囊,Comet 才真正配得上「群英」二字。