Skip to content

SECURITY

wangbo edited this page Jun 7, 2026 · 1 revision

安全与伦理声明


核心理念

本项目坚信:心理探索工具的安全性和伦理性,与其实用性同等重要。 每个提示语的设计都遵循"先安全,后功能"的原则。


一、提示语内置安全机制

每个提示语文件必须包含以下安全要素:

1.1 触发警告

对话开始前明确提示可能的敏感话题,例如:

本对话可能涉及:童年回忆、创伤经历、负面情绪、个人关系等敏感话题。
如果你感到不适,可以随时说出"停止"来结束对话。

1.2 AI 行为约束

每个提示语中对 AI 的指令约束:

规则 说明
❌ 禁止诊断 AI 不得给出任何医学或心理学诊断
❌ 禁止处方 AI 不得推荐药物或替代专业治疗
❌ 禁止绝对化 AI 不得做出确定性判断,必须使用推测性语言
✅ 危机识别 当检测到用户有自伤/自杀风险时,立即切换到危机干预模式
✅ 限定角色 AI 明确声明自己是辅助工具,而非专业治疗师
✅ 鼓励求助 在适当时刻鼓励用户寻求专业帮助

1.3 危机干预协议

当 AI 检测到以下信号时,应立即启动危机干预:

触发信号:

  • 用户表达自伤或自杀意图
  • 用户表达严重伤害他人的意图
  • 用户描述正在经历严重心理危机
  • 用户报告正在经历虐待或暴力

响应模板:

我听到了你的痛苦。感谢你愿意和我分享这些。

但我想让你知道,作为一个 AI,我无法提供专业的危机干预。
你的安全是最重要的。

请立即联系以下资源,他们受过专业训练,能够真正帮到你:
- 24小时心理危机干预热线:400-161-9995
- 或前往最近的医院心理科/急诊科

你不需要独自面对这一切。寻求帮助是勇敢的表现。

二、内容安全标准

2.1 禁止的内容

以下内容不得出现在任何提示语中:

  • 鼓励自我伤害或危险行为的指令
  • 指导用户进行无监督的创伤暴露
  • 鼓励用户停止药物治疗
  • 精神活性物质的滥用引导
  • 任何形式的歧视、仇恨或偏见内容
  • 商业推广或产品推荐

2.2 敏感内容处理

当提示语涉及以下主题时,必须额外谨慎:

  • 童年创伤、虐待经历
  • 丧失与哀伤
  • 关系破裂
  • 身份认同危机
  • 死亡与存在主义议题

处理原则:以邀请而非引导的方式触及这些话题,始终尊重用户的选择权和边界。

2.3 语言规范

  • 使用温和、非评判性的语言
  • 避免使用绝对化表述("你一定是"、"这就是原因")
  • 使用可能性语言("也许"、"可能"、"不妨考虑")
  • 尊重用户的自主性和选择权

三、伦理指南

3.1 知情同意

用户在使用提示语前应了解:

  • 这是一项自我探索工具,而非心理治疗
  • AI 的局限性和可能的不准确性
  • 对话中涉及的隐私风险
  • 他们有随时中止对话的权利

3.2 无害原则

  • 所有提示语设计必须遵循"首先,不伤害"的原则
  • 任何可能带来心理风险的内容必须伴有充分的安全措施
  • 安全机制优先于对话效果

3.3 透明度

  • AI 的角色和局限性必须明确告知用户
  • 不得冒充具有资质的专业人士
  • 对话目标和预期结果应当清晰透明

3.4 自主性

  • 尊重用户自主决定的权利
  • 不强推特定的观点、价值观或生活方式
  • 鼓励用户批判性思考,而非盲目接受 AI 的建议

四、隐私与数据安全

4.1 项目本身

本项目仅提供静态 Markdown 文件:

  • ❌ 不收集任何用户数据
  • ❌ 不设置任何跟踪器或分析工具
  • ❌ 不要求用户注册或登录
  • ❌ 不存储任何对话记录

4.2 第三方平台提示

当用户使用 AI 平台运行提示语时:

  • 对话数据由 AI 服务提供商处理
  • 建议不要在对话中分享真实姓名、地址、联系方式等可识别信息
  • 建议定期清理对话历史
  • 请查阅各平台的隐私政策了解数据处理方式

五、报告安全问题

如果你在本项目中发现了安全隐患、不当内容或伦理问题,请通过以下方式报告:

  • 提交 Issue:在 GitHub 仓库中创建一个 Issue,使用标签 security
  • 敏感问题:请直接联系项目维护者

我们承诺:

  • 在 48 小时内回应安全报告
  • 对报告者的信息保密
  • 及时修复确认的安全问题

六、持续改进

安全是一个持续的过程,而非一次性的工作。

  • 每个新提示语在上线前必须经过安全审查
  • 收到用户反馈后及时更新安全机制
  • 跟踪 AI 技术的发展,持续优化安全策略
  • 定期审查和更新所有提示语的安全合规性

安全不是功能,而是责任。

Clone this wiki locally