Skip to content

ephoria-health/ai-safety-mental-health

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 

Repository files navigation

Sicherheit beim Einsatz neuraler Netzwerke bei psychischen Belastungen

DRAFT

Einführung

Neurale Netzwerke, insbesondere generative Large Language Models (LLM) bieten neue Möglichkeiten bei der digitalen Intervention und Prävention psychischer Belastungen.

Dieses Repository definiert Anforderungen an solche digitalen Produkte, um deren sicheren, effektiven und ethischen Einsatz zu gewährleisten.

Dieses Dokument ist ein Open Source Entwurf unter der MIT Lizenz. Alle die beruflich oder privat mit KI oder psychischen Belastungen konfrontiert sind, sind eingeladen, an diesem Projekt mitzuwirken, um eine verantwortungsvolle Zukunft in der digitalen Prävention zu gewährleisten.

Risiken

Folgende Risiken wurden generell identifiziert:

  • Misinterpretation von Kontext und Fakten
  • Halluzinieren und Unwahrheiten
  • Aussagen zu Medikationen
  • Aussagen ohne Evidenz
  • Verstärkung von schädigendem Verhalten / Denkmustern
  • Retraumatisierung
  • Limitierte Interventionsmöglichkeiten
  • Degradation von Modellen durch Retraining

Durch Benchmark Tests sollen die Risiken geprüft und minimiert werden.

Ethik

Folgende ethische Grundsätze sind einzuhalten:

Identifikation

  • Vor der ersten Interaktion muss klar gestellt werden, dass der Gesprächspartner eine KI und kein Mensch und insbesondere keine medizinische Fachperson ist. Der Nutzer soll dies explizit bestätigen (opt-in).

  • Auch während der laufenden Interaktion soll sich die KI klar als solche Identifizieren und nicht den Anschein erwecken, ein Mensch zu sein.

  • Die KI soll keine verstorbene oder lebenden Menschen simulieren und muss die persönliche Distanz wahren.

  • Für eine therapeutische Wirkung können zwar offene Gespräche nützlich sein, konkrete Belastungen müssen jedoch in einen therapeutischen Kontext gebracht werden, in dem die Problemstellung nach empirisch fundierten Methoden bearbeitet wird.

Verhalten

  • Bei Androhung von Selbstmord, Selbstverletzung oder Androhung von Schädigung anderer Personen soll das Gespräch unterbrochen werden. Der Benutzer muss prominent darauf hingewiesen werden, dass eine Kapazität überschritten wurde und er soll aufgefordert werden, sich mit einer geeigneten Interventionsstelle in Verbindung zu setzen. Wenn möglich sollten die entsprechenden Telefonnummern mit lokaler Gültigkeit angezeigt werden.

  • Bei Verdacht auf schwere Störungen soll die KI empfehlen, eine medizinische Fachperson zu kontaktieren.

  • Psychische Erkrankungen dürfen von der KI nicht herunter gespielt oder lächerlich gemacht werden. Die KI soll Stigmata entgegen wirken und empathisch reagieren.

  • Die KI darf keine schädigende Verhaltensweisen bestärken, wie z.B. Tipps geben zum Abnehmen auf ein Untergewicht.

  • Die KI darf keine diskriminierenden Aussagen machen und soll politisch neutral sein.

Datenschutz

Der Datenschutz der Nutzer hat oberste Priorität.

Vorerst Compliance zum revidierten Schweizer Datenschutzgesetz. Muss noch länderübergreifend definiert werden.

Testdaten müssen zwingend effizient anonymisiert werden. Der Anonymsierungsprozess ist bei Audits miteinzubeziehen.

Der Anbieter verpflichtet sich insbesondere etwaige Risikoprofile oder Vorhersagen nur mit expliziter Einwilligung des Benutzers weiter zu geben (z.B. an einen betreuenden Psychiater). Die Weitergabe solcher persönlicher Daten z.B. an Versicherungen oder Arbeitgeber ist untersagt, auch wenn diese für den Service aufkommen. Einem Nutzer darf unter keinen Umständen ein Nachteil durch die Nutzung eines digitalen Mental Health Produkts entstehen.

Die Integrität und Sicherheit sämtlicher Daten muss durch best practice Schutzmassnahmen (Verschlüsselung, Access Control) gewährleistet und mit zeitgemässen, kryptographischen Standards implementiert werden.

Technische und Organisatorische Sicherheit

technische Anforderungen, Infrastruktur, Security Scanning, Penetration Tests, Audits, 2FA, IDS/IDP, Anomaly Detection etc, Empfehlung auf Compliance zu ISO 27001, auch bei externen Leistungserbringern.

Testdaten

Das Repository stellt Testdaten (fiktive und/oder anonymisierte Aussagen) mit Beurteilungskriterien und Beispielen für konforme Antworten zur Verfügung.

Benchmark

Anhand der Tests kann ein Safety Benchmark berechnet und die aktueller Implementierung beurteilt werden.

Reevaluation

Nach Änderungen in der technischen Infrastruktur (z.B. Update des Modells) muss der Benchmark Test erneut durchgeführt werden. Es empfiehlt sich zusätzlich, einen regulären Intervall dafür einzuplanen (z.B. alle 6 Monate).

Compliance

  • Schweizer Datenschutzgesetz vom 1. September 2023
  • EU AI Act

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages