[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/arvidl/ELMED219-2026/blob/main/Lab3-GenAI-LLM/notebooks/06-ai-etikk-medisin.ipynb)

# AI-etikk i Medisin

**ELMED219 / BMED365 - Lab 3**

---

## Læringsmål

Etter denne notebooken skal du kunne:
- Identifisere etiske utfordringer med AI i helsevesenet
- Forklare ulike typer bias i medisinske AI-systemer
- Diskutere personvernhensyn ved bruk av AI på helsedata
- Beskrive relevante reguleringer (EU AI Act)
- Reflektere over ansvar og transparens

## Innhold

1. [Etiske utfordringer](#1-etiske-utfordringer)
2. [Bias i medisinsk AI](#2-bias-i-medisinsk-ai)
3. [Personvern og datasikkerhet](#3-personvern-og-datasikkerhet)
4. [Regulering og EU AI Act](#4-regulering-og-eu-ai-act)
5. [Ansvar og beslutningstaking](#5-ansvar-og-beslutningstaking)
6. [Beste praksis](#6-beste-praksis)

---

## 1. Etiske utfordringer

AI i helsevesenet reiser fundamentale etiske spørsmål som berører de fire prinsippene i medisinsk etikk:

| Prinsipp | AI-utfordring |
|----------|---------------|
| **Autonomi** | Påvirker AI pasientens frie valg? Forstår pasienten at AI brukes? |
| **Velgjørenhet** | Gir AI faktisk bedre utfall for pasienten? |
| **Ikke-skade** | Kan AI-feil føre til skade? Hvem er ansvarlig? |
| **Rettferdighet** | Er AI rettferdig på tvers av pasientgrupper? |

### Eksempler på etiske dilemmaer

**Case 1: Ressursallokering**
> En AI predikerer at pasient A har 80% sjanse for å overleve intensivbehandling, mens pasient B har 40%. Skal AI-prediksjonen avgjøre hvem som får intensivplass?

**Case 2: Autonomi vs. sikkerhet**
> En pasient nekter behandling basert på AI-anbefaling, men ønsker behandling som AI fraråder. Hvordan vektes pasientens autonomi mot AI-anbefalingen?

**Case 3: Transparens**
> En kompleks AI-modell gir bedre diagnoser enn leger, men kan ikke forklare hvorfor. Skal den brukes?

In [1]:
# Rammeverk for etisk vurdering av AI-systemer

def etisk_sjekkliste(ai_system):
    """
    Sjekkliste for etisk vurdering av et medisinsk AI-system.
    """
    sjekkliste = {
        "Transparens": [
            "Er det tydelig for pasienter at AI brukes?",
            "Kan beslutninger forklares?",
            "Er treningsdata dokumentert?"
        ],
        "Rettferdighet": [
            "Er modellen testet på ulike populasjoner?",
            "Er det kjente bias i dataene?",
            "Overvåkes ytelse på tvers av grupper?"
        ],
        "Personvern": [
            "Hvordan håndteres pasientdata?",
            "Er samtykke innhentet?",
            "Kan data de-anonymiseres?"
        ],
        "Ansvar": [
            "Hvem er ansvarlig ved feil?",
            "Finnes det menneskelig overstyring?",
            "Hvordan logges beslutninger?"
        ],
        "Sikkerhet": [
            "Hva skjer hvis systemet feiler?",
            "Er det backup-prosedyrer?",
            "Hvordan oppdateres modellen?"
        ]
    }
    return sjekkliste

sjekkliste = etisk_sjekkliste("Diagnosestøtte-AI")

print("ETISK SJEKKLISTE FOR MEDISINSK AI")
print("=" * 50)
for kategori, sporsmal in sjekkliste.items():
    print(f"\n{kategori}:")
    for sp in sporsmal:
        print(f"  □ {sp}")

ETISK SJEKKLISTE FOR MEDISINSK AI

Transparens:
  □ Er det tydelig for pasienter at AI brukes?
  □ Kan beslutninger forklares?
  □ Er treningsdata dokumentert?

Rettferdighet:
  □ Er modellen testet på ulike populasjoner?
  □ Er det kjente bias i dataene?
  □ Overvåkes ytelse på tvers av grupper?

Personvern:
  □ Hvordan håndteres pasientdata?
  □ Er samtykke innhentet?
  □ Kan data de-anonymiseres?

Ansvar:
  □ Hvem er ansvarlig ved feil?
  □ Finnes det menneskelig overstyring?
  □ Hvordan logges beslutninger?

Sikkerhet:
  □ Hva skjer hvis systemet feiler?
  □ Er det backup-prosedyrer?
  □ Hvordan oppdateres modellen?


---

## 2. Bias i medisinsk AI

Bias i AI-systemer kan føre til systematisk urettferdig behandling av pasientgrupper.

### Typer bias

| Type | Beskrivelse | Eksempel |
|------|-------------|----------|
| **Historisk bias** | Treningsdata reflekterer tidligere urettferdighet | Kvinner underdiagnostisert for hjertesykdom |
| **Representasjonsbias** | Noen grupper underrepresentert i data | Lite data fra ikke-vestlige populasjoner |
| **Målebias** | Ulike målemetoder for ulike grupper | Hudfarve påvirker pulsoksymeter |
| **Aggregasjonsbias** | Samme modell for alle, ignorerer subgrupper | Én diabetes-modell for alle aldersgrupper |

In [2]:
import numpy as np
import matplotlib.pyplot as plt

# Demonstrasjon av bias i en hypotetisk AI-modell

def simuler_bias_eksempel():
    """
    Simulerer en AI-modell med ulik ytelse på forskjellige grupper.
    Basert på virkelige observasjoner fra medisinsk AI-forskning.
    """
    grupper = ['Gruppe A\n(majoritetsgruppe)', 'Gruppe B\n(minoritetsgruppe)']
    
    # Simulerte ytelsesmål
    sensitivitet = [0.92, 0.71]  # Hvor godt modellen fanger opp sykdom
    spesifisitet = [0.88, 0.82]  # Hvor godt modellen utelukker friske
    
    return grupper, sensitivitet, spesifisitet

grupper, sens, spec = simuler_bias_eksempel()

fig, ax = plt.subplots(figsize=(10, 5))

x = np.arange(len(grupper))
width = 0.35

bars1 = ax.bar(x - width/2, sens, width, label='Sensitivitet', color='steelblue')
bars2 = ax.bar(x + width/2, spec, width, label='Spesifisitet', color='coral')

ax.set_ylabel('Score')
ax.set_title('Bias i AI-modell: Ulik ytelse på forskjellige grupper')
ax.set_xticks(x)
ax.set_xticklabels(grupper)
ax.legend()
ax.set_ylim(0, 1)

# Legg til verdier på søylene
for bar in bars1 + bars2:
    height = bar.get_height()
    ax.annotate(f'{height:.0%}',
                xy=(bar.get_x() + bar.get_width() / 2, height),
                xytext=(0, 3), textcoords="offset points",
                ha='center', va='bottom')

plt.tight_layout()
plt.show()

print("\nKonsekvens:")
print(f"  - Gruppe B har {(sens[0]-sens[1])*100:.0f}% lavere sensitivitet")
print(f"  - Dette betyr at flere i gruppe B får feilaktig "friskmelding"")
print(f"  - Slike skjevheter kan forsterke eksisterende helseforskjeller")

SyntaxError: invalid syntax. Perhaps you forgot a comma? (2984086627.py, line 49)

### Virkelige eksempler på bias

1. **Hudkreft-deteksjon**: Modeller trent primært på lyshudet populasjon presterer dårligere på mørkere hud

2. **Pulsoksymeter**: Overestimerer oksygenmetning hos mørkhudede pasienter

3. **Smertebehandling**: Historisk undervurdering av smerte hos minoriteter reflekteres i data

4. **Kjønnsforskjeller**: Symptomer på hjertesykdom presenterer seg ulikt hos kvinner, men modeller trenes ofte på mannsdominerte datasett

---

## 3. Personvern og datasikkerhet

Helsedata er blant de mest sensitive personopplysningene og krever særlig beskyttelse.

### GDPR og helsedata

Under GDPR er helsedata en "særlig kategori" som krever:

- Eksplisitt samtykke eller annen lovlig basis
- Strenge sikkerhetstiltak
- Dataminimering (kun nødvendige data)
- Rett til innsyn og sletting

In [3]:
# Personvern-risikovurdering

def personvern_risiko(scenario):
    """
    Vurder personvernrisiko for et AI-scenario.
    """
    risikoer = {
        "sky_tjeneste": {
            "beskrivelse": "AI kjører i ekstern sky-tjeneste",
            "risikoer": [
                "Data sendes ut av organisasjonen",
                "Tredjepartsleverandør har tilgang",
                "Usikker hvor data lagres geografisk",
                "Data kan brukes til modelltrening"
            ],
            "tiltak": [
                "Databehandleravtale (DBA)",
                "Verifiser EU-lagring",
                "Kryptering i transit og hvile",
                "Opt-out fra treningsdata"
            ]
        },
        "lokal_modell": {
            "beskrivelse": "AI kjører lokalt på sykehusinfrastruktur",
            "risikoer": [
                "Intern tilgangsstyring",
                "Logging og sporbarhet",
                "Oppdatering og vedlikehold"
            ],
            "tiltak": [
                "Rollebasert tilgang",
                "Audit-logging",
                "Sikker oppdateringsrutine"
            ]
        }
    }
    return risikoer.get(scenario, {})

print("PERSONVERN-RISIKOVURDERING")
print("=" * 50)

for scenario in ["sky_tjeneste", "lokal_modell"]:
    info = personvern_risiko(scenario)
    print(f"\n{info['beskrivelse'].upper()}")
    print("-" * 40)
    print("Risikoer:")
    for r in info['risikoer']:
        print(f"  ⚠ {r}")
    print("Tiltak:")
    for t in info['tiltak']:
        print(f"  ✓ {t}")

PERSONVERN-RISIKOVURDERING

AI KJØRER I EKSTERN SKY-TJENESTE
----------------------------------------
Risikoer:
  ⚠ Data sendes ut av organisasjonen
  ⚠ Tredjepartsleverandør har tilgang
  ⚠ Usikker hvor data lagres geografisk
  ⚠ Data kan brukes til modelltrening
Tiltak:
  ✓ Databehandleravtale (DBA)
  ✓ Verifiser EU-lagring
  ✓ Kryptering i transit og hvile
  ✓ Opt-out fra treningsdata

AI KJØRER LOKALT PÅ SYKEHUSINFRASTRUKTUR
----------------------------------------
Risikoer:
  ⚠ Intern tilgangsstyring
  ⚠ Logging og sporbarhet
  ⚠ Oppdatering og vedlikehold
Tiltak:
  ✓ Rollebasert tilgang
  ✓ Audit-logging
  ✓ Sikker oppdateringsrutine


### Spesielle hensyn for LLM-er

Store språkmodeller (LLM) reiser unike personvernspørsmål:

1. **Memorisering**: LLM-er kan huske og gjenta sensitiv informasjon fra trening
2. **Prompt-injeksjon**: Ondsinnede prompts kan prøve å trekke ut sensitiv data
3. **Treningsdata**: Usikkerhet om hva modellen er trent på
4. **API-logging**: Sky-leverandører kan logge alle prompts

---

## 4. Regulering og EU AI Act

EU AI Act (2024) er verdens første omfattende AI-regulering.

### Risikobasert tilnærming

```
┌─────────────────────────────────────────────────────────┐
│  FORBUDT                                                │
│  Sosial scoring, manipulative AI, biometrisk ID i      │
│  offentlig rom                                          │
├─────────────────────────────────────────────────────────┤
│  HØY RISIKO                                             │
│  Medisinsk utstyr, kritisk infrastruktur,              │
│  rekruttering, utdanning                                │
│  → Strenge krav til dokumentasjon, testing, tilsyn     │
├─────────────────────────────────────────────────────────┤
│  BEGRENSET RISIKO                                       │
│  Chatbots, deepfakes                                    │
│  → Transparenskrav ("Du snakker med AI")               │
├─────────────────────────────────────────────────────────┤
│  MINIMAL RISIKO                                         │
│  De fleste AI-systemer                                  │
│  → Ingen spesielle krav                                 │
└─────────────────────────────────────────────────────────┘
```

### Krav til høyrisiko-AI (inkl. medisinsk)

- Risikovurdering og -styring
- Datakvalitetsstyring
- Teknisk dokumentasjon
- Logging og sporbarhet
- Transparens overfor brukere
- Menneskelig tilsyn
- Robusthet og cybersikkerhet

---

## 5. Ansvar og beslutningstaking

### Hvem er ansvarlig?

Ved AI-feil i helsevesenet er ansvarsfordelingen kompleks:

| Aktør | Potensielt ansvar |
|-------|-------------------|
| **Legen** | Klinisk beslutning, bruk av AI som verktøy |
| **Sykehuset** | Valg av system, implementering, opplæring |
| **AI-leverandøren** | Produktansvar, dokumentasjon |
| **Dataansvarlig** | Datakvalitet, personvern |

### Human-in-the-loop

Et viktig prinsipp er at mennesker alltid skal kunne:
- Overstyre AI-beslutninger
- Forstå grunnlaget for anbefalinger
- Velge å ikke bruke AI

---

## 6. Beste praksis

### Etisk bruk av AI i helsevesenet

**Før implementering:**
- Gjennomfør etisk vurdering
- Test for bias på ulike populasjoner
- Etabler klare ansvarslinjer
- Sikre personvernkomplians

**Under bruk:**
- Gi opplæring til brukere
- Overvåk ytelse kontinuerlig
- Logg alle AI-beslutninger
- Ha rutiner for menneskelig overstyring

**Kommunikasjon:**
- Informer pasienter om AI-bruk
- Vær transparent om begrensninger
- Ikke overselg AI-kapabiliteter

---

## Oppsummering

### Hovedpunkter

1. **Etiske prinsipper** (autonomi, velgjørenhet, ikke-skade, rettferdighet) gjelder også for AI
2. **Bias** kan forsterke eksisterende helseforskjeller hvis ikke adressert
3. **Personvern** krever særlige tiltak for helsedata, spesielt ved sky-tjenester
4. **EU AI Act** klassifiserer medisinsk AI som høyrisiko med strenge krav
5. **Ansvar** er delt mellom mange aktører, men legen beholder klinisk ansvar

### Refleksjonsoppgaver

1. Hvordan ville du forklart til en pasient at AI brukes i deres behandling?
2. Hvilke tiltak ville du innført for å oppdage bias i en AI-modell?
3. Bør leger kunne stilles til ansvar for AI-feil de ikke kunne forutse?

---

*Neste notebook: [07 - Trustworthy AI](07-trustworthy-ai.ipynb)*