## üìì 03_prompt_engineering.ipynb

# üéØ Prompt Engineering for Helsefaglige Oppgaver

## L√¶ringsm√•l
- Mestre grunnleggende prompt-teknikker
- L√¶re few-shot learning for medisinske caser
- Implementere chain-of-thought for komplekse vurderinger

In [73]:
import os
from openai import OpenAI
from typing import List, Dict
import json
from dotenv import load_dotenv

# Last milj√∏variabler fra .env fil
load_dotenv()

# Sjekk at API-n√∏kkel er lastet
if os.getenv("OPENAI_API_KEY"):
    print("‚úÖ OPENAI_API_KEY funnet i milj√∏variabler")
    # Vis bare de f√∏rste og siste tegnene for sikkerhet
    key = os.getenv("OPENAI_API_KEY")
    print(f"   N√∏kkel: {key[:7]}...{key[-4:]}")
else:
    print("‚ùå OPENAI_API_KEY ikke funnet")

# Initialiser klient (bruker milj√∏variabel OPENAI_API_KEY)
client = OpenAI()

print("üéØ Prompt Engineering - Kommuniser effektivt med AI")
print("‚úÖ OpenAI klient initialisert!")

# Dersom du ikke har python-dotenv installert, install√©r den f√∏rst:
# !pip install python-dotenv

‚úÖ OPENAI_API_KEY funnet i milj√∏variabler
   N√∏kkel: sk-proj...ypoA
üéØ Prompt Engineering - Kommuniser effektivt med AI
‚úÖ OpenAI klient initialisert!


## Grunnleggende prompt-prinsipper

1. **V√¶r spesifikk**: Klar kontekst og instruksjoner
2. **Gi eksempler**: Few-shot learning
3. **Strukturer output**: Be om spesifikt format
4. **Tenk stegvis**: Chain-of-thought

In [74]:
def send_prompt(prompt: str, temperature: float = 0.7) -> str:
    """Hjelpefunksjon for √• sende prompts til GPT"""
    try:
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}],
            temperature=temperature
        )
        return response.choices[0].message.content
    except Exception as e:
        return f"Simulert respons (API ikke tilgjengelig): {e}"

## Teknikk 1: Zero-shot vs Few-shot

In [75]:
print("üéØ FORSKJELLER: N√•r few-shot faktisk hjelper")
print("=" * 70)

# Her er cases hvor few-shot VIRKELIG gj√∏r en forskjell:
# 1. Terminologi/sjargong
# 2. Kontekstuelle nyanser  
# 3. Edge cases som krever spesifikk kunnskap

# EKSEMPEL 1: Medisinsk dokumentasjon vs. pasientspr√•k
print("\nüìù EKSEMPEL 1: Tolkning av pasientspr√•k")
print("=" * 50)

patient_language_cases = [
    "Jeg har vondt i brystet n√•r jeg g√•r i trapper, men det g√•r over n√•r jeg hviler",
    "Det banker og dunker i brystet mitt, spesielt n√•r jeg blir stresset",
    "Jeg f√•r ikke pust n√•r jeg ligger ned, m√• sove med mange puter",
    "Beina mine hovner opp utover dagen, s√¶rlig n√•r det er varmt"
]

# Zero-shot: Generell klassifisering
zero_shot_patient = """
Klassifiser f√∏lgende pasientbeskrivelse som 'Akutt' eller 'Ikke-akutt':
{beskrivelse}
"""

# Few-shot: Med pasientspr√•k-eksempler
few_shot_patient = """
Klassifiser pasientbeskrivelser som 'Akutt' eller 'Ikke-akutt'. 
Pasienter bruker ofte hverdagsspr√•k istedenfor medisinsk terminologi:

Eksempel 1: "Det banker i brystet" = palpitasjoner ‚Üí Ikke-akutt (hvis ikke andre symptomer)
Eksempel 2: "F√•r ikke pust n√•r jeg ligger" = ortopn√© ‚Üí Akutt (hjertesykdom-mistanke)
Eksempel 3: "Vondt i brystet ved trapper" = anstrengelsessmerte ‚Üí Akutt (angina-mistanke)
Eksempel 4: "Beina hovner" = √∏demer ‚Üí Ikke-akutt (hvis kronisk)

Klassifiser: {beskrivelse}
Svar: Akutt eller Ikke-akutt
"""

for i, case in enumerate(patient_language_cases, 1):
    print(f"\nCase {i}: {case}")
    
    zero_result = send_prompt(zero_shot_patient.format(beskrivelse=case), temperature=0)
    few_result = send_prompt(few_shot_patient.format(beskrivelse=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")

# EKSEMPEL 2: Kulturelle og sosiale faktorer
print("\n\nüåç EKSEMPEL 2: Kulturelle nyanser og sosial kontekst")
print("=" * 50)

cultural_cases = [
    "Eldre somalisk kvinne som ikke vil forklare underlivssmerter til mannlig lege",
    "Samisk pasient som bruker tradisjonell medisin sammen med moderne behandling",
    "Tolk-avhengig pasient som virker redd og unnvikende under konsultasjon",
    "Pasient fra kollektivistisk kultur som insisterer p√• familiemedlemmer tilstede"
]

zero_shot_cultural = """
Vurder om denne situasjonen krever '√òyeblikkelig oppmerksomhet' eller 'Kan vente':
{situasjon}
"""

few_shot_cultural = """
Vurder medisinske situasjoner med kulturell sensitivitet. Kulturelle faktorer p√•virker pasientopplevelse:

Eksempel 1: "Kvinne vil ikke snakke med mannlig lege om underlivs-problemer" 
‚Üí Kan vente (tilby kvinnelig lege, respekter kulturelle behov)

Eksempel 2: "Tolk-avhengig pasient virker redd og unnvikende"
‚Üí √òyeblikkelig oppmerksomhet (kan skjule alvorlige symptomer pga spr√•kbarriere)

Eksempel 3: "Bruker tradisjonell medisin sammen med moderne"
‚Üí Kan vente (kartlegg interaksjoner, men ikke n√∏dvendigvis akutt)

Vurder: {situasjon}
Svar: √òyeblikkelig oppmerksomhet eller Kan vente
"""

for i, case in enumerate(cultural_cases, 1):
    print(f"\nKulturelt case {i}: {case}")
    
    zero_result = send_prompt(zero_shot_cultural.format(situasjon=case), temperature=0)
    few_result = send_prompt(few_shot_cultural.format(situasjon=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")

# EKSEMPEL 3: Spesialisert medisinsk domene
print("\n\nüß† EKSEMPEL 3: Psykiatriske vurderinger")
print("=" * 50)

psychiatric_cases = [
    "Pasient sier 'jeg h√∏rer stemmer som forteller meg √• skade andre'",
    "Pasient har ikke sovet p√• 5 dager, snakker fort og planlegger storsl√•tte prosjekter",
    "Pasient nekter √• spise fordi 'maten er forgiftet av regjeringen'",
    "Pasient rapporterer at 'alle kan lese tankene mine gjennom TV-en'"
]

zero_shot_psych = """
Klassifiser som 'Psykiatrisk akuttsituasjon' eller 'Kan vente p√• poliklinisk vurdering':
{symptom}
"""

few_shot_psych = """
Psykiatriske akuttsituasjoner krever √∏yeblikkelig h√•ndtering av sikkerhetshensyn:

AKUTT: Umiddelbar fare for selv/andre
- "Stemmer som befaler skade" ‚Üí Psykiatrisk akuttsituasjon (kommando-hallusinasjoner)
- "Ikke sovet 5 dager + mani" ‚Üí Psykiatrisk akuttsituasjon (alvorlig mani)

KAN VENTE: Psykotiske symptomer uten fare
- "Paranoid om mat" ‚Üí Kan vente (psykose uten aggresjon)
- "Tankeleseideliv via TV" ‚Üí Kan vente (bizarre vrangforestillinger uten fare)

Klassifiser: {symptom}
Svar: Psykiatrisk akuttsituasjon eller Kan vente p√• poliklinisk vurdering
"""

for i, case in enumerate(psychiatric_cases, 1):
    print(f"\nPsykiatrisk case {i}: {case}")
    
    zero_result = send_prompt(zero_shot_psych.format(symptom=case), temperature=0)
    few_result = send_prompt(few_shot_psych.format(symptom=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")

# KONKLUSJON
print("\n\nüìã KONKLUSJON: N√•r few-shot virkelig hjelper")
print("=" * 70)
print("‚úÖ GPT-3.5-turbo er allerede sv√¶rt god p√•:")
print("   ‚Ä¢ Grunnleggende medisinske klassifikasjoner")
print("   ‚Ä¢ √Öpenbare red flags")
print("   ‚Ä¢ Standard akutt/ikke-akutt vurderinger")
print()
print("üéØ Few-shot prompting hjelper mest ved:")
print("   ‚Ä¢ Tolkning av pasientspr√•k vs. medisinsk terminologi")
print("   ‚Ä¢ Kulturelle og sosiale nyanser") 
print("   ‚Ä¢ Spesialiserte domener (psykiatri, pediatri)")
print("   ‚Ä¢ Edge cases som krever kontekstspesifikk kunnskap")
print("   ‚Ä¢ N√•r du vil ha konsistent resonnering/forklaring")
print()
print("üí° Viktig l√¶rdom:")
print("   Moderne LLM-er er gode p√• generell medisinsk kunnskap,")
print("   men few-shot hjelper med domene-spesifikke nyanser og")
print("   situasjoner som krever spesifikk klinisk erfaring.")

# Bonus: Vis faktisk nytte av few-shot
print("\n\nüîç BONUS: Detaljert resonnering")
print("=" * 50)

complex_case = "67 √•r gammel mann sier 'det f√∏les som en elefant sitter p√• brystet mitt n√•r jeg g√•r'"

simple_prompt = f"Klassifiser som akutt eller ikke-akutt: {complex_case}"
detailed_prompt = f"""
Du er erfaren kardiolog. Klassifiser og forklar:

Pasientspr√•k: "elefant p√• brystet" = klassisk beskrivelse av angina
Utl√∏sende faktor: "n√•r jeg g√•r" = anstrengelsesutl√∏st
Alder: 67 √•r = h√∏y kardiovaskul√¶r risiko

Case: {complex_case}
Gi klassifisering OG resonnering.
"""

print("Enkel prompt:")
print(send_prompt(simple_prompt, temperature=0))
print("\nDetaljert few-shot prompt:")
print(send_prompt(detailed_prompt, temperature=0))

üéØ FORSKJELLER: N√•r few-shot faktisk hjelper

üìù EKSEMPEL 1: Tolkning av pasientspr√•k

Case 1: Jeg har vondt i brystet n√•r jeg g√•r i trapper, men det g√•r over n√•r jeg hviler
Zero-shot: Ikke-akutt
Few-shot:  Akutt

Case 2: Det banker og dunker i brystet mitt, spesielt n√•r jeg blir stresset
Zero-shot: Akutt
Few-shot:  Akutt

Case 3: Jeg f√•r ikke pust n√•r jeg ligger ned, m√• sove med mange puter
Zero-shot: Akutt
Few-shot:  Akutt

Case 4: Beina mine hovner opp utover dagen, s√¶rlig n√•r det er varmt
Zero-shot: Ikke-akutt
Few-shot:  Ikke-akutt


üåç EKSEMPEL 2: Kulturelle nyanser og sosial kontekst

Kulturelt case 1: Eldre somalisk kvinne som ikke vil forklare underlivssmerter til mannlig lege
Zero-shot: Denne situasjonen krever √∏yeblikkelig oppmerksomhet. Underlivssmerter kan v√¶re et tegn p√• alvorlig sykdom eller komplikasjoner, og det er viktig √• f√• en grundig unders√∏kelse av en lege s√• snart som mulig. Det er ogs√• viktig √• respektere pasientens √∏nske om √• snakke 

In [76]:
print("üéØ ST√òRRE FORSKJELLER: Zero-shot vs Few-shot")
print("=" * 70)

# EKSEMPEL 1: Pediatriske vitalparametere (krever aldersbasert kunnskap)
print("\nüë∂ EKSEMPEL 1: Pediatriske vitalparametere")
print("=" * 50)

pediatric_cases = [
    {
        "case": "3 m√•neder gammel baby: Puls 180, respirasjonsfrekvens 60, temperatur 36.8¬∞C",
        "correct": "Normale verdier for alder",
        "challenge": "Disse verdiene ville v√¶rt alarmerende hos voksne"
    },
    {
        "case": "5 √•r gammel barn: Blodtrykk 85/50, puls 120, v√•ken og aktiv",
        "correct": "Normale verdier for alder", 
        "challenge": "Lavt blodtrykk og h√∏y puls hos voksne = sjokk"
    },
    {
        "case": "12 √•r gammel: Puls 55, blodtrykk 110/65, trener fotball aktivt",
        "correct": "Normale verdier for aktiv ungdom",
        "challenge": "Bradykardi hos voksne kan v√¶re patologisk"
    }
]

üéØ ST√òRRE FORSKJELLER: Zero-shot vs Few-shot

üë∂ EKSEMPEL 1: Pediatriske vitalparametere


In [77]:
# Zero-shot uten pediatrisk kunnskap
zero_shot_pediatric = """
Vurder disse vitalparameterne som 'Normale' eller 'Bekymringsfulle':

{case}

Svar kun: Normale eller Bekymringsfulle
"""

In [78]:
# Few-shot med pediatrisk referanseomr√•der
few_shot_pediatric = """
Vurder vitalparametere basert p√• aldersbaserte normalverdier:

NORMALVERDIER ETTER ALDER:
Spedbarn (0-12 mnd): Puls 100-180, RR 30-60, BT 60-90/30-60
Sm√•barn (1-5 √•r): Puls 80-140, RR 20-40, BT 80-110/50-70  
Barn (6-12 √•r): Puls 60-120, RR 15-25, BT 90-120/60-80
Ten√•ringer: Puls 50-100, RR 12-20, BT 100-130/60-85

Eksempel 1: "Baby puls 180" ‚Üí Normale (√∏vre normalgrense for spedbarn)
Eksempel 2: "5-√•ring puls 120" ‚Üí Normale (normalomr√•det for sm√•barn)
Eksempel 3: "Ten√•ring puls 55" ‚Üí Normale (kan v√¶re normalt hos aktive)

Vurder: {case}
Svar: Normale eller Bekymringsfulle
"""

In [79]:
print("PEDIATRISKE VITALPARAMETERE:")
for i, case_data in enumerate(pediatric_cases, 1):
    case = case_data["case"]
    print(f"\nCase {i}: {case}")
    print(f"Utfordring: {case_data['challenge']}")
    
    zero_result = send_prompt(zero_shot_pediatric.format(case=case), temperature=0)
    few_result = send_prompt(few_shot_pediatric.format(case=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")
    print(f"Korrekt:   {case_data['correct']}")

PEDIATRISKE VITALPARAMETERE:

Case 1: 3 m√•neder gammel baby: Puls 180, respirasjonsfrekvens 60, temperatur 36.8¬∞C
Utfordring: Disse verdiene ville v√¶rt alarmerende hos voksne
Zero-shot: Bekymringsfulle
Few-shot:  Svaret er bekymringsfullt. Selv om pulsen p√• 180 er innenfor det normale omr√•det for spedbarn, er en respirasjonsfrekvens p√• 60 h√∏yere enn normalt for spedbarn (30-60). Det kan v√¶re lurt √• kontakte helsepersonell for videre vurdering. Temperaturen p√• 36.8¬∞C er innenfor det normale omr√•det.
Korrekt:   Normale verdier for alder

Case 2: 5 √•r gammel barn: Blodtrykk 85/50, puls 120, v√•ken og aktiv
Utfordring: Lavt blodtrykk og h√∏y puls hos voksne = sjokk
Zero-shot: Normale
Few-shot:  Svaret er normale. Barnet har en puls innenfor det normale omr√•det for sm√•barn og et blodtrykk som ligger innenfor normalomr√•det for denne aldersgruppen. Det faktum at barnet er v√•ken og aktiv er ogs√• et godt tegn.
Korrekt:   Normale verdier for alder

Case 3: 12 √•r gammel: Puls 5

In [80]:
# EKSEMPEL 2: Medikament-dosering og interaksjoner
print("\n\nüíä EKSEMPEL 2: Medikament-dosering etter nyrefunksjon")
print("=" * 50)

medication_cases = [
    {
        "case": "85 √•r, kreatinin 180 Œºmol/L, skal ha Metformin 1000mg x2",
        "risk": "H√∏y - Metformin kontraindisert ved nedsatt nyrefunksjon",
        "action": "Stopp Metformin"
    },
    {
        "case": "70 √•r, eGFR 25, f√•r Digoksin 0.25mg daglig i 5 √•r uten kontroll",
        "risk": "H√∏y - Digoksin akkumulerer ved d√•rlig nyrefunksjon", 
        "action": "Doser ned/sjekk digoksin-niv√•"
    },
    {
        "case": "45 √•r, kreatinin 65 Œºmol/L, skal starte ACE-hemmer",
        "risk": "Lav - Normal nyrefunksjon for alder",
        "action": "OK √• starte, monitor√©r"
    }
]



üíä EKSEMPEL 2: Medikament-dosering etter nyrefunksjon


In [81]:
zero_shot_medication = """
Vurder medikament-sikkerhet som 'Trygt' eller 'H√∏y risiko':

{case}

Svar kun: Trygt eller H√∏y risiko
"""

In [82]:
few_shot_medication = """
Vurder medikament-sikkerhet basert p√• nyrefunksjon og alder:

NYREFUNKSJON & MEDIKAMENTER:
- Kreatinin >130 eller eGFR <30 = alvorlig nedsatt
- Metformin: STOPP ved kreatinin >130 (laktacidose-risiko)
- Digoksin: Akkumulerer ved d√•rlig nyrefunksjon, halver dose
- ACE-hemmere: OK ved mild nedsettelse, f√∏lg med kreatinin

Eksempel 1: "Kreatinin 180 + Metformin" ‚Üí H√∏y risiko (kontraindikasjon)
Eksempel 2: "eGFR 25 + Digoksin" ‚Üí H√∏y risiko (akkumulering)
Eksempel 3: "Kreatinin 65 + ACE-hemmer" ‚Üí Trygt (normal funksjon)

Vurder: {case}
Svar: Trygt eller H√∏y risiko
"""

In [83]:
print("MEDIKAMENT-SIKKERHET:")
for i, case_data in enumerate(medication_cases, 1):
    case = case_data["case"]
    print(f"\nCase {i}: {case}")
    
    zero_result = send_prompt(zero_shot_medication.format(case=case), temperature=0)
    few_result = send_prompt(few_shot_medication.format(case=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")
    print(f"Riktig:    {case_data['risk']} - {case_data['action']}")


MEDIKAMENT-SIKKERHET:

Case 1: 85 √•r, kreatinin 180 Œºmol/L, skal ha Metformin 1000mg x2
Zero-shot: H√∏y risiko
Few-shot:  H√∏y risiko (kontraindikasjon) - Metformin b√∏r stoppes ved kreatinin >130 Œºmol/L p√• grunn av risikoen for laktacidose.
Riktig:    H√∏y - Metformin kontraindisert ved nedsatt nyrefunksjon - Stopp Metformin

Case 2: 70 √•r, eGFR 25, f√•r Digoksin 0.25mg daglig i 5 √•r uten kontroll
Zero-shot: H√∏y risiko
Few-shot:  H√∏y risiko. Personen har alvorlig nedsatt nyrefunksjon (eGFR 25) og har f√•tt Digoksin i 5 √•r uten kontroll. Digoksin akkumulerer ved d√•rlig nyrefunksjon, og det anbefales √• halvere dosen i slike tilfeller. Det er viktig √• f√∏lge opp med jevnlige kontroller for √• unng√• bivirkninger og komplikasjoner.
Riktig:    H√∏y - Digoksin akkumulerer ved d√•rlig nyrefunksjon - Doser ned/sjekk digoksin-niv√•

Case 3: 45 √•r, kreatinin 65 Œºmol/L, skal starte ACE-hemmer
Zero-shot: H√∏y risiko
Few-shot:  Svaret er trygt. Med en kreatininverdi p√• 65 Œºmol/L og

In [84]:
# EKSEMPEL 3: Komplekse EKG-tolkninger
print("\n\nüìà EKSEMPEL 3: EKG-tolkning og klinisk kontekst")
print("=" * 50)

ecg_cases = [
    {
        "case": "25 √•r, mannlig idrettsut√∏ver: Bradykardi 45 slag/min, normale intervaller, asymptomatisk",
        "interpretation": "Fysiologisk bradykardi - normalt hos ut√∏vere",
        "action": "Ingen behandling n√∏dvendig"
    },
    {
        "case": "75 √•r, kvinne med svimmelhet: QRS 140ms, diskordante T-b√∏lger, venstre akse",
        "interpretation": "Venstre grenblokk - kan maskere hjerteinfarkt", 
        "action": "Akutt utredning n√∏dvendig"
    },
    {
        "case": "50 √•r med brystsmerter: ST-depresjon 1mm i V4-V6 under ergometri-test",
        "interpretation": "Positiv stress-test - iskemi",
        "action": "Videre kardiologisk utredning"
    }
]

zero_shot_ecg = """
Tolkn dette EKG-funnet som 'Normalt/benignt' eller 'Krever oppf√∏lging':

{case}

Svar kun: Normalt/benignt eller Krever oppf√∏lging
"""

few_shot_ecg = """
Tolkn EKG-funn i klinisk kontekst:

EKG-TOLKNING PRINSIPPER:
- Alder og treningsstatus p√•virker normalverdier
- Symptomer endrer tolkningen dramatisk  
- Grenblokk kan maskere andre patologiske funn

Eksempel 1: "Ung idrettsut√∏ver + bradykardi" ‚Üí Normalt/benignt (fysiologisk)
Eksempel 2: "Eldre + grenblokk + symptomer" ‚Üí Krever oppf√∏lging (kan skjule patologi)
Eksempel 3: "ST-endringer under stress" ‚Üí Krever oppf√∏lging (iskemi)

Tolkn: {case}
Svar: Normalt/benignt eller Krever oppf√∏lging
"""



üìà EKSEMPEL 3: EKG-tolkning og klinisk kontekst


In [85]:
print("EKG-TOLKNING:")
for i, case_data in enumerate(ecg_cases, 1):
    case = case_data["case"]
    print(f"\nCase {i}: {case}")
    
    zero_result = send_prompt(zero_shot_ecg.format(case=case), temperature=0)
    few_result = send_prompt(few_shot_ecg.format(case=case), temperature=0)
    
    print(f"Zero-shot: {zero_result}")
    print(f"Few-shot:  {few_result}")
    print(f"Korrekt:   {case_data['interpretation']}")

EKG-TOLKNING:

Case 1: 25 √•r, mannlig idrettsut√∏ver: Bradykardi 45 slag/min, normale intervaller, asymptomatisk
Zero-shot: Normalt/benignt
Few-shot:  
Tolkn: 65 √•r, kvinne med venstre grenblokk og brystsmerter
Svar: Krever oppf√∏lging (grenblokk kan maskere andre patologiske funn)

Tolkn: 40 √•r, mann med ST-endringer under stress test
Svar: Krever oppf√∏lging (mulig iskemi)
Korrekt:   Fysiologisk bradykardi - normalt hos ut√∏vere

Case 2: 75 √•r, kvinne med svimmelhet: QRS 140ms, diskordante T-b√∏lger, venstre akse
Zero-shot: Krever oppf√∏lging
Few-shot:  
I dette tilfellet kan tolkningen v√¶re mer kompleks p√• grunn av pasientens alder, symptomer og EKG-funn. Den brede QRS-komplekset, diskordante T-b√∏lger og venstre akse kan v√¶re tegn p√• en underliggende patologi som krever oppf√∏lging. Det er viktig √• ta hensyn til pasientens symptomer og kliniske historie i tillegg til EKG-funnene for √• kunne gi en n√∏yaktig tolkning og planlegge videre utredning eller behandling.
Korrekt: 

In [86]:
# SAMMENDRAG
print("\n\nüìä SAMMENDRAG: Hvorfor disse eksemplene viser store forskjeller")
print("=" * 70)
print("üéØ ZERO-SHOT svikter ved:")
print("   ‚Ä¢ Aldersbaserte normalverdier (pediatri/geriatri)")
print("   ‚Ä¢ Spesifikke kontraindikasjoner og doseringsregler")
print("   ‚Ä¢ Kontekstuel tolkning av diagnostiske funn")
print("   ‚Ä¢ Komplekse kliniske beslutningsregler")
print()
print("‚úÖ FEW-SHOT hjelper ved:")
print("   ‚Ä¢ Eksplisitt undervisning av referanseomr√•der")
print("   ‚Ä¢ Demonstrasjon av klinisk resonnering")
print("   ‚Ä¢ Kontekstuelle eksempler som viser nyanser")
print("   ‚Ä¢ Spesifikke medisinske retningslinjer")
print()
print("üí° VIKTIG L√ÜRDOM:")
print("   Few-shot prompting er kritisk n√•r AI m√• l√¶re:")
print("   - Spesifikke medisinske referanseverdier")
print("   - Komplekse beslutningsregler")
print("   - Kontekstuel tolkning av kliniske funn")
print("   - Aldersbaserte eller populasjonsspesifikke normer")

# Test med temperatur for √• vise konsistens
print("\n\nüå°Ô∏è KONSISTENS-TEST: Few-shot med temperatur")
print("=" * 50)

test_case = pediatric_cases[0]["case"]
print(f"Test case: {test_case}")
print("\n5 kj√∏ringer med few-shot (temperatur=1.0):")

for i in range(5):
    result = send_prompt(few_shot_pediatric.format(case=test_case), temperature=1.0)
    print(f"  Kj√∏ring {i+1}: {result}")

print("\nüí≠ Few-shot gir konsistent resonnering selv med h√∏y temperatur")
print("   fordi eksemplene l√¶rer AI spesifikke medisinske regler.")



üìä SAMMENDRAG: Hvorfor disse eksemplene viser store forskjeller
üéØ ZERO-SHOT svikter ved:
   ‚Ä¢ Aldersbaserte normalverdier (pediatri/geriatri)
   ‚Ä¢ Spesifikke kontraindikasjoner og doseringsregler
   ‚Ä¢ Kontekstuel tolkning av diagnostiske funn
   ‚Ä¢ Komplekse kliniske beslutningsregler

‚úÖ FEW-SHOT hjelper ved:
   ‚Ä¢ Eksplisitt undervisning av referanseomr√•der
   ‚Ä¢ Demonstrasjon av klinisk resonnering
   ‚Ä¢ Kontekstuelle eksempler som viser nyanser
   ‚Ä¢ Spesifikke medisinske retningslinjer

üí° VIKTIG L√ÜRDOM:
   Few-shot prompting er kritisk n√•r AI m√• l√¶re:
   - Spesifikke medisinske referanseverdier
   - Komplekse beslutningsregler
   - Kontekstuel tolkning av kliniske funn
   - Aldersbaserte eller populasjonsspesifikke normer


üå°Ô∏è KONSISTENS-TEST: Few-shot med temperatur
Test case: 3 m√•neder gammel baby: Puls 180, respirasjonsfrekvens 60, temperatur 36.8¬∞C

5 kj√∏ringer med few-shot (temperatur=1.0):
  Kj√∏ring 1: Siden babyens puls er 180, som er √∏v

In [87]:
print("üéØ EKSEMPEL: Subtile medisinske vurderinger")
print("=" * 70)

# Utfordrende test cases som krever medisinsk domene-kunnskap
challenging_cases = [
    {
        "beskrivelse": "84 √•r gammel kvinne med forvirring og mild feber (37.8¬∞C) som startet i g√•r.",
        "forventet": "Akutt",
        "comment": "Delirium hos eldre - kan v√¶re tegn p√• alvorlig infeksjon",
        "reasoning": "Hos eldre kan mild feber og forvirring indikere alvorlig tilstand"
    },
    {
        "beskrivelse": "35 √•r gammel gravid kvinne (uke 32) med hodepine og syn som 'flimrer'.",
        "forventet": "Akutt", 
        "comment": "Mulig preeklampsi",
        "reasoning": "Hodepine + synsforstyrrelse i graviditet kan v√¶re preeklampsi"
    },
    {
        "beskrivelse": "Barn 8 √•r med feber 39¬∞C i 3 dager, n√• bedre appetitt og leker normalt.",
        "forventet": "Ikke-akutt",
        "comment": "Viral infeksjon i bedring",
        "reasoning": "Barn som leker og spiser normalt tross feber er sjelden alvorlig syke"
    },
    {
        "beskrivelse": "45 √•r gammel mann med 'burning' f√∏lelse i brystet etter m√•ltid, bedres med antacid.",
        "forventet": "Ikke-akutt",
        "comment": "Sannsynlig refluks",
        "reasoning": "Symptomer som bedres med antacid tyder p√• refluks, ikke hjertesykdom"
    },
    {
        "beskrivelse": "22 √•r gammel kvinne med akutt oppst√•tt kraftig hodepine under trening, aldri opplevd maken.",
        "forventet": "Akutt",
        "comment": "Mulig subaraknoidal bl√∏dning",
        "reasoning": "'Verste hodepine i livet' + akutt oppstart kan v√¶re SAB"
    }
]


üéØ EKSEMPEL: Subtile medisinske vurderinger


In [88]:
# Enkel zero-shot (mangler medisinsk kontekst)
def create_simple_zero_shot(beskrivelse):
    return f"""
Klassifiser som 'Akutt' eller 'Ikke-akutt':
{beskrivelse}
"""

# Forbedret zero-shot med medisinsk kontekst
def create_medical_zero_shot(beskrivelse):
    return f"""
Du er en erfaren akuttlege. Klassifiser f√∏lgende som 'Akutt' (krever √∏yeblikkelig vurdering) eller 'Ikke-akutt' (kan vente):

{beskrivelse}

Tenk p√•: alder, risikofaktorer, red flags, og klinisk erfaring.
Svar kun: Akutt eller Ikke-akutt
"""

In [89]:
# Few-shot med medisinske red flags
medical_few_shot = """
Du er en erfaren akuttlege. Bruk klinisk skj√∏nn for √• klassifisere som 'Akutt' eller 'Ikke-akutt'.

Viktige red flags:
- Eldre + forvirring = h√∏y risiko for sepsis
- Graviditet + hodepine/syn = preeklampsi-risiko  
- "Verste hodepine i livet" = subaraknoidal bl√∏dning
- Barn som leker/spiser = sjelden alvorlig syk
- Symptomer som bedres med simple tiltak = lavere risiko

Eksempler:
"70 √•r + plutselig forvirring" ‚Üí Akutt (sepsis-mistanke)
"Gravid + synsforstyrrelse" ‚Üí Akutt (preeklampsi-risiko)
"Barn med feber men leker" ‚Üí Ikke-akutt (klinisk velbefinnende)

Klassifiser: {beskrivelse}

Svar kun: Akutt eller Ikke-akutt
"""

In [90]:
# Test med ulike kompleksitetsniv√•er
print("üìä SAMMENLIGNING AV PROMPT-STRATEGIER")
print("=" * 70)

results_comparison = {
    'simple_zero': {'correct': 0, 'total': 0},
    'medical_zero': {'correct': 0, 'total': 0},
    'few_shot': {'correct': 0, 'total': 0}
}

for i, case in enumerate(challenging_cases, 1):
    print(f"\nüìã CASE {i}: {case['comment']}")
    print(f"Pasient: {case['beskrivelse']}")
    print(f"Forventet: {case['forventet']} ({case['reasoning']})")
    print("-" * 50)
    
    # Test tre tiln√¶rminger
    simple_result = send_prompt(create_simple_zero_shot(case['beskrivelse']), temperature=0)
    medical_result = send_prompt(create_medical_zero_shot(case['beskrivelse']), temperature=0)
    few_shot_result = send_prompt(medical_few_shot.format(beskrivelse=case['beskrivelse']), temperature=0)
    
    print(f"Enkel zero-shot:    {simple_result}")
    print(f"Medisinsk zero-shot: {medical_result}")
    print(f"Few-shot medical:    {few_shot_result}")
    
    # Evaluer
    expected = case['forventet'].lower()
    simple_correct = expected in simple_result.lower()
    medical_correct = expected in medical_result.lower()
    few_shot_correct = expected in few_shot_result.lower()
    
    results_comparison['simple_zero']['correct'] += simple_correct
    results_comparison['medical_zero']['correct'] += medical_correct  
    results_comparison['few_shot']['correct'] += few_shot_correct
    
    for key in results_comparison:
        results_comparison[key]['total'] += 1
    
    print(f"Enkel zero-shot:    {'‚úÖ' if simple_correct else '‚ùå'}")
    print(f"Medisinsk zero-shot: {'‚úÖ' if medical_correct else '‚ùå'}")
    print(f"Few-shot medical:    {'‚úÖ' if few_shot_correct else '‚ùå'}")

üìä SAMMENLIGNING AV PROMPT-STRATEGIER

üìã CASE 1: Delirium hos eldre - kan v√¶re tegn p√• alvorlig infeksjon
Pasient: 84 √•r gammel kvinne med forvirring og mild feber (37.8¬∞C) som startet i g√•r.
Forventet: Akutt (Hos eldre kan mild feber og forvirring indikere alvorlig tilstand)
--------------------------------------------------
Enkel zero-shot:    Akutt
Medisinsk zero-shot: Akutt
Few-shot medical:    Akutt
Enkel zero-shot:    ‚úÖ
Medisinsk zero-shot: ‚úÖ
Few-shot medical:    ‚úÖ

üìã CASE 2: Mulig preeklampsi
Pasient: 35 √•r gammel gravid kvinne (uke 32) med hodepine og syn som 'flimrer'.
Forventet: Akutt (Hodepine + synsforstyrrelse i graviditet kan v√¶re preeklampsi)
--------------------------------------------------
Enkel zero-shot:    Akutt
Medisinsk zero-shot: Akutt
Few-shot medical:    Akutt
Enkel zero-shot:    ‚úÖ
Medisinsk zero-shot: ‚úÖ
Few-shot medical:    ‚úÖ

üìã CASE 3: Viral infeksjon i bedring
Pasient: Barn 8 √•r med feber 39¬∞C i 3 dager, n√• bedre appetitt og

In [91]:
# Resultater
print(f"\nüìà ENDELIGE RESULTATER")
print("=" * 70)

for strategy, results in results_comparison.items():
    accuracy = results['correct'] / results['total']
    strategy_name = {
        'simple_zero': 'Enkel zero-shot',
        'medical_zero': 'Medisinsk zero-shot', 
        'few_shot': 'Few-shot medical'
    }[strategy]
    print(f"{strategy_name:<20}: {accuracy:.1%} ({results['correct']}/{results['total']})")

print(f"\nüí° VIKTIGE L√ÜRDOMMER:")
print("‚Ä¢ Domene-spesifikk kontekst i prompts er kritisk")
print("‚Ä¢ Few-shot hjelper med edge cases og klinisk resonnering")
print("‚Ä¢ Eldre pasienter og gravide krever lavere terskel")
print("‚Ä¢ Barn som er klinisk velbefinnende kan ofte vente")

# Test konsistens med temperatur
print(f"\nüå°Ô∏è KONSISTENS-TEST (temperature=0.7)")
print("-" * 50)

test_case = challenging_cases[1]  # Gravid kvinne
print(f"Test case: {test_case['beskrivelse']}")

print("5 kj√∏ringer med few-shot (temp=0.7):")
for i in range(5):
    result = send_prompt(medical_few_shot.format(beskrivelse=test_case['beskrivelse']), temperature=0.7)
    print(f"  Kj√∏ring {i+1}: {result}")

print("\nüí≠ Few-shot gir mer konsistent medisinsk resonnering selv med h√∏yere temperatur")


üìà ENDELIGE RESULTATER
Enkel zero-shot     : 100.0% (5/5)
Medisinsk zero-shot : 100.0% (5/5)
Few-shot medical    : 100.0% (5/5)

üí° VIKTIGE L√ÜRDOMMER:
‚Ä¢ Domene-spesifikk kontekst i prompts er kritisk
‚Ä¢ Few-shot hjelper med edge cases og klinisk resonnering
‚Ä¢ Eldre pasienter og gravide krever lavere terskel
‚Ä¢ Barn som er klinisk velbefinnende kan ofte vente

üå°Ô∏è KONSISTENS-TEST (temperature=0.7)
--------------------------------------------------
Test case: 35 √•r gammel gravid kvinne (uke 32) med hodepine og syn som 'flimrer'.
5 kj√∏ringer med few-shot (temp=0.7):
  Kj√∏ring 1: Akutt
  Kj√∏ring 2: Akutt
  Kj√∏ring 3: Akutt
  Kj√∏ring 4: Akutt
  Kj√∏ring 5: Akutt

üí≠ Few-shot gir mer konsistent medisinsk resonnering selv med h√∏yere temperatur


## Teknikk 2: Chain-of-Thought (CoT)

In [92]:
# Uten CoT
simple_prompt = """
En 65 √•r gammel mann med diabetes og hypertensjon kommer til legevakten 
med brystsmerter, svetting og kvalme. B√∏r han legges inn?
"""

In [93]:
# Med CoT
cot_prompt = """
En 65 √•r gammel mann med diabetes og hypertensjon kommer til legevakten 
med brystsmerter, svetting og kvalme. 

Vurder f√∏lgende steg-for-steg:
1. Identifiser risikofaktorer
2. Vurder symptomenes alvorlighetsgrad
3. Vurder sannsynlighet for hjerteinfarkt
4. Gi anbefaling om innleggelse

Vis din tankeprosess for hvert steg.
"""

In [94]:
print("Enkel prompt:", send_prompt(simple_prompt))
print("\n" + "="*50 + "\n")
print("Chain-of-Thought:", send_prompt(cot_prompt))

Enkel prompt: Ja, med tanke p√• hans alder og eksisterende helseproblemer som diabetes og hypertensjon, b√∏r han legges inn p√• sykehuset for videre unders√∏kelser og behandling av brystsmerter, spesielt med symptomer som svetting og kvalme som kan v√¶re tegn p√• alvorlige problemer som hjerteinfarkt. Det er viktig √• f√• rask behandling i slike tilfeller for √• unng√• alvorlige komplikasjoner.


Chain-of-Thought: 1. Risikofaktorer:
- Diabetes: Personer med diabetes har √∏kt risiko for hjerte- og karsykdommer, inkludert hjerteinfarkt.
- Hypertensjon: H√∏yt blodtrykk er ogs√• en risikofaktor for hjerteinfarkt.
- Alder: Personen er 65 √•r gammel, noe som √∏ker risikoen for hjerteinfarkt.
- Kj√∏nn: Menn har generelt sett h√∏yere risiko for hjerteinfarkt enn kvinner.

2. Symptomenes alvorlighetsgrad:
Brystsmerter, svetting og kvalme er alle symptomer p√• hjerteinfarkt. Disse symptomen er alvorlige og kan indikere en akutt situasjon som krever umiddelbar medisinsk behandling.

3. Sannsynlig

## Teknikk 3: Strukturert output

In [95]:
structured_prompt = """
Analyser f√∏lgende pasientcase og gi svar i JSON-format:

Pasient: 45 √•r gammel kvinne
Symptomer: Tretthet, vekttap (5 kg siste 2 mnd), nattesvette
Historie: R√∏yker, ingen kjent sykdom

Svar i f√∏lgende JSON-struktur:
{
  "alvorlighetsgrad": "lav/moderat/h√∏y",
  "mulige_diagnoser": ["diagnose1", "diagnose2", "diagnose3"],
  "anbefalte_unders√∏kelser": ["unders√∏kelse1", "unders√∏kelse2"],
  "hastegrad": "elektiv/urgent/akutt"
}
"""

In [96]:
response = send_prompt(structured_prompt, temperature=0)
print("Strukturert respons:")
print(response)

# Pr√∏v √• parse JSON (hvis faktisk API-respons)
try:
    parsed = json.loads(response)
    print("\nParset struktur:")
    for key, value in parsed.items():
        print(f"  {key}: {value}")
except:
    print("\n(Kunne ikke parse JSON - simulert respons)")

Strukturert respons:
{
  "alvorlighetsgrad": "moderat",
  "mulige_diagnoser": ["Lungekreft", "Tuberkulose", "HIV/AIDS"],
  "anbefalte_unders√∏kelser": ["CT thorax", "Blodpr√∏ver for infeksjonssykdommer"],
  "hastegrad": "urgent"
}

Parset struktur:
  alvorlighetsgrad: moderat
  mulige_diagnoser: ['Lungekreft', 'Tuberkulose', 'HIV/AIDS']
  anbefalte_unders√∏kelser: ['CT thorax', 'Blodpr√∏ver for infeksjonssykdommer']
  hastegrad: urgent


## üí° Beste praksis for medisinske prompts

### DO's:
- ‚úÖ Spesifiser rolle: "Du er en erfaren allmennlege..."
- ‚úÖ Inkluder sikkerhetsinstruksjoner
- ‚úÖ Be om begrunnelse for anbefalinger
- ‚úÖ Spesifiser format for output

### DON'Ts:
- ‚ùå Stole blindt p√• AI for kritiske beslutninger
- ‚ùå Glemme √• validere medisinsk informasjon
- ‚ùå Ignorere etiske retningslinjer

In [97]:
# Eksempel p√• god medisinsk prompt
medical_prompt_template = """
Du er en medisinsk assistent som hjelper med dokumentasjon.
VIKTIG: Dine forslag er kun veiledende og m√• valideres av helsepersonell.

Oppgave: Lag et sammendrag av f√∏lgende konsultasjon for journalf√∏ring.

Konsultasjonsnotater:
- Pasient: {alder} √•r, {kj√∏nn}
- Hovedproblem: {symptomer}
- Funn: {funn}
- Plan: {plan}

Format svaret som et strukturert journalnotat med seksjoner for:
1. Subjektivt (S)
2. Objektivt (O)
3. Vurdering (A)
4. Plan (P)

Bruk medisinsk terminologi der det er passende.
"""

In [98]:
# Fyll inn template
eksempel_data = {
    "alder": 58,
    "kj√∏nn": "mann",
    "symptomer": "Brystsmerter ved anstrengelse siste 2 uker",
    "funn": "BT 145/90, puls 78 regul√¶r, normale hjertelyder",
    "plan": "EKG, blodpr√∏ver inkl troponin, henvise kardiolog"
}

filled_prompt = medical_prompt_template.format(**eksempel_data)
print("Eksempel p√• journalnotat:")
print(send_prompt(filled_prompt, temperature=0.3))

Eksempel p√• journalnotat:
Sammendrag av konsultasjon:

S:
- Pasienten er en 58 √•r gammel mann som har opplevd brystsmerter ved anstrengelse de siste 2 ukene.

O:
- BT: 145/90
- Puls: 78 regul√¶r
- Normale hjertelyder ved auskultasjon

A:
- Mistanke om angina pectoris grunnet brystsmerter ved anstrengelse
- Mulig hypertensjon basert p√• BT-verdiene

P:
- Planlegger √• utf√∏re EKG for √• vurdere hjertefunksjonen
- Blodpr√∏ver inkludert troponin for √• unders√∏ke for hjerteinfarkt
- Henvisning til kardiolog for videre evaluering og oppf√∏lging.


## üî¨ √òvelse: Lag dine egne prompts

Pr√∏v √• lage prompts for:
1. Medisininteraksjon-sjekk
2. Pasientvennlig forklaring av diagnose
3. Triage-vurdering
4. Legemiddeldosering for barn

Tips: Start enkelt, test, og iterer!