# 🎯 Prompt Workshop - Praktiske Øvelser

## Læringsmål
- Øve på å skrive effektive prompts for medisinske oppgaver
- Eksperimentere med ulike prompt-teknikker
- Evaluere og forbedre AI-responser
- Forstå begrensninger og muligheter

Dette er en interaktiv workshop hvor du skal teste og forbedre prompts!

In [1]:
import os
from openai import OpenAI
import json
from typing import List, Dict

# Setup
client = OpenAI() if os.getenv("OPENAI_API_KEY") else None

def test_prompt(prompt: str, temperature: float = 0.7) -> str:
    """Test en prompt og returner respons"""
    if not client:
        return f"[Simulert respons for: {prompt[:50]}...]"
    
    try:
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}],
            temperature=temperature
        )
        return response.choices[0].message.content
    except Exception as e:
        return f"Feil: {e}"

print("🎯 Prompt Workshop - La oss eksperimentere!")

🎯 Prompt Workshop - La oss eksperimentere!


## Øvelse 1: Forbedre en dårlig prompt

Her er en vag prompt. Din oppgave er å forbedre den!

In [2]:
# Dårlig prompt
vag_prompt = "Fortell meg om diabetes"

# Test den vage prompten
print("❌ Vag prompt:")
print(test_prompt(vag_prompt))

# Din forbedrede versjon
forbedret_prompt = """
[SKRIV DIN FORBEDREDE PROMPT HER]

Tips:
- Spesifiser målgruppe
- Definer format
- Begrens omfang
- Be om struktur
"""

# Test forbedringen
print("\n✅ Forbedret prompt:")
# print(test_prompt(forbedret_prompt))

❌ Vag prompt:
[Simulert respons for: Fortell meg om diabetes...]

✅ Forbedret prompt:


### Løsningsforslag

In [3]:
# Eksempel på god prompt
god_prompt = """
Du er en sykepleier som forklarer til en nydiagnostisert pasient.

Forklar diabetes type 2 på en enkel måte som dekker:
1. Hva som skjer i kroppen (2-3 setninger)
2. Vanlige symptomer (punktliste)
3. Hvorfor behandling er viktig (2 setninger)
4. Tre livsstilsråd de kan starte med i dag

Bruk vennlig tone, unngå skremming, maks 150 ord totalt.
"""

print("✨ Eksempel på forbedret prompt:")
print(test_prompt(god_prompt, temperature=0.3))

✨ Eksempel på forbedret prompt:
[Simulert respons for: 
Du er en sykepleier som forklarer til en nydiagno...]


## Øvelse 2: Few-shot learning for triage

Lag et few-shot prompt-system for å klassifisere hastegrad.

In [4]:
def create_triage_prompt(symptom_beskrivelse: str) -> str:
    """
    Lag en few-shot prompt for triage-klassifisering
    
    Fyll inn eksempler nedenfor!
    """
    prompt = f"""
    Klassifiser hastegrad som RØD (øyeblikkelig), GUL (haster), eller GRØNN (kan vente).
    
    Eksempler:
    Symptomer: Brystsmerter med utstråling til arm, svetting, kvalm
    Klassifisering: RØD
    
    Symptomer: Sår hals i 3 dager, lett feber, ingen pustevansker
    Klassifisering: GRØNN
    
    [LEGG TIL MINST 2 EKSEMPLER TIL HER]
    
    Symptomer: {symptom_beskrivelse}
    Klassifisering:"""
    
    return prompt

In [5]:
# Test med ulike symptomer
test_symptomer = [
    "Hodepine som har vart i 2 uker, forverres om morgenen",
    "Plutselig synstap på ett øye for 20 minutter siden",
    "Kløe og utslett etter å ha spist skalldyr"
]

for symptom in test_symptomer:
    prompt = create_triage_prompt(symptom)
    print(f"\n📋 Symptom: {symptom}")
    print(f"🚦 Klassifisering: {test_prompt(prompt, temperature=0)}")


📋 Symptom: Hodepine som har vart i 2 uker, forverres om morgenen
🚦 Klassifisering: [Simulert respons for: 
    Klassifiser hastegrad som RØD (øyeblikkelig),...]

📋 Symptom: Plutselig synstap på ett øye for 20 minutter siden
🚦 Klassifisering: [Simulert respons for: 
    Klassifiser hastegrad som RØD (øyeblikkelig),...]

📋 Symptom: Kløe og utslett etter å ha spist skalldyr
🚦 Klassifisering: [Simulert respons for: 
    Klassifiser hastegrad som RØD (øyeblikkelig),...]


## Øvelse 3: Chain-of-Thought for differensialdiagnose

Implementer CoT for å resonere seg frem til mulige diagnoser.

In [6]:
def differential_diagnosis_cot(case: str) -> str:
    """
    Lag en Chain-of-Thought prompt for differensialdiagnose
    """
    prompt = f"""
    Analyser følgende case steg-for-steg:
    
    {case}
    
    Følg denne tankeprosessen:
    
    1. IDENTIFISER hovedsymptomer:
       [List opp de viktigste symptomene]
    
    2. VURDER tidsforløp:
       [Akutt vs kronisk, progresjon]
    
    3. RELEVANTE risikofaktorer:
       [Alder, kjønn, historie, livsstil]
    
    4. MULIGE systemer involvert:
       [Hvilke organsystemer kan være påvirket]
    
    5. DIFFERENSIALDIAGNOSER (mest til minst sannsynlig):
       [List 3-5 mulige diagnoser med kort begrunnelse]
    
    6. RØDE FLAGG å se etter:
       [Hva ville krevd øyeblikkelig handling]
    
    Vis din resonnering for hvert steg.
    """
    
    return prompt

In [7]:
# Test case
case = """
45 år gammel kvinne, tidligere frisk.
Siste 3 måneder: Tretthet, 5 kg vekttap, nattesvette.
Siste uke: Hovne lymfeknuter på halsen, ingen smerter.
Ikke-røyker, moderat alkohol, ingen reiser.
"""

cot_prompt = differential_diagnosis_cot(case)
print("🔍 Differensialdiagnose med Chain-of-Thought:")
print(test_prompt(cot_prompt, temperature=0.2))

🔍 Differensialdiagnose med Chain-of-Thought:
[Simulert respons for: 
    Analyser følgende case steg-for-steg:

    
4...]


## Øvelse 4: Prompt med sikkerhetsinstruksjoner

Lag prompts som inkluderer viktige sikkerhetshensyn.

In [8]:
def safe_medical_prompt(question: str) -> str:
    """
    Wrapper som legger til sikkerhetsinstruksjoner
    """
    safety_instructions = """
    VIKTIGE RETNINGSLINJER:
    1. Dine svar er kun veiledende og erstatter IKKE medisinsk konsultasjon
    2. Ved akutte symptomer: Alltid anbefale å kontakte lege/113
    3. Aldri gi spesifikke medisindoseringer uten legetilsyn
    4. Vær tydelig på usikkerhet og begrensninger
    5. Henvis til helsepersonell ved behov
    """
    
    prompt = f"""
    {safety_instructions}
    
    Spørsmål fra bruker: {question}
    
    Svar på en ansvarlig måte som følger retningslinjene ovenfor.
    """
    
    return prompt

In [9]:
# Test med potensielt problematiske spørsmål
risky_questions = [
    "Hvor mye paracetamol kan jeg ta for sterke smerter?",
    "Jeg har brystsmerter, skal jeg vente til i morgen?",
    "Kan jeg slutte med antidepressiva selv?"
]

for q in risky_questions:
    print(f"\n❓ Spørsmål: {q}")
    safe_prompt = safe_medical_prompt(q)
    print(f"✅ Trygt svar: {test_prompt(safe_prompt, temperature=0.2)}")


❓ Spørsmål: Hvor mye paracetamol kan jeg ta for sterke smerter?
✅ Trygt svar: [Simulert respons for: 
    
    VIKTIGE RETNINGSLINJER:
    1. Dine svar...]

❓ Spørsmål: Jeg har brystsmerter, skal jeg vente til i morgen?
✅ Trygt svar: [Simulert respons for: 
    
    VIKTIGE RETNINGSLINJER:
    1. Dine svar...]

❓ Spørsmål: Kan jeg slutte med antidepressiva selv?
✅ Trygt svar: [Simulert respons for: 
    
    VIKTIGE RETNINGSLINJER:
    1. Dine svar...]


## Øvelse 5: Evaluere og sammenligne prompts

Lag et system for å evaluere prompt-kvalitet.

In [11]:
def evaluate_prompts(prompts: List[str], criteria: List[str]) -> Dict:
    """
    Evaluer flere prompts mot gitte kriterier
    """
    evaluation = {}
    
    for i, prompt in enumerate(prompts, 1):
        print(f"\n📝 Evaluerer prompt {i}...")
        
        eval_prompt = f"""
        Evaluer følgende prompt på en skala 1-5 for hvert kriterium:
        
        PROMPT:
        {prompt}
        
        KRITERIER:
        {chr(10).join(f"- {c}" for c in criteria)}
        
        Gi score og kort begrunnelse for hver.
        Format: Kriterium: Score/5 - Begrunnelse
        """
        
        evaluation[f"prompt_{i}"] = test_prompt(eval_prompt, temperature=0)
    
    return evaluation

In [12]:
# Definer evalueringskriterier
kriterier = [
    "Klarhet og spesifisitet",
    "Medisinsk korrekthet",
    "Pasientvennlighet",
    "Sikkerhetshensyn",
    "Praktisk anvendbarhet"
]

# Test med to ulike prompts for samme oppgave
prompt_v1 = "Forklar hva antibiotika er"

prompt_v2 = """
Du er en allmennlege som forklarer til en pasient med ørebetennelse.

Forklar:
1. Hva antibiotika er (2-3 setninger, enkelt språk)
2. Hvorfor det er foreskrevet for deres tilstand
3. Viktigheten av å fullføre kuren
4. Vanlige bivirkninger å se etter

Tone: Vennlig og beroligende
Lengde: Maks 100 ord
"""

# Evaluer
resultater = evaluate_prompts([prompt_v1, prompt_v2], kriterier)
for key, value in resultater.items():
    print(f"\n{key}:")
    print(value)


📝 Evaluerer prompt 1...

📝 Evaluerer prompt 2...

prompt_1:
[Simulert respons for: 
        Evaluer følgende prompt på en skala 1-5 f...]

prompt_2:
[Simulert respons for: 
        Evaluer følgende prompt på en skala 1-5 f...]


## 🏆 Sluttøvelse: Lag din egen avanserte prompt

Oppgave: Design en prompt for en kompleks medisinsk oppgave du velger selv.

Krav:
1. Bruk minst 3 prompt-teknikker
2. Inkluder sikkerhetsinstruksjoner
3. Definer tydelig output-format
4. Test med edge cases

In [14]:
# Din avanserte prompt her
min_avanserte_prompt = """
[SKRIV DIN PROMPT HER]

Ideer:
- Medisininteraksjon-sjekker
- Symptom-dagbok analyse
- Rehabiliteringsplan generator
- Ernæringsråd for spesifikke tilstander
- Mental helse screening
"""

# Test den
# resultat = test_prompt(min_avanserte_prompt)
# print(resultat)

## 📊 Oppsummering og refleksjon

### Hva har vi lært?
1. **Spesifisitet** gir bedre resultater
2. **Eksempler** (few-shot) forbedrer ytelse
3. **Struktur** i prompts gir struktur i svar
4. **Sikkerhet** må alltid inkluderes i medisinske prompts
5. **Iterasjon** er nøkkelen - test og forbedre!

### Videre eksperimentering
- Prøv samme prompt med ulik temperature
- Test på edge cases og uventede inputs
- Kombiner flere teknikker
- Sammenlign GPT-3.5, GPT-4 og Claude

### Etisk refleksjon
- Hvordan sikre at AI ikke overskrider sin kompetanse?
- Når bør AI IKKE brukes i helsevesenet?
- Hvordan bevare menneskelig tilsyn og ansvar?

**Husk:** AI er et verktøy som forsterker, ikke erstatter, klinisk kompetanse!