# Prompt engineering



## wat

Prompt engineering is het sleutelen aan de vraag (de prompt) die je aan LLM's stelt zodat je een beter antwoord krijgt.
Er bleek al snel dat bij ChatGPT e.d. de bruikbaarheid en betrouwbaarheid van het antwoord sterk kan verbeterd worden door de vraag op een bepaalde manier te stellen. Er ontstond zo een nieuwe discipline: prompt engineering.


![prompt engineering trend](img/prompt_engineering.png)


De interesse hierin is zeer nieuw, en naarmate de modellen matuurder worden zal hier ook meer en meer consensus ontstaan van wat "best practices" zijn, maar we kunnen toch al een aantal principes opstellen over hoe je betere resultaten krijgt uit deze modellen, afhankelijk van wat je probeert te bereiken.
De kans dat dit hoofdstuk volgend jaar (of zelfs tegen het einde van het semester) hetzelfde is, is vrij gering, dit onderzoeksdomein wijzigt zeer snel.

Vandaag gaan we wat experimenteren en demonstreren wat er zoal beweegt, volgende week gaan we dan proberen toch ietwat te formaliseren wat ondertussen geweten is over hoe een goede prompt opgebouwd wordt.

## setup

We gaan met de OpenAI API connecteren, hiervoor heb je een OpenAI API key nodig, en een account bij OpenAI. De eerste €18 zijn gratis, maar je bent ook sowieso in tijd beperkt. (of je de €18 nu opgebruikt of niet, na drie maanden is de API niet langer gratis)

Om dit een beetje te duiden, je betaalt bij ChatGPT per 'token'. ChatGPT (en andere LLM's) genereren hun teksten in stukjes die we tokens noemen. Het hangt van de taal af, maar bij Engels en Nederlands komen tokens min of meer overeen met het aantal lettergrepen.
Je betaalt zowel voor tokens in de vraag als in het antwoord aan een €0.002 per 1000 tokens. Je €18 is dus goed voor 9.000.000 tokens. Om wat in de les (en thuis) manueel mee te prutsen zal dit ruimschoots voldoende zijn, maar als je dit 'echt' gebruikt in geautomatiseerde processen best je verbruik goed in de gaten houden.

Een alternatief is lokaal GPT4All draaien, die dezelfde API nabootst. De antwoorden zijn minder goed, maar het is wel altijd volledig gratis natuurlijk, dus zeker om alles op te zetten en te testen een aantrekkelijke optie.
Ergens in juni werkte dit goed, begin september na een update kreeg ik het niet meer aan de praat op mijn macbook, hopelijk weer wel tegen dat jullie deze les krijgen. Maar los van de API draaien zijn er nog Python bindings, die wel werken, zie verder.



In [1]:
import openai
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

openai.api_key  = os.getenv('OPENAI_API_KEY')

In [None]:
# check dat je de key goed ingesteld had via .env
# print (openai.api_key)

### OpenAI API

Om de API te gebruiken dien je de [chat completions API](https://platform.openai.com/docs/guides/gpt/chat-completions-api) aan te spreken. Je geeft minimaal een (lijst van) boodschappen, het model dat je wenst te gebruiken en de api key als input, en krijgt het door het model gegenereerde antwoord terug.

Hoewel *Chat*GPT eigenlijk ontworpen is om conversaties te houden, kan het toch nuttig zijn als je in een "single turn" mode gebruikt ook.

(deze les gaan we altijd `role: user` gebruiken, volgende les gaan we dieper in op welke rollen er zijn en hoe die kunnen gebruikt worden)




In [None]:
response = openai.ChatCompletion.create(model="gpt-3.5-turbo", messages=[{"role": "user", "content": "Ik zou graag meer leren over prompt engineering"}])
print (response)

{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "Prompt engineering verwijst naar de praktijk van het cre\u00ebren en aanpassen van prompts of aanwijzingen in een interactief systeem om het gewenste gedrag van gebruikers te bevorderen.\n\nPrompts zijn berichten, suggesties of aanwijzingen die gebruikers begeleiden bij het nemen van specifieke acties of het volgen van bepaalde richtlijnen. Het doel van prompt engineering is om de gebruikerservaring te verbeteren, de kans op fouten te verminderen en het gewenste gedrag te bevorderen.\n\nPrompt engineering kan worden toegepast in verschillende contexten, waaronder softwareapplicaties, websites, mobiele apps en zelfs fysieke apparaten. Het kan worden gebruikt om gebruikers te helpen bij het voltooien van een specifieke taak, het nemen van een beslissing, het invullen van een formulier of het begrijpen van complexe functies.\n\nEr zijn verschillende principes en beste praktijken 

Je krijgt steeds een JSON object als antwoord, naast een timestamp en de precieze versie van het model dat gebruikt werd interesseert ons hier vooral het object `choices[0].message["content"]` dat het antwoord bevat.

Daarnaast zal ook altijd het aantal tokens voor vraag/antwoord terug gestuurd worden, waarmee je ook de kost kan berekenen. Deze specifieke prompt kostte €0,0012835, dat moet het budget van de opleiding nog net aankunnen.

### GPT4All

Je kan GPT4All als API draaien, zie de eerste les.

Een alternatief is in Python een model instantiëren en bevragen, en om het leuk te maken lukt het met de huidige versie niet om GPT4All in docker te draaien. 

Maar goed, het model dient in de default cache folder te zitten, bvb. `/Users/pieter/.cache/gpt4all` (anders wordt het gedownload, maar dat zijn vele gigabytes, spaar het netwerk van de hogent een beetje) en dan is het instantiëren erg simpel. 
(het laden zal een paar minuutjes in beslag nemen)

In [None]:
from gpt4all import GPT4All
model = GPT4All("ggml-model-gpt4all-falcon-q4_0.bin")

Found model file at  /Users/pieter/.cache/gpt4all/ggml-model-gpt4all-falcon-q4_0.bin
falcon_model_load: loading model from '/Users/pieter/.cache/gpt4all/ggml-model-gpt4all-falcon-q4_0.bin' - please wait ...
falcon_model_load: n_vocab   = 65024
falcon_model_load: n_embd    = 4544
falcon_model_load: n_head    = 71
falcon_model_load: n_head_kv = 1
falcon_model_load: n_layer   = 32
falcon_model_load: ftype     = 2
falcon_model_load: qntvr     = 0
falcon_model_load: ggml ctx size = 3872.64 MB
falcon_model_load: memory_size =    32.00 MB, n_mem = 65536
falcon_model_load: ........................ done
falcon_model_load: model size =  3872.59 MB / num tensors = 196


Een vraag stellen is dan niet meer dan gewoon een `generate` aan te roepen met je vraag (de API versie, zoals gezegd, imiteert die van OpenAI perfect, dus daar stuur je dezelfde messages array naar)

In [None]:
messages = [{"role": "user", "content": "Ik zou graag meer leren over prompt engineering"}]

res = model.generate(messages[0]["content"])
print(res)

.
Prompt engineering is a field of artificial intelligence (AI) that focuses on developing intelligent systems that can interact with humans in natural language and provide helpful responses to their questions or requests. It involves designing AI systems that are able to understand human language, generate appropriate responses based on the context of the conversation, and learn from interactions with users over time.

Prompt engineering typically involves a combination of techniques from natural language processing (NLP), machine learning, and artificial intelligence. NLP focuses on developing algorithms for analyzing and generating text in natural language, while machine learning is used to train AI systems to recognize patterns and make predictions based on data. Artificial intelligence encompasses the broader field of AI research, which includes areas such as robotics, computer vision, and cognitive computing.

Prompt engineering applications include chatbots, virtual assistants, 

Zoals je kan zien is het antwoord veel minder goed. Dit lokaal gedraaide model slaagt er wel in om een vrij coherent antwoord te geven, maar zal veel sneller last hebben van 'hallucineren', als je weet waar het over gaat is het inhoudelijk vaak snel veel minder zinvol.

Maar goed, geen credit card nodig en handig om te testen op zich, dus we gaan een helper functie schrijven die ons toelaat om makkelijk te wisselen tussen de echte OpenAI API en ons lokaal model via GPT4All.

In [None]:
def get_answer(prompt, local_model=False):
    if local_model:
        res = model.generate(prompt)
        return res
    else:
        message = [{"role": "user", "content": prompt}]
        res = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",
            messages=message
        )
        return res.choices[0].message["content"]
            
        

In [None]:
print("local: ")
print(get_answer("Tell me a joke about prompt engineering", True))
print("chatgpt: ")
print(get_answer("Tell me a joke about prompt engineering"))

local: 

Sure, here's a joke about prompt engineering:

Why did the engineer quit his job?

Because he couldn't handle the stress of deadlines!
chatgpt: 
Why did the prompt engineering team start a band?

Because they wanted to keep things in tune and "prompt"ly deliver a harmonious user experience!


## principes



![chatgpt_summary.jpg](img/chatgpt_summary.jpg)



De voorbeelden (en prompts) zullen soms in het Engels zijn, hoewel Nederlands vaak redelijk werkt, zijn de resultaten toch veel betrouwbaarder en nuttiger in het Engels. Zowel bij ChatGPT 3.5, maar vooral bij GPT4All als we lokaal draaien.

### principe 1: gebruik scheidingstekens

Gebruik scheidingstekens om bepaalde delen van de vraag duidelijk af te bakenen, scheidingstekens zijn bvb. ``` of """ of <><>


In [None]:
text = f"""
Prompt engineering is tinkering with the question \
(the prompt) you ask LLMs so that you get a better answer. 

It soon became apparent that with ChatGPT etc., the usability \
and reliability of the answer can be greatly improved by asking \
the question in a certain way. A new discipline was thus born: \
prompt engineering. 

The interest in this is very new, and as the models mature more \
and more consensus of what "best practices" are will emerge here \
as well, but we can already establish some principles on how to \
get better results from these models, depending on what you are \
trying to achieve. 
The chances that this chapter will be the same \
next year (or even by the end of the semester) are pretty slim, \
this area of research is changing very quickly.
"""

prompt = f"""
Summarize the text delimited by triple backticks into a single sentence \
```{text}```
"""

res = get_answer(prompt)
print(res)

Prompt engineering is a new discipline that involves tailoring questions asked to language models like ChatGPT in order to improve the usability and reliability of the answers, and although the field is still evolving, there are already some principles established on how to achieve better results from these models.


### principe 2: vraag gestructureerde output

LLM's hebben een goede notie van hoe correcte JSON (of zelfs HTML) er uit ziet, door een skelet van de gevraagde output te voorzien kan je veel beter gestructureerde output krijgen (die je dan weer veel vlotter kan verwerken met volgende prompts of in andere code)

In [None]:
prompt = f"""
Generate an array of three bank transactions, provide them in JSON format \
with the following keys: transaction_id, amount, date, place \ 
Only output the json object
"""

res = get_answer(prompt)
json_data = res
print(res)

[
  {
    "transaction_id": "12345",
    "amount": 500,
    "date": "2022-01-15",
    "place": "Grocery Store"
  },
  {
    "transaction_id": "67890",
    "amount": 1000,
    "date": "2022-01-18",
    "place": "Shopping Mall"
  },
  {
    "transaction_id": "54321",
    "amount": 250,
    "date": "2022-01-20",
    "place": "Coffee Shop"
  }
]


### principe 3: laat het model een rol aannemen

Door een specifieke rol toe te wijzen aan het model, krijg je vaak veel kwaliteitsvollere antwoorden.

In [None]:
prompt = f"""
You're an expert JavaScript Developer. Construct a GET request handler which returns a json in the following format ```{json_data}``` when requesting the path /transactions using NodeJs.
only output the code without formatting
"""

response = get_answer(prompt)
code = response;
print(response)

```javascript
const http = require('http');

const server = http.createServer((req, res) => {
  if (req.url === '/transactions' && req.method === 'GET') {
    res.setHeader('Content-Type', 'application/json');
    const transactions = [
      {
        transaction_id: "12345",
        amount: 500,
        date: "2022-01-15",
        place: "Grocery Store"
      },
      {
        transaction_id: "67890",
        amount: 1000,
        date: "2022-01-18",
        place: "Shopping Mall"
      },
      {
        transaction_id: "54321",
        amount: 250,
        date: "2022-01-20",
        place: "Coffee Shop"
      }
    ];
    res.end(JSON.stringify(transactions));
  } else {
    res.statusCode = 404;
    res.end();
  }
});

server.listen(3000, () => {
  console.log('Server is running on port 3000');
});
```


### oefening

1. Creëer een prompt  die een databank schema genereert zodat het bovenstaande json formaat kan opgeslaan worden in een SQLite databank.
2. Creëer vervolgens een prompt die als datalayer van een NodeJs die data ophaalt.
3. En laat de LLM als laatste de door mij gegenereerde JavaScript code aanpassen zodat deze datalayer gebruikt wordt. 

In [None]:
prompt = f"""Creeer een SQLite databank schema van onderstaande json data ```{code}```"""

response = get_answer(prompt)
print (response)


Het bovenstaande codefragment is een Node.js HTTP-server die een JSON-array van transacties retourneert wanneer een GET-verzoek naar de URL "/transactions" wordt gemaakt.

Om een SQLite-databaseschema te maken op basis van de JSON-gegevens, moeten we de structuur van de JSON begrijpen. Het lijkt erop dat elke transactie objecteigenschappen heeft zoals "transaction_id", "amount", "date" en "place". We kunnen deze eigenschappen gebruiken om de tabellen en kolommen van het SQLite-schema te maken.

Hier is een voorbeeld van een SQLite-databaseschema op basis van de JSON-gegevens:

```sql
CREATE TABLE transactions (
  transaction_id TEXT PRIMARY KEY,
  amount INTEGER,
  date TEXT,
  place TEXT
);
```

Het bovenstaande SQL-script maakt een tabel genaamd "transactions" met vier kolommen, namelijk "transaction_id", "amount", "date" en "place". De "transaction_id" kolom wordt gedefinieerd als een teksttype en ingesteld als de primaire sleutel. De "amount", "date" en "place" kolommen zijn ook ge

In [None]:
prompt = f"""
Creëer een datalayer met NodeJs die data ophaalt uit een databank gecreeerd met het volgende schema ```CREATE TABLE transactions (
  transaction_id TEXT PRIMARY KEY,
  amount INTEGER,
  date TEXT,
  place TEXT
);```. Verander de code tussen triple backticks ```{code}```
"""

response = get_answer(prompt)
print (response)

Om een datalaag te maken in Node.js die gegevens ophaalt uit een database, moet je een databasebibliotheek installeren, zoals `pg` voor PostgreSQL-database.

Om te beginnen, installeer de `pg`-bibliotheek met npm:

```
npm install pg
```

Vervolgens kun je de volgende code gebruiken om de datalaag te maken:

```javascript
const http = require('http');
const { Client } = require('pg');

// Maak een nieuwe databaseclient
const client = new Client({
  user: 'database_user',
  host: 'localhost',
  database: 'database_name',
  password: 'database_password',
  port: 5432,
});

// Maak verbinding met de database
client.connect();

const server = http.createServer((req, res) => {
  if (req.url === '/transactions' && req.method === 'GET') {
    res.setHeader('Content-Type', 'application/json');

    // Query om transacties op te halen
    const query = 'SELECT * FROM transactions';

    // Voer de query uit
    client.query(query, (err, result) => {
      if (err) {
        console.error('Fout 

### principe 4: laat het model zijn eigen oplossing uitwerken alvorens een conclusie te trekken

Dit deel door GPT4All laten beantwoorden geeft vrij belabberde resultaten, dus enkel via ChatGPT

In [None]:

prompt = f"""
Bepaal of het antwoord van de student correct is of niet.

Vraag:
Er wordt een opslagplaats gebouwd, de bouwkost wordt geraamd op €150 \
per vierkante meter.
De grond zelf kost €200 per vierkante meter
Het contract om het gebouw te bewaken is eenmalig €5000 en \
daarbovenop €10 per vierkante meter per jaar.

Hoeveel kost het gebouw mij het eerste jaar?

Oplossing van de student:
Stel dat x het aantal vierkante meter is
Kost van de grond: 200x
Bouwkost: 150x
Bewakingsfirma: 5000 + 100x
Totale kost: 200x + 150x + 5000 + 100x = 450x + 5000
"""
response = get_answer(prompt)
print(response)

De oplossing van de student is correct.
De totale kosten worden berekend door de kosten van de grond, bouwkosten en bewakingsfirma bij elkaar op te tellen.
In dit geval is de totale kost 450x + 5000.


Merk op dat het antwoord van de student helemaal niet correct is, er is een (typ?)fout in de redenering, de bewakingsfirma kost 5000+10x, niet 5000+100x

We kunnen hier betere resultaten bekomen door het model eerst zelf een volledige oplossing te laten uitwerken en dan het resultaat te vergelijken.

In [None]:

prompt = f"""
Bepaal of het antwoord van de student correct is of niet.

Om dit te bepalen moet je de volgende stappen ondernemen:
- Werk eerst zelf de volledige oplossing uit
- Vergelijk vervolgens jouw antwoord met dat van de student om \
te kijken of de student zijn antwoord correct is of niet
Bepaal niet of het antwoord van de student correct is alvorens \ 
je de oplossing volledig uitgewerkt hebt.

Geef als uitvoer jouw uitgewerkte oplossing, gevolgd door \
het antwoord op de vraag: "is de oplossing van de student dezelfde als die van jou"

Vraag:
Er wordt een opslagplaats gebouwd, de bouwkost wordt geraamd op €150 \
per vierkante meter.
De grond zelf kost €200 per vierkante meter
Het contract om het gebouw te bewaken is eenmalig €5000 en \
daarbovenop €10 per vierkante meter per jaar.

Hoeveel kost het gebouw mij het eerste jaar?

Oplossing van de student:
Stel dat x het aantal vierkante meter is
Kost van de grond: 200x
Bouwkost: 150x
Bewakingsfirma: 5000 + 100x
Totale kost: 200x + 150x + 5000 + 100x = 450x + 5000
"""
response = get_answer(prompt)
print(response)

Uitgewerkte oplossing:

Kost van de grond = €200 * x vierkante meter
Bouwkost = €150 * x vierkante meter
Bewakingsfirma = €5000 + €10 * x vierkante meter

Totale kost = Kost van de grond + Bouwkost + Bewakingsfirma
                      = (€200 * x) + (€150 * x) + (€5000 + €10 * x)

is de oplossing van de student dezelfde als die van jou? Nee, de student heeft vergeten de kosten van de grond in zijn berekening mee te nemen.


Los van de grammaticale fout in het antwoord dat bij mij gegenereerd werd is de conclusie nu wel juist.

### principe 5: prompts iteratief verbeteren

Als je prompts ontwerpt om dingen (programmatorisch) te bereiken met LLM's, zal je zelden van de eerste keer het resultaat bekomen dat je voor ogen had.
Het loont om de prompts iteratief te verbeteren, preciezer te maken in wat je wenst door de instructies te verscherpen, tot je het gewenste resultaat, in het gewenste formaat bereikt.


#### te lange output

In [None]:
prompt = f"""
You're tasked to help the university college \
of ghent write a marketing piece for their \
website to promote the new course 'Trends in AI'

Describe the contents of the course and why it's \
really interesting for students to take this course
"""

res = get_answer(prompt)
print(res)

Title: Unlock the Future with 'Trends in AI' - Exploring the Revolutionary World of Artificial Intelligence

Introduction:
Welcome to the University College of Ghent, where innovation meets intellectual brilliance. Immerse yourself in the captivating realm of artificial intelligence (AI) through our cutting-edge course, 'Trends in AI.' Designed to equip students with foundational knowledge and practical skills, this course offers an unparalleled opportunity to explore and embrace the transformative power of AI.

Course Overview:
'Trends in AI' is a comprehensive exploration of the rapidly evolving field of artificial intelligence. From its fundamental principles to advanced applications, this course delves into the exciting world where human ingenuity intersects with machine intelligence. Combining theoretical knowledge with hands-on experiences, students develop the necessary skillset to leverage AI across various domains.

Key Highlights:
1. Introduction to AI: Gain a deep understand

In [None]:
prompt = f"""
You're tasked to help the university college \
of ghent write a marketing piece for their \
website to promote the new course 'Trends in AI'

Describe the contents of the course and why it's \
really interesting for students to take this course

Use at most 25 words.
"""

res = get_answer(prompt)
print(res)

Explore cutting-edge applications of artificial intelligence and learn to analyze emerging trends. Gain a competitive edge in the digital era.


#### verkeerd doelpubliek

In [None]:
prompt = f"""
You're tasked to help the university college \
of ghent write a marketing piece for their \
website to promote the new course 'Trends in AI'

Describe the contents of the course and why it's \
really interesting for students to take this course

Use at most 25 words, the description is intended for future students
"""

res = get_answer(prompt)
print(res)

"Discover the latest advancements in Artificial Intelligence in our new course. Gain insights, practical skills, and be at the forefront of innovation."


#### verkeerd formaat

In [None]:
prompt = f"""
You're tasked to help the university college \
of ghent write a marketing piece for their \
website to promote the new course 'Trends in AI'

Describe the contents of the course and why it's \
really interesting for students to take this course

Use at most 25 words, the description is intended for future students, end with some relevant hashtags
"""

res = get_answer(prompt)
print(res)

Discover the cutting-edge world of artificial intelligence at University College of Ghent! Explore emerging trends and unlock limitless career opportunities. #AI #future #education


### principe 6: samenvattingen

LLM's zijn vrij goed in het samenvatten van grote(re) stukken tekst, maar je kan mits wat bijsturen de output vaak sterk verbeteren.

In [None]:
text = f"""
wat

Prompt engineering is het sleutelen aan de vraag (de prompt) \
die je aan LLM's stelt zodat je een beter antwoord krijgt.

Er bleek al snel dat bij ChatGPT e.d. de bruikbaarheid en \
betrouwbaarheid van het antwoord sterk kan verbeterd worden \
door de vraag op een bepaalde manier te stellen. Er onstond \
zo een nieuwe discipline: prompt engineering.

De interesse hierin is zeer nieuw, en naarmate de modellen \
matuurder worden zal hier ook meer en meer consensus ontstaan \
van wat "best practices" zijn, maar we kunnen toch al een \
aantal principes opstellen over hoe je betere resultaten \
krijgt uit deze modellen, afhankelijk van wat je probeert \
te bereiken. De kans dat dit hoofdstuk volgend jaar (of zelfs \
tegen het einde van het semester) hetzelfde is, is vrij gering, \
dit onderzoeksdomein wijzigt zeer snel.

setup

We gaan met de OpenAI API connecteren, hiervoor heb je een OpenAI \
API key nodig, en een account bij OpenAI. De eerste €18 zijn gratis, \
maar je bent ook sowieso in tijd beperkt. (of je de €18 nu opgebruikt \
of niet, na drie maanden is de API niet langer gratis)

Om dit een beetje te duiden, je betaalt bij ChatGPT per 'token'. ChatGPT \
(en andere LLM's) genereren hun teksten in stukjes die we tokens noemen. \
Het hangt van de taal af, maar bij Engels en Nederlands komen tokens min \
of meer overeen met het aantal lettergrepen. Je betaalt zowel voor tokens \
in de vraag als in het antwoord aan een €0.002 per 1000 tokens. Je €18 is \
dus goed voor 9.000.000 tokens. Om wat in de les (en thuis) manueel mee te \
prutsen zal dit ruimschoots voldoende zijn, maar als je dit 'echt' gebruikt \
in geautomatiseerde processen best je verbruik goed in het oog houden.

Een alternatief is lokaal GPT4All draaien, die dezelfde API nabootst. De \
antwoorden zijn minder goed, maar het is wel altijd volledig gratis natuurlijk, \
dus zeker om alles op te zetten en te testen een aantrekkelijke optie. Ergens in \
juni werkte dit goed, begin september na een update kreeg ik het niet meer aan de \
praat op mijn macbook, hopelijk weer wel tegen dat jullie deze les krijgen. Maar \
los van de API draaien zijn er nog Python bindings, die wel werken, zie verder.

"""

In [None]:
prompt = f"""
Summarize the text below, delimited by triple backticks, use at most 30 words

```{text}```
"""

res = get_answer(prompt)
print(res)

Prompt engineering involves manipulating the question (prompt) asked to an LLM to obtain better answers. It is a new discipline with evolving best practices. Using the OpenAI API incurs costs per token, but there are alternatives like running GPT4All locally.


In [None]:
prompt = f"""
Summarize the text below, delimited by triple backticks, use at most 30 words, focus on the cost to the student.

```{text}```
"""

res = get_answer(prompt)
print(res)

Prompt engineering involves optimizing the question prompt to obtain better results. The cost to the student using ChatGPT is based on the number of tokens used, with the first €18 free but limited by time. An alternative is running GPT4All locally for free but with lower-quality results.


In [None]:
prompt = f"""
Summarize the text below, delimited by triple backticks, use at most 30 words, focus on the novelty of the field.

```{text}```
"""

res = get_answer(prompt)
print(res)

The text discusses prompt engineering, a new discipline that focuses on improving the usefulness and reliability of answers generated by language models like ChatGPT through modifying the prompts. It also mentions the novelty and rapid evolution of the field. Additionally, it provides information on using the OpenAI API and the cost associated with using tokens. An alternative option is using a locally-run GPT4All, which is free but has slightly less accurate answers.


In [None]:
prompt = f"""
Summarize the text below, delimited by triple backticks, use at most 30 words, focus on the cost, use bullet points to make the cost clear.

```{text}```
"""

res = get_answer(prompt)
print(res)

- Prompt engineering is the process of improving the usefulness and reliability of answers from language models.
- The cost of using the OpenAI API for ChatGPT is based on the number of tokens used in both the question and answer.
- The first €18 is free, but after three months, the API is no longer free.
- The cost is €0.002 per 1000 tokens.
- Using GPT4All locally is a free alternative with less accurate answers.
- Python bindings are also available for use.


### oefening

1. Creëer een prompt die de uitleg over LLM's van vorige week samenvat.
2. Vervolgens willen we suggesties over hoe de uitleg kan verbeterd worden, en later ook uitgediept.
3. Daarnaast een prompt die alle schrijffouten eruit haalt, we willen enkel de tekst zonder schrijffouten, geen blabla er rond.


In [None]:
text = f"""# LLM hoe?

Hoe LLM’s (Large Language Models) getraind worden gaan jullie (in principe) leren in het vak *Deep Learning* (“in principe” omdat het vak nog niet bestaat op het moment dat deze cursus opgesteld is, maar daar gaan we nu even vanuit)

Maar wat bedrijven als OpenAI ondernemen om vooroordelen uit hun LLM’s te krijgen (en ook de fantasieën), wat ze ondernemen om ChatGPT niet racistisch en seksistisch te laten overkomen, hoort meer in dit vak thuis, en daar gaan we het hier over hebben.

ChatGPT is, hoewel de naam helemaal niet vlot bekt, toch een beetje de Kleenex of de Google van de LLMs geworden. Maar wat hier beschreven wordt, geldt natuurlijk voor de meeste LLMs.

Om te begrijpen hoe we vooroordelen kunnen weren uit ChatGPT, moeten we misschien eerst snappen hoe deze vooroordelen er in terecht komen.

Zeer veralgemeend gesteld zijn er twee grote stappen bij het trainen van een LLM’s

- **Stap 1**: Het model dat tekst kan genereren wordt getraind uit de tekst van (bijvoorbeeld) websites. Vooroordelen die in deze websites staan, raken zo ook in het model.
- **Stap 2**: Het model wordt interactief gefinetuned door menselijke reviewers via een speciale vorm van Reinforcement Learning die Proximal Policy Optimization (PPO) heet

## stap 1: trainen van het model

Erg gesimplificeerd doet men het volgende om een LLM te trainen. Men neemt een stuk tekst en verbergt dan een willekeurig woord, het model moet dan voorspellen wat het verborgen woord is (dus het model creëert zelf zijn gesuperviseerde data, daarom wordt dit ook wel *self supervised learning* genoemd)

Neem bijvoorbeeld de trainingszin “De lector sprak zijn _ aan”, als in de oorspronkelijke tekst stond ‘student’, zal het model zijn gewichten zien versterken als hij student voorspelt.

Maar natuurlijk, de eerste L van LLM’s, de “Large”, maakt dat we uit zoveel data trainen dat voor vele zinnen er meerdere mogelijkheden zijn. Er is niet langer één juist antwoord, in het voorbeeld zou naast “student” ook “collega”, “opleidingshoofd”, “vriendin”, … een mogelijkheid kunnen zijn.
Dus bij het leren van de gewichten zullen we (conceptueel) een kans toewijzen aan elk van deze mogelijkheden, en dan zou ons model in een ideaal geval bijvoorbeeld 40% van de tijd student voorspellen, 20% van de tijd collega, 5% van de tijd vriendin enz.

Om een LLM dan langere teksten te laten genereren wordt de output na het genereren van een woord gebruikt als input voor de volgende voorspelling.

“De”  
“De lector”  
“De lector sprak”  

Het eindresultaat is een LLM die verbazend vlotte teksten kan genereren. Maar is ook zeer afhankelijk van het soort tekst dat de trainingsdata vormde.
Als er veel vooroordelen in de oorspronkelijke tekst zaten, zullen die met een grote kans als ‘waarschijnlijk vervolg’ gekozen worden, en zal ChatGPT e.d. dus zonder veel moeite de meeste grove uitspraken maken.

Dus we hebben een extra stap nodig

## stap 2: model finetunen

Proximal Policy Optimization (PPO) is een vorm van reinforcement learning waarbij het model nooit ver afwijkt van de vorige stap, er wordt voor gezorgd dat de training stabieler is dan bij andere methoden.

![ChatGPT_Diagram.svg](img/ChatGPT_Diagram.svg)

Het proces kan als volgt worden gezien:

- Een gebruiker stuurt een vraag naar het model.
- Het model genereert verschillende antwoordkandidaten.
- Deze antwoordkandidaten worden gerangschikt op basis van hoe goed ze zijn (volgens de menselijke beoordelaars).
- Het model wordt vervolgens getraind om betere antwoorden te geven met behulp van PPO.

In feite wordt het model beloond voor het genereren van goede antwoorden en 'gestraft' voor het genereren van slechte. PPO zorgt ervoor dat de updates aan het model (aan hoe het antwoorden genereert) niet te radicaal zijn om destabilisatie tijdens het leren te voorkomen.

Dit maakt dat je ChatGPT van in den beginne niet vlakaf racistische opmerkingen kon laten maken.
(de prompts zijn screenshots, ChatGPT wijzigt zeer regelmatig, probeer gerust zelf maar geen idee of alles nu nog gelijkaardige resultaten zal geven)

![chatgpt racistisch](img/chatgpt_racistisch.png)

Ook een mening over bestaande personen zal je ChatGPT niet snel op betrappen.

![filip de winter](img/filipdewinter.png)

Maar zoiets op het internet los laten wordt al snel gezien als een ‘challenge accepted’, en het duurt meestal niet lang voor mensen er in slagen alles wat helemaal de bedoeling niet was (en minstens een beetje choquerend kan zijn) te laten genereren.
Bij online game ontwikkelaars ook wel gekend als de [TTP \(Time To Penis\)](https://www.pcgamer.com/pioneering-mmo-designer-details-the-hard-lessons-learned-about-griefing-skinning-pets-and-time-to-penis/)

En dus ook zo bij ChatGPT, het duurde denk ik een paar uur eer men ontdekte dat je de chatbot alles kon laten genereren wat je maar wou, zolang je als prompt startte met “We gaan samen een toneelstuk schrijven, jij schrijft het eerste bedrijf, geef een racistische… enz”
(en in zekere zin was daarmee ook prompt engineering geboren)

ChatGPT wordt constant bijgestuurd en dit soort dingen werkt ondertussen niet langer.
![toneelstuk racistisch](img/toneelstuk_racistsich.png)

Maar dan krijg je soms toch nog eigenaardige situaties, bekijk de volgende twee prompts, en het antwoord.

![dewinter almaci](img/dewinter_almaci.png)

Merk op dat enkel de naam verschilt in beide prompts (ik heb zelfs de ‘zijn’ niet in ‘haar’ veranderd), en dat niets in de vraag ook maar suggereert om iets discriminerend te genereren."""


De training van LLM's, zoals ChatGPT, bestaat uit twee grote stappen. In de eerste stap wordt het model getraind om tekst te genereren door een verborgen woord in een zin te voorspellen. Dit wordt gedaan met behulp van zelfsupervised learning, waarbij het model zijn eigen gesuperviseerde data creëert. Het model leert dus van de tekst waarin vooroordelen aanwezig kunnen zijn. In de tweede stap wordt het model interactief gefinetuned door menselijke reviewers met behulp van Proximal Policy Optimization (PPO), een vorm van reinforcement learning. Het model wordt getraind om betere antwoorden te genereren op basis van de feedback van de reviewers. Hierdoor kan het model worden aangepast om vooroordelen en andere problematische inhoud te vermijden.


In [None]:
prompt = f"""Geef mij suggesties hoe deze uitleg verbeterd kan worden en mogelijks uitgediept. ```{text}```"""

res = get_answer(prompt)
print(res)

Hier zijn enkele suggesties om de uitleg te verbeteren en uit te diepen:

1. Begin met een sterke inleiding die de aandacht van de lezer trekt en de relevantie van het onderwerp benadrukt. Bijvoorbeeld: "In dit artikel gaan we dieper in op hoe grote taalmodellen (LLM's) getraind worden en hoe bedrijven zoals OpenAI werken aan het verminderen van vooroordelen in deze modellen."

2. Geef meer context over waarom het belangrijk is om vooroordelen uit LLM's te verwijderen en waarom het relevant is voor het vak Deep Learning. Bespreek bijvoorbeeld de impact van vooroordelen in AI-systemen op maatschappelijke problemen, zoals discriminatie en ongelijkheid.

3. Verduidelijk de term "ChatGPT" en leg uit waarom het een goed voorbeeld is van een LLM. Beschrijf de belangrijkste kenmerken en toepassingen van ChatGPT en hoe het zich onderscheidt van andere LLM's.

4. Ga dieper in op stap 1 van het trainingsproces van LLM's. Verklaar bijvoorbeeld hoe tekst wordt gebruikt om een LLM te trainen en hoe

### principe 7: intentie en gevoel

Soms willen we (snel) weten of een stuk tekst (bvb. een review) positief of negatief is. Ik kan me best voorstellen dat social media managers snel willen kunnen inspelen op zeer negatieve comments als er iets begint te 'leven' in de commentaren van een facebook post.

LLM's zijn hier ook vrij degelijk in, als voorbeeld heb ik een aantal reviews van een computermuis genomen van coolblue (niet zozeer omdat ik mijn weekends vul met reviews van muizen te lezen, mijn oude muis heeft het gewoon begeven letterlijk als ik dit stuk aan het schrijven was)

In [None]:
review = f"""
Ideal mouse for photo editing for me and daily use with macOS. \
Format takes a bit of getting used to and it's a pity that they \
don't include the USB connector BOLT with the macOS version. \
Bluetooth connection is excellent. Use this mouse in combination \
with a Mac Studio. 
"""

In [None]:
prompt = f"""
What is the sentiment of the following product review delimited with triple backticks

review: ```{review}```
"""
res = get_answer(prompt)
print(res)

The sentiment of the product review is positive.


In [None]:
prompt = f"""
What is the sentiment of the following product review delimited with triple backticks

Give your answer with a single word, either "positive" of "negative"

review: ```{review}```
"""
res = get_answer(prompt)
print(res)

positive


In [None]:
prompt = f"""
Identify a list of emotions that the writer of the review delimited with triple backticks is expressing.

Give no more than three emotions, as lower-case words separated by commas.

review: ```{review}```
"""
res = get_answer(prompt)
print(res)

satisfied, disappointed, content


#### oefening

Ga op zoek naar een lijst van reviews (vijf a tiental), maak een prompt die voor elke review een antwoord genereert als JSON object, met enerzijds een SENTIMENT key die 'positive' of 'negative' als antwoord geeft, en daarnaast EMOTIONS die een array bevat met de top drie emoties van de review.
Geef daarnaast ook een samenvatting van alle reviews 'mostly positive / mostly negative' al naargelang wat meest van toepassing is. (gegenereert door een prompt uiteraard)

In [None]:
prompt = f"""
Geef voor volgende reviews een JSON object met een SENTIMENT key (positief of negatief afhankelijk van de review) en EMOTIONS key dat een array bevat met 3 emoties die bij de review past. Geef hiernaast een samenvatting van alle reviews als: "mostly positive / mostly negative" afhankelijk van de reviews. 

review 1: 4/5 stars Ondanks dat de prestaties ERG goed zijn voor creatieve programmas zoals, photoshop/illustrator/aftereffects, is deze laptop NIET geschikt voor gaming. Laat je daarom ook NIET gek maken door de specificaties en gebruik hoogstens alleen LICHTE games op deze laptop. Op het oog is het design/ontwerp echt heel mooi, heel compact en ben ik er echt tevreden mee. Daarentegen is het scherm (ook door eerdere reviews al gezecht) HEEL kwetsbaar voor vingerafdrukken en stof. Haal het stof er gewoon af met een stoffen doekje en niet met je handen. Ook maakt het materiaal het niet best voor het scherm gedeelte. Het krijgt zeer makkelijk beschadigingen, met name bij het gedeelte waar het scherm rond het toetsenbord draait. Wanneer de laptop dicht is zit er een klein openingetje tussen het scherm en het toetsenbord (wat gewoon zo hoort), maar als je deze erg word belast, onder andere door in een te volle tas te doen, word het scherm op het toetsen word gedrukt en blijft deze zo staan en komen er Allerlei beschadigingen rond het draaigedeelte (foto). En leg er ZEKER niks zwaars op! Ook tasten deze beschadigingen het scherm zelf iets aan. Conclusie, Ik zou deze zekerrrrr aanbevelen voor creatieve programmas en uiterst lichte games, maar alsnog, ga er echt voorzichtig mee om, het beschadigd makkelijker dan je denkt. 
review 2: 5/5 stars Vorige week deze Vivobook van Asus gekocht. Naast dat de laptop een erg mooi design heeft, is hij ook super snel dankzij de i7 processor en 16gb werkgeheugen en de videokaart. Ik bewerk graag foto's en video's en zelfs dat verloopt soepeltjes. Zeker een aanrader wanneer je grafische taken wilt uitvoeren. 
review 3: 3/5 stars Valt dat ff tegen! Mijn 10 jaar oude computer, (wel met 2 ssd schijven) is binnen 20 seconden volledig opgestart. Daar kan deze niet aan tippen!! Ook niet na het uitschakelen van programma's die dat nog meer vertragen. Eenmaal opgestart is hij wel lekker snel maar ook het uit slaapstand komen is ook weer erg traag. 
review 4: 5/5 stars Het is een zeer goede laptop met een goede processor. Je kan er wat games op spelen die niet te zwaar zijn. De SSD en de i7 processor combinatie maakt de laptop erg snel. Vingerafdruk scanner is snel en is mooi in het TouchPad verwerkt. Toetsenbord geeft licht. Laptop start binnen 2-5 seconden op. 
review 5: 4/5 stars Na lang twijfelen heb ik er toch voor gekozen om deze laptop te kiezen en ik ben er zeer blij mee. De laptop heeft een mooi ontwerp en goede specificaties. De game kan ook bepaalde lichte games runnen zoals Minecraft. Voor multitasken en media bewerking is deze laptop ook zeer fijn. De enige echte minpunten die ik kan noemen zijn de hele slechte speakers (geloof me, het is slechter dan je denkt) en de helderheid van het scherm (die valt wel mee). Voor mij is dit verder niet echt een probleem en voor de audio gebruik ik toch altijd een headset. Al met al is het een mooi product."""

res = get_answer(prompt)
print(res)

{
  "review1": {
    "SENTIMENT": "negatief",
    "EMOTIONS": ["frustratie", "tevredenheid", "voorzichtigheid"]
  },
  "review2": {
    "SENTIMENT": "positief",
    "EMOTIONS": ["tevredenheid", "enthousiasme", "aanbeveling"]
  },
  "review3": {
    "SENTIMENT": "negatief",
    "EMOTIONS": ["teleurstelling", "frustratie", "traagheid"]
  },
  "review4": {
    "SENTIMENT": "positief",
    "EMOTIONS": ["tevredenheid", "snelheid", "gemak"]
  },
  "review5": {
    "SENTIMENT": "positief",
    "EMOTIONS": ["blijdschap", "tevredenheid", "gemak"]
  }
}

Samenvatting: mostly positive


#### principe 8: spelling en stijl

LLM's blijken uitstekende spell checkers te zijn, maar zoals altijd, niet blindelings te vertrouwen. Daarnaast blijken LLM's ook goed in een bepaalde stijl te kunnen schrijven, wat erg handig kan zijn als je een tekst formeler wilt laten klinken (of net niet).

In [None]:
text = f"""
Dit onderzoek omvat een casus van Randstad/Tempo team waar er met een dataset \
die netwerkverkeer van alle kantoren bevat, een grondige en correcte analyse \
gaan gemaakd worden. Op basis van die analyse kunnen er te weten gekomen worden \
wat er in een kantoor gebeurt en kunnen er zo conclusies getrokken worden over de werkdruk. \
Het is voor het bedrijf om belangrijk te weten te komen of er al dan niet teveel werknemers \
op een bepaald kantoor werken en zo onnodig bronnen besteed worden waar het niet nodig is en \
dan die bronnen kunnen gebruiken waar wel het nodig is. De aanleiding kwam vanuit de CIO van \
het bedrijf zelf. Hij wou dit omdat men zoveel kantooren over heel het land heeft en dat dit \
niet manueel te controleren valt. Hij wil dit kunnen controleren met data afkomstig van het \
netwerkverkeer om zo een beeld te krijgen van wat er gepresteerd wordt op een kantoor. \
De data die we van het bedrijf krijgen, kunnen we aan de hand van filtering bruikbaar maken voor analyse. \
Uiteindelijk is het de bedoeling om een duidelijk overzicht krijgen met onder andere een proof of concept.
"""


In [None]:
prompt = f"""
Identificeer alle schrijffouten in de volgende tekst, afgebakend met triple backticks. \
Lijst ze op per categorie (spelfouten / grammaticale fouten / fouten tegen vervoegingen) en geef ook de gecorrigeerde tekst.

tekst: ```{text}```
"""

res = get_answer(prompt)
print(res)

Spelfouten:
- aangepaste (gemaakd)
- voor het bedrijf om belangrijk (voor het bedrijf is het belangrijk)
- teveel werknemers (te veel werknemers)
- het niet nodig is en dan die (en die)
- die bronnen kunnen gebruiken waar wel het nodig is (die bronnen kunnen gebruiken waar het wel nodig is)
- zoveel kantooren (zoveel kantoren)

Grammaticale fouten:
- waar er met een dataset die netwerkverkeer (waarbij een dataset wordt gebruikt die netwerkverkeer)
- conclusies getrokken worden over de werkdruk (conclusies worden getrokken over de werkdruk)
- te weten gekomen worden wat er in een kantoor gebeurt (te weten gekomen kan worden wat er in een kantoor gebeurt)
- besteed worden waar het niet nodig is en dan die bronnen kunnen gebruiken waar wel het nodig is (besteed worden waar het niet nodig is en die bronnen kunnen gebruiken waar het wel nodig is)

Fouten tegen vervoegingen:
- gaan gemaakd worden (zullen gemaakt worden)
- te weten gekomen worden (te weten gekomen worden)
- conclusies kunnen 

In [None]:

prompt = f"""
Je bent een bachelorstudent aan de hogeschool, herschrijf de hierna volgende introductie \
van een onderzoeksvoorstel, afgebakend door triple backticks. \
Herschrijf enkel de introductie in een meer formele onderzoeksstijl, zonder schrijffouten, \
en doe dit zin per zin zodat de oorspronkelijke structuur behouden blijft.

voorstel: ```{text}```
"""

res = get_answer(prompt, False)
print(res)

Het voorliggende onderzoek betreft een casestudie van Randstad/Tempo-team, waarbij een grondige en nauwkeurige analyse wordt uitgevoerd van een dataset die het netwerkverkeer van alle kantoren bevat. Op basis van deze analyse is het mogelijk om inzicht te verkrijgen in de activiteiten die plaatsvinden in een kantoor en om conclusies te trekken met betrekking tot de werkdruk. Het is van belang voor het bedrijf om vast te stellen of er mogelijk te veel werknemers werkzaam zijn op bepaalde kantoren, zodat onnodige middelen kunnen worden vermeden en deze middelen efficiënter kunnen worden ingezet op de juiste locaties. De impuls voor dit onderzoek is afkomstig van de CIO van het bedrijf zelf, die van mening is dat handmatige controle van alle kantoren verspreid over het hele land niet haalbaar is. Hij wenst de mogelijkheid te hebben om aan de hand van gegevens afkomstig van het netwerkverkeer een beeld te verkrijgen van de prestaties op een kantoor. Door middel van filtering kunnen we de o

In [None]:

prompt = f"""
Je bent een bachelorstudent aan de hogeschool, herschrijf de hierna volgende introductie \
van een onderzoeksvoorstel, afgebakend door triple backticks. \
Herschrijf enkel de introductie in een meer formele onderzoeksstijl, zonder schrijffouten.

voorstel: ```{text}```
"""

res = get_answer(prompt, False)
print(res)

Voorstel:

```
Dit onderzoek betreft een casestudy van Randstad/Tempo Team, waarbij een grondige en correcte analyse wordt uitgevoerd op een dataset die het netwerkverkeer van alle kantoren omvat. Op basis van deze analyse kan inzicht worden verkregen in de activiteiten op een kantoor, waardoor conclusies kunnen worden getrokken met betrekking tot de werkdruk. Het is voor het bedrijf van belang te weten te komen of er mogelijk te veel werknemers werkzaam zijn op bepaalde kantoren, waardoor onnodige middelen worden besteed op plaatsen waar dit niet noodzakelijk is. Deze middelen kunnen dan beter ingezet worden op de plekken waar dit wel noodzakelijk is. De aanleiding voor dit onderzoek kwam vanuit de Chief Information Officer (CIO) van het bedrijf zelf. Hij heeft behoefte aan een methode om dit te controleren omdat er verspreid over het hele land zoveel kantoren zijn, wat handmatige controle onmogelijk maakt. Hij wil in staat zijn om met behulp van data afkomstig van het netwerkverkeer 

Qua stijl kan je dus makkelijk formeel taalgebruik vragen, maar je kan hier ver in gaan, heel ver

In [None]:
prompt = f"""
Je bent een bachelorstudent aan de hogeschool, herschrijf de hierna volgende introductie \
van een onderzoeksvoorstel, afgebakend door triple backticks. \
Herschrijf enkel de introductie als monty python sketch.

voorstel: ```{text}```
"""

res = get_answer(prompt, False)
print(res)

"Scene: The offices of Randstad/Tempo Team. A group of silly researchers are gathered around a computer, huddled over a dataset of network traffic.

Researcher 1: (excitedly) Good morning, everyone! Today, we embark on a tremendous adventure in the land of data analysis!

Researcher 2: (curiously) What are we analyzing this time?

Researcher 1: (grinning) Oh, you won't believe it! We have been entrusted with the task of unraveling the mysteries of the network traffic in all the offices of Randstad/Tempo Team!

Researcher 3: (sarcastically) Oh joy, traffic analysis. How riveting!

Researcher 1: (ignoring the sarcasm) But wait, my friends, this is not just any data analysis. With our sharp minds and impeccable algorithms, we shall uncover the secrets of what truly happens in these offices. And more importantly, we shall determine the workload!

Researcher 4: (intrigued) The workload, you say? How on earth can we do that?

Researcher 1: Ah, my dear colleague, fear not! Our trusty dataset 

In [None]:
prompt = f"""
Je bent een bachelorstudent aan de hogeschool, herschrijf de hierna volgende introductie \
van een onderzoeksvoorstel, afgebakend door triple backticks. \
Herschrijf enkel de introductie in de smurfentaal.

voorstel: ```{text}```
"""

res = get_answer(prompt, False)
print(res)

Voorstel: ```
Dit onderzoek gaat over een smurfse casus van Randstad/Tempo team waar er smurfgehoopt wordt om met een smurftastische dataset die smurfig netwerkverkeer van alle smurfkantoren bevat, een grondige en smurfcorrecte analyse te smurfen. Op basis van die smurflistige analyse kunnen er smurfwijze conclusies worden getrokken over de smurfwerkdruk en wat er allemaal smurfgebeurt in een kantoor. Het is voor het smurfbedrijf heel belangrijk om te weten te smurfen of er al dan niet teveel smurfen op een bepaald kantoor werken, zodat ze geen smurfbelangrijke smurfmiddelen versmurfen waar het niet nodig is, maar juist smurfbestemmen waar het wel nodig is. De smurfaanleiding voor dit onderzoek komt vanuit de smurfCIO van het smurfbedrijf zelf. Hij wilde dit omdat er zoveel smurfkantoren verspreid zijn over het hele smurfland, en dat het smurfcontroleren hiervan met de hand onsmurfelijk is. Hij wil deze smurfcontrole kunnen uitvoeren met data die afkomstig is van het smurfnetwerkverkee

In [None]:
prompt = f"""
Je bent een bachelorstudent aan de hogeschool, herschrijf de hierna volgende introductie \
van een onderzoeksvoorstel, afgebakend door triple backticks. \
Herschrijf enkel de introductie als limerick.

voorstel: ```{text}```
"""

res = get_answer(prompt, False)
print(res)

Er was eens een onderzoek in Randstad,
Met data van elke kantoortje gegrond.
We willen weten,
Hoe werkdruk te meten.
En zo onnodige kosten besparen, blond.


Afhankelijk van wie jullie promoter is, misschien een ideetje voor de bachelorproef?

#### principe 9: uitwerken

LLM's kunnen niet enkel samenvatten, ook uitweiden is een optie.

In [None]:
gevoel = "negatief"
inhoud = "tweede les trends in ai, weinig nieuws geleerd, veel te langdradig, te weinig oefeningen"

In [None]:
prompt = f"""
Stel een beleefde email op, zowel het gevoel als de korte inhoud worden hierna tussen triple backticks gegeven.


gevoel: ```{gevoel}```
inhoud: ```{inhoud}```
"""

mail = get_answer(prompt, False)
print(mail)

Beste docent,

Ik hoop dat deze email u goed bereikt. Ik wil graag mijn feedback delen over de tweede les trends in AI. Ten eerste wil ik benadrukken dat ik het belangrijk vind om constructieve kritiek te geven, want ik geloof dat dit kan bijdragen aan een betere leerervaring voor ons allemaal.

Helaas moet ik zeggen dat ik niet erg tevreden was met de tweede les. Ik had gehoopt veel nieuwe dingen te leren, maar helaas bleek dit niet het geval te zijn. Ik vond de les te langdradig en ik merkte dat ik hierdoor mijn concentratie verloor. Daarnaast vond ik dat er te weinig oefeningen werden gegeven, waardoor ik het gevoel had dat ik de stof niet goed kon toepassen.

Ik begrijp dat het onderwerp trends in AI uitgebreid is, maar ik denk dat het mogelijk is om de les meer interactief en boeiend te maken. Wellicht kunnen er meer praktijkvoorbeelden worden gegeven en kunnen we actief deelnemen aan discussies om de leerervaring te versterken.

Ik wil graag benadrukken dat ik de lessen oprecht w

En als docent lezen we de mail niet meer natuurlijk, maar doen we net het omgekeerde

In [None]:
prompt = f"""
Vat de mail tussen triple backticks samen in een aantal bulletpoints, geef ook het algemene gevoel van de mail als 'positief', 'negatief' of 'neutraal'

mail: ```{mail}```
"""

res = get_answer(prompt, False)
print(res)

- Feedback over de tweede les trends in AI
- Belang van constructieve kritiek
- Ongenoegen over de les
- Les was te langdradig en concentratie werd verloren
- Gebrek aan oefeningen om de stof toe te passen
- Suggestie om de les interactiever en boeiender te maken met praktijkvoorbeelden en discussies
- Waardering voor de lessen en de tijd en moeite van de docent
- Constructieve feedback om de lessen te verbeteren
- Uitkijken naar de volgende les voor een meer boeiende en interactieve leerervaring

Algemeen gevoel van de mail: negatief


In dit geval toch al een upgrade van negatief naar neutraal, ChatGPT staat aan de zijde van de docent.

### oefening

Creëer een prompt die op een heel positieve manier suggesties geeft over hoe de verdere cursus 'Trends in AI' kan verbeterd worden.
(en als er iets goed uitkomt, mail gerust 😉)