<img src="../.images/bannerugentdwengo.png" alt="Banner" style="width:500px;"/>

# Soorten chatbots
Sommige robots worden geprogrammeerd met een set regels, ze volgen als het ware een script.
Die robots zijn een beetje als een onine enquête, nuttig en eenvoudig, maar niet heel flexibel.
We noemen ze *regelgebaseerde* chatbots.

Een tweede grote groep zijn de lerende chatbots. Deze hebben steeds een (grote) hoeveelheid voorbeeldtekst nodig
die ze analyseren en waaruit ze leren hoe een conversatie werkt. Het leren zelf kan op vele manieren gebeuren;
sommige bots zullen een basiskennis van taal hebben en dus bijvoorbeeld snappen dat "katje" en "kat" grotendeels hetzelfde is.

Sommige lerende chatbots (zoals bijvoorbeeld GPT-2) gebruiken *deep learning* om echt te begrijpen hoe taal werkt en wat het beste antwoord is.
Deze chatbots kunnen volledig nieuwe antwoorden verzinnen.

De soort die wij gebruiken is een simpele *retrievalgebaseerde* robot. Deze slaat alle tekst uit een conversatie op,
en gaat dan bij elke vraag zoeken in de database welke gekende vraag daar het meeste op lijkt.

# Waarom chatbots
Er zijn weinig mensen die echt graag met vreemden praten om iets te regelen, maar wat zijn precies de voordelen moest je alles kunnen regelen via enkel een goed werkende chatbot? Geef enkele voorbeelden.

Antwoord:

# Modules

Voor je aan de slag gaat, voorzie je eerst de nodige tools. 

Je importeert de nodige modules (dit hoef je maar één keer te doen). <br>Deze modules bevatten functies en methodes die jouw onderzoek zullen vergemakkelijken. Er zijn immers reeds zaken voorgeprogrammeerd, waardoor jij met vrij eenvoudige instructies kunt werken.

Voer daartoe de twee code-cellen hieronder uit. De code in deze cellen hoef je niet te begrijpen.

In [1]:
from Levenshtein import distance
from util import test_bot
from bot import ChatBot

Nu ben je klaar voor stap 1: een basis chatbot.

# 1. Een simpele chatbot

Hier gaan we een chatbot maken. Hoe die werkt zien we later, het is hier al voor ons gemaakt.

In [2]:
# Je kan de naam zelf kiezen, wij hebben hier gekozen om de robot Marvin te noemen
bot = ChatBot("Marvin")

Op dit moment is het brein van deze robot nog leeg, Marvin heeft geen enkel idee hoe een conversatie er uit ziet.
Om hem dit aan te leren, gaan we hem trainen met een voorbeeldgesprek. Dit gesprek noemen we de trainingsdata.
Je kan er zelf extra vragen en antwoorden toevoegen.

In [3]:
conversatie = {
               'Hallo': 'Hi!',
               'Hoe gaat het met jou?': 'Prima',
               'Wie ben jij?': 'Marvin de robot',
               'Tot ziens': 'Bye',
    # Voeg hier eventueel andere vragen en antwoorden toe
}

# We trainen hier de bot
bot.train(conversatie)

Om te kijken of het werkt, vragen we wat hij reageert als iemand "Hallo" zegt.

In [4]:
print(bot.get_response('Hallo'))

Hi!


Dit stukje code laat je een vraag stellen aan de robot en toont het antwoord, steeds opnieuw. Als je "stop" typt, stopt deze lus.
Probeer eerst eens een vraag te stellen die letterlijk in de trainingsdata staat. Probeer dan eens een vraag met een kleine variatie
en tot slot een vraag die er absoluut niet in staat.

In [5]:
test_bot(bot)

Zeg 'stop' om de conversatie te stoppen.


 hallo


Hi!


 hoe gaat het met je


Prima


 wie is je


Marvin de robot


 dag


Hi!


 bye


Bye


 stop


Het is duidelijk dat een robot trainen niet zo vanzelfsprekend is!

**Opdracht**: Stop de testconversatie door *stop* te typen. Voeg dan nog eens 2 vragen en antwoorden toe en train de robot opnieuw. Werkt het?

Antwoord:

# 2. Hoe wordt het beste antwoord bepaald?
Een simple manier om te bepalen welk antwoord het beste is, is opzoeken welke vraag in onze trainingsdata het meest lijkt op de vraag die gesteld is
en dan het bijbehorende antwoord terug te geven.

Hoe bepaal je dan hoe hard twee zinnen op elkaar lijken? Er zijn meerdere manieren, wij gebruiken een simpele genaamd de Levenshtein afstand.
Die afstand is gelijk aan hoeveel letters je moet veranderen om de twee zinnen (of woorden) gelijk te maken aan elkaar.

Hier is een voorbeeldje, stel dat we de woorden "kitten" en "koken" willen vergelijken:
 - kitten en koken
 - kotten en koken
 - koten en koken
 - koken en koken

Er waren 3 aanpassingen nodig, dus de afstand is 3.

## Dus, als je de afstand hebt, hoe weet je dan het antwoord op een vraag?
We overlopen elke vraag in onze trainingsdata en bepalen de afstand. We onthouden ook steeds de vraag die de kleinste afstand geeft.

De functie die we hiervoor gebruiken geeft een score tussen 0 en 1, 1 betekent dat de twee tekstjes perfect overeenkomen en 0 betekent dat ze volledig verschillend zijn.
Zo kan je makkelijker stukken tekst van verschillende lengte vergelijken. We testen het hier op de zin *Tot wiens*, iets dat Marvin verkeerd begreep.

In [None]:
# Op deze vragen weten we het antwoord
vraag_en_antwoord = {
    "Is dit leuk?": "ja!",
    "Is dit saai?": "nee!",
    "Leer je iets?": "Misschien",
    "Tot ziens": "Bye",
    "Hoe gaat het met jou?": "Prima",
}

# Iemand stelt deze vraag
vraag = "Tot wiens"

laagste_score = 9999
beste_vraag = ""
beste_antwoord = "geen antwoord"

# We zoeken in de lijst met gekende vragen, welke het meeste lijkt op de vraag
for gekende_vraag, antwoord in vraag_en_antwoord.items():
    # Voor elke gekende vraag, berekenen we de afstand
    score = distance(gekende_vraag, vraag)
    print(gekende_vraag, " heeft afstand ", score)
    
    # Als de score groter is dan de huidige grootste score
    if score < laagste_score:
        # Dan is deze score de nieuwe kleinste afstand
        laagste_score = score
        # En is deze vraag de beste vraag,
        # en dit antwoord het beste antwoord
        beste_antwoord = antwoord
        beste_vraag = gekende_vraag

print("Je vroeg: ", vraag)
print("Dat lijkt het beste op: ", beste_vraag)
print("Het antwoord is: ", beste_antwoord)

Verandert het antwoord als je niet alles naar kleine letters zet?

**Opdracht:** Weet je nu waarom de vorige robot soms vreemde antwoorden gaf? Hoe zou je dat kunnen verhelpen?

Antwoord:

# 3. Een praktisch voorbeeld
Stel nu dat we een robot willen maken die iets nuttig doet, zoals iemand die een vaccin wil krijgen enkele vragen stellen.

De chatbot slaat automatisch de volledige conversatie op, zodat een dokter deze info later kan bekijken.
Wat voor nuttige vragen of antwoorden kan de robot bieden? Probeer zeker zelf ook dingen uit!

Let er op dat elke eerste (en derde, en vijfde, ...) regel in de conversatie hieronder een vraag is en de even regels antwoorden zijn.
Als je meerdere vragen wilt die het zelfde antwoord geven, typ je het twee keer, zoals hieronder met de zin *Wat is de code op uw vaccinatiebrief?*.

Waarom is het belangrijk dat we deze trainingsdata volledig in kleine letters zetten?

In [2]:
# Dit voorbeeld is een automatische vragenlijst voor een vaccinatie.
medische_conversatie = {
    "Hallo": "Goeiedag, wat is uw naam?",
    "Mijn naam is ": "Wat is de code op uw vaccinatiebrief?",
    "Ik heet ": "Wat is de code op uw vaccinatiebrief?",
    "Waar staat de code?": "De code staat rechtsboven op de brief. Wat is het cijfer?",
    "Mijn code is ": "Wilt u uw afspraak bevestigen of annuleren?",
    "Mijn getal is ": "Wilt u uw afspraak bevestigen of annuleren?",
    "Annuleren": "Oké, bedankt voor de verwittiging. U kan altijd bellen om uw afspraak te verplaatsen.",
    "Bevestigen": "Oké, bent u recent ziek geweest?",
    "Ja": "Dan moet u helaas uw afspraak verplaatsen, gelieve het kantoor te bellen.",
    "Neen": "Oké, welke medicatie neemt u? Reageer 'geen medicatie' als u geen medicatie neemt aub.",
    "Geen medicatie": "Bedankt, ik geef het door. Een prettige dag nog.",
    "Waar kan ik parkeren?": "Er staan pijlen naar de verschillende parkings in de buurt.",
}

We zullen een nieuwe chatbot aanmaken om deze data te testen en meteen ook trainen.

In [3]:
medibot = ChatBot("MediBot")

medibot.train(medische_conversatie)

Probeer hieronder de robot eens uit. Wanneer geeft hij foute antwoorden?
Je merkt dat hij je enkel snapt als je bijna letterlijk een zin uit de trainingsdata zegt, hoe komt dit?
Waar reageert hij fout op?

In [4]:
test_bot(medibot)

Zeg 'stop' om de conversatie te stoppen.


 hallo


Goeiedag, wat is uw naam?


 mijn naam is Stef


Wat is de code op uw vaccinatiebrief?


 waar staat het?


De code staat rechtsboven op de brief. Wat is het cijfer?


 mijn cijfer is 123


Wilt u uw afspraak bevestigen of annuleren?


 bevestigen


Oké, bent u recent ziek geweest?


 neen hoor


Oké, welke medicatie neemt u? Reageer 'geen medicatie' als u geen medicatie neemt aub.


 Ik neem hoestsiroop


Wat is de code op uw vaccinatiebrief?


 Dat heb ik je al gezegd?


Er staan pijlen naar de verschillende parkings in de buurt.


 Huh?


Goeiedag, wat is uw naam?


 stop


Wat merk je op? Stelt de robot alle vragen? Waarom wel of niet? Overloopt de robot alles in een logische volgorde?

**Opdracht:** Hieronder vindt je een voorbeeld van een conversatie die even goed ging, maar dan de mist in ging.
Waarom vond de robot geen goed antwoord? Kan je de trainingsconversatie aanpassen zodat het wel werkt?
```
Hallo
> goeiedag, wat is uw naam?
mijn naam is Stef.
> wat is het cijfer op uw vaccinatiebrief?
waar staat het?
> het cijfer staat rechtsboven op de brief. wat is het cijfer?
mijn cijfer is 123
> Wilt u uw afspraak bevestigen of annuleren?
bevestigen
> Oké, bent u recent ziek geweest?
nee hoor
> Oké, welke medicatie neemt u? Reageer 'geen medicatie' als u geen medicatie neemt aub.
Ik neem hoestsiroop
> Wat is de code op uw vaccinatiebrief?
Dat heb ik je al gezegd?
> Er staan pijlen naar de verschillende parkings in de buurt.
Huh?
> Goeiedag, wat is uw naam?
```

Antwoord:

<img src="../.images/cclic.png" alt="Banner" align="left" style="width:100px;"/><br><br>
Notebook Chatbot, zie <a href="http://www.aiopschool.be">AI Op School</a>, van S. Pletinck , F. wyffels & N. Gesquière is in licentie gegeven volgens een <a href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 4.0 Internationaal-licentie</a>. 