<img src='../images/bildungscampus_logo.png' width="40%" align="left" />
<img src='../images/hhn.png' width="25%" align="right" />

# Schritt 2: Intent Classification
Masterarbeit - Sebastian Kahlert | Fakultät Wirtschaft und Verkehr | Wirtschaftsinformatik - Informationsmanagement und Data Science | WS 2021/22

<img src='../images/bar.png'/>

## Implementation und Training des Neuronales Netzes dür die Klassifizerung von Intents

<img src='../images/neural_net.png' align="right" />

Abbildung: Vereinfachte Darstellung des Feddforward Neural Network

Zur Klassifizierung der Intents wird ein **Feedforward Neural Network** verwendet. Es ist eines der einfachsten Arten von Nueronalen Netzen, da die Daten hier nur in eine Richtung fließen. Da der Input des Netzes im Rahmen dieser Arbeit Texte sind, müssen diese im Vorfeld in Zahlen umgewandelt werden, da Neuronale Netze keine Buchstaben bzw. Sätze und Wörter als Input verarbeiten können. Aus diesem Grund werden die Trainingsdaten und die Eingaben des Benutzers durch einen **Bag  of Words Ansatz** umgewandelt, bevor diese vom Neuronalen Netzwerk verarbeitet werden.

### 2.1. Import benötigter Bibliotheken

Zur Vorbereitung der Trainingsdaten wird unteranderem der **Stemmer von NLTK** verwendet. **TensorFlow** ist ein Framework zur datenstromorientierten Programmierung und wird für die Implementation des neuronalen Netzes verwendet.

In [21]:
# import of necessary libraries
import nltk 
from nltk.stem.lancaster import LancasterStemmer
stemmer = LancasterStemmer()

import numpy
import tflearn 
import tensorflow
import random 
import json
import pickle
import re
import os

### 2.2. Trainingsdaten vorbereiten, Implementation und Training des Neuronalen Netzes

Die Trainingsdaten liegen in einer json-Datei vor. Die folgende Funktion öffnet die Datei, extrahiert die Daten und speichert diese in verschiedenen Listen. Anschließend werden diese durch Bag of Words in lesbare Trainingsdaten umgewandelt. Zum Schluss wird das Neuronale Netz erstellt, trainert und gespeichert, sodass es auch in anderen Notebooks geladen werden kann.

<img src='../images/training_data.jpg' align="right" />
Ausschnit aus den Trainingsdaten

In [22]:
# open and load json file with patterns --> questions and tags
with open("intents.json") as file:
    data = json.load(file)

In [36]:
# prepare training data + implement and train Neural Net
try: 
    with open("data.pickle", "rb") as f:
        words, labels, training, output = pickle.load(f)
except:
    words = [] #all word in the json file
    labels = [] #all intents in the json file
    docs_x = [] #input of user
    docs_y = [] #intent for each input

    for intent in data["intents"]:
        for pattern in intent["patterns"]:
            #Stemming - Getting the root words with tokenize
            wrds = nltk.word_tokenize(pattern)
            words.extend(wrds)
            docs_x.append(wrds)
            docs_y.append(intent["tag"])

        if intent["tag"] not in labels:
            labels.append(intent["tag"])

    words = [stemmer.stem(w.lower()) for w in words if w != "?"]
    words = sorted(list(set(words)))

    labels = sorted(labels)

    # Neural Network versteht nur Nummern --> Bag of words
    training = []
    output = []

    out_empty = [0 for _ in range(len(labels))]

    for x, doc in enumerate(docs_x):
        bag =  []
        wrds = [stemmer.stem(w) for w in doc]

        for w in words: 
            if w in wrds:
                bag.append(1)
            else: 
                bag.append(0)


        output_row = out_empty[:]
        output_row[labels.index(docs_y[x])] = 1

        training.append(bag)
        output.append(output_row)

    # in array für model
    training = numpy.array(training)
    output = numpy.array(output)
    
    with open("data.pickle", "wb") as f:
        pickle.dump((words, labels, training, output), f)
        
#create, train and save neural net
tensorflow.compat.v1.reset_default_graph()
    
# Creating the Neural Network
net = tflearn.input_data(shape= [None, len(training[0])]) #input layer Neurons = numer of words in training
net = tflearn.fully_connected(net, 8) #hidden layer fully connected with 8 neuron
net = tflearn.fully_connected(net, len(output[0]), activation="softmax" ) #output layer 6 Neurons = labels
net = tflearn.regression(net)

model = tflearn.DNN(net)

if os.path.exists(r"model.tflearn.meta"):
    model.load(r"model.tflearn")
else:
    model.fit(training, output, n_epoch=1000, batch_size=8, show_metric=True)
    model.save(r"model.tflearn")

INFO:tensorflow:Restoring parameters from C:\Users\Sebi\OneDrive\Studium\Thesis_Chatbot\2. Intent Classififcation\model.tflearn


### 2.3. Herausforderungen 

* Es existieren zwar Trainingsdatensätze für die Intent Classification, jedoch nicht für diesen speziellen Use Case. Das heißt die Trainingsdaten müssen zum großen Teil manuell erstellt werden.
* Es kann schwierig sein vorherzusehen, wie genau der Benutzer mit dem Chatbot sprechen wird. Demnach kann es notwendig sein, in Laufe der Zeit die Trianingsdaten anzupassen.