# ADVA Girls' Day 2021



## Von künstlicher Intelligenz und lernenden Maschinen


Sie ist heute allgegenwärtig,
und Ihr habt wahrscheinlich
auch schon oft von ihr gehört.
In Filmen und Serien,
in Nachrichten
und sozialen Medien,
überall wird zunehmend
von AI: Artificial Intelligence -
deutsch KI: Künstliche Intelligenz -
gesprochen.
Es werden ihre bahnbrechenden Einsatzmöglichkeiten gezeigt,
aber es wird auch vor ihren Gefahren gewarnt.

KI ist bereits zum Streitpunkt politischer Debatten
und zum entscheidenden Wirtschaftsfaktor geworden.
Sie hält Einzug
in die alltägliche Arbeits- und Freizeitwelt.
Es scheint dabei,
als sei KI-Technologie etwas Neues,
Unberechenbares.
Das täuscht,
denn ihre Geschichte begann
schon vor über 60 Jahren,
und seit dem wurde sie
kontinuierlich weiterentwickelt.
An den Grundprinzipen von damals
hat sich bis heute nichts geändert.

Künstliche Intelligenz ist
ein Teilgebiet der Informatik,
also der Computerwissenschaft -
englisch Computer Science.
Forscher versuchen damit,
menschliche Intelligenz am Computer nachzuahmen.
Sie entwickeln Computerprogramme,
die eigenständig Muster und Zusammenhänge
in großen Datenmengen finden
und daraus Schlussfolgerungen ziehen
und Vorhersagen treffen.
Diese dienen den Menschen
entweder als Empfehlungen
für ihr weiteres Handeln,
oder der Computer
führt eigenständige Handlungen aus.

Um richtige Ergebnisse zu liefern,
werden die KI-Programme
auf ihre jeweiligen Anwendungsfälle trainiert.
Dieser Bereich heißt ML: Machine Learning -
deutsch Maschinelles Lernen.
Den Programmen werden Datenmengen
mit vorgefertigten Lösungen übergeben.
Sie probieren eigenständig
so lange verschiedene mathematische Operationen
mit den Daten aus,
bis sie irgendwann auf die richtigen
Lösungen kommen.
Trial and Error -
Versuch und Irrtum.
Das gelernte Wissen,
welche Operationen zum Ziel führen,
wenden sie dann immer wieder
auf neue Daten an.

Wir werden gleich versuchen,
einen ML-Vorgang zu verstehen,
indem wir selbst einen solchen Lernprozess durchlaufen.
Dazu schreiben wir ein kleines Computerprogramm
mit Python...

## Doch was ist Python?

[Python](https://de.wikipedia.org/wiki/Python_(Programmiersprache))
ist eine Programmiersprache.
Ihr gebt dem Computer damit Anweisungen.
Das sind Befehle,
Bedingungen,
unter denen er bestimmte Befehle ausführen
oder nicht ausführen soll,
und Beschreibungen,
wie er auf Eingaben reagieren soll.
Aus Kombinationen vieler solcher Anweisungen
entstehen Computerprogramme.

Python ist außerdem eine Skriptsprache.
Im Gegensatz zu einer Compilersprache
muss ein Python-Skript
nicht erst wie ein Buch
vollständig in Maschinensprache übersetzt werden.
Es wird von einem Interpreter ausgeführt,
der wie eine Art Simultanübersetzer
(englisch auch Interpreter genannt)
das Skript beim Lesen
Anweisung für Anweisung übersetzt
und direkt an den Prozessor des Computers
weiterleitet.

Python ist eine freie
und offene Programmiersprache.
Der Python-Interpreter ist FOSS -
Free and OpenSource Software.
Er steht jedem kostenlos zur Verfügung,
und jeder kann sich
an der Weiterentwicklung
beteiligen.
Deswegen ist Python vor allem
in der Wissenschaft sehr beliebt.

Das Interpretieren
macht ein Programm langsamer
als ein vollständig im Voraus übersetztes
bzw. compiliertes Programm
(von englisch _(to) compile_).
Dafür kann man interaktiv programmieren,
also Schritt für Schritt
Anweisungen ausprobieren
und jederzeit ändern,
während das Programm schon läuft.

Um bspw. mathematische Berechnungen auszuführen,
gebt Ihr sie einfach
wie auf einem Taschenrechner
ein:

In [None]:
2 + 3

Auch in Python gilt Vorrang von Operatoren:

In [None]:
2 + 3 * 4 # multiplication precedes addition ==> not 5 * 4

Wie Ihr oben seht, gilt alles nach einem # als Kommentar. Es wird also nicht vom Interpreter ausgeführt.

Dividiert wird mit einem Schrägstrich:

In [None]:
3 / 4

Und Potenzen, also $a^b$, schreibt Ihr so:

In [None]:
2 ** 3

Jeden Wert und jedes Ergebnis könnt Ihr wie in der Mathematik einer Variable zuweisen. Ihr schreibt jedoch nicht einfach nur $a, b, c, ... x, y, z$, sondern verwendet aussagekräftige Worte oder Wortgruppen, so dass auch jeder etwas damit anfangen kann:






In [None]:
seconds_in_a_minute = 60
minutes_in_an_hour = 60
hours_in_a_day = 24
days_in_a_week = 7

Und wieviele Sekunden hat eine Woche?

In [None]:
seconds_in_a_week = seconds_in_a_minute * minutes_in_an_hour * hours_in_a_day * days_in_a_week
seconds_in_a_week

Wie Ihr oben seht, müsst Ihr nach einer Zuweisung die Variable noch einmal getrennt angeben, um ihren Wert anzeigen zu lassen.

Wollt Ihr eine Wurzel ziehen oder trigonometrische Funktionen oder sonstige höhere mathematische Operationen ausführen, dann importiert Ihr eine Bibliothek:

In [None]:
import numpy as np # np is a shortcut for further use

Programmier-Bibliotheken sind Sammlungen von vorgefertigten Anweisungen, und [numpy](https://numpy.org) steht für _**Num**erical computing with **Py**thon_. Enthalten sind Funktionen...

In [None]:
np.sqrt(2) # square root

... und Konstanten, wie $\pi$:

In [None]:
np.cos(np.pi)

Mit anderen Bibliotheken könnt Ihr u.A. Daten aus dem Internet "anfordern" (englisch _(to) request_):

In [None]:
import requests

Auf eine Anfrage folgt eine Antwort:

In [None]:
response = requests.get("https://upload.wikimedia.org/wikipedia/commons/f/f8/Python_logo_and_wordmark.svg")

War die Anfrage erfolgreich?

In [None]:
response.ok # True or False (1 or 0)

Und anzeigen könnt Ihr die in der Antwort enthaltenen Daten bspw. so:

In [None]:
from IPython.display import display_svg # import only one function from library
display_svg(response.text, raw=True)

## Maschinelles Lernen verstehen

Stell Dir vor, Du bist eine KI... Du bekommst einen Datensatz mit Schulnoten, die 8 Schüler während eines Schuljahres in den 3 abzulegenden Prüfungen in einem bestimmten Fach erhalten haben:

In [None]:
exam_marks = np.asarray([
    [1, 2, 5],
    [4, 3, 2],
    [5, 5, 3],
    [2, 6, 2],
    [3, 1, 1],
    [6, 5, 4],
    [4, 2, 2],
    [2, 4, 6],
])

Dann bekommst Du für jeden Schüler einen Wert, der aussagt, ob er oder sie das Fach bestanden hat: Bestanden = 1, Nicht bestanden = 0

In [None]:
student_has_passed = np.asarray([1, 1, 0, 1, 1, 0, 1, 1])

Dir sagen all diese Begriffe wie Schüler, Schule, Noten, Prüfungen und Bestanden überhaupt nichts... Doch das ist dir egal! Du hast Zahlen... Die machen Dich froh!

Jeder Eintrag im Datensatz hat 3 Werte, die 3 Prüfungsnoten je Schüler. Du gruppierst diese erst einmal zu 3 Zahlenreihen mit jeweils 8 Werten um, denn Dich interessieren keine Schüler... Dich interessieren nur die 3 verschiedenen Gruppen von Werten, also Noten in Prüfung 0, Noten in Prüfung 1 und Noten in Prüfung 2... So kannst Du viel besser mit ihnen rechnen!

Dazu musst Du im Datensatz nur aus Zeilen Spalten und aus Spalten Zeilen machen. Das nennt man in der Mathematik Transponieren:

In [None]:
exam0_marks, exam1_marks, exam2_marks = exam_marks.transpose()

In [None]:
exam0_marks

In [None]:
exam1_marks

In [None]:
exam2_marks

Du versuchst erstmal die einfachste mathematische Operation... Du addierst jeweils die 3 Werte:

In [None]:
mark_sums = exam0_marks + exam1_marks + exam2_marks
mark_sums

Hmm... Weit entfernt von 0 und 1! Aber Du könntest ja mal versuchen, die Werte auf den Bereich von 0 bis 1 zu "normalisieren", also den kleinsten Wert auf 0 legen, den größten Wert auf 1 und alle anderen Werte dazwischen... Mit den gleichen Größenverhältnissen wie im Originalergebnis...

Der kleinste Wert ist:

In [None]:
np.min(mark_sums)

Der größte Wert ist:

In [None]:
np.max(mark_sums)

Und die Differenz zwischen größtem und kleinstem Wert ist:

In [None]:
np.max(mark_sums) - np.min(mark_sums)

Also musst Du von allen Werten 5 abziehen und sie danach durch 10 teilen... Und schon liegen sie alle zwischen 0 und 1:

In [None]:
normalized_marks = (exam0_marks + exam1_marks + exam2_marks - 5) / 10
normalized_marks

Und jetzt schaust Du, ob die Werte jeweils näher an der 0 oder and der 1 liegen... D.h. Du rundest:

In [None]:
rounded_marks = np.round(normalized_marks).astype(int)
rounded_marks

Hmm... Das Sieht doch fast in allen Fällen wie das genaue Gegenteil der Lösungen aus:

In [None]:
student_has_passed

Sehr schön! Du musst also nur die drei Prüfungsnoten addieren, dann 5 abziehen, dann durch 10 dividieren und schließlich das Ergebnis umkehren... Und schon kannst Du in 7 von 8 Fällen, also mit einer Genauigkeit von 87,5%, richtig vorhersagen, ob ein Schüler das Fach bestanden hat... Das reicht Dir erstmal! Oder doch nicht? Hmm...

## Chihuahua oder Muffin; das ist die Frage!

In [None]:
import tensorflow as tf
from tensorflow import keras

In [None]:
import matplotlib.pyplot as plt

In [None]:
import PIL
from PIL import Image

In [None]:
from io import BytesIO

In [None]:
CHIHUAHUA_MUFFIN_URL = "https://github.com/ieee8023/deep-learning-datasets/raw/master/chihuahua-muffin"

In [None]:
def get_image(filename):
    response = requests.get(f"{CHIHUAHUA_MUFFIN_URL}/{filename}")
    if not response.ok:
        raise ValueError(f"Image {filename} not found")

    jpeg_data = response.content
    image_input = BytesIO(jpeg_data)
    return Image.open(image_input)

In [None]:
def get_chihuahua(number):
    return get_image(f"chihuahua-{number}.jpg")

In [None]:
def get_muffin(number):
    return get_image(f"muffin-{number}.jpeg")

In [None]:
CHIHUAHUA_VALUE = 0
MUFFIN_VALUE = 1

In [None]:
def image_to_grayscale_array(image, width, height):
    resized_image = image.convert('L').resize((width, height))
    return np.asarray(resized_image)

In [None]:
def display_dataset(image_arrays, classes):
    plt.figure(figsize=(10, 10))
    for index in range(len(image_arrays)):
        plt.subplot(5, 5, index + 1)
        plt.xticks([])
        plt.yticks([])
        plt.grid(False)
        plt.imshow(image_arrays[index], cmap=plt.cm.binary)
        plt.xlabel(classes[index])

In [None]:
training_chihuahuas = [get_chihuahua(number) for number in [1, 2, 3, 4, 5]]

In [None]:
training_muffins = [get_muffin(number) for number in [1, 2, 3, 4, 5]]

In [None]:
testing_chihuahuas = [get_chihuahua(number) for number in [6, 7, 8]]

In [None]:
testing_muffins = [get_muffin(number) for number in [6, 7, 8]]

In [None]:
training_dataset = np.asarray([
    image_to_grayscale_array(image, 100, 100)
    for image in training_chihuahuas + training_muffins])

training_dataset.shape

In [None]:
training_solutions = np.asarray(5 * [CHIHUAHUA_VALUE] + 5 * [MUFFIN_VALUE])
training_solutions

In [None]:
display_dataset(training_dataset, training_solutions)

In [None]:
testing_dataset = np.asarray([
    image_to_grayscale_array(image, 100, 100)
    for image in testing_chihuahuas + testing_muffins])

testing_dataset.shape

In [None]:
testing_solutions = np.asarray(3 * [CHIHUAHUA_VALUE] + 3 * [MUFFIN_VALUE])
testing_solutions

In [None]:
display_dataset(testing_dataset, testing_solutions)

In [None]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(100, 100)),
    keras.layers.Dense(128, activation=tf.nn.sigmoid),
    keras.layers.Dense(16, activation=tf.nn.sigmoid),
    keras.layers.Dense(2, activation=tf.nn.softmax),
])

In [None]:
optimizer = keras.optimizers.SGD(
    lr=0.01,
    decay=1e-5,
    momentum=0.7,
    nesterov=True)

In [None]:
model.compile(
    optimizer=optimizer,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy'])

In [None]:
model.fit(training_dataset, training_solutions, epochs=100)

In [None]:
model.evaluate(testing_dataset, testing_solutions)

In [None]:
prediction = model.predict(testing_dataset)
prediction

In [None]:
predicted_values = np.argmax(prediction, axis=1)
predicted_values

In [None]:
display_dataset(testing_dataset, predicted_values)