# Einleitung

## Ausgangslage

In der Experimentalphysik werden, grob gesprochen, aus Daten, die
mittels Experimenten erfasst werden, Erkenntnisse gewonnen. Dabei
entstehen bei vielen Experimenten eine große Masse von Daten. Diese
Mengen können nicht mehr per Hand ausgewertet werden. Die Datenanalyse
ist daher ein wichtiger Teil in der physikalischen Forschung geworden.
Hierbei ist der Einsatz von Computern ein unverzichtbarer Teil. Hierbei
wird der Grundsatz *Lernen aus Beispielen* angewendet. Dieses (ML), als
ein Bestandteil der (KI) ist ein wichtiger Baustein in der
physikalischen Forschung geworden.

In *PHYSIKonkret Nr. 70*[1] der Deutschen Physikalischen Gesellschaft
(DPG) vom Januar 2024 steht:

> Mathematische Methoden des maschinellen Lernens sind u.a. als
> Werkzeuge zur Analyse großer Datensätze zunehmend ein wichtiger
> Bestandteil der täglichen Arbeit vieler Physiker:innen.

Maschinelles Lernen ist jedoch nicht nur innerhalb der Physik eine
wichtige Aufgabe. Auch außerhalb der Physik werden Verfahren der KI und
des Maschinelles Lernens immer häufiger und intensiver gebraucht -
manchmal leider auch missbraucht. Daher ist es für alle Physikerinnen
und Physiker wichtig, Kenntnisse in diesem Bereich zu haben.

In den verschiedenen Praktika der Physik lernen Studierende, Daten zu
erhaben und diese Auszuwerten. In der klassischen Art und Weise wird
diese Auswertung mit Hilfe von per Hand erstellten deterministischen
Programmen erstellt. Auf Grund des meist geringen Datenvolumens ist dies
auch kein größeres Problem. Aus dieser Sicht ergibt sich zuerst keine
zwingende Notwendigkeit, dies zu ändern. Das physikalische Praktikum hat
jedoch nicht nur die Aufgabe, physikalische Experimente durchzuführen
und damit physikalische Erkenntnisse zu sammeln. Im Modulhandbuch für
das Bachelorstudium Physik an der Fakultät Physik am Karlsruher Institut
für Technologie (KIT) steht in der Beschreibung zum Praktikum klassische
Physik I im Qualifikationsziel: “erlangen die Fähigkeit, experimentelle
Daten zu erfassen und darzustellen, sowie die Daten zu analysieren”.
Daher ergibt sich die Frage oder Herausforderung, wie Maschinelles
Lernen in das Praktikum eingebunden werden kann, als ein Verfahren zur
Datenauswertung.

Die Künstliche Intelligenz und das Maschinelle Lernen ist nicht erst
eine neue Entwicklung. Die Anfänge dazu gab es schon in den 1940er
Jahren.[2] Erst in den letzten Jahren ist die Bedeutung jedoch enorm
angestiegen. Dies hat zum einen mit zwei wichtigen Entwicklung zu tun

-   der enorme Anstieg von gut strukturierten und verfügbaren Daten und

-   die enorm gewachsene Rechenleistung der Computer.

Das alleine ist jedoch nicht ausreichend. Klassische Verfahren des
Maschinellen Lernen konnten noch nicht viele neue Errungenschaften
erzielen. Diese erzielen kaum Verbesserungen gegenüber den
deterministischen Verfahren. Die in den letzten Jahren immer stärker
auftretenden (NN) führen zu “Erkenntnisgewinn durch moderne
datengetriebenen Methoden” (). Hierbei ist insbesondere das
hervorzuheben, neuronale Netzte, mit vielen Ebenen und Knoten.

## Zielsetzung der Arbeit

Diese Arbeit verfolgt mehrere Ziele:

-   Die Grundbegriffe des Maschinellen Lernens werden dargestellt und
    erläutert. Diese Grundbegriffe werden auch beim Deep Learning
    verwendet. Daher es ist wichtig, diese Begriffe zu kennen und zu
    verstehen.

-   Es werden einige Verfahren des klassischen Maschinellen Lernens
    vorgestellt. In der Anwendung haben diese zwar derzeit nicht mehr
    die große Bedeutung. Jedoch sind die Konzepte weiterhin wichtig.

-   Es wird an Beispielen aufgezeigt, wie Maschinelles Lernen bei der
    Auswertung von Experimenten, beispielsweise in einem physikalischen
    Praktikum in Bachelorstudium angewendet werden kann. Derzeit sind
    die Experimente in der Regel so ausgewählt und ausgerichtet, dass
    Methoden des Maschinellen Lernens in der Regel nicht notwendig sind.

-   Die Arbeit dient als Vorbereitung für das Deep Learning. Deep
    Learning wird in dieser Arbeit nicht behandelt, ist jedoch das
    moderne Werkzeug in der Datenanalyse. Dies wird im Studium jedoch
    erst im Masterstudium behandelt, beispielsweise in der Vorlesung
    *Modern Methods of Data Analysis*.

Damit wird in dieser Arbeit sich, die Grundlagen des Maschinellen
Lernens zu vermitteln. Dabei wird die Anwendung in physikalischen
Fragestellungen beispielhaft demonstriert und dadurch wichtige Begriffe
und Verfahren des Maschinellen Lernen vermittelt.

Für das Maschinelle Lernen wird damit nur ein Anfang dargeboten. Die
Welt des Maschinellen Lernens ist in den letzten Jahren enorm gewachsen.
Immer mehr komplexere und aufwändigere Verfahren wurden entwickelt. Die
Einsatzmöglichkeiten sind ebenso enorm gewachsen. Bilderkennung,
Übersetzungen, autonomes Fahren, medizinische Untersuchungen sind nur
einige wenige Stichworte dazu. Daher dürfte klar sein, dass diese Arbeit
nur an der Oberfläche kratzt. Es soll aber ein Ausgangspunkt dafür sein,
tiefer in die Materie einzudringen.

## Aufbau der Arbeit

Der Aufbau der Arbeit orientiert sich stark an dem Buch von Viviana
Acquaviva . Aus diesem Buch werden auch Beispiele verwendet. Beispiele
aus der Physik.

Im Kapitel 2 (Maschinelles Lernen) wird erläutert, was unter
Maschinellen Lernen zu verstehen ist. Darüber hinaus wird dargestellt,
welche Aufgaben und mit welchen grundlegenden Methoden damit bearbeitet
werden. Nach der Klärung der Aufgabe wird die Sprache, die beim
Maschinellen Lernen verwendet wird eingeführt. Das sind die
grundlegendsten Begriffe, die bei jedem Verfahren, egal ob einfache
Verfahren oder komplexe Verfahren im Deep Learning verwendet werden. Es
wird auch bereits ein erstes Verfahren, die (**LR**) behandelt. An
diesem Verfahren werden zum einen die Begriffe erläutert. Zum anderen
wird die Fragestellung, bezüglich er Verwendung von Maschinellem Lernen
gegenüber den “traditionellen”, deterministischen Verfahren angerissen.

Im Kapitel 3 (Binäre Klassifikation - Erste Modelle) werden zwei
klassische Algorithmen des Maschinellen Lernens eingeführt, der (**DT**)
und (**kNN**). An Hand eines kleinen Beispiels wird ein erster Entwurrf
für eine Ablauf dargestellt. Dies wird dann mit diesen beiden Verfahren
demonstriert. Dabei werden manche Eigenheiten betrachtet, die auftreten
und behandelt werden müssen.

Im Kapitel 4 (Binäre Klassifikation - Bewertung) wird mit Hilfe der
beiden in Kapitel 2 vorgestellten Modelle ein größeres umfangreicheres
beispiel durchgearbeitet. Dabei werden weitere Fragestellung diskutiert.
Ein Schwerpunkt dabei ist die Fragestellung, wie das Ergebnis eines
Modells bewertet wird. Die Bewertung ist ein Maß für die Güte, die
Qualität des Verfahrens. Die Güte soll möglichst hoch sein.

Im Kapitel 5 (Binäre Klassifikation - Optimierung) wird ein anderes
Beispiel bearbeitet und ein neues klassischen Modell vorgestellt. Die
[3] (**SVM**). Darüber hinaus werden ausführlicher dargestellt, welche
Möglichkeiten zur Optimierung vorhanden sind.

Das Kapitel 6 (Regression) befasst sich mit der Fragestellung, eine
stetige Funktion zu finden. Im Kapitel 2 wurde schon beispielhaft die
Lineare Regression eingefügt. Hier wird dieses Thema weit umfassender
beleuchtet. Damit sind zwei Punkte wichtig: eine komplett andere
Bewertung der Güte und der (**GD**) als Methode zur Optimierung.

Im Kapitel 7 (Ensemble Methoden) wird aufgezeigt, was passiert, wenn
mehrere Methoden gemischt werden. Es gibt in der Regel für eine
Problemstellung nicht die eine “richtige” Methode, die anzuwenden ist.
Oftmals liefert die Mischung von Methoden noch leine Verbesserungen.

Das Kapitel 8 (Neuronale netzte) befasst sich, wie die Überschrift schon
besagt, mit (**NN**). Dabei kann dies nur ein Einstieg sein, um wichtige
Begriffe zu klären. Neuronale Netze sind in den letzten Jahren, auch
dank gestiegener Rechenleistungen immer mächtiger geworden. Diese enorme
Leistung ist jedoch auch verbunden mit einem enormen Energieverbrauch.
Daher ergibt sich auch die Frage, wie Rechenleistung und damit
Energieverbrauch sinnvoll reduziert werden kann.

Im abschließenden Kapitel 9 (Schlussbemerkungen) wird ein Ausblick auf
den weiteren Weg im Maschinellen Lernen dargestellt. Denn diese Arbeit
kann nur ein kleiner Einstieg sein. Es gibt viele Methoden und auch
einige große und mächtige Werkzeuge, die verwendet werden können.

## Verwendete Werkzeuge

Das Lernen von Maschinellem Lernen kann nicht als Trockenkurs
durchgeführt werden. Wichtig ist es, die Verfahren zu implementieren,
auszuprobieren und damit zu “spielen”, also bewusst Veränderungen
vornehmen und beobachten, was sich daraus ergibt. Dazu gibt es einige
hilfreiche Werkzeuge. Es werden nun einige Werkzeuge kurz aufgeführt,
die verwendet werden. Es werden jedoch auch einige Werkzeuge
vorgestellt, die nicht verwendet werden, jedoch für spätere Arbeiten im
Maschinellen Lernen hilfreich sind. In VanderPlas sind die Werkzeuge
ausführlich dargestellt:

Verwendete Werkzeuge.

-   **Python**: Dazu schreibt VanderPlas (, Einleitung): “Python hat
    sich in den vergangenen Jahrzehnten zu einem erstklassigen Tool für
    wissenschaftliche Berechnungen entwickelt, insbesondere auch für
    Analyse und Visualisierung großer Datensätze”. Mit Python muss auch
    **Jupyter Notebook** erwähnt werden, denn die Implementierung werden
    zum Großteil mit Hilfe von Jupyter Notebooks realisiert.

-   **NumPy**: Diese Programmbibliothek bietet vieles für die Benutzung
    von (auch sehr großen) Vektoren, Matrizen und mehr-dimensionalen
    Datenstrukturen von numerischen Daten. Das sind die mathematischen
    Gebilde, die wichtig in der Bearbeitung im Maschinellen Lernen sind.

-   **Matplotlib**: Mit der Programmbibliothek ergeben sich viele
    Möglichkeiten zur Visualisierung von Datenmengen.

-   **Scikit-Learn** (kurz **sklearn**) ist eine Programmbibliothek in
    Python für das Lernen von Maschinellem Lernen. Die Algorithmen, die
    in dieser Arbeit vorgestellt werden sind in Scikit-Learn
    implementiert. Dies wird genutzt. Teilweise wird eventuell zuerst
    ein Algorithmus per Hand implementiert, um das Verständnis für den
    Algorithmus zu fördern. Später wird dann Scikit-Learn als
    Black-Box-Bibliothek verwendet.

Nicht verwendete Werkzeuge, die jedoch später, für die weitere
Bearbeitung wichtig oder hilfreich sind:

-   **Pandas**: Diese Programmbibliothek kann verschiedenartige Daten
    bearbeiten. Es ist daher universeller als Numpy, welchen numerische
    Daten bearbeitet. Pandas wird oftmals verwendet, um Daten, die
    teilweise aus sehr unterschiedlichen Quellen mit sehr
    unterschiedlicher Qualität kommen aufzubereiten. DIes ist ein sehr
    wichtige, jedoch manchmal auch sehr schwere Aufgabe. In dieser
    Arbeit wird davon ausgegangen, dass die Daten sauber zur
    Verarbeitung zur Verfügung stehen. An wenigen Stellen werden mit
    Hilfe von Pandas Daten aufbereitet und dann als NumPy-Array zur
    Verfügung gestellt, damit es dann einfach weiter verarbeitet werden
    kann.

-   **Seaborn**: Diese Programmbibliothek baut auf Matplotlib auf, ist
    jedoch an vielen Stellen moderner und einfacher anzuwenden als
    Matplotlib.


[1] <https://www.dpg-physik.de/veroeffentlichungen/publikationen/physikkonkret/pk70_kuenstliche-intelligenz>

[2] siehe dazu *Meilensteine der Künstlichen Intelligenz*, Physik
Journal 19 (2020), Nr. 4, p. 22 - 23

[3] Die deutsche Übersetzung *Stützvektormaschine* wird in der Regel
nicht verwendet