<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Machine Learning
### Sommersemester 2023
Prof. Dr. Heiner Giefers

# Einführung

In diesem Modul wollen wir verschiedene Verfahren aus dem Bereich des Maschinellen Lernens (**ML**) untersuchen.
Die gängiste Programmiersprachen, die zur Entwicklung von ML-Anwendungen eingesetzt wird ist Python.
Die allermeisten Bücher (so auch das Lehrbuch zur Veranstaltung) basieren auf Python.
Daher sollten Sie sich auf Ihrem PC oder Notebook eine entsprechende Programmierumgebung einrichten.
Im folgenden wird kurz vorgestellt, welche Schritte dazu notwendig sind.

# Python

Python ist eine sogenannte Multiparadigmensprache, was bedeutet, dass mehrerer Programmieransätze von der Sprache unterstüzt werden.
In Python kann man sowohl imperativ, als auch objektorientiert, funktional und aspektorientiert programmieren.
Was das im einzelnen bedeutet, werden wir im Verlauf des Moduls noch genauer sehen.

Die Sprache selbst frei verfügbar und der Sprachstandard ist open-source.
Die Python Software Foundation steht als gemeinnützige Organisation hinter der Weiterentwicklung des Sprachstandards und der Referenzimplementation des Interpreters (CPython).

Zu etwas Verwirrung führt gelegentlich die Tatsache, dass mit der Version 3.0 im Jahre 2008 der Python-Standard von Grund auf überarbeitet wurde und damit nicht mehr abwärtskompatibel ist.
Das bedeutet, dass Python Programme, die den (heute immer noch verbreiteten) Standard 2.7 verwenden, nicht mehr mit Interpretern des neueren Standards ausgeführt werden können.



## Auswahl und Installation einer Python-Distribution

Eine Hauptinformationsquelle und der erste Anlaufpunkt zum Thema Python ist www.python.org.
Dort finden Sie Links zum Sprachstandard, Dokumentationen und zur Referenzimplementation der Laufzeitumgebung mit dem Interpreter CPython.
Da Python eine offene Sprache ist, gibt es aber noch weitere Implementationen der Sprache, eine Auswahl finden Sie auf wiki.python.org/moin/PythonDistributions.

Eine Distribution, die sich in letzter Zeit besonderer Beliebtheit erfreut ist Anaconda [https://www.anaconda.com/distribution].
Die Distribution beinhaltet u.a. die integrierte Entwicklungsumgebung (IDE)  Spyder, den Kommandozeileninterpreter IPython, das webbasierte Umgebung Jupyter, sowie mächtige Werkzeuge für die Installation und Verwaltung von zusätzlichen Softwarepaketen.

Die Beispiele im Lehrbuch, sowie in den weiteren Lehrmaterialien verwenden die Anaconda Distribution.
Um kompatibilitätsproblemen vorzubeugen, empfehle ich Ihnen, auf Ihren privaten Geräten ebenfalls die Anaconda distribution zu verwenden.

Die folgenden Abschnitte zeigen, wie Sie eine Anaconda-Installation auf ihrem Computer verwenden können.

## Python im interaktiven Modus nutzen

Rufen Sie das Programm `ipython` auf.
Wenn Sie einen Anaconda auf einem Windows Computer installiert haben, finden Sie ein ausführbares Programm *ipython.exe* standardmäßig unter folgendem Dateipfad: `C:\Users\<Benutzername>\Anaconda3\Scripts\`.
Bei der Installation fügt Anaconda normalerweise das `Scripts`-Verzeichnis Ihrem Suchpfad hinzu, so dass die Programme von überall aus (also z.B. über die Windows-Suche) starten können.

Ebenfalls in der Anaconda Distribution mitgeliefert, ist die standard Python Shell, die Sie mit dem Kommando `python.exe` aufrufen können.
Im Vergleich dazu bietet ihnen die ipython Shell eine farbige Hervorhebung von Schlüsselwörtern, eine formatierte Code-Darstellung und Auto-Vervollständigung.
Für die ersten Schritte in Python bietet es sich an, die interaktive Shell zu verwenden.

![](ipython.png)



## Python Skripte

Die interaktive Python-Shell ist im grunde nichts anderes als ein Konsolenprogramm, dass Ihre Kommandos an den Python-Interpreter weiterleitet und dessen Ausgaben anzeigt.
Neben der interaktiven Verarbeitung, können aber auch Anweisungen in einer Datei zusammengefasst werden und als Ganzes an den Interpreter übergeben werden.
Diese Dateien werden dann auch Skriptdatei oder kurz, Skript genannt.
Im Fall von Python ist die Dateiendung `.py` üblich, aber nicht vorgeschrieben.
Der Name des Skripts wird normalerweise als Argument an den Interpreter übergeben, als z.B. `python.exe myscript.py`.

Auf UNIX-artigen Betriebssystemen ist es möglich und üblich, am Anfang der Skriptdatei den zur Ausführung benötigten Interpreter über einen sogenannten *Shebang* (oder auch *Hashbang*) anzugeben.
Wenn man das Skript selbst, als ausführbares Programm in einer UNIX-Shell startet, so wird zuerst über das Kommando nach den beiden Zeichen `#!` die Ausführungsumgebung gestartet und dann das Skript als Argument an diese Umgebung übergeben.
Folgendes Beispiel zeigt ein einfaches Python-Skript, das die Versionsnummer des Interpreters auf der Kommandozeile ausgibt:

```python
#!/usr/bin/env python
import sys
print(sys.version)
```

## Python Notebooks

Jupyter Notebook ist eine Webanwendung, die eine graphische Benutzeroberfläche für Python (und andere Programmier-/Skriptsprachen) bietet.
Notebooks sind Dokumente die aus einer Folge von Zellen bestehen und einem Ausführungskernel zugeordnet sind.
Häufig wird als Kernel ein Python Interpreter verwendet, Jupyter unterstüzt aber eine Reihe weiterer [Kernels](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels).
Die einzelnen Zellen sind unterschiedlichen Typen zugeordnet, die wichtigsten Typen sind Code-Zellen und Markdown-Zellen.
Code-Zellen werden durch Drückern der Tastenkomination *Umschalttaste+Enter* (oder durch Klicken des *Run*-Buttons) auf dem assoziierten Kernel ausgeführt.
Markdown-Zellen enthalten neben reinem Text noch Formatierungsanweisungen; sie werden ebenso wie Code-Zellen durch *Umschalttaste+Enter* bestätigt und daraufhin vom Jupyter System gerendert.
Die [Markdown Syntax](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html) ist relativ leicht zu erlernen, bietet aber gleichzeit alle Wichtigen Funktionen zum Erstellen optisch ansprechender Dokumente.

![](notebooks.png)

Die Aufgaben und Übungsblätter zu diesem Modul werden als html und Python Notebook zur Verfügung gestellt.
Wenn Sie die Notebook-Version einsetzen, können Sie die Dokumente nicht nur lesen (wie im html-Modus), sonder direkt in ihnen arbeiten.
Sie können neue Code-Zellen einfügen und eigene Experimente durchführen.
Der Lerneffekt ist dabei wesentlich größer und daher empfehle ich Ihnen, die Jupyter Notebooks einzusetzen.