Python ist eine interpretierte Programmiersprache, die besonders in machine learning und data science, aber auch in vielen anderen Bereichen der Informatik verwendet wird. Weil Python Skripte einfach an einen Interpreter übergeben werden können (wie z.B. bash Skripte), wird es oftmals auch als Automatisierungstool benutzt, wenn mehr Funktionalität oder eine modernere Syntax erwünscht ist als bash.

Dass Python eine interpretierte, nicht eine kompilierte Sprache ist, ist gleichzeitig seine größte Stärke und Schwäche: Dass kein Kompilieren notwendig ist, erlaubt sehr schnelle Iterationen, eine Idee kann schnell umgesetzt und getested werden. Besonders in der Wissenschaft ist Python deswegen beliebt. Allerdings sorgt der Garbage Collector und der Interpreter dafür, dass Python auf bestimmten Aufgaben deutlich langsamer ist, als andere Programmiersprachen wie C++ oder java.

Trotzdem wird Python gerade bei Machine Learning Aufgaben auch im High Performance Computing eingesetzt, wo Geschwindigkeit essentiell ist. Bei diesen Aufgaben werden externe Bibliotheken genutzt, die in anderen Sprachen geschrieben sind und lediglich ein API in Python bereit stellen.

Neben der Python sprache selbst, die mit einer Umfangreichen Standardbibliothek kommt, gibt es auch zahlreiche Bibliotheken, die normalerweise über einen Paketmanager verwaltet werden. Auf Linux können Sie dafür natürlich ihren System-Paketmanager verwenden, aber es ist üblich, einen eigenen Manager zu benutzen, der für unterschiedliche Projekte voneinander getrennte Umgebungen verwalten kann, so dass jedes Projekt (nur) die notwendigen Bibliotheken in der jeweils richtigen Version zur Verfügung hat. Wir empfehlen dafür Anaconda, welches für alle gängigen Betriebssysteme verfügbar ist.

### Grundlagen
Sie können mit dem Python Interpreter auf unterschiedliche Arten interagieren
* Im interaktiven Modus: Rufen Sie dafür einfach `python` auf
* Mit einem Skript: Schreiben Sie ihren Code in eine Textdatei mit der Dateiendung `.py` und rufen Sie `python meinskript.py` auf
* Jupyter Notebooks bieten etwas von beidem: In ihnen kann man Code interaktiv bearbeiten und auch gleich ausführen, kann frühere Teile ändern und erneut ausführen und außerdem Code mit Markdown annotieren. Diese Einführung ist auch als Jupyter Notebook verfügbar

#### Primitive Typen

In [1]:
name = 'Chapman'  # Der Variable name wird der string "Chapman" zugewiesen. Sie können " oder ' verwenden
number1 = 0.5 * 4 + 1
number2 = 25 ** 0.5  # Der ** Operator ist für exponentialrechnung, also 25^0.5 = sqrt(25)
print(number2)  # Für Konsolenausgabe
print(name[2])  # Den dritten Buchstaben des strings (python ist 0-indiziert)
print(number1 == number2)  # Da number1 != number2, wird False ausgegeben (beachten Sie die Großschreibung)
print(type(number1))  # Datentyp der variable ist float

5.0
a
False
<class 'float'>


In Python existieren mehrere eingebaute Typen – drei davon haben Sie oben bereits kennengelernt: numerische Werte (`bool`, `int`, `float`, `complex`), Sequenzen (`list`, `tuple`, `str`), Mengen (`set`) und assoziative Typen (`dict`). Mehr Details zu den einzelnen Typen ist unter [Pythons offizieller Dokumnetationsseite](https://docs.python.org/3/library/stdtypes.html) zu finden. Im Folgenden werden Sie Grundlegendes über diese
Typen kennenlernen.

#### Programmablauf-Steuerung

Bevor Sie nun Ihre erste Schleife implementieren, sollten Sie wissen, dass Einrückungen (Leerzeichen bzw. Tabulatoren) in Python eine wichtige Rolle spielen: In Python wird der Programmablauf durch Einrückung gesteuert. Das Einrücken von Codezeilen ist obligatorisch, wie bspw. das richtige Setzten der geschweiften Klammern in java. Eine fehlerhafte Einrückung führt zu einem Fehler.

In [None]:
last_3 = -1
for i in range(100):  # Iteration über alle Werte 0 <= i < 100
    if i % 3 == 0:    # Die Einrückung gibt an, was in die Schleife gehört. Statements, die einen Block eröffnen,
                      # (for, if, while, class etc.) enden mit ":"
        print('3')
        last_3 = i
    print(i)

#### Listen und Schleifen
Im folgenden Code werden Sie mit Listen experimentieren. Die vorher definierte Variable `name` wird hier weiterverwendet. Der Zugriff auf die Zeichen dieses Strings erfolgt Analog zum Zugriff auf Listenelemente.

In [6]:
vowels = ["k", 'e', "i", "l", "m"]  # Initialisiere eine Liste.
                                    # Beachten Sie, dass es keinen Unterschied zwischen " und ' gibt
                                    # Listen haben variable Länge und Elemente können Verändert werden
                                    # vgl. std::vector und java.util.ArrayList
vowels[0] = 'o'  # Ersetze falschen Eintrag am Anfang
vowels[-1] = 'u'  # Negative Indizes zählen von hinten in der Liste, -1 ist der letzte Eintrag
vowels[-2] = name[2]  # Setze zweitletzten Eintrag auf "a"
# Mehrfachzuweisung zum Tauschen zweier Elemente
vowels[0], vowels[3] = vowels[3], vowels[0]
n = len(vowels)  # len gibt die Länge der Liste

In [7]:
# Strings können nicht bearbeitet werden:
name[2] = "f"

TypeError: 'str' object does not support item assignment

Mit einer Schleife können Sie über die oben erzeugte Liste zu iterieren. Sie können die print-Funktion verwenden, um Elemente auszugeben. Hier gibt es mehrere Möglichkeiten – in der [offiziellen Python-Dokumentation](https://docs.python.org/3/library/functions.html) finden Sie weitere Informationen zu `range` bzw. `enumerate`:

In [None]:
for i in range(n):
    print(vowels[i])

for vowel in vowels:
    print(vowel)

for i, vowel in enumerate(vowels):  # Es kann auch über mehrere Werte gleichzeitig iteriert werden
    print(i, vowel)

# Mit zip können zwei Sequenzen miteinander verbunden werden
indices = range(n)
for i, vowel in zip(indices, vowels):
    print(i, vowel)

Für Listen existieren in Python einige Operationen. Im Folgenden wird die Liste der Plosive
sortiert, zwei Listen werden verkettet und ein Teil einer Liste wird ausgeschnitten:

In [9]:
plosives = ['p', 'b', 't', 'd', 'c', 'k']
plosives = sorted(plosives) # Sortiere Liste der Plosive
vowels += ['ä', 'ö', 'ü'] # Konkateniere zwei Listen
print(vowels[:3]) # Ersten drei Vokale - also die Indizes 0 <= i < 3
print(vowels[1:-1]) # Lasse ersten und letzten Vokal weg

['a', 'e', 'i']
['e', 'i', 'o', 'u', 'ä', 'ö']


Auch für Strings gibt es einige wichtige Operationen, die Sie kennen sollten. Dazu gehört das
Ersetzen, Löschen und Aufteilen eines Strings:

In [12]:
name_gm = " Günther Rüdiger Müller "
print(name_gm.replace('ü', 'ue')) # Ersetze Umlaut "ü" - der ursprüngliche string wird nicht modifiziert
name_gm = name_gm.strip() # Lösche Leerzeichen am Anfang und Ende
first1, first2, last = name_gm.split(' ')
first, _ = name_gm.rsplit(' ', maxsplit=1)
# Sortiere Buchstaben des Namens (Vokale zuerst)
print(sorted(name_gm, key=lambda x: x.lower() in vowels, reverse=True))

 Guenther Ruediger Mueller 
['ü', 'e', 'ü', 'i', 'e', 'ü', 'e', 'G', 'n', 't', 'h', 'r', ' ', 'R', 'd', 'g', 'r', ' ', 'M', 'l', 'l', 'r']


Übergeben Sie der Funktion strip() keinen Parameter werden Leerzeichen am Ende und Anfang eines Strings gelöscht, Sie können aber beliebige Zeichenketten entfernen, bspw. strip('asdf'). Analog zu strip(...) existieren die Funktionen lstrip(...) und rstrip(...), die jeweils Zeichenketten nur links bzw. rechts entfernen.

Mittels split(...) bzw. rsplit(...) wird der String in einzelne Teilstrings zerteilt (siehe [Dokumentationsseite](https://docs.python.org/3/library/stdtypes.html#str.split)).

Mit dem Unterstrich _ gibt man in Codezeile 5 an, dass man nicht an der Rückgabe dieser Variable interessiert ist.
Um die Sortierfunktion genauer zu verstehen, sollte Sie sich Teile der [Dokumentation](https://docs.python.org/3/howto/sorting.html#sortinghowto) anschauen.

Auf den Lambda-Operator wird später in eingegangen.

#### Formatierung
Sie können in Python variablen direkt in strings einpassen. Dabei können Sie auch Angaben für die Formatierung machen (z.B. auf zwei Zeichen auffüllen).
Auf [dieser Seite](https://pyformat.info) können Sie bei Bedarf recht übersichtlich Formatiertungsmuster nachschlagen.

In [13]:
for i, vowel in enumerate(vowels):
    print(f"Vowel {i+1:03d}: {vowel}")  # Beachten Sie das "f" vor dem string

Vowel 001: a
Vowel 002: e
Vowel 003: i
Vowel 004: o
Vowel 005: u
Vowel 006: ä
Vowel 007: ö
Vowel 008: ü


Sollte das letzte Codebeispiel für Sie nicht funktioniert haben, benutzen Sie eine Pythonversion vor 3.6. In diesem Fall können Sie dieses (äquivalente) Format benutzen:

In [14]:
for i, vowel in enumerate(vowels):
    print("Vowel {:03d}: {}".format(i+1, vowel))

Vowel 001: a
Vowel 002: e
Vowel 003: i
Vowel 004: o
Vowel 005: u
Vowel 006: ä
Vowel 007: ö
Vowel 008: ü


#### Mengen und assoziative Typen
Möchten Sie nun wissen ob sich ein Buchstabe in der Liste der Vokale (Länge n) befindet, können Sie über diese Liste iterieren. Da diese sequentielle Suche eine Laufzeit in O(n) besitzt, sollte hier bei größeren Datenmengen ein `set` verwendet werden. Im folgenden Codebeispiel wird die Vokalliste in ein `set` übertragen und pro Buchstaben des vorher definierten Namens überprüft, ob es sich um einen Vokal handelt.

In [16]:
# Füge Vokale in die neue Datenstruktur ein:
vowel_set = set()
for vowel in vowels:
    vowel_set.add(vowel)
vowel = set(vowel) # Alternative zum vorherigen Code
# Überprüfe ob die Buchstaben des Namens ein Vokal sind:
for i, letter in enumerate(name):
    letter = letter.lower() # Wandle Groß- in Kleinbuchstaben um
    if letter in vowel_set:
        print(f'Letter {i:d} ({letter}) is a vowel.')
    else:
        print(f'Letter {i:d} ({letter}) is no vowel.')

Letter 0 (c) is no vowel.
Letter 1 (h) is no vowel.
Letter 2 (a) is a vowel.
Letter 3 (p) is no vowel.
Letter 4 (m) is no vowel.
Letter 5 (a) is a vowel.
Letter 6 (n) is no vowel.


Möchten Sie nun bspw. zu einem Nachnamen (Key) einen Vornamen (Value) nachschlagen benötigen sie einen assoziativen Datentyp, ein `dict`:

In [19]:
lastnames = {'Chapman': 'Graham', 'Cleese': 'John',
             'Giliam': 'Terry', 'Idle': 'Eric',
             'Jones': 'Terry', 'Palin': 'Michael'}
if name in lastnames:
    print(f'{name} {lastnames[name]}')
    lastnames[name] += ' Arthur'
# Alternative mit Standardwert, falls Key nicht gefunden:
lastnames.get(name, 'Name not in dict')

Chapman Graham


'Graham Arthur'

Der Code beschreibt die Initialisierung eines Dictionarys, den lesenden, sowie den schreibenden Zugriff. Wie Sie nun auf die Menge der Keys (bspw. 'Chapman') oder Values (bspw. 'John') zugreifen, finden Sie in der oben erwähnten Dokumentationsseite.

### Funktionen
Im Folgenden sehen Sie eine Definition einer Funktion. Wie der Name bereits verrät, berechnet die Funktion die Anzahl der Vokale des übergebenen Wortes. Die Angabe der Typen der Parameter und die Angabe des Rückgabetyps einer Funktion sind optional, werden aber in den [Python Enhancement Proposals (PEP) 8](https://www.python.org/dev/peps/) empfohlen (benötigt mindestens Version 3.5).

In [22]:
def count_vowels(word: str) -> int:
    vowel_count = 0
    for char in word:
        if char.lower() in vowel_set:
            vowel_count += 1
    return vowel_count

name = "Eric Idle"
n = count_vowels(name)
print(f'{name} contains {n:d} vowels.')

Eric Idle contains 4 vowels.


Darüber hinaus ist es in Python möglich anonyme Funktionen zu definieren (mit Hilfe des Lambda-Operators). Das wird meistens verwendet für Funktionen, die nur aus einem Befehl bestehen und die nicht wiederverwendet werden müssen, wie zum Beispiel die Schlüsselfunktion beim Sortieren.

In [26]:
for i in map(lambda x: x**2, range(10)):  # Map wendet eine Funktion auf jedes Element einer Sequenz an
    print(i)

0
1
4
9
16
25
36
49
64
81


### Lesen und Schreiben von Dateien
Dateien können in Python in unterschiedlichen Modi geöffnet werden. Im folgenden Code beschränken wir uns auf den lesenden (r) und schreibenden (w) Modus. Zum Zugriff auf die Datei wird die [`open`-Methode](https://docs.python.org/3/library/functions.html#open) in einem `with`-Block verwendet. Dieser Block schließt die Datei automatisch, auch wenn bspw. ein Fehler während des Lesens auftritt.
Eine weitere verwendete Methode ist `join`, welche den String `\n` (Symbol für eine neue Zeile) verwendet, um eine Liste aus Strings zu verketten. Es wird also
`vowels[0] + '\n' + vowels[1] + '\n' + ...`
ausgeführt.

In [29]:
with open('vowels.txt', 'w') as text_file:
    text_file.write('\n'.join(vowels))

with open('vowels.txt', 'r') as text_file:
    for line in text_file:
        print(line.strip())

a
e
i
o
u
ä
ö
ü
