# Einführung in Python

Diese Einführung ist auf **Deutsch** geschrieben, um deutschsprachigen interessierten Lesern in die Programmiersprache Python eine Alternative zu all den anderen auf Englisch verfassten Einführungen im Internet und in Sachbüchern anbieten und sich somit von den anderen Lernmaterialien abheben zu können; zu bestimmten Begriffen werden aber stattdessen von den englischen Übersetzungen Gebrauch gemacht, da diese in der Regel international in der Python-Community verwendet werden und somit deren Kenntnis bei eigenständiger weiterführender Recherche im Internet (wie z.B. bei Lösung eines Problems) sehr hilfreich sein können (bzw. in manchen Fällen sogar unabdingbar sein kann). Darüber hinaus dient diese Zusammenfassung mir selbst auch als eine Möglichkeit bestehendes Wissen zu verfestigen und die Möglichkeit wahrzunehmen, anderen Lesern klar und verständlich die wichtigsten Konzepte vermitteln zu können.

Die in dieser Einführung aufgeführten Abschnitte orientieren sich primär an folgendem **Buch** und werden bei Möglichkeit durch eigene Code-Beispiele erweitert: 

![image.png](attachment:image.png)

## Welche Objekte gibt es eigentlich in Python?
In diesem Abschnitt werden wir uns mit den **unterschiedlichen Objekten** auseinandersetzen, die bereits zu Beginn in Python vorliegen (d.h. es handelt sich hierbei um sogenannte *built-in* Objekte) und was man mit ihnen alles machen kann (wir werden uns folglich ebenfalls mit ihren Methoden auseinandersetzen); es gibt aber noch viele weitere Objekte in Python, die durch andere Python-Libraries/Packages bei Bedarf mit integriert werden können (wie z.B. das *Dataframe*-Objekt in *Pandas*). Des Verständnisses halber werden im weiteren Verlauf zudem weiterführende bzw. mit einem bestimmten Thema einhergehende Konzepte gleichsam erklärt, die aber auch übersprungen werden können.

Da mir persönlich der Umgang mit Python mit dem Wissen über die zugrunde liegenden Strukturen und ihren Funktionalitäten deutlich leichter gefallen ist, finde ich, dass dieser Abschnitt relativ vorne in der Einführung angesetzt werden sollte und somit als eine gute **Grundlage** für weitere Aspekte zu dieser Programmiersprache dient.

Jeder Abschnitt schließt mit einer **Reihe von hilfreichen Beispielen** ab, die einerseits die Methodik veranschaulichen und andererseits den Umgang mit den jeweiligen Objekten schärfen soll.

Python unterscheidet prinzipiell zwischen folgenden **Objekten**: 
- **Numbers** (Zahlen),
- **Strings** (Text),
- **Lists** (Listen),
- **Dictionaries** (prinzipiell eine Art "Übersetzungsbuch"),
- **Tuples** (wie das gleichnamige mathematische Tupel),
- **Files** (Dateien),
- **Sets** (eine bestimmte in Python definierte "Menge"),
- **Booleans** (Objekte, die entweder wahr oder falsch sein können),
- **Funktionen, Module und Klassen** (also somit nach bestimmten Einheiten eines Programms), und
- **Kompilierter Code** (das ist eine Art "transformierter" Python-Code, auf den im weiteren Verlauf näher eingegangen werden wird und zu Beginn erst einmal übersprungen werden kann).

### Numbers
Im Grunde genommen unterscheiden wir in diesem Fall zwischen **ganzen Zahlen** und **Dezimalzahlen**, die auch *Integers* und *Floating-Point Numbers* bezeichnet werden; es gibt auch noch weitere Varianten, wie z.B. die komplexen Zahlen, die jedoch der Übersichtlichkeit halber hier nicht aufgeführt werden. *Floating-Point* rührt daher, dass Computer aufgrund ihrer Hardware-Architektur nicht jede beliebige reele Zahl wiedergeben können und somit die zur Verfügung stehenden Bits zum Abspeichern einer Zahl endlich sind und somit die Zahl in einer bestimmten Art und Weise approximiert aufgeführt werden muss; dies ist aber ein Sachverhalt, welches primär in der Informatik behandelt wird und hier ausgelassen wird.

Wie man erwarten würde, lassen sich auf Zahlen in Python **arithmetische Operatoren** anwenden, wie die Summe (+), die Subtraktion (-), die Multiplikation (*) und die Division (/):

In [246]:
### Arithmetische Operatoren in Python
print('Addition: ', 25 + 86)
print('Subtraktion:', 25 - 86)
print('Multiplikation:', 7 * 7)
print('Quadratzahl: ', 7 ** 2)
print('Division:', 10 / 7)
print('Division mit Abrunden:', 10 // 7)
print('Modulo:', 10 % 7)

Addition:  111
Subtraktion: -61
Multiplikation: 49
Quadratzahl:  49
Division: 1.4285714285714286
Division mit Abrunden: 1
Modulo: 3


Analog könnte man stattdessen auch mit Variablen rechnen, denen Zahlen zugewiesen worden sind; diese fungieren daraufhin somit als **Platzhalter**:

In [251]:
a = 5
b = 4

print('Addition: ', a + b)
print('Subtraktion:', a - b)
print('Multiplikation:', a * a)
print('Quadratzahl: ', a ** 2)
print('Division:', a / b)
print('Division mit Abrunden:', a // b)
print('Modulo:', a % b)

Addition:  9
Subtraktion: 1
Multiplikation: 25
Quadratzahl:  25
Division: 1.25
Division mit Abrunden: 1
Modulo: 1


Die oben aufgeführten Zeilen geben die beispielhaften **Ergebnisse** zu den jeweiligen arithmetischen Operatoren wieder. 

Dem Leser fällt wahrscheinlich ganz unten in der Zelle der **Modulo** auf: das ist ein Operator, mit dem bei einer Division mit Rest eben jener Rest zurückgegeben werden kann. Dies ist beispielsweise hilfreich, um eine gerade bzw. ungerade Zahl identifizieren zu können.

Bevor wir aber fortfahren, werden einige dazugehörige **Feinheiten** erklärt: 

Einerseits werden die Ergebnisse (die wir auch einfach als Output abkürzen können) mit einem zusätzlichen Text am Anfang eingeblendet, die Bestandteile der sogenannten **print**-Funktion sind: die *built-in*-Funktion dient ausschließlich dazu Informationen für den Programmierer im Textformat sichtbar auszugeben oder weiterzuverarbeiten; das können Zahlen, längere Texte aber auch bestimmte Outputs im Tabellenformat sein (wie z.B. als Dataframe in *Pandas*). Eine Funktion erkennen wir daran, dass einer Bezeichnung eine geöffnete und einer geschlossene Klammer folgen, wie z.B. hier die *print()*-Funktion.

Andererseits können wir bereits mit dieser relativ simplen Python-Funktion eine weitere wichtige Eigenschaft von definierbaren Funktionen allgemein identifizieren, und zwar, dass Funktionen (wie in diesem Falle die *print*-Funktion) **Argumente** annehmen, mit denen ihr Output gezielt gesteuert werden kann (in den meisten Fällen gibt es aber bestimmte Argumente, die mindestens definiert müssen, um eine Funktion überhaupt ausführen zu können; alle anderen werden als optionale Argumente bezeichnet.). 

Welche Argumente genau das sind, kann man für eine jede Funktion einsehen. Für die ***print*-Funktion** wäre das beispielsweise:
![image.png](attachment:image.png)

Diese Informationen lassen sich in diesem Jupyter Notebook aufrufen, wenn man die Funktionsbezeichnung mit einer offenen Klammer eintippt und direkt danach die Tastenkombination **Umschalttaste+Tab** drückt; dies ruft zu einer jeden definierten Funktion den hinterlegten *Docstring* auf, der eine Art "Zusammenfassung" darstellt und eine vom Programmierer verfasste Beschreibung der jeweiligen Funktionalitäten zurückgibt.

Eine weitere Möglichkeit Informationen zu einer bestimmten Funktion einzusehen, besteht darin, die dazugehörige **Dokumentation** aufzurufen; hierbei handelt es sich um die sogenannte "Betriebsanleitung", die in diesem Falle einer *built-in*-Funktion in der offiziellen Python-Dokumentation aufgefunden werden kann: https://docs.python.org/3/library/functions.html#print. Dasselbe gilt auch für Funktionen, die durch andere Python-Pakete definiert werden; es liegt prinzipiell immer auch eine ausführliche Dokumentation vor, die technisch detailliert alle dazugehörigen Eigenschaften beschreibt und auf der jeweiligen offiziellen Website abgelegt ist (für *Pandas* wäre das beispielsweise https://pandas.pydata.org/docs/).

Am Docstring für die *print*-Funktion erkennen wir, dass unter anderem die Argumente ***value*** und ***sep*** festgelegt werden können: Während Ersteres z.B. ganz einfach für Zahlen steht, die ausgegeben werden sollen, ermöglicht Letzteres das dazugehörige Format anzupassen. Ein einfaches Beispiel wäre, dass wir die Zahlen 1, 2, 3 mit Komma getrennt als Output zurückgeben wollen. Um dies zu erreichen, müssen wir aber das zweite Argument *sept* mit definieren. Andernfalls bekommen wir nämlich folgendes Output:

In [202]:
print(1,2,3)

1 2 3


Setzen wir hingegen aber das zweite Argument auf **sep = ','**, so werden die aufgeführten Zahlen mit einem Komma wie gewünscht wiedergegeben (anstelle der einfachen Anführungszeichen ' ' können auch die doppelten " " verwendet werden):

In [204]:
print(1,2,3, sep=',')

1,2,3


Das Festlegen eines Arguments mittels des **Gleichheitszeichens =** hebt eine weitere Eigenschaft von Python hervor, und zwar, dass dieser Operator ausschließlich dazu dient einem definierten Objekt einen Wert zuzuweisen (ein Objekt wird deklariert); in diesem Falle wird dem Argument **sep** der Wert **','** zugewiesen. 

Ein weiteres **Beispiel** für zwei Objekte könnte wie folgt aussehen:

In [237]:
a = 4
b = 4
print('a = {} \nb = {}'.format(a, b))

a = 4 
b = 4


Hier weisen wir den Objekten a und b die gleiche Zahl 4 zu. Möchten wir nun überprüfen, ob diese beiden Objekte tatsächlich identisch sind, so würden wir eine unbeabsichtigte Operation durchführen, wenn wir wir das einfache Gleichheitszeichen = verwenden würden:

In [240]:
a = b

Wenn die obere Zelle ausgeführt wird, so scheint auf dem erstem Blick erst einmal nichts zu passieren. Wenn wir den Ausdruck hingegen mit der *print*-Funktion ausgeben wollen, so bekommen wir eine Fehlermeldung: 

In [241]:
print(a = b)

TypeError: 'a' is an invalid keyword argument for print()

Dies hat damit zu tun, dass die *print*-Funktion auszugebende Werte erwartet, die in diesem Falle nicht vorliegen, da das Gleichheitszeichen primär der Zuweisung von Werten dient; und die Zuweisung selbst kann nicht als Output wiedergegeben werden. Um die Gleichheit zweier Objekte zu überprüfen, muss stattdessen ein anderer Python-Operator verwendet werden, und zwar das **doppelte Gleichheitszeichen ==**:

In [256]:
a == b

False

Da sowohl a und b die gleiche Zahl 4 darstellen, bekommen wir als Ergebnis den wahren Wert "**True**" zurück; das ist ein sogenannter boolescher Ausdruck, der im weiter unten aufgeführten Abschnitt "Booleans" näher erläutert wird; das Ergebnis könnte bei Bedarf auch mit der *print*-Funktion als Text zurückgegeben werden.

Wenn wir den beiden Objekten a und b andere Werte zuordnen und auf Gleichheit untersuchen würden, so erhalten wir erwartungsgemäß den falschen Wert **False** als Ergebnis zurück: 

In [243]:
a = 3
b = 4
a == b

False

Die bisher behandelten mathematischen Operatoren waren aber eher einfach und stellen nicht die Gesamtheit der Möglichkeiten dar, mit denen mathematische Operationen in Python durchgeführt werden können. 

Weitere Operatoren und bestimmte wichtige mathematische Konstanten stehen dem Anwender zur Verfügung, wenn z.B. das Python-Modul **math** eingelesen bzw. importiert wird. Als Beispiel dient das Rechnen mit der Zahl ${\pi}$ :

In [249]:
import math

pi = math.pi
pi

3.141592653589793

Hierfür muss zuerst das jeweilige Modul importiert werden (das erreichen wir mit dem Ausdruck "import math"); Module stellen im Grunde genommen **Python-Dateien** dar, in denen mehrere vordefinierte Funktionen abliegen und die bei Bedarf eingesetzt werden können (wie z.B. hier die Zahl ${\pi}$). Manche Module liegen bereits auf dem lokalen Rechner ab und können somit direkt eingelesen werden; diese werden bei der erstmaligen Installation und Einrichtung von Python mit installiert. Dies gilt jedoch für viele weitere Module nicht (wie z.B. das Modul *NumPy*), die dann zu Beginn vom Anwender selbst installiert werden müssen; hierauf wird weiter unten näher eingegangen.

Auf Bestandteile eines Moduls kann mittels der **Punkt-Notation** zugegriffen werden, indem man den Namen des Moduls definiert "math" und diesen mittels Punkt mit dem gewünschten Element kombiniert ausgibt (also in unserem Beispiel "math.pi"). Eine weitere Interpretation der Punkt-Notation besteht darin, dass das Modul selbst ein Objekt darstellt und mit dem Punkt als Trennzeichen Python versteht, dass auf Elemente dieses Objekts zugegriffen werden soll. 

Es muss jedoch eine Unterscheidung vorgenommen im Hinblick auf die Elemente eines definierten Objekts, denn hierbei unterscheidet Python zwischen Dingen, die man mit diesem Objekt machen kann (den zur Verfügung stehenden **Methoden**) und den Eigenschaften, die in Bezug auf das Objekt abgerufen werden können (den sogenannten **Attributen**); dies wirkt sich nämlich gleichsam auf die Art und Weise aus, wie man den Code schreiben würde.

Im oberen Fall z.B. setzen wir keine Methode des Moduls *math* ein, sondern greifen auf eine **vordefinierte Eigenschaft** (bzw. Attribut) zurück, und zwar die Zahl ${\pi}$. Dies erkennen wir dadurch. dass im Befehl "math.pi" hinter dem "pi" keine Klammern gesetzt worden sind (wie das z.B. mit der *print*-Funktion der Fall gewesen ist). Würden wir hingegen Klammern setzen (z.B. "math.pi()"), so würde das einen Fehler verursachen.

Ein Beispiel für eine Methode im *math*-Modul ist hingegen das **Wurzelziehen** der Zahl 9, die wir als Argument in der Methode *math.sqrt()* mit definieren müssen:

In [252]:
math.sqrt(9)

3.0

Eine genaue **Übersicht** zu den mathematischen Methoden, die im *math*-Modul zur Verfügung stehen, kann unter folgendem Link eingesehen werden: https://docs.python.org/3/library/math.html#.

#### Aufgaben

### Strings

Eines der leicht verständlichsten Beispiele für einen **String** wäre folgende Variable:

In [3]:
variable_string1 = "Hello World"
variable_string1

'Hello World'

Hierbei handelt es sich augenschaulich um Text, welches als Output ausgegeben wird. Dass es sich um Text handelt, ist für den Leser zwar direkt ersichtlich, im Hintergrund jedoch ist die folgende Variable als eine Aneinanderreihung (auf Englisch *Sequence*) von Zeichen definiert; sowohl die Buchstaben als auch das Leerzeichen. Und jedes Zeichen in einem String kann eindeutig anhand seiner Position identifiziert werden (Strings werden intuitiv von links nach rechts gelesen).

Aber auch bei folgender Variable handelt es sich um einen String, obwohl wir lediglich ein Zeichen vorliegen haben:

In [4]:
variable_string2 = "a"
variable_string2

'a'

Aufgrund der Tatsache, dass es sich um eine *Sequence* handelt - also um eine geordnete Kombination von Objekten - können die einzelnen Objekte bzw. Elemente dieses Objekts, dem String, gleichsam referenziert werden. Wenn wir beispielsweise nur den ersten Großbuchstaben des Satzes "Hello World" extrahieren wollen, so können wir das mit der Notation **[ ]** erreichen:

In [6]:
variable_string1[0]

'H'

Wollen wir hingegen das erste Wort auslesen, so lässt sich das ebenfalls leicht durchführen, indem man mehrere Zeichen des Strings erfasst:

In [8]:
variable_string1[:5]

'Hello'

In diesem Falle geben wir vor, dass wir **alle Zeichen bis zur fünften Stelle** ausgeben lassen möchten und wird als *Slicing* bezeichnet; es sei anzumerken, dass Python bei der Zahl 0 zu zählen beginnt und bei der 4 aufhört (die 5 ist nicht mit eingeschlossen und dient als Obergrenze).

Diese Notation kann ebenfalls für andere Objekte in Python verwendet werden, wie z.B. ***Lists*** und ***Tuples***, was im weiteren Verlauf in den jeweiligen Abschnitten näher erläutert wird.

Strings lassen sich darüber hinaus relativ einfach kombinieren, was als ***Concatenating*** beschrieben wird:

In [9]:
string1 = "Hello"
string2 = " World"
string1 + string2

'Hello World'

Hierbei muss aber gewährleistet werden, **dass die zu kombinierenden Objekte auch tatsächlich Strings darstellen**; die obige Syntax würde auf einen Fehler laufen, falls es sich um einen String und um eine Zahl handeln würde. Wird die Zahl aber in einen String umgewandelt, so würde das wiederum wieder funktionieren:

In [10]:
string1 = "Hello"
string2 = str(123)
string1 + string2

'Hello123'

Die **Umwandlung** einer Zahl (bzw. eines *Integers*) in einen String (bzw. die Umwandlung von einen Datentypen in einen anderen) kann mittels der built-in-Methode **str()** einfach ausgeführt werden (wobei das nicht für jedes Objekt funktioniert, wie z.B. für eine Liste).

Eine wichtige Eigenschaft von Strings ist die der *Immutability*; das bedeutet, dass man das einmal erzeugte Objekt (bzw. die Datenstruktur) nachträglich nicht modifizieren kann. Dieser Befehl, in dem wir den ersten Buchstaben durch einen kleingeschriebenen Buchstaben ersetzen wollen, beispielsweise würde auf einen Fehler laufen:

In [11]:
string1 = "Hello"
string1[0] = 'h'

TypeError: 'str' object does not support item assignment

Weitere hilfreiche Methoden, die auf Strings angewendet werden können, werden zum Schluss im Abschnitt zu den **Aufgaben** behandelt.

Ein letztes Thema, welches einen Ausblick auf eine weiterführende Funktionalität in Bezug auf Strings ermöglichen soll, betrifft das ***Pattern Matching*** bzw. die ***Regular Expressions***, womit die Möglichkeit subsumiert wird einen bestehenden String auf ein bestimmtes Muster hin zu untersuchen.

Ein einfaches **Beispiel**, welches dem folgendem [Link](https://www.w3schools.com/python/python_regex.asp) entnommen ist, wäre: 

In [14]:
import re

variable_text = "The rain in Spain"
re.search("^The.*Spain$", variable_text)

<re.Match object; span=(0, 17), match='The rain in Spain'>

Im Prinzip wird der String "variable_text" verwendet, um zu überprüfen, ob dieser mit "The" beginnt und mit "Spain" aufhört; da er dies tut, wird ein **Match** ausgegeben, wobei das Match der String selbst ist.

Dies ist lediglich ein sehr einfaches Beispiel und es gibt noch viele **weitere Möglichkeiten und Methoden**, die mit Regular Expressions möglich ist; eine genaue Behandlung von Regular Expressions erfolgt aufgrund seiner Komplexität in einem separaten Kapitel.

#### Aufgaben

### Lists

### Dictionaries

### Tuples

### Files

### Sets

### Booleans

### Funktionen, Module und Klassen

### Kompilierter Code

[17570002, 17572342, 17572345, 17573005, 17579000, 17579329]