# Einf√ºhrung in Python

Diese Einf√ºhrung ist auf **Deutsch** geschrieben, um deutschsprachigen interessierten Lesern in die Programmiersprache Python eine Alternative zu all den anderen auf Englisch verfassten Einf√ºhrungen im Internet und in Sachb√ºchern anbieten und sich somit von den anderen Lernmaterialien abheben zu k√∂nnen; zu bestimmten Begriffen werden aber stattdessen von den englischen √úbersetzungen Gebrauch gemacht, da diese in der Regel international in der Python-Community verwendet werden und somit deren Kenntnis bei eigenst√§ndiger weiterf√ºhrender Recherche im Internet (wie z.B. bei L√∂sung eines Problems) sehr hilfreich sein k√∂nnen (bzw. in manchen F√§llen sogar unabdingbar sein kann). Dar√ºber hinaus dient diese Zusammenfassung mir selbst auch als eine M√∂glichkeit bestehendes Wissen zu verfestigen und die M√∂glichkeit wahrzunehmen, anderen Lesern klar und verst√§ndlich die wichtigsten Konzepte vermitteln zu k√∂nnen.

Die in dieser Einf√ºhrung aufgef√ºhrten Abschnitte orientieren sich prim√§r an folgendem **Buch** und werden bei M√∂glichkeit durch eigene Code-Beispiele erweitert: 

![image.png](attachment:image.png)

## Welche Objekte gibt es eigentlich in Python?
In diesem Abschnitt werden wir uns mit den **unterschiedlichen Objekten** auseinandersetzen, die bereits zu Beginn in Python vorliegen (d.h. es handelt sich hierbei um sogenannte *built-in* Objekte) und was man mit ihnen alles machen kann (wir werden uns folglich ebenfalls mit ihren Methoden auseinandersetzen); es gibt aber noch viele weitere Objekte in Python, die durch andere Python-Libraries/Packages bei Bedarf mit integriert werden k√∂nnen (wie z.B. das *Dataframe*-Objekt in *Pandas*). Des Verst√§ndnisses halber werden im weiteren Verlauf zudem weiterf√ºhrende bzw. mit einem bestimmten Thema einhergehende Konzepte gleichsam erkl√§rt, die aber auch √ºbersprungen werden k√∂nnen.

Da mir pers√∂nlich der Umgang mit Python mit dem Wissen √ºber die zugrunde liegenden Strukturen und ihren Funktionalit√§ten deutlich leichter gefallen ist, finde ich, dass dieser Abschnitt relativ vorne in der Einf√ºhrung angesetzt werden sollte und somit als eine gute **Grundlage** f√ºr weitere Aspekte zu dieser Programmiersprache dient.

Jeder Abschnitt schlie√üt mit einer **Reihe von hilfreichen Beispielen** ab, die einerseits die Methodik veranschaulichen und andererseits den Umgang mit den jeweiligen Objekten sch√§rfen soll.

Python unterscheidet prinzipiell zwischen folgenden **Objekten**: 
- **Numbers** (Zahlen),
- **Strings** (Text),
- **Lists** (Listen),
- **Dictionaries** (prinzipiell eine Art "√úbersetzungsbuch"),
- **Tuples** (wie das gleichnamige mathematische Tupel),
- **Files** (Dateien),
- **Sets** (eine bestimmte in Python definierte "Menge"),
- **Booleans** (Objekte, die entweder wahr oder falsch sein k√∂nnen),
- **Funktionen, Module und Klassen** (also somit nach bestimmten Einheiten eines Programms), und
- **Kompilierter Code** (das ist eine Art "transformierter" Python-Code, auf den im weiteren Verlauf n√§her eingegangen werden wird und zu Beginn erst einmal √ºbersprungen werden kann).

### Numbers
Im Grunde genommen unterscheiden wir in diesem Fall zwischen **ganzen Zahlen** und **Dezimalzahlen**, die auch *Integers* und *Floating-Point Numbers* bezeichnet werden; es gibt auch noch weitere Varianten, wie z.B. die komplexen Zahlen, die jedoch der √úbersichtlichkeit halber hier nicht aufgef√ºhrt werden. *Floating-Point* r√ºhrt daher, dass Computer aufgrund ihrer Hardware-Architektur nicht jede beliebige reele Zahl wiedergeben k√∂nnen und somit die zur Verf√ºgung stehenden Bits zum Abspeichern einer Zahl endlich sind und somit die Zahl in einer bestimmten Art und Weise approximiert aufgef√ºhrt werden muss; dies ist aber ein Sachverhalt, welches prim√§r in der Informatik behandelt wird und hier ausgelassen wird.

Wie man erwarten w√ºrde, lassen sich auf Zahlen in Python **arithmetische Operatoren** anwenden, wie die Summe (+), die Subtraktion (-), die Multiplikation (*) und die Division (/):

In [246]:
### Arithmetische Operatoren in Python
print('Addition: ', 25 + 86)
print('Subtraktion:', 25 - 86)
print('Multiplikation:', 7 * 7)
print('Quadratzahl: ', 7 ** 2)
print('Division:', 10 / 7)
print('Division mit Abrunden:', 10 // 7)
print('Modulo:', 10 % 7)

Addition:  111
Subtraktion: -61
Multiplikation: 49
Quadratzahl:  49
Division: 1.4285714285714286
Division mit Abrunden: 1
Modulo: 3


Analog k√∂nnte man stattdessen auch mit Variablen rechnen, denen Zahlen zugewiesen worden sind; diese fungieren daraufhin somit als **Platzhalter**:

In [251]:
a = 5
b = 4

print('Addition: ', a + b)
print('Subtraktion:', a - b)
print('Multiplikation:', a * a)
print('Quadratzahl: ', a ** 2)
print('Division:', a / b)
print('Division mit Abrunden:', a // b)
print('Modulo:', a % b)

Addition:  9
Subtraktion: 1
Multiplikation: 25
Quadratzahl:  25
Division: 1.25
Division mit Abrunden: 1
Modulo: 1


Die oben aufgef√ºhrten Zeilen geben die beispielhaften **Ergebnisse** zu den jeweiligen arithmetischen Operatoren wieder. 

Dem Leser f√§llt wahrscheinlich ganz unten in der Zelle der **Modulo** auf: das ist ein Operator, mit dem bei einer Division mit Rest eben jener Rest zur√ºckgegeben werden kann. Dies ist beispielsweise hilfreich, um eine gerade bzw. ungerade Zahl identifizieren zu k√∂nnen.

Bevor wir aber fortfahren, werden einige dazugeh√∂rige **Feinheiten** erkl√§rt: 

Einerseits werden die Ergebnisse (die wir auch einfach als Output abk√ºrzen k√∂nnen) mit einem zus√§tzlichen Text am Anfang eingeblendet, die Bestandteile der sogenannten **print**-Funktion sind: die *built-in*-Funktion dient ausschlie√ülich dazu Informationen f√ºr den Programmierer im Textformat sichtbar auszugeben oder weiterzuverarbeiten; das k√∂nnen Zahlen, l√§ngere Texte aber auch bestimmte Outputs im Tabellenformat sein (wie z.B. als Dataframe in *Pandas*). Eine Funktion erkennen wir daran, dass einer Bezeichnung eine ge√∂ffnete und einer geschlossene Klammer folgen, wie z.B. hier die *print()*-Funktion.

Andererseits k√∂nnen wir bereits mit dieser relativ simplen Python-Funktion eine weitere wichtige Eigenschaft von definierbaren Funktionen allgemein identifizieren, und zwar, dass Funktionen (wie in diesem Falle die *print*-Funktion) **Argumente** annehmen, mit denen ihr Output gezielt gesteuert werden kann (in den meisten F√§llen gibt es aber bestimmte Argumente, die mindestens definiert m√ºssen, um eine Funktion √ºberhaupt ausf√ºhren zu k√∂nnen; alle anderen werden als optionale Argumente bezeichnet.). 

Welche Argumente genau das sind, kann man f√ºr eine jede Funktion einsehen. F√ºr die ***print*-Funktion** w√§re das beispielsweise:
![image.png](attachment:image.png)

Diese Informationen lassen sich in diesem Jupyter Notebook aufrufen, wenn man die Funktionsbezeichnung mit einer offenen Klammer eintippt und direkt danach die Tastenkombination **Umschalttaste+Tab** dr√ºckt; dies ruft zu einer jeden definierten Funktion den hinterlegten *Docstring* auf, der eine Art "Zusammenfassung" darstellt und eine vom Programmierer verfasste Beschreibung der jeweiligen Funktionalit√§ten zur√ºckgibt.

Eine weitere M√∂glichkeit Informationen zu einer bestimmten Funktion einzusehen, besteht darin, die dazugeh√∂rige **Dokumentation** aufzurufen; hierbei handelt es sich um die sogenannte "Betriebsanleitung", die in diesem Falle einer *built-in*-Funktion in der offiziellen Python-Dokumentation aufgefunden werden kann: https://docs.python.org/3/library/functions.html#print. Dasselbe gilt auch f√ºr Funktionen, die durch andere Python-Pakete definiert werden; es liegt prinzipiell immer auch eine ausf√ºhrliche Dokumentation vor, die technisch detailliert alle dazugeh√∂rigen Eigenschaften beschreibt und auf der jeweiligen offiziellen Website abgelegt ist (f√ºr *Pandas* w√§re das beispielsweise https://pandas.pydata.org/docs/).

Am Docstring f√ºr die *print*-Funktion erkennen wir, dass unter anderem die Argumente ***value*** und ***sep*** festgelegt werden k√∂nnen: W√§hrend Ersteres z.B. ganz einfach f√ºr Zahlen steht, die ausgegeben werden sollen, erm√∂glicht Letzteres das dazugeh√∂rige Format anzupassen. Ein einfaches Beispiel w√§re, dass wir die Zahlen 1, 2, 3 mit Komma getrennt als Output zur√ºckgeben wollen. Um dies zu erreichen, m√ºssen wir aber das zweite Argument *sept* mit definieren. Andernfalls bekommen wir n√§mlich folgendes Output:

In [202]:
print(1,2,3)

1 2 3


Setzen wir hingegen aber das zweite Argument auf **sep = ','**, so werden die aufgef√ºhrten Zahlen mit einem Komma wie gew√ºnscht wiedergegeben (anstelle der einfachen Anf√ºhrungszeichen ' ' k√∂nnen auch die doppelten " " verwendet werden):

In [204]:
print(1,2,3, sep=',')

1,2,3


Das Festlegen eines Arguments mittels des **Gleichheitszeichens =** hebt eine weitere Eigenschaft von Python hervor, und zwar, dass dieser Operator ausschlie√ülich dazu dient einem definierten Objekt einen Wert zuzuweisen (ein Objekt wird deklariert); in diesem Falle wird dem Argument **sep** der Wert **','** zugewiesen. 

Ein weiteres **Beispiel** f√ºr zwei Objekte k√∂nnte wie folgt aussehen:

In [237]:
a = 4
b = 4
print('a = {} \nb = {}'.format(a, b))

a = 4 
b = 4


Hier weisen wir den Objekten a und b die gleiche Zahl 4 zu. M√∂chten wir nun √ºberpr√ºfen, ob diese beiden Objekte tats√§chlich identisch sind, so w√ºrden wir eine unbeabsichtigte Operation durchf√ºhren, wenn wir wir das einfache Gleichheitszeichen = verwenden w√ºrden:

In [240]:
a = b

Wenn die obere Zelle ausgef√ºhrt wird, so scheint auf dem erstem Blick erst einmal nichts zu passieren. Wenn wir den Ausdruck hingegen mit der *print*-Funktion ausgeben wollen, so bekommen wir eine Fehlermeldung: 

In [241]:
print(a = b)

TypeError: 'a' is an invalid keyword argument for print()

Dies hat damit zu tun, dass die *print*-Funktion auszugebende Werte erwartet, die in diesem Falle nicht vorliegen, da das Gleichheitszeichen prim√§r der Zuweisung von Werten dient; und die Zuweisung selbst kann nicht als Output wiedergegeben werden. Um die Gleichheit zweier Objekte zu √ºberpr√ºfen, muss stattdessen ein anderer Python-Operator verwendet werden, und zwar das **doppelte Gleichheitszeichen ==**:

In [256]:
a == b

False

Da sowohl a und b die gleiche Zahl 4 darstellen, bekommen wir als Ergebnis den wahren Wert "**True**" zur√ºck; das ist ein sogenannter boolescher Ausdruck, der im weiter unten aufgef√ºhrten Abschnitt "Booleans" n√§her erl√§utert wird; das Ergebnis k√∂nnte bei Bedarf auch mit der *print*-Funktion als Text zur√ºckgegeben werden.

Wenn wir den beiden Objekten a und b andere Werte zuordnen und auf Gleichheit untersuchen w√ºrden, so erhalten wir erwartungsgem√§√ü den falschen Wert **False** als Ergebnis zur√ºck: 

In [243]:
a = 3
b = 4
a == b

False

Die bisher behandelten mathematischen Operatoren waren aber eher einfach und stellen nicht die Gesamtheit der M√∂glichkeiten dar, mit denen mathematische Operationen in Python durchgef√ºhrt werden k√∂nnen. 

Weitere Operatoren und bestimmte wichtige mathematische Konstanten stehen dem Anwender zur Verf√ºgung, wenn z.B. das Python-Modul **math** eingelesen bzw. importiert wird. Als Beispiel dient das Rechnen mit der Zahl ${\pi}$ :

In [249]:
import math

pi = math.pi
pi

3.141592653589793

Hierf√ºr muss zuerst das jeweilige Modul importiert werden (das erreichen wir mit dem Ausdruck "import math"); Module stellen im Grunde genommen **Python-Dateien** dar, in denen mehrere vordefinierte Funktionen abliegen und die bei Bedarf eingesetzt werden k√∂nnen (wie z.B. hier die Zahl ${\pi}$). Manche Module liegen bereits auf dem lokalen Rechner ab und k√∂nnen somit direkt eingelesen werden; diese werden bei der erstmaligen Installation und Einrichtung von Python mit installiert. Dies gilt jedoch f√ºr viele weitere Module nicht (wie z.B. das Modul *NumPy*), die dann zu Beginn vom Anwender selbst installiert werden m√ºssen; hierauf wird weiter unten n√§her eingegangen.

Auf Bestandteile eines Moduls kann mittels der **Punkt-Notation** zugegriffen werden, indem man den Namen des Moduls definiert "math" und diesen mittels Punkt mit dem gew√ºnschten Element kombiniert ausgibt (also in unserem Beispiel "math.pi"). Eine weitere Interpretation der Punkt-Notation besteht darin, dass das Modul selbst ein Objekt darstellt und mit dem Punkt als Trennzeichen Python versteht, dass auf Elemente dieses Objekts zugegriffen werden soll. 

Es muss jedoch eine Unterscheidung vorgenommen im Hinblick auf die Elemente eines definierten Objekts, denn hierbei unterscheidet Python zwischen Dingen, die man mit diesem Objekt machen kann (den zur Verf√ºgung stehenden **Methoden**) und den Eigenschaften, die in Bezug auf das Objekt abgerufen werden k√∂nnen (den sogenannten **Attributen**); dies wirkt sich n√§mlich gleichsam auf die Art und Weise aus, wie man den Code schreiben w√ºrde.

Im oberen Fall z.B. setzen wir keine Methode des Moduls *math* ein, sondern greifen auf eine **vordefinierte Eigenschaft** (bzw. Attribut) zur√ºck, und zwar die Zahl ${\pi}$. Dies erkennen wir dadurch. dass im Befehl "math.pi" hinter dem "pi" keine Klammern gesetzt worden sind (wie das z.B. mit der *print*-Funktion der Fall gewesen ist). W√ºrden wir hingegen Klammern setzen (z.B. "math.pi()"), so w√ºrde das einen Fehler verursachen.

Ein Beispiel f√ºr eine Methode im *math*-Modul ist hingegen das **Wurzelziehen** der Zahl 9, die wir als Argument in der Methode *math.sqrt()* mit definieren m√ºssen:

In [252]:
math.sqrt(9)

3.0

Eine genaue **√úbersicht** zu den mathematischen Methoden, die im *math*-Modul zur Verf√ºgung stehen, kann unter folgendem Link eingesehen werden: https://docs.python.org/3/library/math.html#.

#### Aufgaben

### Strings

Eines der leicht verst√§ndlichsten Beispiele f√ºr einen **String** w√§re folgende Variable:

In [3]:
variable_string1 = "Hello World"
variable_string1

'Hello World'

Hierbei handelt es sich augenschaulich um Text, welches als Output ausgegeben wird. Dass es sich um Text handelt, ist f√ºr den Leser zwar direkt ersichtlich, im Hintergrund jedoch ist die folgende Variable als eine Aneinanderreihung (auf Englisch *Sequence*) von Zeichen definiert; sowohl die Buchstaben als auch das Leerzeichen. Und jedes Zeichen in einem String kann eindeutig anhand seiner Position identifiziert werden (Strings werden intuitiv von links nach rechts gelesen).

Aber auch bei folgender Variable handelt es sich um einen String, obwohl wir lediglich ein Zeichen vorliegen haben:

In [4]:
variable_string2 = "a"
variable_string2

'a'

Aufgrund der Tatsache, dass es sich um eine *Sequence* handelt - also um eine geordnete Kombination von Objekten - k√∂nnen die einzelnen Objekte bzw. Elemente dieses Objekts, dem String, gleichsam referenziert werden. Wenn wir beispielsweise nur den ersten Gro√übuchstaben des Satzes "Hello World" extrahieren wollen, so k√∂nnen wir das mit der Notation **[ ]** erreichen:

In [6]:
variable_string1[0]

'H'

Wollen wir hingegen das erste Wort auslesen, so l√§sst sich das ebenfalls leicht durchf√ºhren, indem man mehrere Zeichen des Strings erfasst:

In [8]:
variable_string1[:5]

'Hello'

In diesem Falle geben wir vor, dass wir **alle Zeichen bis zur f√ºnften Stelle** ausgeben lassen m√∂chten und wird als *Slicing* bezeichnet; es sei anzumerken, dass Python bei der Zahl 0 zu z√§hlen beginnt und bei der 4 aufh√∂rt (die 5 ist nicht mit eingeschlossen und dient als Obergrenze).

Diese Notation kann ebenfalls f√ºr andere Objekte in Python verwendet werden, wie z.B. ***Lists*** und ***Tuples***, was im weiteren Verlauf in den jeweiligen Abschnitten n√§her erl√§utert wird.

Strings lassen sich dar√ºber hinaus relativ einfach kombinieren, was als ***Concatenating*** beschrieben wird:

In [9]:
string1 = "Hello"
string2 = " World"
string1 + string2

'Hello World'

Hierbei muss aber gew√§hrleistet werden, **dass die zu kombinierenden Objekte auch tats√§chlich Strings darstellen**; die obige Syntax w√ºrde auf einen Fehler laufen, falls es sich um einen String und um eine Zahl handeln w√ºrde. Wird die Zahl aber in einen String umgewandelt, so w√ºrde das wiederum wieder funktionieren:

In [10]:
string1 = "Hello"
string2 = str(123)
string1 + string2

'Hello123'

Die **Umwandlung** einer Zahl (bzw. eines *Integers*) in einen String (bzw. die Umwandlung von einen Datentypen in einen anderen) kann mittels der built-in-Methode **str()** einfach ausgef√ºhrt werden (wobei das nicht f√ºr jedes Objekt funktioniert, wie z.B. f√ºr eine Liste).

Eine wichtige Eigenschaft von Strings ist die der *Immutability*; das bedeutet, dass man das einmal erzeugte Objekt (bzw. die Datenstruktur) nachtr√§glich nicht modifizieren kann. Dieser Befehl, in dem wir den ersten Buchstaben durch einen kleingeschriebenen Buchstaben ersetzen wollen, beispielsweise w√ºrde auf einen Fehler laufen:

In [11]:
string1 = "Hello"
string1[0] = 'h'

TypeError: 'str' object does not support item assignment

Weitere hilfreiche Methoden, die auf Strings angewendet werden k√∂nnen, werden zum Schluss im Abschnitt zu den **Aufgaben** behandelt.

Ein letztes Thema, welches einen Ausblick auf eine weiterf√ºhrende Funktionalit√§t in Bezug auf Strings erm√∂glichen soll, betrifft das ***Pattern Matching*** bzw. die ***Regular Expressions***, womit die M√∂glichkeit subsumiert wird einen bestehenden String auf ein bestimmtes Muster hin zu untersuchen.

Ein einfaches **Beispiel**, welches dem folgendem [Link](https://www.w3schools.com/python/python_regex.asp) entnommen ist, w√§re: 

In [14]:
import re

variable_text = "The rain in Spain"
re.search("^The.*Spain$", variable_text)

<re.Match object; span=(0, 17), match='The rain in Spain'>

Im Prinzip wird der String "variable_text" verwendet, um zu √ºberpr√ºfen, ob dieser mit "The" beginnt und mit "Spain" aufh√∂rt; da er dies tut, wird ein **Match** ausgegeben, wobei das Match der String selbst ist.

Dies ist lediglich ein sehr einfaches Beispiel und es gibt noch viele **weitere M√∂glichkeiten und Methoden**, die mit Regular Expressions m√∂glich ist; eine genaue Behandlung von Regular Expressions erfolgt aufgrund seiner Komplexit√§t in einem separaten Kapitel.

#### Aufgaben

### Lists

### Dictionaries

### Tuples

### Files

### Sets

### Booleans

### Funktionen, Module und Klassen

### Kompilierter Code

[17570002, 17572342, 17572345, 17573005, 17579000, 17579329]