# Python Tutorial

Dieses Python Tutorial behandelt nur die wesentlichen Informationen, um Daten zu analysieren und zu visualisieren. Für weitergehende Informationen wird das offizielle (englischsprachige) [The Python Tutorial](https://docs.python.org/3/tutorial/) empfohlen.

## Python Code in Jupyter Notebooks

Jupyter Notebooks unterstützen die direkte Ausführung von Python Code. Daher können Beispiele wie das folgende direkt ausgeführt werden, indem die entsprechende Zelle gestartet (*run*) wird:

In [None]:
print("Hallo Welt!")

## Kommentare

Es ist oft sehr hilfreich und es wird an vielen Stellen wärmstens empfohlen den Python Code so gut zu dokumentieren, dass andere ihn einfach verstehen können.

Kommentare beginnen mit dem # Zeichen, gehen bis zum Ende einer Zeile und können sowohl am Anfang einer Zeile als auch nach einem Leerzeichen genutzt werden.

In [None]:
print("Hallo Welt!") # Hier beginnt der Kommentar
#print("Hallo Kommentar!") Dies ist ein Kommentar am Beginn der Zeile und der Code nach dem # wird nicht ausgeführt

## Datentypen und Variablen

Python unterstützt verschiedene Datentypen, wobei wir nur folgende [integrierte Datentypen](https://docs.python.org/3/library/stdtypes.html) genauer beschreiben werden:

- Nummern
- Strings
- Listen

### Zahlen (Numbers)

Python kann sehr einfach als Taschenrechner eingesetzt werden:

In [None]:
1 + 2 * 3 / 4

Python unterscheidet hierbei zwischen folgenden Zahlentypen:
- `int` (Integer) - [Ganze Zahlen](https://de.wikipedia.org/wiki/Ganze_Zahl) z.B. `-5` oder `10`
- `float` - [Reelle Zahl](https://de.wikipedia.org/wiki/Reelle_Zahl) z.B. `-9.9` oder `2.5`
- `complex` - [Komplexe Zahl](https://de.wikipedia.org/wiki/Komplexe_Zahl) z.B. `complex('1+2j')` - diese spielen aber im folgenden keine Rolle und können ignoriert werden

Python [integriert eine Reihe von Operatoren um Berechnungen durchzuführen](https://docs.python.org/3/library/operator.html#mapping-operators-to-functions). Hier sind einige Beispiele:

| Operation                                                        | Syntax |
| ---------------------------------------------------------------- | ------ |
| Addition                                                         | a + b  |
| Subtraktion                                                      | a - b  |
| Multiplikation                                                   | a * b  |
| Division                                                         | a / b  |
| [Potenzieren](https://de.wikipedia.org/wiki/Potenz_(Mathematik)) | a ** b |
| [Modulo](https://de.wikipedia.org/wiki/Division_mit_Rest#Modulo) | a % b  |


Weitere Funktionen für mathematische Operationen, z.B. um die Wurzel einer Zahl zu bestimmen, können über das `math` Modul eingebunden werden, welches unter [Module](#Module) beschrieben wird. 

Python gibt immer nur das Ergebnis der letzten Zeile aus!

**Aufgabe:** Was ist das Ergebnis von $\frac{3^2 + 4^2}{5}$ und als welcher Datentyp wird es ausgegeben?

In [None]:
(3 ** 2 + 4 **2)/5

### Zeichen (Strings)

Python kann Text auf vielfältige Weise verarbeiten. Text wird im Datentyp `String` gespeichert und kann mit Hilfe von einfachen `'` und doppelten `"` Anführungszeichen definiert werden. Um Anführungszeichen innerhalb eines Strings zu verwenden müssen diese mit Hilfe des Backslash `\` maskiert werden. Es gibt zudem einige weitere besondere Zeichen die mit einem Backslash beginnen, die häufigsten sind `\n` für einen Zeilenumbruch und `\\` um einen Backslash auszugeben.

Wird ein `String` als Ergebnis der letzten Zeile eines Programmes ausgegeben, so wird dieser immer in einfachen `'` Anführungsstrichen ausgegeben und alle Backslashes werden ebenfalls ausgegeben. Wird ein `String` jedoch mit Hilfe der `print()` [Funktion](#Funktionen) auf dem Bildschirm ausgegeben, so wird nur der Text ausgegeben. 

Hier einige Beispiele:

In [None]:
"Dies ist ein Text in doppelten Anführungszeichen. Einfache Anführungszeichen ' müssen nicht maskiert werden, doppelte Anführungszeichen \" müssen maskiert werden.\nBeginnt eine neue Zeile und \\ zeigt einen Backslash an." 

In [None]:
'Dies ist ein Text in einfachen Anführungszeichen. Einfache Anführungszeichen \' müssen maskiert werden, doppelte Anführungszeichen " müssen nicht maskiert werden.\nBeginnt eine neue Zeile und \\ zeigt einen Backslash an.'

In [None]:
print("Dies ist ein Text in doppelten Anführungszeichen. Einfache Anführungszeichen ' müssen nicht maskiert werden, doppelte Anführungszeichen \" müssen maskiert werden.\nBeginnt eine neue Zeile und \\ zeigt einen Backslash an.")

In [None]:
print('Dies ist ein Text in einfachen Anführungszeichen. Einfache Anführungszeichen \' müssen maskiert werden, doppelte Anführungszeichen " müssen nicht maskiert werden.\nBeginnt eine neue Zeile und \\ zeigt einen Backslash an.' )

Längere Texte über mehrere Zeilen können definiert werden, indem drei Anführungszeichen am Beginn und Ende verwendet werden, wobei Zeilenumbrüche automatisch übernommen werden, außer die Zeile endet mit einem einfachen Backslash.

Hier ein Beispiel:

In [None]:
print("""\
Zeile 1
Zeile 2 \
ebenfalls Zeile 2
""")

Strings können verkettet werden, entweder mit einem Leerzeichen oder einem `+`. Strings können zudem mit einem `*` wiederholt werden. Hier einige Beispiele:

In [None]:
print("Py" "th" "on")
print("Py" + "thon")
print((3 * "uR" + "großeltern").capitalize())

Das letzte Beispiel enthält bereits die String Methode `capitalize()` welche dafür sorgt, dass nur der erste Buchstabe des Strings ein Großbuchstabe ist. Dies ist eine von vielen [integrierten String Methoden](https://docs.python.org/3/library/stdtypes.html#string-methods).

Python ermöglicht einen einfachen Zugriff auf Teile von Strings indem deren Position in eckigen Klammern `[]` angegeben wird wobei Anfangsposition (in Teilstring enthalten) und Endposition (in Teilstring nicht enthalten) durch einen Doppelpunkt getrennt sind. Die erste Position beginnt bei 0! Bei negativen Zahlen wird die Position von rechts statt von links angegeben. Hier einige Beispiele:

In [None]:
print("abc"[1:2])
print("abc"[1:])
print("abc"[:2])
print("abc"[-1])

### Variablen

Variablen ordnen Daten einen Namen zu um im weiteren Programmablauf auf diese Daten zugreifen zu können. Die Namen von Variablen können keine Leerzeichen enthälten und sollten keine Sonderzeichen enthalten. Es wird empfohlen bei Variablen immer nur Kleinschreibung zu verwenden und mehrere Wörter im Namen einer Variable durch einen Unterstrich `_` zu trennen. Hier einige Beispiele:

In [None]:
meine_variable = "meine daten"
print(meine_variable)
meine_berechnung = 1 + 1
print(meine_berechnung)

Es ist oft hilfreich Text mit Daten aus Variablen auszugeben. Hierfür können [formattierte Strings (auch f-Strings genannt)](https://docs.python.org/3/tutorial/inputoutput.html#formatted-string-literals) genutzt werden, bei denen immer ein f vor den Anführungszeichen des Strings steht:

In [None]:
meine_variable = "meine daten"
print(f"Dies sind {meine_variable}.")
meine_berechnung = 1 / 3
print(f'Dies ist das Ergebnis meiner Berechnung mit zwei Nachkommastellen:\n{meine_berechnung:.2f}')

Es können auch mehreren Variablen gleichzeitig Werte zugewiesen werden:

In [None]:
a, b = "Py","thon"
print(a + b)

### Listen

Listen können in Python genutzt werden um mehrere Daten zu gruppieren. Listen werden mit eckigen Klammern `[]` definiert und können unterschiedliche Datentypen enthalten, meist sind die Daten jedoch alle vom selben Datentyp. Hier einige Beispiele:

In [None]:
quadrate = [1, 4, 9, 16, 25]
print(quadrate)
print(quadrate[0])
print(quadrate[-1])

## Steuerung des Programmablauf

### Bedingungen

Bedingungen ermöglichen es, Code nur bei erfüllung oder nichterfüllung einer oder mehrerer Bedingungen auszuführen.

Es gibt verschiedene Bedingungen um Zahlen oder Strings zu vergleichen, beachte das die Prüfung auf Gleichheit mit 2 `=` angegeben werden muss:

In [None]:
print(1<2)
print(1>2)
print(1==2)
print("Py" in "Python")

In den meisten Fällen wird eine `if` Anweisung genutzt, welche prüft ob eine Bedingung wahr (`if`) ist, dann wird eine Anweisung ausgeführt, ansonsten (`else`) wird eine alternative Anweisung ausgeführt.

In Python ist es dabei sehr wichtig, dass die Anweisungen innerhalb der Bedingung mit mindestens einem Leerzeichen eingerückt sind. Es wird empfohlen immer die gleiche Anzahl an Leerzeichen für Einrückungen zu nutzen. Jupyter Notebooks nutzen oft 4 Leerzeichen:

In [None]:
if True:
    print(True)
    if 1 > 2:
        print("wird nicht ausgeführt")
    else:
        print(False)
else:
    print("wird nicht ausgeführt")

Bei `if` Anweisungen können mehrere Bedingungen hintereinander geprüft werden mit `elif`:

In [None]:
if 1 > 2:
    print("wird nicht ausgeführt")
elif 1 < 2:
    print("Wahr!")
else:
    print("Alles nicht wahr!")


### Schleifen

Anweisungen können in Python mit `for` oder `while` Schleifen wiederholt werden. Die Anweisungen innerhalb von Schleifen müssen eingerückt werden.

Bei einer `while` Schleife werden die Anweisungen so oft ausgeführt, wie die angegebene Bedingung wahr ist:


In [None]:
# Fibonacci Reihe:
# die Summe der letzten beiden Elemente definiert das nächste Element
a, b = 0, 1
while a < 1000:
    print(a, end=',')
    a, b = b, a + b

Bei `for` Schleifen wird über die Elemente einer Liste oder die Zeichen eines Strings iteriert. Das bedeutet, dass immer das nächste Element einer Liste oder Zeichen einest Strings einer Variable zugewiesen wird und dann hierfür die Anweisungen ausgeführt werden:

In [None]:
for i in [1,2,3]:
    print(i,end=" ")

In [None]:
for i in "456":
    print(i,end=" ")

Listen für einen bestimmten Bereich können einfach mit der `range` Funktion angegeben werden. Wird nur ein Parameter für `range` angegeben, so ist dies die Anzahl der Zahlen startend bei 0. Werden zwei Paramter angegeben, so ist der erste Paramater der Start und der zweite Parameter ist das Ende, welches jedoch **nicht** teil der Liste ist:

In [None]:
for i in range(3):
    print(i,end=" ")

In [None]:
for i in range(4,6):
    print(i,end=" ")

Innerhalb einer Schleife kann die aktuelle Iteration mit `continue` beendet und die nächste begonnen werden. Mit `break` wird eine Schleife vorzeitig beendet:

In [None]:
for i in [1,2,3]:
    if i == 2:
        continue
    print(i,end=" ")

In [None]:
for i in [1,2,3]:
    if i == 2:
        break
    print(i,end=" ")

## Funktionen

Funktionen erlauben es, häufig genutzte Anweisungen zentral zu definieren und dann mehrfach zu verwenden. Auch erlauben Funktionen Parameter als Variable zu übergeben, welche dann innerhalb der Funktion genutzt werden können. Funktionen werden mit `def` gefolgt vom Funktionsnamen und geschweiften Klammern definiert. In den geschweiften Klammern können die Namen der Parameter getrennt durch ein Komma angegeben werden. Direkt auf die Funktionsbeschreibung kann ein [Documentation String](https://docs.python.org/3/tutorial/controlflow.html#tut-docstrings) angegeben werden, welche die Funktion beschreibt. Die Anweisung innerhalb einer Funktion müssen mit eingerückt werden:

In [None]:
def fib(n):
    """Gebe eine Fibonacci Reihe aus bis maximal zum Wert n"""
    a, b = 0,1
    while a < n:
        print(a, end=' ')
        a, b = b, a+b
    print()
# Ausgabe der Funktionsbeschreibung
print(fib.__doc__)
# Die Funktion kann nun mit einem Parameter aufgerufen werden
fib(2000)

## Module

Python ermöglicht es, Funktionen in einem Modul zusammenzufassen. Einige Module sind bereits in der Python Standard Library integriert.
Eigene Module können öffentlich in einer Python Registry, in der Regel im [Python Package Index](https://pypi.org/) bereitgestellt werden. Von dort können Module mit dem Tool `pip` installiert werden und mit `import` in einem Python Programm eingebunden und dann genutzt werden. In Jupyter Notebooks

Hier einige Beispiele für häufig genutzte Module der Python Standard Library:
- [math](https://docs.python.org/3/library/math.html) - Einfache mathematische Funktionien
- [statistics](https://docs.python.org/3/library/statistics.html) - Statistische Funktionen
- [json](https://docs.python.org/3/library/json.html) - Funktionen um den bei Webanwendungen häufig genutzten [JSON](https://de.wikipedia.org/wiki/JavaScript_Object_Notation) Datentypen zu verarbeiten
- [io](https://docs.python.org/3/library/io.html) - Funktionen für die Ein- und Ausgabe von Daten z.B. aus Dateien

Hier einige häufig genutzte Python Module aus dem Python Package Index:
- [NumPy](https://numpy.org/) - Umfangreiche Sammlung von Mathematischen Funktionen 
- [Pendulum](https://pendulum.eustace.io/) - Funktionen zur Verarbeitung von Datumsangaben insbesondere mit Zeitzonen
- [matplotlib](https://matplotlib.org/) - Funktionen um Daten zu Visualisieren
- [seaborn](https://seaborn.pydata.org/) - Statistische Datenvisualisierung
- [Requests](https://requests.readthedocs.io/en/master/) - Funktionen für HTTP und REST APIs 
- [Pandas](https://pandas.pydata.org/) - Funktionen zur Datenanalyse und Datenverarbeitung

In Jupyter Notebooks können Befehle im Betriebssystem mit Hilfe eines Ausrufezeichens `!` ausgeführt werden:

In [4]:
!python --version

Python 3.7.8


Auf diesem Weg können auch Pakete mittels `pip` installiert werden:

In [8]:
!pip install emojis

Collecting emojis
  Downloading emojis-0.6.0-py3-none-any.whl (27 kB)
Installing collected packages: emojis
Successfully installed emojis-0.6.0


In [11]:
import emojis
print(emojis.encode(':smile: :wave:'))

😄 👋
