# Kapitel 2: Grundlagen in Python und Jupyter Notebooks
McKinney, W. (2017). *Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython*. 2. Auflage. Sebastopol, CA [u. a.]: O’Reilly.

Überarbeitet: armin.baenziger@zhaw.ch, 2. Januar 2020

**Hinweise**: 
- Dieses Kapitel gibt einen ersten Einblick in Python und das Jupyter Notebook. 
- **Es ist somit nicht erforderlich, dass Sie bereits alle Details des Kapitels verstehen.**
- Bedenken Sie, dass man eine Programmiersprache nur lernt, wenn man sich dabei "die Hände schmutzig macht". Versuchen Sie, viel zu üben. 

In [None]:
%autosave 0

`%autosave` ist ein sogenannter *Magic command*, welcher das Jupyter Notebook steuert. `%autosave 100` würde bedeuten, dass das Notebook alle 100 Sekunden gespeichert wird. `%autosave 0` bewirkt, dass das Notebook *nicht* automatisch gespeichert wird. 

Als nächstes importieren wir die Bibliothek `sys` und ermitteln Ihre Python-Version:

In [None]:
import sys
sys.version

## Zellen in Jupyter Notebooks
Die Eingabe von Python-Befehlen bzw. -Funktionen erfolgt in Jupyter Notebooks in sog. Zellen. Output wird gegebenenfalls in der gleichen Zelle dargestellt.

In [None]:
4 + 5

### Markdown

Text kann mit Markdown-Zellen zu Jupyter Notebooks hinzugefügt werden. Markdown ist eine beliebte Markup-Sprache, die eine Obermenge von HTML ist.
#### Grundlagen
Text kann *kursiv* und **fett** geschrieben werden.

Listen:
- Man kann einfach Listen bilden, welche auch
    - Unterlisten enthalten können.
    - Das ist sehr praktisch
    
Nummerierte Listen:
1. Man kann auch nummerierte Listen erstellen.
1. Auch das ist einfach.
 
Horizontale Linie:
***

- LaTeX-Formeln im Text, z.B: $x^2$, geht auch.
- Man kann Formeln auch absetzen:
$$ \sum x_i = n \cdot \bar{x} $$

Tabellen:
Zudem ist es möglich, Tabellen zu erstellen:

| $i$| $x_i$ | $y_i$ |
| ---|-------| ------|
| 1  | 15    | 32    |
| 2  | 11    | 21    |
| 3  | 13    | 25    |

Link:
http://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html

### Kommentare
Kommentare können mit der Raute (schweiz. Gartenhag, engl. hash) hinzugefügt werden. *Alles hinter einer Raute wird vom Interpreter ignoriert.*

In [None]:
# Erzeugung einer sog. Python-Liste mit []:
wochentage = ['Mo', 'Di', 'Mi', 'Do', 'Fr', 'Sa', 'So']
# Werte aus der Liste ziehen: Python beginnt die Indizierung mit 0!
wochentage[0]        # erstes Element der Liste    

In [None]:
wochentage[1]        # zweites Element der Liste

In [None]:
wochentage[-1]       # letztes Element der Liste

**Kontrollfragen**:

In [None]:
# Frage 1: Was ist der Output?
wochentage[3]

In [None]:
# Frage 2: Was ist der Output?
wochentage[-3]

### Tab-Vervollständigung (Tab Completion)

In [None]:
eine_Orange = 'Jaffa'
eine_Banane = 'Cavendish'

In [None]:
eine_       # Mit Tabulator vervollständigen 

In [None]:
# Mit dem Tabulator können auch sog. Methoden und Attribute eines Objekts vervollständigt werden.
wochentage.    # Mit Tabulator vervollständigen

### Introspektion (Object Introspection)
Mit einem Fragezeichen (?) vor oder nach einem Objekt erhält man einige generelle Informationen zum Objekt.

In [None]:
# Informationen zur Liste:
?eine_Orange

In [None]:
# Informationen zur Funktion:
?len

In [None]:
# Anzahl Elemente in der Liste:
len(wochentage)

### Magic Commands

- "Magic Commands" starten mit `%` und sind spezielle Befehle, welche nicht in Python selber implementiert sind.
- Mit "Magic Commands" kann man das Jupyter Notebook steuern. 
- Wir haben weiter oben bereits ein Beispiel von einem "Magic Commands" gesehen: `%autosave 0`
- Mit `%quickref` erhält man eine Übersicht über die Befehle.
- Ein weiteres Beispiel eines "Magic Command": Definierte Variablen

In [None]:
%who

## Grundlagen der Python Sprache
### Sprach-Semantik
#### Einrückung statt Klammern
- Statt (geschweifte) Klammern (wie z.B. in C oder R), werden in Python Programmblöcke durch Einrücken strukturiert.
- Ein Code-Block startet mit einem Doppelpunkt. Danach muss der ganze Block mit *derselben* Anzahl Leerschlägen eingerückt sein.
- *Es ist Usanz, 4 Leerschläge für eine Einrückung zu verwenden*.
- Beispiel (Erklärungen folgen später):

In [None]:
x = 2
if x < 0:
    print('Die Zahl', x, 'ist negativ.')
else:
    print('Die Zahl', x, 'ist nicht negativ.')

- Python Statements müssen *nicht* durch ein Semikolon abgeschlossen werden. Mit Semikolons können aber mehrere Statements auf einer Zeile abgetrennt werden. 
- Man sollte von dieser Möglichkeit allerdings nur in Ausnahmefällen Gebrauch machen, da die Lesbarkeit des Codes dadurch erschwert wird. 

In [None]:
a = 5; b = 6; c = 7   # mehrere Anweisungen auf einer Zeile
print('Summe:', a + b + c)

#### Funktionen und Methoden
- Funktionen werden mit runden Klammern und evt. Argumenten aufgerufen.

In [None]:
text = 'Datenanalyse'
print(text)
len(text)  
# Die Funktion len(x) gibt die Anzahl Elemente des Objekts x zurück. 

- Funktionen können verschachtelt werden:

In [None]:
print('Das Wort', text, 'hat', len(text), 'Buchstaben.')

- Optional kann der Funktionswert einer Variable zugewiesen werden.

In [None]:
n = len(text)
print(n)

- Die meisten *Objekte* in Python haben zugehörige Funktionen, welche Zugriff auf den Inhalt der Objekte haben.
- Man nennt diese Funktionen **Methoden**.
- Methoden werden wie folgt aufgerufen: **`objekt.Methodenname(Argument 1, Argument 2, ...)`**
- Beispiel:

In [None]:
text.upper()  # Die Methode upper() wandelt den Text in Grossbuchstaben um.

In [None]:
text.count('a')  # Anzahl "a" in der Zeichenkette.

**Kontrollfrage**:

In [None]:
# Gegeben:
z = 'Datenanalyse mit Python'

In [None]:
# Frage 1: Wie erhalten wir die Länge der Zeichenkette z?


In [None]:
# Frage 2: Wie viele "e" hat die Zeichenkette z?


#### Bibliotheken importieren
Mit dem Befehl `import` können Bibliotheken ("Libraries") geladen werden, welche den Funktionsumfang von Python in bestimmten Dimensionen erweiteren. Beispiel:

In [None]:
import numpy as np

- Die Anordnung lädt die Bibliothek NumPy, welche eine grundlegende Bibliothek für wissenschaftliche Berechnungen mit Python ist.
- Es ist üblich, die Bibliothek `numpy` mit der Abkürzung `np` zu laden.
- Will man Funktionen dieser Bibliothek aufrufen, stellt man `np.` vor die entsprechende Funktion.
- Beispiel:

In [None]:
np.random.seed(321)
np.random.randint(1, 7, 10)

- Die erste Zeile setzt den Seed für die Ausgabe von Quasi-Zufallszahlen. Wenn ein Seed gesetzt wird, erhält man reproduzierbare (immer die gleichen) "Zufallszahlen".
- Die zweite Zeile erzeugt 10 ganze Zahlen (Integers) von 1 bis und mit 6.
- Kapitel 4 wird sich näher mit der Bibliothek `numpy` befassen.
- Später werden wir uns insb. mit der Bibliothek `pandas` beschäftigen.

#### Binäre Operationen und Vergleiche

In [None]:
5 + 7

In [None]:
12 - 21.5

In [None]:
4 * 3

In [None]:
9 / 4

In [None]:
9 // 4    # Division ohne Rest

In [None]:
9 % 4     # Rest der Division (Modulo)

In [None]:
2 ** 3    # Potenz (Achtung, nicht mit ^ wie z.B. in Excel)

In [None]:
16 ** 0.5 # Potenz mit geborchenem Exponenten (Wurzel)

In [None]:
a = 2; b = 3

In [None]:
a == b    # True, falls a gleich b ist; sonst False

In [None]:
a <= b    # kleiner oder gleich

In [None]:
a > b     # grösser

In [None]:
a != b    # ungleich

In [None]:
(a < 3) & (b < 3)  # "logisches und" mit &
# Nur wenn alle Bedingungen wahr sind, ist der Gesamtausdruck wahr.

In [None]:
(a < 3) | (b < 3)  # "logisches oder" mit |
# Wenn mindestens eine Bedingung wahr ist, ist der Gesamtausdruck wahr.

**Kontrollfragen**:

In [None]:
# Frage 1: Was ist der Output?
2**3

In [None]:
# Frage 2: Was ist der Output?
(5 < 4) | (3 != 2)

Um zu prüfen, ob zwei Referenzen auf das gleiche (unterschiedliche) Objekt(e) zeigen, verwendet man `is` (`is not`).

In [None]:
a = [1, 2, 3]
b = a
a is b     
# a und b sind identische Objekte (mit zwei Namen).

In [None]:
c = [1, 2, 3]
a is c     
# a und b haben gleiche Inhalte, sind aber unterschiedliche Objekte 
# (im Speicher).

In [None]:
# Hingegen:
a == c

In [None]:
a is not c

#### Modifizierbare und nicht modifizierbare Objekte (Mutable and Immutable Objects)
Die meisten Objekte in Python sind modifizierbar (mutable), so z. B. Listen. 

In [None]:
eine_Liste = [1, 2, 3]   # Listen sind modifizierbar.
eine_Liste[0]            # Das erste Element der Liste ausgeben.

In [None]:
eine_Liste[1] = 99       # Das zweite Element der Liste wird verändert.
eine_Liste

Andere Objekte, wie z. B. Tupel, sind *nicht* modifizierbar (*immutable*).

In [None]:
ein_Tupel = (1, 2, 3)   # Tupel werden mit runden Klammern erstellt.
type(ein_Tupel)

In [None]:
ein_Tupel[1]           # Tupel können wie Listen angesprochen werden.

In [None]:
ein_Tupel[1] = 99      # Tupel sind nicht modifizierbar.

**Kontrollfragen**:

In [None]:
# Gegeben:
li = [1, 2, 3]
li[1] = 0

In [None]:
# Frage 1: Was ist der Output?
print(li)

In [None]:
# Frage 2: Was ist der Output?
t = (1, 2, 3)
type(t)

### Skalar-Typen (Scalar Types)
Die "Ein-Wert-Datentypen" umfassen numerische Typen, Zeichenketten (Strings), Boolean (True, False) und Datum/Zeit.

#### Numerische Typen
Die primären numerischen Skalar-Typen in Python sind `int` und `float`.

In [None]:
ganzzahl = 125 ** 12        # Ganze Zahlen sind vom Typ int.

In [None]:
type(ganzzahl)

In [None]:
dezimalzahl = 7.243       # Dezimalzahlen sind vom Typ float.
type(dezimalzahl)

In [None]:
# Wissenschaftliche Notation ist auch möglich:
grosse_zahl = 1.2e6    
grosse_zahl

In [None]:
kleine_zahl = 6.78e-3    
kleine_zahl

#### Zeichenketten (Strings)

In [None]:
a = 'Eine Möglichkeit, einen String zu schreiben.'
b = "Eine weitere Möglichkeit, einen String zu schreiben"

In [None]:
a[0]       # Das erste Zeichen des Strings a ausgeben.

In [None]:
a[-1]      # Das letzte Zeichen des Strings ausgeben.

In [None]:
a[:8]     # Die ersten 8 Zeichen ausgeben. 

Man nennt die Syntax `a[:8]` *"slicing"*. Wir werden uns damit später ausführlicher befassen.

Zeichenketten sind nicht *modifzierbar (immutable)*.

In [None]:
a[0] = 'e'

Man kann aber mit Methoden Zeichenketten ändern bzw. umkopieren:

In [None]:
a = 'Dies ist eine Zeichenkette.'
b = a.replace('eine', 'eine kurze')
b

In [None]:
a     # a ist aber nicht modifiziert!

Mit `+` werden zwei Strings verknüpft.

In [None]:
a = 'Dies ist die erste Hälfte'
b = 'und dies ist die zweite Hälfte.'
a + ' ' + b

**Kontrollfragen**:

In [None]:
# Gegeben:
a = '232'
b = '100'

In [None]:
# Frage 1: Was ist der Output?
a + b

In [None]:
# Frage 2: Was ist der Output?
b.count('0')

#### Booleans

In [None]:
True and True  # and-Bedingung ist wahr, wenn beide Bedingungen wahr sind.

In [None]:
False and True  

In [None]:
False or True  # or-Bedingung ist wahr, wenn mindestens eine Bedingung wahr ist.

In [None]:
False or False

Booleans sind eine Unterklasse von `int`: `False` ist 0 und `True` ist 1

In [None]:
True + 2

In [None]:
True + True + False

In [None]:
False == 0

**Kontrollfragen**:

In [None]:
# Gegeben:
a = 0
b = 2

In [None]:
# Frage 1: Was ist der Output?
a is not b

In [None]:
# Frage 2: Was ist der Output?
(a > 0) + (b > 0)

#### Type-Casting (Typumwandlung)
Mit der Funktion `str` können viele Python-Objekte in einen String umgewandelt werden.

In [None]:
a = 7.1
a

In [None]:
s = '7.1'
s

In [None]:
a*2

In [None]:
s*2        # nicht 14.2, da s ein String ist!

In [None]:
# Mit der Funktion float() wandeln wir das Argument in eine 
# Fliesskommazahl um:  
float(s)*2  

In [None]:
#  Mit int() wird das Argument in eine ganze Zahl umgewandelt:
int(a)

#### None
- `None` ist der "Nichts-Typ" in Python. 

In [None]:
Vornamen = ['Anna', 'Berta', None]
len(Vornamen)

In [None]:
Vornamen[2]  
# Es erscheint kein Wert, aber auch kein Fehler.
# None ist hier lediglich ein Platzhalter.

In [None]:
Vornamen[2] = 'Claudia'  # Platzhalter None überschreiben
Vornamen

**Kontrollfragen**:

In [None]:
# Gegeben:
a = 123

In [None]:
# Frage 1: Was ist der Output?
a + a

In [None]:
# Frage 2: Was ist der Output?
str(a) + str(a)

### Verzweigungen und Schleifen

#### Bedingte Anweisungen und Verzweigungen: if, elif und else
- Eine **Bedingte Anweisung** ist in der Programmierung ein Programmabschnitt, der nur unter einer bestimmten Bedingung ausgeführt wird. 
- Eine **Verzweigung** legt fest, welcher von zwei (oder mehr) Programmabschnitten, abhängig von einer (oder mehreren) Bedingungen, ausgeführt wird.
- *Bedingte Anweisungen* und *Verzweigungen* bilden, zusammen mit den Schleifen, die Kontrollstrukturen der Programmiersprachen. Sie gehören zu den wichtigsten Bestandteilen der Programmierung, da durch sie ein Programm auf unterschiedliche Zustände und Eingaben reagieren kann.
Quelle: https://de.wikipedia.org/wiki/Bedingte_Anweisung_und_Verzweigung

In [None]:
x = -3 
# Bedingte Anweisung:
if x < 0:
    print('x ist negativ')

In [None]:
x = 2
# Verzweigung:
if x < 0:
    print('x ist negativ')
elif x == 0:
    print('x ist null')
elif 0 < x < 5:
    print('x ist positiv, aber kleiner 5')
else:
    print('x ist mindestens 5')

**Kontrollfrage**:

In [None]:
# Gegeben:
a = b = 6

In [None]:
# Frage: Was ist der Output?

if a <= b:
    print('eins')
else:
    print('zwei')

#### for-Schleife (loop)
for-Loops iterieren über eine Kollektion (z.B. Liste, Tupel) oder einen Iterator (siehe unten). Die Standard-Syntax lautet:

```python
for wert in Kollektion:
    # mach etwas mit wert
```
Beispiele:

In [None]:
liste = [0, 1, 2, 3, 4]
for zahl in liste:
    print(zahl ** 2)

In [None]:
# Beispiel mit Interator:
# range(n) erzeugt den Iterator 0, 1, 2, ..., n-1

for zahl in range(5):   
    print(zahl ** 2)

Loops können auch verschachtelt werden:

In [None]:
for i in ['A', 'B']:
    for j in ['a', 'b', 'c']:
        print(i + j)

**Kontrollfrage**:

In [None]:
# Gegeben:
zahlen = [1, 2, 3, 4]

In [None]:
# Frage: Bestimmen Sie die Quadratwurzeln der vier Zahlen 
# der Liste "zahlen".


#### range
Wie zuvor gesehen, kann mit `range` eine Zahlenfolge erstellt werden. 

In [None]:
range(10)

In [None]:
list(range(10))   # Mit der Funktion list() wird eine Liste generiert.

In [None]:
list(range(0, 20, 2))     # gerade Zahlen von 0 bis (aber ohne) 20

In [None]:
list(range(5, 0, -1))     # ganze Zahlen von 5 bis (aber ohne) 0 (zurückgezählt)

`range` wird oft als Iterator verwendet, wie zuvor gesehen.

In [None]:
# Noch ein Beispiel:
for i in range(6):
    print('Die Zahl ist', i)

**Kontrollfragen**:

In [None]:
# Frage 1: Erstellen Sie eine Liste mit den ungeraden 
# natürlichen Zahlen kleiner 30:
liste = 

In [None]:
# Frage 2: Erstellen Sie die Liste [30, 27, 24, ..., 3, 0]:

liste =

## Fazit
- Damit sind wir am Ende der etwas längeren Einführung angelangt. 
- Wir haben einige wichtige Grundlagen von Python kennen gelernt. 
- Wie bereits in der Einleitung erwähnt, werden viele der hier erstmals vorgestellten Konzepte später im Kurs genauer erläutert.
- **Speichern Sie das Notebook (Icon ganz links in der Toolbar). Danach sollten Sie das Notebook über das Menü `File > Close and Halt` schliessen. (Sie sollten nicht einfach den Browser schliessen.)**