 Grundlagen der Programmierung in Python

Programmieren besteht aus einer Aneinanderreihung von Befehlen, die der Python Interpreter ausführt. Ein einfacher Befehl ist die Zuweisung eines Wertes zu einer **Variablen**:

In [1]:
x = 1
# Diese Zelle auswählen und mit `<SHIFT> + <ENTER>` ausführen.
# Der letzte Rückgabewert der Zelle wird dann unten ausgegeben,
# hier also der Wert von `x`:
x

1

> **Hinweis:** Dieses Kursmaterial besteht aus interaktiven [Jupyter Notebooks](http://jupyter.org). Jede _Zelle_, wie die obige, könnt ihr per Klick oder mit den Pfeiltasten auswählen und mit `<SHIFT> + <ENTER>` ausführen. Probiert's mal mit der Zelle oben!
> 
> **Geht, um dem Kurs zu folgen, _alle_ Zellen nacheinander durch und führt sie aus.**
>
> Wie hier demonstriert gibt das Jupyter Notebook immer den letzten Rückgabewert einer Zelle aus. Wir können auch die `print()` Funktion verwenden, um Ausgaben zu generieren:

In [2]:
print(x)

1


Der **Wert** der Variable `x` ist nun der Integer `1`. Werte haben immer einen **Typ** wie

- `int` für ganze Zahlen, z.B. `1`, `42`, `-10`,
- `float` für Fließkommazahlen, z.B. `0.5`, `3.14`, `1e10`,
- `str` für Zeichenketten (_Strings_), z.B. `"Hello World!"`,
- `boolean` für Wahrheitswerte (_Booleans_), also `True` und `False`

> Die Typen der Python Standardlibrary findet ihr in der [Dokumentation](https://docs.python.org/3/library/stdtypes.html).

Da Variablen in Python nicht typisiert sind, können der gleichen Variable nacheinander Werte verschiedener Typen zugewiesen werden:

In [3]:
type(x)

int

In [4]:
x = 0.5
type(x)

float

Weiterhin können Werte in einen anderen Typ konvertiert werden:

In [5]:
x = int(0.5) # Bei der Konvertierung zu int wird immer abgerundet!
x

0

Die grundlegenden Rechenoperationen `+`, `-`, `*`, `/` und `**` sind ebenfalls in Python verfügbar und verhalten sich, wie man es erwartet:

In [6]:
1 + 3

4

In [7]:
3 / 2

1.5

> Die Integer Division ist außerdem in Python 3 als Operator `//` verfügbar:

In [8]:
3 // 2

1

In [9]:
3**2

9

## Aufgabe 1 - Werte und Typen

Der Operator zur Potenzierung ist in Python `**`. Weise einer Variablen `y` folgende Werte zu und lasse dir dann ihren Wert und Typ ausgeben. Stimmen Wert und Typ mit deinen Erwartungen überein?

a) $4^3$

> **Hinweis:** Dies ist eine Übungsaufgabe. Verwende die Zelle unten, um sie zu lösen. **Entferne** dazu den Platzhalter-Code
>
> ```python
> # DEINE LÖSUNG HIER
> ```
>
> und schreibe stattdessen den Code zur Lösung der Aufgabe.

In [10]:
y = 4**3
y, type(y)

(64, int)

> **Hinweis:** Auf die Lösung jeder Aufgabe folgt eine Test-Zelle wie die folgende, mit der du deine Lösung überprüfen kannst. Führe einfach diese Zelle aus. Wenn etwas an deiner Lösung nicht stimmt, erhälst du eine Fehlermeldung mit Hinweisen.

In [11]:
from nose.tools import assert_equal
try:
    y
except NameError:
    raise NameError("Es gibt keine Variable 'y'. Weise den Wert einer Variablen mit diesem Namen zu.")
assert_equal(y, 64, "Die Variable hat nicht den richtigen Wert. Überprüfe deine Rechnung.")
print("👍 Sehr gut!")

👍 Sehr gut!


b) $2+3.4^2$

In [12]:
y = 2 + 3.4**2
y, type(y)

(13.559999999999999, float)

In [13]:
from nose.tools import assert_equal
try:
    y
except NameError:
    raise NameError("Es gibt keine Variable 'y'. Weise den Wert einer Variablen mit diesem Namen zu.")
assert_equal(y, 2 + 3.4**2, "Die Variable hat nicht den richtigen Wert. Überprüfe deine Rechnung.")
print("Ok, du hast es verstanden.")

Ok, du hast es verstanden.


## Strings

Strings sind **Zeichenketten** wie:

In [14]:
s = "Hello World"

und werden in Python vom Typ `str` repräsentiert. Um einen String zu erstellen können wir einzelne (`'`), doppelte (`"`) oder dreifache (`'''` oder `"""`, für mehrzeilige Strings) Anführungszeichen verwenden, sodass das jeweils andere Anführungszeichen im String verwendet werden kann:

In [15]:
s.count(s)

1

In [16]:
"I'm"

"I'm"

Alternativ können Steuerzeichen im String auch _escaped_ werden:

In [17]:
"Say \"hi\""

'Say "hi"'

### Strings sind Reihen

Da Strings eine Aneinanderreihung von Elementen (in diesem Fall Textzeichen) darstellen, können viele Funktionen mit Strings verwendet werden, die mit **Reihen** arbeiten. Dazu gehören:

In [18]:
len(s) # gibt die Zahl der Reihenelemente zurück

11

In [19]:
s[0] # gibt das Element der Reihe an der Stelle 0 zurück

'H'

In [20]:
s + "!" # Reihen können kombiniert werden

'Hello World!'

### Strings sind Objekte

Die meisten "Dinge" in Python sind **Objekte**, d.h. neben ihrem Typ besitzen sie assoziierte **Attribute** und **Methoden**, auf die über einen Punkt `.` zugegriffen werden kann. Neben Strings sind bspw. auch Werte der anderen schon bekannten Datentypen wie `int(5)` und sogar Funktionen und die Datentypen selbst Objekte.

Ein Attribut eines Objekts ist eine Variable, die gelesen und gesetzt werden kann, wie bspw. `x.shape`. Eine Methode ist eine Funktion, die das Objekt zur Verfügung stellt, wie `x.min()`.

Einige Beispiele für Methoden, die Strings zur Verfügung stellen, sind:

In [21]:
s.upper()

'HELLO WORLD'

In [22]:
s.split()

['Hello', 'World']

In [23]:
s.index('World')

6

> **Hinweis:** In Jupyter Notebooks können wir die **`<TAB>`-Vervollständigung** verwenden um die assoziierten Attribute und Methoden eines Objekts zu inspizieren:
>
> ```python
> s = "Hello World"
> # Zelle ausführen, dann:
> s.<TAB> # `s.` tippen und die <TAB>-Taste drücken
> ```
>
> Dies zeigt die verfügbaren Attribute und Methoden des Strings `s` an. Die `<TAB>`-Vervollständigung für eine Variable funktioniert erst nachdem die Variable erstellt wurde, also die Zelle einmal ausgeführt wurde.
>
> Um herauszufinden, was eine Funktion oder Methode tut, könnt ihr im Jupyter Notebook ein Fragezeichen `?` verwenden:
>
>```python
>In [1]: s.split?
>```
>```markdown
>Docstring:
>S.split(sep=None, maxsplit=-1) -> list of strings
>
>Return a list of the words in S, using sep as the
>delimiter string.  If maxsplit is given, at most maxsplit
>splits are done. If sep is not specified or is None, any
>whitespace string is a separator and empty strings are
>removed from the result.
>Type:      builtin_function_or_method
>```
>
> Schreibt ihr stattdessen zwei Fragezeichen `??` zeigt das Jupyter Notebook die gesamte Definition der Funktion oder Methode an.
>
> **Verwendet die `<TAB>`-Vervollständigung und die `?`-Dokumentation häufig um hilfreiche Attribute und Methoden zu finden und zu verstehen!**

## Aufgabe 2 - Strings und Dokumentation

Finde im folgenden String mithilfe einer Methode, wie häufig der Buchstabe `"A"` auftaucht und weise den Wert einer Variable `n` zu. Probiere die `<TAB>`-Vervollständigung und die `?`-Dokumentation aus um eine passende Methode zu finden.

In [24]:
s = "CAGTACCAAGTGAAAGAT"
### BEGIN SOLUTION
n = s.count("A")
### END SOLUTION
print(n)

8


In [25]:
from nose.tools import assert_equal
try:
    y
except NameError:
    raise NameError("Es gibt keine Variable 'n'. Weise den Wert einer Variablen mit diesem Namen zu.")
assert_equal(n, 8, "Das ist nicht die richtige Anzahl. Versuch's mal mit der `count` Methode!")
print("Klappt!")

Klappt!


### String-Formatierung

Eine wichtige Methode ist `str.format()`, die markierte Platzhalter im String mit Werten ersetzt, die der Methode übergeben werden:

In [26]:
x = 10
"Der Wert von x ist {}".format(x)

'Der Wert von x ist 10'

Ein Platzhalter wird durch eine öffnende `{` und schließende `}` geschweifte Klammer begrenzt und kann eine Bezeichnung des Platzhalters sowie Formatierungsoptionen beinhalten:

In [27]:
"{raw_value} ist gerundet {rounded_value:.3f}.".format(raw_value=2/3, rounded_value=2/3)

'0.6666666666666666 ist gerundet 0.667.'

> **Hinweis:** Die vollständige Syntax der String-Formatierung ist in der [Dokumentation](https://docs.python.org/2/library/string.html#format-string-syntax) einzusehen.

## Aufgabe 3 - String Formatierung

Schreibe deinen Namen in die Variable `name`. Verwende dann die `format` Methode um aus `s` und `name` den Gruß `"Hello World, mein Name ist __DEIN_NAME__!"` zusammenzusetzen. Weise den zusammengesetzten String der Variable `greeting` zu.

In [28]:
s = "Hello World"
name = "__DEIN_NAME__"
### BEGIN SOLUTION
greeting = s + ", mein Name ist {name}!".format(name=name)
### END SOLUTION
print(greeting)

Hello World, mein Name ist __DEIN_NAME__!


In [29]:
from nose.tools import assert_in
try:
    greeting
except NameError:
    raise NameError("Es gibt keine Variable 'greeting'. Weise den Wert einer Variablen mit diesem Namen zu.")
assert_in("mein Name ist", greeting)
print("Hello {}! 👋".format(name))

Hello __DEIN_NAME__! 👋


## Listen und Tupel

Während Strings einzelne Zeichen aneinanderreihen, repräsentieren **Listen** und **Tupel** eine Reihe _beliebiger_ Werte. Die Elemente einer Liste können verändert werden, während ein Tupel unveränderlich ist. Wir können Listen erstellen, indem wir die Elemente durch Kommata getrennt in eckigen Klammern `[` und `]` angeben, und Tupel durch die Verwendung runder Klammern `(` und `)`:

In [30]:
l = [ 4, 0.5, "Alice" ]
l

[4, 0.5, 'Alice']

In [31]:
t = ( "Bob", True )
t

('Bob', True)

### Auch Listen und Tupel sind Reihen

Wie bei jeder Reihe können wir die Anzahl der Elemente bestimmen und auf einzelne Elemente über ihren Index zugreifen:

In [32]:
len(l), len(t)

(3, 2)

In [33]:
l[0] # Indexierung beginnt in Python mit dem Index 0

4

In [34]:
l[1]

0.5

In [35]:
l[2]

'Alice'

In [36]:
t[0]

'Bob'

In [37]:
t[1]

True

### Listen sind veränderlich

Anders als Strings und Tupel können Listen jedoch verändert werden, indem Elemente verändert, hinzugefügt oder entfernt werden:

In [38]:
l[1] = -2.2 # Weise der Liste einen neuen Wert beim Index 1 zu
l

[4, -2.2, 'Alice']

In [39]:
l.append(-3) # Füge einen neuen Wert am Ende der liste hinzu
l

[4, -2.2, 'Alice', -3]

In [40]:
l.pop() # Entfernt das letzte Element (bzw. das am angegebenen Index) aus der Liste und gibt es zurück

-3

## Slicing

Du kannst mit der _Slicing_ Syntax auf Teile einer Reihe zugreifen:

```python
slice = list[start:stop:step]
```

Dabei bezeichnet `start` den ersten Index und `stop` den letzten nicht mehr enthaltenen Index des Abschnitts. Mit `step` kannst du eine Schrittweite angeben, in der die Reihe iteriert werden soll.

Du musst nicht alle drei Argumente angeben. Per default ist dann `start=0`, `stop=len(list)` und `step=1`:

In [41]:
l[:2] # Der erste Index ist per default start=0

[4, -2.2]

In [42]:
l[2:] # Der letzte Index ist per default das Ende der Reihe

['Alice']

In [43]:
l[::2] # Jedes zweite Element

[4, 'Alice']

In [44]:
l[::-1] # Umgekehrte Reihenfolge

['Alice', -2.2, 4]

> **Hinweis:** Slicing ist ein mächtiges Werkzeug um kurzen, prägnanten Code zu schreiben und wird dir bei der Arbeit mit _Numpy Arrays_ noch sehr häufig begegnen.

## Dictionaries

Ein weiterer wichtiger Datentyp ist das **Dictionary**. Ein Dictionary ordnet jeweils einem _Key_ einen _Value_ zu und wird durch geschweifte Klammern `{` und `}` erstellt:

In [45]:
d = { 'a':1, 'b':2, 'c':3 }
d

{'a': 1, 'b': 2, 'c': 3}

Auf einzelne Werte kann über ihren Key zugegriffen werden:

In [46]:
d['a']

1

Dictionaries sind veränderlich wie Listen:

In [47]:
d['d'] = 4
d

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

Es müssen nicht unbedingt Strings als Keys verwendet werden, und auch verschiedene Datentypen sind möglich:

In [48]:
e = { 'some_key': 4.2, 3517: 'some_value' }
e

{'some_key': 4.2, 3517: 'some_value'}

In [49]:
e['some_key']

4.2

In [50]:
e[3517]

'some_value'

## Aufgabe 4 - Dictionaries

Schreibe ein Wörterbuch mit einigen deutschen Wörtern und ihrer Übersetzung ins Englische. Weise es der Variable `d` zu und verwende es dann, indem du dir einige Werte darin ausgeben lässt.

In [51]:
### BEGIN SOLUTION
d = {
    "Wörterbuch": "dictionary"
}
### END SOLUTION
d["Wörterbuch"]

'dictionary'

In [52]:
from nose.tools import assert_true
try:
    d
except NameError:
    raise NameError("Es gibt keine Variable 'd'. Weise den Wert einer Variablen mit diesem Namen zu.")
assert_true(len(d) > 0, "Das Wörterbuch hat keine Einträge.")
print("Wow, {} Einträge im Wörterbuch!".format(len(d)))

Wow, 1 Einträge im Wörterbuch!
