<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="img/cover-small.jpg" />

Dieses Notizbuch enthält einen angepassten Auszug aus der [Whirlwind Tour of Python](http://www.oreilly.com/programming/free/a-whirlwind-tour-of-python.csp) von Jake VanderPlas; Der Inhalt ist auf [GitHub](https://github.com/jakevdp/WhirlwindTourOfPython) verfügbar.

Text und Code werden unter der [CC0](https://github.com/jakevdp/WhirlwindTourOfPython/blob/master/LICENSE)- Lizenz veröffentlicht; Das Begleitprojekt, das [Python Data Science Handbook](https://github.com/jakevdp/PythonDataScienceHandbook) wird sehr empfohlen.


# Integrierte Datenstrukturen

Wir haben die einfachen Typen von Python gesehen: i``int``, ``float``, ``complex``, ``bool``, ``str``, usw. Python verfügt außerdem über mehrere integrierte zusammengesetzte Typen, die als Container für andere Typen fungieren. Diese Datentypen sind:


| Type Name | Example                   |Description                            |
|-----------|---------------------------|---------------------------------------|
| ``list``  | ``[1, 2, 3]``             | Ordered collection                    |
| ``tuple`` | ``(1, 2, 3)``             | Immutable ordered collection          |
| ``dict``  | ``{'a':1, 'b':2, 'c':3}`` | Unordered (key,value) mapping         |
| ``set``   | ``{1, 2, 3}``             | Unordered collection of unique values |

Runde, eckige und geschweifte Klammern haben hier sehr unterschiedliche Bedeutungen, wenn es um die Art der erstellten Sammlung geht. Wir werden uns hier einen kurzen Überblick verschaffen.

## Listen
Listen sind der grundlegende *geordnete* und *veränderliche* Collection-Typ in Python. Listen können mit durch Kommas getrennten Werten in eckigen Klammern definiert werden; Hier ist zum Beispiel eine Liste der ersten Primzahlen:

In [1]:
L = [2, 3, 5, 7]

Listen verfügen über eine Reihe nützlicher Eigenschaften und Methoden. Hier werfen wir einen kurzen Blick auf einige der gebräuchlichsten und nützlichsten:

In [2]:
# Length of a list
len(L)

4

In [3]:
# Append a value to the end
L.append(11)
L

[2, 3, 5, 7, 11]

In [4]:
# Addition concatenates lists
L + [13, 17, 19]

[2, 3, 5, 7, 11, 13, 17, 19]

In [5]:
# sort() method sorts in-place
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

[1, 2, 3, 4, 5, 6]

In [2]:
L = [2, 5, 1, 6, 3, 4]
print(sorted(L))
L

[2, 5, 1, 6, 3, 4]

Darüber hinaus gibt es viele weitere integrierte Listenmethoden; Sie werden in der [Online-Dokumentation](https://docs.python.org/3/tutorial/datastructures.html) von Python ausführlich behandelt.

Bisher haben wir Listen Listen gesehen, die Werte eines einzelnen Typs enthalten. Listen können Objekte jeden Typs oder sogar eine Mischung aus Typen enthalten. Zum Beispiel:

In [7]:
L = [1, 'two', 3.14, [0, 3, 5]]

L2 = ["one", "two", "three"]
L2.sort()
L2

['one', 'three', 'two']

Diese Flexibilität ist eine Folge des dynamischen Typsystems von Python. Das Erstellen einer solchen gemischten Sequenz in einer statisch typisierten Sprache wie C kann viel mehr Kopfschmerzen bereiten! Wir sehen, dass Listen sogar andere Listen als Elemente enthalten können. Diese Typflexibilität ist ein wesentlicher Faktor dafür, dass sich Python-Code relativ schnell und einfach schreiben lässt.

Bisher haben wir Manipulationen an Listen als Ganzes in Betracht gezogen; Ein weiterer wesentlicher Bestandteil ist der Zugriff auf einzelne Elemente. Dies geschieht in Python über *Indizierung* und *Slicing* , was wir als Nächstes untersuchen werden.

### Listenindizierung und Slicing 
Python bietet Zugriff auf Elemente in zusammengesetzten Typen durch *Indizierung* für einzelne Elemente und *Slicing* für mehrere Elemente. Wie wir sehen werden, werden beide durch eine Syntax in eckigen Klammern gekennzeichnet. Angenommen, wir kehren zu unserer Liste der ersten Primzahlen zurück:

In [10]:
L = [2, 3, 5, 7, 11]

Python verwendet eine *Null-basierte* Indizierung, sodass wir mit der folgenden Syntax auf das erste und zweite Element zugreifen können:

In [8]:
L[0]

2

In [9]:
L[1]

3

Auf Elemente am Ende der Liste kann mit negativen Zahlen, beginnend bei -1, zugegriffen werden:

In [10]:
L[-1]

11

In [5]:
L[-2]

IndexError: list index out of range

Wir können uns dieses Indizierungsschema so visualisieren:


![List Indexing Figure](img/list-indexing.png)

In der Abbildung werden Werte in der Liste durch große Zahlen in den Quadraten dargestellt; Listenindizes werden durch kleine Zahlen oben und unten dargestellt. In diesem Fall wird mit ``L[2]`` zurückgegeben ``5``, da dies der nächste Wert bei index ``2`` ist.

Während die *Indizierung* ein Mittel zum Abrufen eines einzelnen Werts aus der Liste ist, ist das *Slicing* ein Mittel zum Zugriff auf mehrere Werte in Unterlisten. Für das *Slicing* verwenden wir einen Doppelpunkt, um den Startpunkt (*einschließlich*) und den Endpunkt (***nicht*** *einschließlich*) der Unterliste anzugeben. Um beispielsweise die ersten drei Elemente der Liste zu erhalten, können wir schreiben:

In [11]:
L[0:3]

[2, 3, 5, 7]

Wir erkennen, wo ``0`` und ``3`` im vorherigen Diagramm liegen und wie das Slicing nur die Werte zwischen den Indizes annimmt. Wenn wir den ersten Index ``0`` weglassen, wird von ``0`` ausgegangen, so dass wir äquivalent schreiben können:

In [13]:
L[:3]

[2, 3, 5]

Wenn wir den letzten Index weglassen, wird standardmäßig die Länge der Liste verwendet. Somit kann auf die letzten drei Elemente wie folgt zugegriffen werden:

In [14]:
L[-3:]

[5, 7, 11]

Schließlich ist es möglich, eine dritte Ganzzahl anzugeben, die die Schrittgröße darstellt; Um beispielsweise jedes zweite Element der Liste auszuwählen, können wir schreiben:

In [15]:
L[::2]  # equivalent to L[0:len(L):2]

[2, 5, 11]

Eine besonders nützliche Variante davon ist die Angabe eines negativen Schritts, der die Liste umkehrt:

In [13]:
L[::-1]

[11, 5, 2]

Sowohl die Indizierung als auch das Slicing können verwendet werden, um Elemente festzulegen und auf sie zuzugreifen. Die Syntax ist wie erwartet:

In [14]:
L[0] = 100
print(L)

[100, 3, 5, 7, 11]


In [18]:
L[1:3] = [55, 56]
print(L)

[100, 55, 56, 7, 11]


Eine sehr ähnliche Slicing-Syntax wird auch in vielen datenwissenschaftsorientierten Paketen verwendet, darunter in NumPy und Pandas.

Python hat keinen Datentypen für Arrays. Listen dienen hier als leistungsfähiger Ersatz.

Nachdem wir nun Python-Listen und den Zugriff auf Elemente in geordneten zusammengesetzten Typen kennengelernt haben, werfen wir einen Blick auf die anderen drei zuvor erwähnten zusammengesetzten Standarddatentypen.

## Tuple
Tupel ähneln Listen in vielerlei Hinsicht, werden jedoch durch Klammern statt durch eckige Klammern definiert:

In [19]:
t = (1, 2, 3)

Sie können auch ganz ohne Klammern definiert werden:

In [20]:
t = 1, 2, 3
print(t)

(1, 2, 3)


Wie die zuvor besprochenen Listen haben Tupel eine Länge und einzelne Elemente können mithilfe der Indizierung in eckigen Klammern extrahiert werden:

In [21]:
len(t)

3

In [22]:
t[0]

1

Das Hauptunterscheidungsmerkmal von Tupeln besteht darin, dass sie ***unveränderlich*** sind. Dies bedeutet, dass ihre Größe und ihr Inhalt nach ihrer Erstellung nicht mehr geändert werden können:

In [23]:
t[1] = 4

TypeError: 'tuple' object does not support item assignment

In [None]:
t.append(4)

AttributeError: 'tuple' object has no attribute 'append'

Tupel werden häufig in Python-Programmen verwendet; Ein besonders häufiger Fall sind Funktionen, die mehrere Rückgabewerte haben. Beispielsweise gibt die ``as_integer_ratio()`` Methode von Gleitkommaobjekten einen Zähler und einen Nenner zurück; Dieser duale Rückgabewert liegt in Form eines Tupels vor:

In [None]:
x = 0.125
x.as_integer_ratio()

(1, 8)

Diese mehrfachen Rückgabewerte können wie folgt individuell zugewiesen werden:

In [None]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

0.125


Die Indizierungs- und Slicing-Logik der Listen funktioniert neben einer Vielzahl anderer Methoden auch für Tupel. Eine vollständigere Liste finden wir in der Online- [Python documentation](https://docs.python.org/3/tutorial/datastructures.html).

## Dictionaries
Dictionaries sind äußerst flexible Zuordnungen von Schlüsseln zu Werten. Sie bilden die Grundlage für einen Großteil der internen Implementierung von Python. Sie können über eine durch Kommas getrennte Liste von ``key:value``-Paaren in geschweiften Klammern erstellt werden:

In [None]:
numbers = {'one':1, 'two':2, 'three':3}

Auf Elemente wird über die für Listen und Tupel verwendete Indexierungssyntax zugegriffen – außer dass der Index hier keine nullbasierte Reihenfolge, sondern ein gültiger Schlüssel im Dictionary ist:

In [None]:
# Access a value via the key
numbers['two']

2

Neue Elemente können dem Wörterbuch auch mithilfe der Indizierung hinzugefügt werden:

In [None]:
# Set a new key:value pair
numbers['ninety'] = 90
print(numbers)

{'three': 3, 'ninety': 90, 'two': 2, 'one': 1}


 Dictionaries erhalten keine Reihenfolge für die Eingabewerte aufrecht. Das ist beabsichtigt. Durch diese fehlende Ordnung können Dictionaries sehr effizient implementiert werden, sodass der zufällige Elementzugriff unabhängig von der Größe des Dictionary sehr schnell erfolgt (wenn Sie wissen möchten, wie das funktioniert, lesen Sie mehr über das Konzept einer Hash-Tabelle). Die [Python-Dokumentation](https://docs.python.org/3/library/stdtypes.html) enthält eine vollständige Liste der verfügbaren Methoden.

## Sets - Mengen
Die vierte Basiskollektion ist das Set, das ungeordnete Sammlungen einzigartiger Elemente enthält. Sets werden ähnlich wie Listen und Tupel definiert, außer dass sie die geschweiften Klammern von Dictionaries verwenden:

In [None]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

Wer mit der Mathematik von Mengen vertraut ist, kennt Operationen wie Vereinigung, Schnittmenge, Differenz, symmetrische Differenz und andere. In Pythons Mengen sind alle diese Operationen über Methoden oder Operatoren integriert. Für jede Operation sehen wir hier die beiden äquivalenten Methoden:

### Vereinigung

In [None]:
# union: items appearing in either
primes | odds      # with an operator
primes.union(odds) # equivalently with a method

{1, 2, 3, 5, 7, 9}

### Schnittmenge

In [None]:
# intersection: items appearing in both
primes & odds             # with an operator
primes.intersection(odds) # equivalently with a method

{3, 5, 7}

In [None]:
# difference: items in primes but not in odds
primes - odds           # with an operator
primes.difference(odds) # equivalently with a method

{2}

### Symmetrische Differenz

In [None]:
# symmetric difference: items appearing in only one set
primes ^ odds                     # with an operator
primes.symmetric_difference(odds) # equivalently with a method

{1, 2, 9}

Es stehen viele weitere festgelegte Methoden und Operationen zur Verfügung.
Eine vollständige Referenz finden wir in der Online-Dokumentation von [Python](https://docs.python.org/3/library/stdtypes.html).

## Spezialisiertere Datenstrukturen

Python enthält mehrere andere Datenstrukturen, die für uns nützlich sein könnten. Diese sind in der Regel im integrierten ``collections`` Modul zu finden. Das ``collections`` Modul ist in der [Online-Dokumentation von Python](https://docs.python.org/3/library/collections.html) vollständig dokumentiert. 

Folgendes Datenstrukturen sind besonders nützlich:

- ``collections.namedtuple``: Wie ein Tupel, aber jeder Wert hat einen Namen
- ``collections.defaultdict``: Wie ein Wörterbuch, aber nicht spezifizierte Schlüssel haben einen vom Benutzer angegebenen Standardwert
- ``collections.OrderedDict``: Wie ein Wörterbuch, aber die Reihenfolge der Schlüssel bleibt erhalten

Sobald man die standardmäßig integrierten Collection-Typen kennengelernt hat, ist die Verwendung dieser erweiterten Funktionen sehr intuitiv. Es ist empfohlen, sich über [deren Verwendung zu informieren](https://docs.python.org/3/library/collections.html).

---
**SELBST AUSPROBIEREN!**

**AUFGABE 6-1. Glossar:**
Ein Python-Wörterbuch kann verwendet werden, um ein echtes Wörterbuch zu modellieren. Um Verwirrung zu vermeiden, nennen wir es jedoch ein **Glossar**.

- Denke an fünf Begriffe aus der Python-Programmierung, die du bisher gelernt hast. Verwende diese Wörter als Schlüssel in deinem Glossar und speichere ihre Bedeutungen als Werte.
- Gib jedes Wort und seine Bedeutung in einer ordentlich formatierten Ausgabe aus. Du könntest das Wort gefolgt von einem Doppelpunkt und dann seiner Bedeutung ausgeben, oder das Wort auf einer Zeile drucken und dann seine Bedeutung auf einer zweiten Zeile eingerückt ausgeben. Verwende das Zeichen für einen Zeilenumbruch (`(\n`), um eine leere Zeile zwischen jedem Wort-Bedeutungs-Paar in deiner Ausgabe einzufügen.

In [15]:
# AUFGABE 6.1
# DEIN CODE HIER:

glossary = {"int": "Ganze Zahl", 
            "float": "Gleitkommazahl", 
            "sort()": "Methode, die 'in-place' sortiert",
            "tuple": "unveränderliche geordnete 'Liste'",
            "set": "ungeordnete Sammlung einzigartiger Werte"}

for key in glossary:    
    print(f"{key}: {glossary[key]}")
    
for key in glossary:    
    print(f"{key}: \n{glossary[key]}\n")
    
print(glossary)

int: Ganze Zahl
float: Gleitkommazahl
sort(): Methode, die 'in-place' sortiert
tuple: unveränderliche geordnete 'Liste'
set: ungeordnete Sammlung einzigartiger Werte
int: 
Ganze Zahl

float: 
Gleitkommazahl

sort(): 
Methode, die 'in-place' sortiert

tuple: 
unveränderliche geordnete 'Liste'

set: 
ungeordnete Sammlung einzigartiger Werte

{'int': 'Ganze Zahl', 'float': 'Gleitkommazahl', 'sort()': "Methode, die 'in-place' sortiert", 'tuple': "unveränderliche geordnete 'Liste'", 'set': 'ungeordnete Sammlung einzigartiger Werte'}
