<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="img/cover-small.jpg" />

Dieses Notizbuch enthält einen angepassten Auszug aus der [Whirlwind Tour of Python](http://www.oreilly.com/programming/free/a-whirlwind-tour-of-python.csp) von Jake VanderPlas; Der Inhalt ist auf [GitHub](https://github.com/jakevdp/WhirlwindTourOfPython) verfügbar.

Text und Code werden unter der [CC0](https://github.com/jakevdp/WhirlwindTourOfPython/blob/master/LICENSE)- Lizenz veröffentlicht; Das Begleitprojekt, das [Python Data Science Handbook](https://github.com/jakevdp/PythonDataScienceHandbook) wird sehr empfohlen.


# Module und Pakete

Eine Eigenschaft von Python, die es für eine Vielzahl von Aufgaben nützlich macht, ist die Tatsache, dass die Sprache bereits „Batterien enthält“ - das heißt, die Python-Standardbibliothek enthält nützliche Werkzeuge für eine breite Palette von Aufgaben.
Darüber hinaus gibt es ein breites Ökosystem von Tools und Paketen von Drittanbietern, die speziellere Funktionen anbieten.
Hier werfen wir einen Blick auf den Import von Modulen der Standardbibliothek, auf Werkzeuge zur Installation von Modulen von Drittanbietern und auf eine Beschreibung, wie Sie Ihre eigenen Module erstellen können.

## Module laden: die ``import``-Anweisung

Um eingebaute Module und Module von Drittanbietern zu laden, bietet Python die ``import``-Anweisung.
Es gibt einige Möglichkeiten, diese Anweisung zu verwenden, die wir hier kurz erwähnen werden, und zwar in der Reihenfolge, in der sie am meisten empfohlen wird.

### Expliziter Modulimport

Beim expliziten Import eines Moduls wird der Inhalt des Moduls in einem Namespace gespeichert.
Der Namespace wird dann verwendet, um auf den Inhalt mit einem „``.``“ dazwischen zu verweisen.
Hier importieren wir zum Beispiel das eingebaute Modul ``math`` und berechnen den Kosinus von Pi:

In [1]:
import math
math.cos(math.pi)

-1.0

### Expliziter Modulimport mit Alias

Bei längeren Modulnamen ist es nicht sinnvoll, bei jedem Zugriff auf ein Element den vollen Modulnamen zu verwenden.
Aus diesem Grund verwenden wir üblicherweise das Muster „``import ... as ...``“, um einen kürzeren Alias für den Namensraum zu erstellen.
Das NumPy-Paket (Numerical Python), ein beliebtes Paket eines Drittanbieters, das für Data Science nützlich ist, wird zum Beispiel unter dem Alias ``np`` importiert:

In [2]:
import numpy as np
np.cos(np.pi)

-1.0

### Expliziter Import von Modulinhalten

Manchmal möchte man nicht den gesamten Modul-Namensraum importieren, sondern nur ein paar bestimmte Elemente aus dem Modul importieren.
Dies kann mit dem „``von ... importieren ...``“-Muster geschehen.
Zum Beispiel können wir nur die Funktion ``cos`` und die Konstante ``pi`` aus dem Modul ``math`` importieren:

In [3]:
from math import cos, pi
cos(pi)

-1.0

### Impliziter Import von Modulinhalten

Schließlich ist es manchmal nützlich, den gesamten Inhalt des Moduls in den lokalen Namensraum zu importieren.
Dies kann mit dem „``from ... import *``“-Muster geschehen:

In [4]:
from math import *
sin(pi) ** 2 + cos(pi) ** 2

1.0

Dieses Muster sollte, wenn überhaupt, nur sparsam verwendet werden.
Das Problem ist, dass solche Importe manchmal Funktionsnamen überschreiben können, die wir nicht überschreiben wollen, und die Form der Anweisung macht es schwierig zu bestimmen, was sich geändert hat.

Python hat zum Beispiel eine eingebaute Funktion ``sum``, die für verschiedene Operationen verwendet werden kann:

In [5]:
help(sum)

Help on built-in function sum in module builtins:

sum(...)
    sum(iterable[, start]) -> value
    
    Return the sum of an iterable of numbers (NOT strings) plus the value
    of parameter 'start' (which defaults to 0).  When the iterable is
    empty, return start.



Wir können damit die Summe einer Folge berechnen, die mit einem bestimmten Wert beginnt (hier beginnen wir mit ``-1``):

In [6]:
sum(range(5), -1)

9

Beobachten wir nun, was passiert, wenn wir den *exakten gleichen Funktionsaufruf* nach dem Import von ``*`` aus ``numpy`` machen:

In [7]:
from numpy import *

In [8]:
sum(range(5), -1)

10

Das Ergebnis liegt um eins daneben!
Der Grund dafür ist, dass die ``import *``-Anweisung die eingebaute Funktion ``sum`` durch die Funktion ``numpy.sum`` ersetzt, die eine andere Aufrufsignatur hat: in ersterer summieren wir ``range(5)`` beginnend bei ``-1``; in letzterer summieren wir ``range(5)`` entlang der letzten Achse (angezeigt durch ``-1``).
Dies ist die Art von Situation, die entstehen kann, wenn man nicht aufpasst, wenn man „``import *``“ benutzt - aus diesem Grund ist es am besten, es zu vermeiden, wenn man nicht genau weiß, was man tut.

## Importieren aus der Standardbibliothek von Python

Die Standardbibliothek von Python enthält viele nützliche eingebaute Module, die wir in [Pythons Dokumentation](https://docs.python.org/3/library/) ausführlich erkunden können.
Jedes dieser Module kann mit der Anweisung ``import`` importiert und dann mit der Hilfefunktion aus dem vorherigen Abschnitt erkundet werden.
Hier ist eine äußerst unvollständige Liste einiger Module, die Sie vielleicht erforschen und kennenlernen möchten:

- ``os`` und ``sys``: Werkzeuge für die Zusammenarbeit mit dem Betriebssystem, einschließlich der Navigation in Dateiverzeichnisstrukturen und der Ausführung von Shell-Befehlen
- ``math`` und ``cmath``: Mathematische Funktionen und Operationen mit reellen und komplexen Zahlen
- ``itertools``: Werkzeuge zur Konstruktion von und Interaktion mit Iteratoren und Generatoren
- ``functools``: Werkzeuge zur Unterstützung der funktionalen Programmierung
- ``random``: Werkzeuge zur Erzeugung von Pseudozufallszahlen
- ``pickle``: rkzeuge für die Objektpersistenz: Speichern von Objekten auf der Festplatte und Laden von Objekten von der Festplatte
- ``json`` und ``csv``: Tools zum Lesen von JSON- und CSV-formatierten Dateien.
- ``urllib``: Werkzeuge für die Bearbeitung von HTTP- und anderen Web-Anfragen.

Diese und viele weitere Informationen finden wir in der Dokumentation der Python-Standardbibliothek: https://docs.python.org/3/library/.

## Importieren aus Modulen von Drittanbietern

Eines der Dinge, die Python nützlich machen, insbesondere in der Data Science-Welt, ist das Ökosystem von Modulen von Drittanbietern.
Diese können genauso wie die eingebauten Module importiert werden, aber zuerst müssen die Module auf dem jeweiligen System installiert werden.

Das Standardregister für solche Module ist der Python Package Index (kurz *PyPI*), zu finden im Internet unter http://pypi.python.org/.

Zur Vereinfachung wird Python mit einem Programm namens ``pip`` (ein rekursives Akronym, das „pip installiert Pakete“ bedeutet) ausgeliefert, das automatisch Pakete holt, die im PyPI veröffentlicht und aufgelistet sind (in Python Version 2 muss ``pip`` separat installiert werden).

Um zum Beispiel das Paket `sympy` für symbolische Mathematik zu installieren, könnten wir auf der Kommandozeile folgendes eingeben:

```
$ pip install sympy # Bitte nicht in unserer Veranstaltung!
```

Der Quellcode für das Paket wird automatisch aus dem PyPI-Repository heruntergeladen und das Paket in den Standard-Python-Pfad installiert (vorausgesetzt, Sie haben die Erlaubnis, dies auf dem von Ihnen verwendeten Computer zu tun).

Weitere Informationen über PyPI und das ``pip``-Installationsprogramm finden Sie in der Dokumentation unter http://pypi.python.org/.


Wir nutzen in unserer Veranstaltung **[Poetry](https://python-poetry.org/)**, ein noch leistungsfähigeres Werkzeug zur Verwaltung von Paketen und Abhängigkeiten. Um ein Paket hinzuzufügen, können wir auf der Kommandozeile folgendes eingeben:

```
$ poetry add sympy
```

Poetry verwaltet Abhängigkeiten in der Datei `pyproject.toml`. Dies hat den Vorteil, dass wir (und andere Teammitglieder) mit dem Kommando `poetry install` alle Projektabhängigkeiten im Projekt installieren können.