# Python - Pakete
### Angewandte Systemwissenschaften I
#### Python - Wonderland
Einheit 5 / 10

# Semesterplan
---
0. Anaconda und Pip
1. Einführung in Python
2. Matplotlib: Eine Einführung ins Wonderland - Modell
3. Jupyter-Notebooks: Wonderland in Python
4. Funktionale Programmierung & Python-Module
5. **Python-Pakete und Workflow**
6. Agenten-basierte Modellierung
7. Objekt-orientierte Programmierung 
8. Animationen zur Modellentwicklung
9. Multiprocessing & Sensitivity Analysis
10. Projektpräsentationen

## Inhalt
+ Python Module
+ Namespaces
+ Packages
+ Projektstruktur
+ Strukturierung des vorhandenen Codes
+ Dokumentation
+ Versionskontrolle
+ Unit Testing

## Python Module

Hat sich unsere Idee in der **Prototypen-Phase bewährt**, können wir die Funktionen in einer Datei mit der Endung ```.py``` speichern. <br>
Eine solche Datei nennen wir dann **Modul**. 

Das Modul in dieser Datei lässt sich dann mit ```import``` in den aktuellen **Namespace** importieren. Somit können die **Funktionen** im Modul dann aufgerufen werden.

In [5]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Namespaces

Als **Namespace** wird der "Raum" aller belegten Namen in einem **Python**-Kontext bezeichnet.

Mit der Funktion ```dir``` lässt sich **der aktuelle** Namespace betrachten.

In [8]:
dir()

['In',
 'Out',
 '_',
 '_2',
 '_3',
 '_4',
 '_5',
 '_6',
 '_7',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_i3',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'exit',
 'get_ipython',
 'quit',
 'this']

Der Namespace **ändert sich** wenn wir zum Beispiel in eine Funktion gelangen:

In [30]:
def func(funktions_variable):
    print(dir())

func(5)

['funktions_variable']


Ist ein Name im **äußeren** und im **inneren** Namespace einer Funktion, **verdeckt** jener in der Funktion jenen der außen liegt. <br>
Dies nennt man **Shadowing**.

In [27]:
variable = 0

def func(variable):
    print(variable)
    return variable
    
func(5), variable

5


(5, 0)

<div class="alert alert-block alert-info">
<h3>Tipp: Einzelne Funktionen importieren</h3>
    
Mittels Stern <code>from .. import</code> kann in Python eine **Funktion** oder ein **Submodul** importiert werden, <br>
ohne gleich ein ganzes Modul laden zu müssen:
<pre><code>from math import exp
</code></pre>
Zum Beispiel kann man dann statt <code>math.exp</code> also <code>exp</code> schreiben.
</div>

Importieren wir ein **Modul** kommt es in unseren Namespace. Wir können ihm mit ```as``` einen **eigenen Namen** zuweisen.

Die Namen der **Funktionen** sind dann **mit einem Punkt** ```.``` hinter dem Namen des Moduls erreichbar.

In [15]:
import numpy as np 
np.add(1,3)

4

<div class="alert alert-block alert-info">
<h3>Tipp: Der Trick mit dem Stern</h3>
    
Mittels Stern <code>*</code> kann in Python ein Namespace <strong>direkt importiert</strong> werden: <code>from numpy import *</code> <br>
Zum Beispiel kann man dann statt <code>numpy.add</code> also <code>add</code> schreiben. 
<br><br>
Dies wird <strong>nicht empfohlen</strong> da es den aktuellen Namespace <strong>unübersichtlich</strong> macht.
</div>

## Pakete

Wächst die länge unseres Projekts liegt es nahe, die **vielen Zeilen Code** auf mehrere Dateien aufzuteilen. <br>
So kann eine **übersichtlichere Struktur** erreicht werden und das Projekt **langfristig** weiterentwickelt werden.

Wir wollen also ein **Paket** erstellen. Zuerst erstellen wir einen **Ordner** mit dem Pojekt**namen**.

~~~bash
$ mkdir Wonderland
~~~

## Die \_\_init\_\_.py Datei

Sitzt eine Datei namens ```__init__.py``` in einem Ordner mit Python Modulen, wird dieser **Ordner für Python zu einem Package**.

Dabei kann ```__init__.py``` komplett leer sein. Ist sie es jedoch nicht, wird dieser Code **beim Laden** des Pakets mit ```import``` **ausgeführt**.

~~~bash
echo "" > __init__.py
~~~


## Projektstruktur

```
Wonderland
│   README.md
│   LICENSE.txt
|   setup.py
│   requirements.txt
|
└───wonderland
    │   __init__.py
    │   core.py
    │   parameters.py
    │   plots.py
    |   utils.py
 
└───tests
    |   context.py
    │   test_basic.py
    
└───docs
    |   conf.py
    |   index.rst
```

## README

Die README - Datei wird einfach als **Text - Datei** und oft in einer einfachen **Markup** - Sprache geschrieben.<br>

+ Markdown (```README.md```)
+ ReStructured-Text (```README.rst```)
+ (Manchmal: ```README``` oder ```README.txt```)

Sie **enthält Informationen** zu:

+ Zweck des Projekts

+ URL des Projekts

+ Anerkennungen

Sie ist meistens das **erste** was Leser des Codes sehen.

## LICENSE

Im LICENSE.txt - File steckt, wie der Name schon sagt, die **Lizenz**. Sie bestimmt wie der Code verwendet werden darf. <br>
Diese Datei ist **wichtig** denn ohne Lizenz können viele Anwender den Code **gar nicht nutzen**.

Ist man sich nicht sicher, **welche Lizenz** zum eigenen Projekt passt, kann man auf [Choose a License](https://choosealicense.com/) eine finden.

## Versionskontrolle

Wird Code **geändert** behält man oft den alten bei, um bei Problemen zum **Ursprungszustand** zurückkehren zu können. Diese **Rückstände** von altem Code machen den Quelltext schnell unübersichtlich. <br>
Mit einem Programm zur **Versionskontrolle** wie zum Beispiel **Git** lässt sich dies komfortabel verhindern.

Git kann man einfach unter [git-scm.com](https://git-scm.com/downloads) **herunterladen und installieren**.

**Dann** kann man im Projekt-Ordner die **rechte Maustaste** drücken und auf ```Git Bash here``` klicken. <br>
Nun sollte man **zuerst** Git **konfigurieren**:
~~~
git config --global user.name "Maxi Musterfrau"
~~~
~~~
git config --global user.email "maxi.muster@provider.xxx"
~~~
~~~
git config --global color.ui auto
~~~

## Git - Befehle
Mit **Git** wollen wir jetzt ein neues **Repositorium** anlegen, worin wir unsere **Änderungen speichern** können.

Neues **Repositorium anlegen**:
~~~bash
git init
~~~

Die Dateien die wir bisher erstellt haben **vorbereiten**:
~~~bash
git add [Datei]
~~~

Alle **vorbereiteten Dateien** zur aktuellen Version hinzufügen:
~~~bash
git commit -m "Beschreibung"
~~~

Um alle **Änderungen** seit dem letzten Commit **anzuzeigen**:
~~~bash
git diff
~~~
*Tipp: Aus dieser Anzeigen kann man mit der Taste 'Q' aussteigen.*

<div class="alert alert-block alert-info">
<h3>Tipp: Git Zweige und Klone</h3>
    
<h4>Zweige</h4>
<br>
Bei <strong>größeren Änderungen</strong> am Code, wo man noch nicht weiß ob man diese Änderungen auch wirklich in den <strong>Hauptzweig</strong> übernehmen will, lohnt es sich eine <strong>Abzweigung</strong> zu erstellen. Man wechselt dadurch <strong>nicht</strong> zum neuen Branch!
<pre><code>git branch [branch-name]
</code></pre>
Eine <strong>Liste aller Zweige</strong> findet man unter
<pre><code>git branch
</code></pre>
Will man zu einem anderen <strong>Zweig wechseln</strong> schreibt man:
<pre><code>git checkout [branch-name]
</code></pre>
Und um einen Zweig <strong>mit dem aktuellen zusammenzuführen</strong>:
<pre><code>git merge [branch-name]
</code></pre>
<h4>Klone</h4>
<br>
Auf <strong>GitHub</strong> lassen sich Git - Projekte hochladen und teilen. Ist man am <strong>Quelltext</strong> eines dortigen Projekts interessiert, kann man ihn mit dem <strong>Befehl</strong> <code>clone</code> <strong>herunterladen</strong>:
<pre><code>git clone [Repositoriumsname]
</code></pre>

Alle Befehle findet man in der <strong><a href=https://github.github.com/training-kit/downloads/github-git-cheat-sheet.pdf>Git Cheat Sheet</a></strong>
</div>

## setup.py und requirements.txt

**setup.py** wird von ```pip``` benötigt um ein Paket zu installieren.

In **requirements.txt** stehen, wie der Name vermuten lässt, die Pakete, auf welchen unser Code aufbaut.

## Dokumentation

Eines der Grundprinzipien von Python ist, dass Code **selbst-dokumentierend** sein sollte. 

Kann man also eine Erklärung in einem Kommentar durch eine bessere **Bennung der Variablen oder Funktionen** erreichen, sollte man das auch tun.

Empfohlen ist es aber auch, an den Beginn eines jeden (*öffentlichen*) **Moduls**, jeder **Klasse** und jeder **Methode** bzw. **Funktion** einen ```docstring``` zu setzen.

## Docstrings

Ein ```docstring``` ist jener String, der **in der ersten Zeile** eines Moduls, einer Klasse oder eben einer Funktion/Methode steht.

In [33]:
def quadrat(x):
    """Calculates the square of a number.
    
    Parameter
    ---------
    x : numeric
        The number to be squared.
        
    Returns
    -------
    x² : numeric
        The square of x.
    """
    return x*x

Als **Konvention** werden ```docstring```s immer in **drei Anführungszeichen** gebettet. Das letzte ```"""``` steht dabei immer in einer eigenen Zeile, außer der ganze ```docstring``` umfasst nur eine Zeile.

Der gesamte ```docstring``` wird im **Attribut** ```__doc__``` gespeichert:

In [17]:
quadrat.__doc__

'\n    Berechnet das Quadrat einer Zahl.\n    \n    Parameter\n    ---------\n    x: numerisch\n        Die Zahl welche quadriert werden soll.\n        \n    Returns\n    -------\n    x²: numerisch\n    '

Darauf greift man dann mit der Funktion ```help``` zu. (*Im Jupyter-Notebook oder anderen IPython-Konsolen, kann man auch einfach* ```[SHIFT]+[TAB]``` *drücken*)

In [8]:
import numpy as np
?np

# Docstring-Styles

Es gibt **verschiedene Stile** wie Docstrings geschrieben werden. Diese sind **Konventionen** die von Programmen wie [Sphinx](https://www.sphinx-doc.org/en/master/) dazu benutzt werden, automatisch **Websites** für die Dokumentation zu erstellen.

+ Numpy-Style Docstrings: https://numpydoc.readthedocs.io/en/latest/format.html

+ Google-Style Docstrings: https://www.sphinx-doc.org/en/1.7/ext/example_google.html

+ ReStructured-Text Docstrings: https://sphinx-rtd-tutorial.readthedocs.io/en/latest/docstrings.html

## Quelltext

Nun kommen wir zum ```wonderland``` - Verzeichnis. Hier findet sich unser **eigentlicher Code**.

+ Wie erwähnt verwandelt ```__init__.py``` unseren Ordner in ein Paket, die Datei bleibt dabei (vorerst) leer.

+ Im **Modul** ```core.py``` können wir die **Funktionen die den Zustand berechnen** ablegen.

+ Die **Parameter** legen wir separat in ```parameters.py``` ab.

+ Mit ```plots.py``` sind alle unsere Funktionen **zur Darstellung** in einem Modul gebündelt.

+ In ```utils.py``` können wir Funktionen ablegen welche sich **nicht genau zuordnen** lassen, aber nötig sind.

Es kann leicht sein, dass wir manche Module nicht oder **später noch mehr** Module benötigen.

## Unit Testing

- ### Wie können wir sicherstellen dass unser neuer Code korrekt ist?

> Wir **zerlegen** den Code in **kleine Einheiten** ('Units') und **testen** deren Korrektheit.

Tests sollte man immer **vor** und **nach** der Weiterarbeit am Code ausführen. <br>
Außerdem lohnt es sich **nach jeder gröberen Änderung** die Tests durchlaufen zu lassen.

Um unsere Tests durchzuführen verwenden wir die Python-Module ```py.test``` und ```hypothesis```
~~~
pip install pytest
pip install hypothesis
~~~

<div class="alert alert-block alert-info">
<h3>Tipp: Durch Tests einlesen in neue Projekte</h3>
    
Oftmals ist es nützlich, um sich mit einem neuen Projekt vertraut zu machen, <br>
die für dieses Projekt bereits geschriebenen <strong>Tests durchzulesen</strong>.

So kann man schnell verstehen welchen <strong>Limitierungen</strong> man unterworfen ist <br>
und wo Probleme in der Entwicklung auftauchen (können).
</div>

Die Tests finden sich im **Verzeichnis** ```tests```.

Dort findet sich zu allererst ```context.py```. Damit können wir sicherstellen, dass die Tests immer auf den aktuellen Code **zugriff haben**.

```context.py```

~~~python
import os
import sys
sys.path.insert(0, os.path.abspath(os.path.join(os.path.dirname(__file__), '..')))

import wonderland.core as wonderland
~~~

Dann kann man in ```tests.py``` schreiben:
~~~python
from context import wonderland
~~~
Und hat das aktuelle Wonderland geladen.

### Das Testen unseres Wonderlands

Unsere **Zustandsvariablen** unterliegen laut Definition gewissen **Grenzen**. Wie können wir nun sicherstellen, dass diese Grenzen von unseren Funktionen **eingehalten** werden?

Gibt es gewisse Werte, welche **innerhalb der Grenzen** unserer Definition liegen, für welche eine der Funktionen **nicht definiert** ist?
.. außerhalb ihres **Bildbereichs** liegt?

In [11]:
import wonderland.core as wonderland

from hypothesis import given
import hypothesis.strategies as strat

### Definitionsbereiche

Zuerst beschreiben wir die **Definitionsbereiche** unserer Zustandsvariablen:

Der **Umweltzustand** liegt im Intervall $[0,1]$. Außerdem möchten wir ausschließen, dass ihm der Wert ```NaN``` zugewiesen werden kann, deshalb setzen wir: ```allow_nan = False``` als **Schlüsselwortargument**:

In [12]:
st_z = strat.floats(min_value=0.0, max_value=1.0, allow_nan=False)

Die **Technologie** ist die einzige **exogene** Variable, da wir sie immer mit ```1.0``` starten, liegt sie **im selben Intervall**. Ihrer Definition entsprechend kann sie aber niemals genau 0 werden, daher setzen wir ```exclude_min = True```.

In [13]:
st_p = strat.floats(min_value=0.0, max_value=1.0, allow_nan=False, exclude_min=True)

Bei der Betrachtung der Definitionen von **Umweltzustand** (z) und **Population** (x) sehen wir, dass für diese nur gilt, dass sie **positiv** sein müssen.

Diesmal wollen wir neben ```NaN``` auch den Wert für die **Unendlichkeit** ```inf``` ausschließen und setzen: ```allow_infinity = False```.

In [14]:
st_x = strat.floats(min_value=0.0, allow_nan=False, allow_infinity=False)

st_y = strat.floats(min_value=0.0, allow_nan=False, allow_infinity=False)

## Tests schreiben

Mit diesen **Strategien** für **Hypothesis** können wir nun **Tests** definieren. <br>
**Hypothesis** weiß anhand der Strategien, welche Werte es unseren Funktionen überreichen kann, und **versucht** damit unsere Tests zu **falsifizieren**.

Wir fangen mit einem **einfachen Test** an und wollen überprüfen, ob die **Technologie** (p) sicher immer im Intervall $[0,1]$ liegt.

In [20]:
@given(st_p)
def teste_technologie_im_definitionsbereich(p):
    res = wonderland.technologie(p)
    assert res >= 0 and res <= 1

NameError: name 'given' is not defined

In [16]:
teste_technologie_im_definitionsbereich() 

Da die Technologie im Definitionsbereich bleibt, passiert nichts.

Versuche den **Definitionsbereich einzuschränken** und die Funktion neu aufzurufen.<br>
Was passiert wenn ein Fehler entdeckt wird?

<div class="alert alert-block alert-info">
<h3>Tipp: Konsole im Environment</h3>
    
Um eine Konsole <strong>im</strong> Environment in welchem <code>py.test</code> installiert ist zu öffnen:
<br><br>
In Anaconda auf <code>Environments</code> klicken und dann auf den Pfeil nach rechts im gewählten Environment.<br>
Hier kann man nicht nur mit <code>pip</code> neue Pakete installieren!
<br><br>
Mit <code>cd</code> (<i>Change Directory</i>) lässt sich das Verzeichnis wechseln.<br>
Mit <code>dir</code> (<i>MacOS / Linux:</i> <code>ls</code>) sieht man was sich im aktuellen Verzeichnis befindet.
<br><br>
Mit <code>cd ..</code> geht man in der Orderstruktur nach <strong>oben</strong>.<br>
<i>Tipp:</i> Mit der Tabulator-Taste kann man angefangene Befehle, Ordner- und Dateinamen vervollständigen lassen!
</div>

## Testen in der Konsole

Auch aus der Konsole lässt sich ```py.test``` aufrufen. Als Argument nimmt es die **Testdatei** entgegen.

Mit ```!``` lassen sich im Jupyter-Notebook Konsolen-Befehle ausführen:

In [17]:
!pytest tests/tests.py

platform win32 -- Python 3.7.3, pytest-5.2.2, py-1.8.0, pluggy-0.13.0
rootdir: C:\Users\Pinselimo\Google Drive\Doktorat USW\Teaching\Applied Sys 2\Jupyter Notebooks
plugins: hypothesis-4.43.1
collected 9 items

tests\tests.py ........F                                                 [100%]

__________________ teste_umweltzustand_im_definitionsbereich __________________

    @given(st_x, st_y, st_z)
>   def teste_umweltzustand_im_definitionsbereich(x,y,z):

tests\tests.py:57: 
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

x = 0.0, y = 0.0, z = 0.8735225772143222

    @given(st_x, st_y, st_z)
    def teste_umweltzustand_im_definitionsbereich(x,y,z):
        p = 1.0
        for _ in range(500):
            p = wonderland.technologie(p)
    
        res = wonderland.umwelt(x,y,z,p)
>       assert res >= 0 and res <= 1
E       assert (1.0000000000000004 >= 0 and 1.0000000000000004 <= 1)

tests\tests.py:63: AssertionError
--------------------------------- H

<div class="alert alert-block alert-info">
<h3>Tipp: Mit dem Example-Dekorator gewissen Eingaben immer überprüfen</h3>
    
Hypothesis nimmt auch Beispiele entgegen. So kann ein bestimmter (<i>wichtiger</i>) Fall immer überprüft werden. <br>
Der Dekorator dazu heißt <strong>@example</strong>:
<br>
<pre><code>@example(1.0, 1.0)
@given(st_y, st_z)
def teste_wirtschaft_im_definitionsbereich(y,z):
    res = wonderland.wirtschaft(y,z)
    assert res >= 0
</code></pre>
</div>

<div class="alert alert-block alert-danger">
<h3>Übungsaufgabe: 3 Test-Funktionen</h3>
    
Schreibe drei Test-Funktionen. Gibt es Fehler in unseren Annahmen?
<br><br>
<i>Was spricht dafür die Annahme/den Test anzupassen, was dagegen?<br>
    Was spricht für/wider eine Anpassung der Funktionen?</i>
</div>