<h1>Modularisierung<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Modularisierung" data-toc-modified-id="Modularisierung-7"><span class="toc-item-num">7&nbsp;&nbsp;</span>Modularisierung</a></span><ul class="toc-item"><li><span><a href="#Globale-Module-und-Importanweisungen" data-toc-modified-id="Globale-Module-und-Importanweisungen-7.1"><span class="toc-item-num">7.1&nbsp;&nbsp;</span>Globale Module und Importanweisungen</a></span></li><li><span><a href="#Lokale-Module" data-toc-modified-id="Lokale-Module-7.2"><span class="toc-item-num">7.2&nbsp;&nbsp;</span>Lokale Module</a></span></li><li><span><a href="#Suchpfad-(Module-Search-Path)" data-toc-modified-id="Suchpfad-(Module-Search-Path)-7.3"><span class="toc-item-num">7.3&nbsp;&nbsp;</span>Suchpfad (<em>Module Search Path</em>)</a></span></li><li><span><a href="#Modulinterne-Referenzen" data-toc-modified-id="Modulinterne-Referenzen-7.4"><span class="toc-item-num">7.4&nbsp;&nbsp;</span>Modulinterne Referenzen</a></span><ul class="toc-item"><li><span><a href="#if-__name__-==-&quot;__main__&quot;" data-toc-modified-id="if-__name__-==-&quot;__main__&quot;-7.4.1"><span class="toc-item-num">7.4.1&nbsp;&nbsp;</span>if __name__ == "__main__"</a></span></li></ul></li><li><span><a href="#Pakete-(Packages)" data-toc-modified-id="Pakete-(Packages)-7.5"><span class="toc-item-num">7.5&nbsp;&nbsp;</span>Pakete (<em><a href="https://docs.python.org/3/tutorial/modules.html#packages" target="_blank">Packages</a></em>)</a></span><ul class="toc-item"><li><span><a href="#Beispielanwendung" data-toc-modified-id="Beispielanwendung-7.5.1"><span class="toc-item-num">7.5.1&nbsp;&nbsp;</span>Beispielanwendung</a></span></li><li><span><a href="#Absolute-vs.-relative-Importanweisung" data-toc-modified-id="Absolute-vs.-relative-Importanweisung-7.5.2"><span class="toc-item-num">7.5.2&nbsp;&nbsp;</span>Absolute vs. relative Importanweisung</a></span></li><li><span><a href="#Alle-Module-eines-Pakets-importieren" data-toc-modified-id="Alle-Module-eines-Pakets-importieren-7.5.3"><span class="toc-item-num">7.5.3&nbsp;&nbsp;</span>Alle Module eines Pakets importieren</a></span></li><li><span><a href="#Bibliotheken,-Module,-Pakete,-Skript,-Programm,...?" data-toc-modified-id="Bibliotheken,-Module,-Pakete,-Skript,-Programm,...?-7.5.4"><span class="toc-item-num">7.5.4&nbsp;&nbsp;</span>Bibliotheken, Module, Pakete, Skript, Programm,...?</a></span></li></ul></li></ul></li></ul></div>

# Modularisierung



**Quellen:** 

  - J.Ernesti, P.Kaiser, *Python 3 - Das umfassende Handbuch*: Teil II - Kapitel 10
  - Pyton Tutorial zu Modulen: https://docs.python.org/3/tutorial/modules.html
  - Python Language Reference zu Importanweisungen: https://docs.python.org/3/reference/import.html
  - (Importmodule aus der Standardbibliothek: https://docs.python.org/3/library/modules.html)




Modularisierung = Aufteilung des Quelltextes in sogenannte *Module*

- Module helfen den Programmcode überschaubar auf verschiedene Programmdateien aufzuteilen.
- Wir können Namensräume erzeugen, um thematisch verwandte Bereiche voneinander abzugrenzen.
- Module stellen meist Datentypen und Funktionen bereit, die einem bestimmten Zweck dienen.


In [4]:
import math # provides access to the mathematical functions
import os # provides a portable way of using operating system dependent functionality
directory = "TestDirectory"
os.mkdir(directory)
math.cos(math.pi)

-1.0

In [5]:
os.rmdir(directory)

In [6]:
with os.scandir(".") as it:
    for entry in it:
        print(entry)



Die Unterscheidung nach dem Speicherort ergibt zwei Arten von Modulen:
  
  - **globale Module**: systemweit verfügbar, das heißt sie stehen allen Python-Programmen zur Verfügung
       - meist unter 'site-packages'/ 'dist-packages' oder direkt im Interpreter eingebaut (*built-ins*)
       - wir können eigene globale Module schreiben

   - **lokale Module**: befinden sich im Programmverzeichnis und sind zunächst nur für die lokalen Skripte verfügbar.

**Standardbibliothek (the "Python Library")** <br>
https://docs.python.org/3/library/intro.html
 - (eingebaute) Funktionen
 - (eingebaute) Datentypen
 - Module
 
(**Mathematik**, Textverarbeitung, Netzwerkkommunikation, Parallelisierung,...)

Ubuntu: dist-packages vs site-packages
https://stackoverflow.com/questions/9387928/whats-the-difference-between-dist-packages-and-site-packages

- dist-packages: where apt-get and friends install things
- site-packages: where system-python installs things

## Globale Module und Importanweisungen

**`import`** `Modul1, Modul2,...`
- erstellt einen neuen Namensraum
    - unter `Modul1.` alle Funktionen, Datentypen und Werte verfügbar

In [7]:
import math
#math.  # <tab>
a = math.pi
print(math.sin(a))

1.2246467991473532e-16


- Wir können mehrere Module auf einmal importieren.
- Alle Anweisungen eines Moduls werden beim ersten Import ausgeführt.

**`import`** `Modulname as EigenerModulname`
 - Wir können den Namensraum-Titel ändern.

In [8]:
import math as mathematik
a = mathematik.pi
print(mathematik.cos(a))

-1.0


**`from Modulname import *`**

In [9]:
from math import *
# b = math.pi
a = pi
print(tan(a))

-1.2246467991473532e-16


 - Es wird *kein* neuer Namensraum erstellt.
 - Alle Elemente von `Modulname` werden in den globalen Namensraum eingebunden 
    - Ausnahme: Elemente, deren Namen mit `__` beginnen (diese sind *modulintern*; später mehr dazu)

**Vorsicht:**
  - Dadurch sind Referenzen-Kollisionen im globalen Namensraum möglich.
  - Dies widerspricht dem Sinn, Funktionalitäten thematisch in Namensräume zu unterteilen und sollte vermieden werden!

In [10]:
from math import *
print(pi)
pi = 0
print(cos(pi/2)) # != 0

3.141592653589793
1.0


**`from`** `Modulname` **`import`** `Modulelement1` **`as`** `model1`
- Wir können einzelne Elemente (Funktionen, Module,...) eines Moduls in den globalen Namensraum eingliedern.

In [11]:
from math import cos as cosinus, sin as sinus, pi
print(pi)
print(cosinus(pi), sinus(pi))

3.141592653589793
-1.0 1.2246467991473532e-16


**Zusammenfassung**
 - **`import`** `Modul`
     - <span style="color:blue"> *Modul unter dem Namensraum `Modul` einbinden*</span>
 - **`import`** `Modul` **`as`** `M`
     - <span style="color:blue">*Modul unter dem Namensraum `M` einbinden*</span>
 - **`from`** Modul **`import`** `*`
     - <span style="color:blue">*Alle Elemente des Moduls in den globalen Namensraum einbinden* [vermeiden!]</span>
 - **`from`** Modul **`import`** `Element1` **`as`** `E1`, `Element1` **`as`** `E1` `[,...]` 
     - <span style="color:blue">*Einzelne Elemente des Moduls mit eigenen Namen in den globalen Namensraum eimbinden*</span>
 

## Lokale Module

- Der Unterschied zu globalen Modulen: Lokale Module liegen meist im Unterverzeichnis und sind daher nur lokal verfügbar und nicht in beliebigen anderen Python-Programmen.
- Importanweisungen bleiben gleich.
- **Beispiel**
    - Wir schreiben unser eigenes "Mathematik"-Modul `mathe.py` mit Hilfsfunktionen, Konstanten usw., welche wir in dem Hauptprogramm `main.py` verwenden werden.

In [12]:
with open("mathe.py", "w") as eigenesmodul:  # erstellen eine Datei mit dem Name <Par1> mit Lese/Schreibrechten <Par2>
    eigenesmodul.writelines( 
"""
def factorial(n): return factorial(n-1) * n if n > 0 else 1 

def summe(*args):
    result = 0
    for i in range(len(args)):
        result+= args[i]
    return result

constant = 5
    """)

In [13]:
import mathe
mathe.constant

5

In [14]:
mathe.factorial(5)

120

In [15]:
import mathe as m
m.constant

5

In [16]:
from mathe import factorial as F
F(5), mathe.factorial(5)

(120, 120)

Das Hauptprogramm `main.py`

In [17]:
with open("main.py", "w") as main:
    main.writelines("""import mathe as m
num = m.constant
print(m.factorial(num))
print(m.summe(num, num+1))
""")


In [18]:
%run main.py # magic function %run, wie `python Hauptprogramm.py` im Terminal

120
11


## Suchpfad (*Module Search Path*) 


**Wo wird nach Modulen gesucht?**

 - Der Interpreter sucht in einer Liste von Verzeichnissen in vorgegebener Reihenfolge nach den Modulen.
 - Die Variable `sys.path` verweist genau auf diese Liste.

In [19]:
import sys
sys.path

['/home/vollmann/Seafile/2_TEACHING/3_prog/script/python',
 '/usr/lib/python310.zip',
 '/usr/lib/python3.10',
 '/usr/lib/python3.10/lib-dynload',
 '',
 '/usr/local/lib/python3.10/dist-packages',
 '/usr/lib/python3/dist-packages',
 '/usr/lib/python3/dist-packages/IPython/extensions',
 '/home/vollmann/.ipython']

Das Verzeichnis, welches das auszuführende Skript enthält, wird an den Anfang des Suchpfads gesetzt (noch vor dem Pfad der Standardbibliothek). Damit ergibt sich:

  - **Fall 1**: Modul mit entsprechendem Name wird im lokalen Programmordner gefunden, dann import und STOP
  - **Fall 2**: Modul nicht lokal gefunden
     - **Fall 2.1**: Suche globales Modul. Falls gefunden, dann import und STOP
     - **Fall 2.2**: `ImportError: No module named ...`


In [20]:
import hallo

ModuleNotFoundError: No module named 'hallo'

Wir können die Liste der Suchpfade auch erweiteren (um eigene Skripte auszulagern):

In [None]:
import sys
sys.path.append('/home/vollmann/python/lib')
sys.path

## Modulinterne Referenzen

In jedem Modul existieren Variablen, die Informationen über das Modul selbst enthalten. Zum Beispiel:

|Referenz | Beschreibung|
|---|---|
|`__file__` | Referenziert einen String, der den Namen der Programmdatei des Moduls inklusive Pfad enthält.|
|`__name__`| Referenziert einen String, der den Namen des Moduls enthält.|

In [21]:
import mathe as m

In [22]:
m.__file__

'/home/vollmann/Seafile/2_TEACHING/3_prog/script/python/mathe.py'

In [23]:
m.__name__

'mathe'

In [None]:
import numpy as np
np.__file__

In [None]:
dir(m) 
# https://docs.python.org/3/library/functions.html#dir
# Without arguments, return the list of names in the current local scope.

### if \_\_name\_\_ == "\_\_main\_\_"

 - Falls Modulname.py *direkt ausgeführt* wird, dann \_\_name\_\_ == "\_\_main\_\_"
 - Falls Modulname.py von einem anderen Skript *importiert* wird, dann \_\_name\_\_== "Modulname"
 - **Beispiel:** mathe.py erweitern

In [24]:
with open('mathe.py', 'a') as mathe: # "append" Modus
    mathe.writelines(
"""
print("__name__ =", __name__)

if __name__ == "__main__":
    print("Ich wurde direkt ausgeführt")
"""
)

In [1]:
import mathe  # if already imported, restart kernel or import importlib, importlib.reload(mathe) 

__name__ = mathe


In [2]:
%run mathe.py

__name__ = __main__
Ich wurde direkt ausgeführt


In [None]:
# Bemerkung:
# Ein Modul wird in einer Session nur genau einmal importiert
# (--> sehen den print also nur beim ersten mal)
# wir bekommen lediglich eine Referenz auf das bereits importierte Modul
import mathe
# import importlib; importlib.reload(mathe)

Das kann zum Beispiel nützlich sein, um die Elemente einzelner Module zu testen:

**Situation:** 
 - Wir haben unser Software-Projekt sinnvoll in Module unterteilt.
 - Diese Module werden im Hauptprogramm eingebunden.
 - Um sicherzustellen, dass die einzelnen Elemente der jeweiligen Module funktionieren, möchten wir Tests schreiben.
 - Diese Tests könnten wir direkt in die Programmdateien der Module schreiben.
 - Allerdings wollen wir nicht, dass diese Tests jedes Mal ausgeführt werden, wenn die Module im Hauptteil 
importiert werden.

**Lösung:**

Mit der Konstruktion 
 ```python 
 if __name__ == "__main__" 
 ```
 
können wir eine Python Datei sowohl als eigenständiges Programm nutzen, als auch als importierbare Datei.

## Pakete (*[Packages](https://docs.python.org/3/tutorial/modules.html#packages)*)

 - Wir können mehrere Module, die thematisch zusammengehören, zu einem Paket zusammenfassen.
 - Pakete können Pakete und Module enthalten.


 - **Erstellung eines Pakets**: 
     - Erzeuge Unterverzeichnis im Programmverzeichnis
     - Paket-Name = Name des Unterverzeichnisses
     - in dieses Unterverzeichnis muss eine Datei namens `__init__.py` (darf leer sein)
         - enthält Initialisierungscode, der beim import einmalig ausgeführt wird

### Beispielanwendung

- **image_processing**/
    - `__init__.py`
    - <span style="color:red">Paket (=Verzeichnis) **`effects/`** </span>
        - `__init__.py`
        - <span style="color:blue">Modul `blur.py`</span>
        - <span style="color:blue">Modul `rotate.py`</span>
    - <span style="color:red">Paket (=Verzeichnis) **`formats`**</span>
        - `__init__.py`
            - <span style="color:red">Paket (=Verzeichnis) **`jpeg/`**</span>
                -  `__init__.py`
                - <span style="color:blue"> Modul `read.py` </span>
                - <span style="color:blue"> Modul `write.py`</span>
            - <span style="color:red">Paket (=Verzeichnis) **`png/`**</span>
                -  `__init__.py`
                - <span style="color:blue"> Modul `read.py`</span>
                - <span style="color:blue"> Modul `write.py`</span>
   


**Was passiert nun beim Import**

Bei der Importanweisung 
```python
import effects
```
wird die Datei `__init__.py` ausgeführt

**Mögliche Namenskonflikte**

Es kommt zu einem Namenskonflikt, wenn ein Paket und ein Modul denselben Namen besitzen. Es ist grundsätzlich so, dass bei Namensgleichheit ein Paket Vorrang vor einem Modul hat, es also keine Möglichkeit mehr gibt, das Modul zu importieren.

**Beispiel:** Erstelle ein Paket `effects`

In [3]:
import os
os.makedirs("effects", exist_ok=True)
with open("effects/__init__.py", "w") as _: pass
with open("effects/blur.py", "w") as modul:
    modul.writelines("""
def fun():
    print("Hallo ich bin fun() in blur.py")

"""
)

Wir können nun einzelne Module (.py) unter Angabe des **gesamten Pfads** importieren

In [4]:
# restart kernel
import effects.blur
effects.blur.fun()

Hallo ich bin fun() in blur.py


In [None]:
# restart kernel
from effects import blur
blur.fun()

In [None]:
# restart kernel
from effects.blur import fun
fun()

In [None]:
# restart kernel
import effects    # we must provide full name of module, i.e., effects.blur # adaptable via __init__
effects.blur.fun()

### Absolute vs. relative Importanweisung

- *absolute* Importanweisungen: **`import`** mit absolutem Pfad
    - importiert gemäß der Liste sys.path (also globale Module/Pakete oder lokale Module/Pakete im selben Verzeichnis mit Gesamtpfad)
- *relative* Importanweisungen: können durch Ebenen in der Verzeichnisstruktur navigieren (Eltern- und Kindverzeichnisse)
    - `.` ein Level tiefer
    - `..` ein Level höher

**Beispiel:** 
 - Erstelle ein weiteres Paket `formats`
 - Darin ein Modul `./formats/read.py` welches das Modul `./effects/blur.py` laden soll
 - Bemerkung: Aus Sicht des Moduls `read.py` ist der relative Pfad zu `blur.py` gerade `../effects/blur.py`

In [None]:
# generate subpackage effects (copy from above)
import os
os.makedirs("effects", exist_ok=True)
with open("effects/__init__.py", "w") as _: pass
with open("effects/blur.py", "w") as modul:
    modul.writelines(
"""
def fun():
    print("Hallo ich bin fun() in blur.py")

"""
)

In [None]:
# generate subpackage formats
import os
os.makedirs("formats", exist_ok=True)
with open("formats/__init__.py", "w") as _: pass
with open("formats/read.py", "w") as read:
    read.writelines(
"""
from ..effects import blur
blur.fun()
print("in package/formats/read.py: __name__ =", __name__)
"""
)

In [None]:
# move effects and formats to package
import os
os.system("rm -r package; mkdir package; mv formats package; mv effects package")
with open("package/__init__.py", "w") as _: pass

In [None]:
# write a main file using package, importing read (so read is executed but not run directly as script)
with open("main2.py", "w") as main2:
    main2.writelines("import package.formats.read")

In [None]:
%run main2.py  # restart kernel if needed

**Caution**

run formats/read.py directly
 - will result in an error, since the relative imports are based on the name of the current module, 
    i.e., the `__name__` variable
 -  if ran directly then `__name__ = "__main__"`, thus there is no way to find out the path
 - modules intended for use as the main module of a Python application must always use absolute imports.

### Alle Module eines Pakets importieren

- siehe: https://docs.python.org/3/tutorial/modules.html#importing-from-a-package
- ein naiver Versuch: **`from`** `Paket` **`import *`**
    - was passiert?  **`import`** `Paket` und Ausführung von `__init__.py`
        - müssen weiterhin durch `Paket.Modul.` auf das Modul zugreifen

- ein möglicher workaround: Da `__init__.py` ausgeführt wird, könnten dort alle Importanweisungen für alle enthaltenen Module hineingeschrieben werden
    - muss also vom Autor des Pakets implementiert werden

In [None]:
from package import *
effects.blur.fun()

In [None]:
with open("package/__init__.py", "w") as init:
    init.writelines("from . import effects")
with open("package/effects/__init__.py", "w") as init:
    init.writelines("from . import blur")

In [None]:
# restart kernel and rerun:
from package import *
effects.blur.fun()

### Bibliotheken, Module, Pakete, Skript, Programm,...?

- **Blibliothek** = beliebig komplexe Paketstruktur/ veröffentlichte Pakete
    - <a href="https://docs.python.org/3/tutorial/modules.html#packages">**Paket**</a> ("Verzeichnis") = enthält Module und Pakete unter einem gemeinsamen Namensraum (=Verzeichnisname)
        - <a href="https://docs.python.org/3/tutorial/modules.html#modules">**Modul**</a> ("Datei mit .py extension") = enthält Funktionen, Datentypen, Konstanten
            - **Skript** ("Datei mit .py extension") = kleines Python-Programm (<1000 Zeilen), das als Hauptprogramm dient und ausgeführt werden soll