<font size="6"> Python-Projekte erstellen </font> 
<br><br>
<font size="4">&copy;2023 Peter Rösch </font>

# Einleitung

## Ziele

* Sie können ein installierbares Python-Paket inklusive Tests und Dokumentation erstellen.
* Durch entsprechende "Kochrezepte" können Sie einschlägige Werkzeuge (z.B. *sphinx* *pydoc*, *black*, *pylint*) praktisch einsetzen.
* Die Vorteile der dargestellten Vorgehensweise, die von erfolgreichen Paketen inspiriert wurde, ist ihnen klar.
* Die Vorlage soll Plattform-unabhängig sein.

**Wichtig:** Damit Sie etwas von diesem Notebook haben, sollten Sie auftretende Fragen sofort stellen und nachfragen, falls Unklarheiten bleiben.

## Überblick

In Verlauf des Notebooks wird ein sehr einfaches Python-Paket erstellt, an dem Sie anschließend mit einer Entwicklungsumgebung weiterarbeiten können. Die Struktur ist als Vorlage für eigene Pakete gedacht. Daher ist z.B. der Name des Projekts in einer Variablen *project_name* gespeichert und kann für eigene Projekte angepasst werden.

Die Funktionalität des Pakets *calculator* steht nicht im Vordergrund, so dass nur ein Modul *add_sub* mit zwei einfachen Funktionen 
*my_add* und *add_main* implementiert wird. Darüber hinaus wird ein leeres Module *mul_div* erstellt.

Für das Modul *add_sub* wird auch ein einfacher Test *test_add_sub.py* erstellt, der mit *pytest* automatisch gefunden und durchgeführt werden kann.

Schließlich wird noch mit *sphinx* automatisch eine Schnittstellen-Dokumentation im html-Format erzeugt.

# Einstellungen

Die Vorlage kann durch Anpassungen der Variablen in der folgenden Zelle an eigene Projekte angepasst werden. Wir erzeugen das Projekt im Verzeichnis *tmp* innerhalb Ihres Home-Verzeichnisses.

In [None]:
from pathlib import Path

# path where the project directory should be created
base_path = Path.home() / "tmp"

project_name = "project_example"

# Please don't use spaces in the author name:
# underlines will be automatically replaced by spaces
author_name = "Project_Team"

project_version = "0.0.1"
project_release = "0.0.1"

package_name = "calculator"
# name of package modules
module_names = ["add_sub", "mul_div"]

test_dir_name = "tests"
doc_dir_name = "docs"

# theme for sphinx documentation
sphinx_html_theme = "classic"

# path of project directories
project_path = base_path / project_name
# names of directories to be created
subdir_names = [package_name, test_dir_name, doc_dir_name]

# Verzeichnis-Struktur

Zunächst wird das Projektverzeichnis komplett gelöscht, anschließend werden die benötigten Unterverzeichnisse generiert.

Für jedes Modul wird eine bis auf einen Docstring leere Python-Datei sowie eine ebenfalls leere Test-Datei erzeugt.

In [None]:
# check if project path exists
if project_path.exists():
    print(f"Project path {project_path} already exists")
    print(f"Please remove or rename {project_path}")
    print("and execute this cell again.")
else:
    # create parent directory including intermediate directories
    Path.mkdir(project_path)
    # create default subdirectories
    for subdir_name in subdir_names:
        Path.mkdir(project_path / subdir_name)
    # create empty module and test files
    package_path = project_path / package_name
    test_path = project_path / test_dir_name
    for module_name in module_names:
        module_file_path = package_path / (module_name + ".py")
        module_file_path.write_text(
            f'""" TODO: Enter docstring for module {module_name}"""\n'
        )
        test_file_path = test_path / ("test_" + module_name + ".py")
        test_file_path.write_text(f'""" Tests for module {module_name}"""\n')
    print("Project directory successfully created")

Jetzt können wir den Inhalt des Verzeichnisses anzeigen:

In [None]:
%ls -R $project_path

Damit ein Verzeichnis als Paket erkannt wird, muss es eine Datei *\_\_init.py\_\_* enthalten, die auch leer sein kann. Die folgende Funktion erzeugt eine Datei *\_\_init\_\_.py* im angegebenen Verzeichnis.

In [None]:
def create_init_file(dir_path: Path, comment: str) -> None:
    init_file_path = dir_path / "__init__.py"
    init_file_path.write_text(f"{comment}")

Dateien *\_\_init\_\_.py* werden im Paket- und Test-Verzeichnis erzeugt. 

In [None]:
create_init_file(package_path, f'"""\nPackage {package_name}\n"""')
create_init_file(test_path, f'"""\nTests for package {package_name}\n"""')

Die Datei *README.md* enthält eine Beschreibung des Pakets im [markdown](https://www.markdownguide.org/)-Format, die z.B. in [PyPi](https://pypi.org/) angezeigt wird.

In [None]:
# create README.md
(project_path / "README.md").write_text(f"{project_name} is a great project\n")

# *setup.py* 

Die Datei setup.py steuert die Erstellung eines Python-Pakets (in der Regel eine mit *pip* installierbare Datei mit der Endung *.whl*. Die hier erstellte Datei *setup.py* ist sehr einfach gehalten. Details zur weiterführenden Optionen finden Sie in der [Dokumentation](https://docs.python.org/3/distutils/setupscript.html).

Besonders wichtig sind folgende Einstellungen:

* package_name: Name des Pakets
* python_requires: Einschränkung der Python-Versionen, für die das Paket installiert werden kann
* install_requires: Abhängigkeiten des Pakets. Bei der Installation wird überprüft, ob die Abhängigkeiten erfüllt sind. Gegebenenfalls werden fehlende Pakete nachinstalliert.
* entry_points: Es können automatisch ausführbare Programme erzeugt werden, die direkt vom Terminal ausgeführt werden können. In diesem Fall wird eine Kommandozeilen-Anwendung *add_float* erzeugt, die die funktion *add_main* im Modul *add_sub.py* aufruft. Kommandozeilenparameter stehen in Python über die Liste *sys.argv* zur Verfügung.

In [None]:
setup_string = f'''
"""
setup file for project {project_name}
"""

from pathlib import Path
from setuptools import setup

def read(fname):
    f_path = Path(__file__).parent / fname
    return f_path.read_text()


setup(
    name="{package_name}",
    version="{project_version}",
    # replace underline characters by spaces
    author="{author_name.replace('_', ' ')}",
    author_email="Vorname.Nachname@gmail.com",
    description=("A very simple setup.py file"),
    license="GPL",
    keywords="example",
    url="http://myUrl.com",
    packages=["{package_name}"],
    long_description=read("README.md"),
    classifiers=[
        "Development Status :: 3 - Alpha",
        "Topic :: Demonstration",
        "License :: GPL License",
    ],
    python_requires=">=3.10, <4",
    install_requires=["setuptools>=60"],
    entry_points=dict(console_scripts= [
            "add_float={package_name}.add_sub:add_main",
        ]
    ),
)
'''

with open(project_path / "setup.py", "w") as setup_file:
    setup_file.write(setup_string)

# Dokumentation

Für die Erzeugung der Dokumentation verwenden wir [sphinx](https://www.sphinx-doc.org/en/master/). Zum Einstieg erzeugen wir nur die Schnittstellen-Dokumentation automatisch aus den Docstrings, nutzen also nur einen kleinen Teil der zur Verfügung stehenden Funktionalität. Da wir noch keine Module implementiert haben, wird hier nur der Rahmen erstellt.

Als Nebeneffekt sehen Sie in der folgenden Zelle, wie man in Python mit dem Modul [subprocess](https://docs.python.org/3/library/subprocess.html) Programme starten kann. 

In [None]:
import subprocess

documentation_path = project_path / doc_dir_name

if not documentation_path.exists():
    Path.mkdir(documentation_path)
# check if directory is empty
if len(list(documentation_path.iterdir())) > 0:
    print(f"Directory {documentation_path} is not empty")
    print(f"Please remove or rename {documentation_path}")
else:
    # call sphinx-quickstart
    quickstart_cmd = f"sphinx-quickstart -p {project_name} -a {author_name} "
    quickstart_cmd += (
        f"-v {project_version} -r {project_release} -l en --no-sep "
    )
    quickstart_cmd += "--ext-autodoc --extensions=sphinx.ext.napoleon"
    quickstart_args = quickstart_cmd.split()
    subprocess.run(quickstart_args, cwd=documentation_path)
    # modyfy sys.path in conf.py
    with open(documentation_path / "conf.py", "r") as in_file:
        conf_orig = in_file.read()
    with open(documentation_path / "conf.py", "w") as out_file:
        out_file.write(
            "import sys; import os; sys.path.insert(0, os.path.abspath('../'))\n"
        )
        out_file.write(conf_orig)
        if len(sphinx_html_theme) > 0:
            out_file.write(f"html_theme = '{sphinx_html_theme}'\n")
    # call apidoc
    apidoc_cmd = f"sphinx-apidoc -o {doc_dir_name} {package_name}"
    apidoc_args = apidoc_cmd.split()
    subprocess.run(apidoc_args, cwd=project_path)

Außer der Dokumentation der Schnittstelle sollte die Dokumentation folgende Komponenten enthalten:
* Tutorial
* HOW-TOs
* Hintergrundinformationen

Quelle: [Daniele Procida: The four kinds of Documentation](https://www.writethedocs.org/videos/eu/2017/the-four-kinds-of-documentation-and-why-you-need-to-understand-what-they-are-daniele-procida)

In [None]:
%%file $documentation_path/how-tos.rst
How-to-guides
=============

Goal-oriented how-to guides.

In [None]:
%%file $documentation_path/tutorials.rst
Tutorials
=========

Learning-oriented tutorials.

In [None]:
%%file $documentation_path/explanations.rst
Background information
======================

Understanding-oriented discussions.

In [None]:
%%file $documentation_path/index.rst
Overview
========
This is a great project

Documentation
=============
.. toctree::
   :maxdepth: 2

   tutorials
   how-tos
   explanations

Reference
=========
.. toctree::
   :maxdepth: 2

   modules

Indices and tables
==================

* :ref:`genindex`
* :ref:`modindex`
* :ref:`search`

# Versionsverwaltung

Welche Dateien sollen von der Versionsverwaltung ausgeschlossen sein?

In [None]:
%%file $project_path/.gitignore
########
# editor
*~
*.bak
*.swp
.vscode

########
# python
*.pyc
build/
_build/
*.egg-info/
__pycache__/
dist/
.mutmut-cache/

#########
# jupyter
Untitled*.ipynb
.ipynb_checkpoints/

Ablauf für Gitlab CI/CD (bei Bedarf muss der Typ der folgenden Zelle auf 'Code' umgestellt werden)

Bisher wurden die folgenden Dateien erzeugt:

In [None]:
%ls -R $project_path

Diese werden jetzt einheitlich mit [black](https://pypi.org/project/black/) formatiert, wobei keine Zeile länger als 79 Zeichen sein soll.

In [None]:
%cd $project_path
!black -l 79 .

Diese Dateien werden im weiteren Verlauf des Projekts mit Funktionaltiät "gefüllt". Es kommen zusätzliche, automatisch generierte Dateien (z.B. die html-Dokumentation) hinzu, die jedoch nicht in die Versionverwaltung übernommen werden müssen, da sie jederzeit neu erzeugt werden können.

Es ist daher sinnvoll, an dieser Stelle das komplette Projektverzeichnis in die Versionsverwaltung zu übernehmen. Von der Kommandozeile erfolgt das beispielsweise so:

    cd  ~/tmp/project_example
    git init --initial-branch=main
    git add .
    git commit -m "Initial commit"
    git branch develop
    git checkout develop
    
    # Hier muss die URL angepasst werden
    git remote add origin ssh://git@myserver.de:2222/username/project_example.git
    git checkout main
    git push -u origin main
    git checkout develop
    git push origin develop
    
    
    
Die folgenden Abschnitte demonstrieren die weitere Vorgehensweise anhand eines einfachen Beispiels.

## Beispiel: pre-commit (lokal) 

Verwendete Werkzeuge: [mypy](https://mypy.readthedocs.io/en/latest/), [black](https://pypi.org/project/black/), [git-pylint-commit-hook](https://git-pylint-commit-hook.readthedocs.io/en/latest/index.html)

Vorarbeiten:
    
    pip install git-pylint-commit-hook
    
Hinweis: Die Datei *.git/hooks/pre-commit* muss unter Linux ausführbar gemacht werden mit

    chmod +x pre-commit

In [73]:
pre_commit_str = f"""
#!/bin/bash

echo "*** running mypy"
mypy -p {package_name}

echo "*** running black"
black -l 79 .

echo "*** running pylint"
git-pylint-commit-hook --limit 8
"""

git_path = project_path / ".git"
if git_path.is_dir():
    hook_dir = git_path / "hooks"
    Path.mkdir(hook_dir)
    file_path = hook_dir / "pre-commit"
    file_path.write_text(pre_commit_str)

# Modul *add_sub* (spezifisch für dieses Beispiel)

Das folgende Modul enthält eine Funktion *my_add*, die zwei float-Zahlen addiert sowie eine Funktion *add_main*, die als Einsprungspunkt für eine Kommandozeilen-Anwendung dient. Dazu wird in der Datei *setup.py* (weiter unten) über *entry_points* auf diese Funktion verwiesen.

Für die automatische Erzeugung der Dokumentation ist es essenziell, dass alle Funktionen mit einem *docstring* versehen sind, wobei hier der [google-style](https://sphinxcontrib-napoleon.readthedocs.io/en/latest/example_google.html) verwendet wird.

Das Konstrukt 

    if __name__ == '__main__':
        # Block
        
bewirkt, dass der entsprechende Block nur dann ausgeführt wird, wenn das Modul mit
    
    python add_sub.py 3 4

beziehungsweise mit

    python -m calculator.add_sub 3 4
    
aufgerufen wird. Beim Import steht in der Variablen *\_\_name\_\_* der Name des Moduls und der Block wird nicht ausgeführt.

In [None]:
%%file $project_path/calculator/add_sub.py

"""Add and subtract numbers"""

import sys

# import the package
import calculator


def my_add(n1: float, n2: float = 0) -> float:
    """
    Add two numbers and return the sum

    Args:
        n1: first number
        n2: second number

    Returns:
        n1 + n2

    Example:
        >>> int(my_add(3,4))
        7
    """
    return float(n1 + n2)


def add_main():
    """
    Entry point for command line call using arguments from sys.argv

    """
    if (argnum := len(sys.argv)) not in (2, 3):
        raise ValueError(
            f"{sys.argv[0]}: Require 2 command line arguments, got {argnum - 1}"
        )
        
    n1 = float(sys.argv[1])
    match argnum:
        case 3:
            n2 = float(sys.argv[2])
        case 2:
            n2 = 0.0
    print(f"{n1} + {n2} = {my_add(n1, n2)}")


if __name__ == "__main__":
    add_main()

## Aufruf vor der Installation mit *pip*

Wenn das Modul nicht mit *pip* oder *pip -e* importiert worden ist, sollte der Aufruf vom Projekt-Verzeichnis aus mit *python -m* ohne Erweiterung *.py* erfolgen. Die Kommandozeilenparameter stehen in der Liste *sys.argv* zur Verfügung, wobei sich in *sys.argv[0]* der Name des Moduls befindet.

Ansonsten kann es zu Fehlermeldungen beim Import des Pakets kommen.

In [None]:
%cd $project_path
!python -m calculator.add_sub 3 4

# Test (spezifisch für dieses Beispiel)

Das Programm *pytest* erkennt Tests automatisch am Namen. Üblicherweise wird für jedes Modul *modul.py* ein Test mit dem Namen *test_modul.py* erstellt. Die Funktion zum Test einer Funktion *funktion* erhält den Namen *test_funktion*, eine Test-Klasse für die Klasse *KlasseX* heist entsprechend *TestKlasseX* mit Methoden *test_methodeX* für die zu testenden Methoden.

In [None]:
%%file $project_path/tests/test_add_sub.py

""" Tests for module add_sub"""
import pytest
from calculator import add_sub


def test_my_add():
    result = add_sub.my_add(3, 4)
    expectation = 7.0
    assert result == pytest.approx(expectation, 1e-3)

Die nächste Zelle zeigt, wie Tests automatisch gefunden und ausgeführt werden können. In diesem Fall wird die Funktion *test_my_add* sowie der doctest im Docstring der Funktion *my_add* (unter "Example:") durchgeführt und die jeweilige Testabdeckung ausgegeben.

In [None]:
%cd $project_path
!pytest --doctest-modules --ignore docs

# Erstellen der Dokumentation

Mit *sphinx apidoc* wurden Dateien erzeugt, die es erlauben, html-Dokumentation mit dem Befehl *make html* zu generieren: 

In [None]:
# create html documentation
make_cmd = "make html"
make_args = make_cmd.split()
subprocess.run(make_args, cwd=documentation_path)

Das Ergebnis können Sie sich im Browser anschauen:

In [None]:
import sys

index_url_name = (
    "file:///"
    + str(documentation_path).replace("\\", "//")
    + r"//_build//html//index.html"
)

if sys.platform.startswith("win"):
    print("Bitte folgenden Datei im Browser öffnen:")
    print(index_url_name)
else:
    cmd = f"firefox {index_url_name}"
    subprocess.run(cmd.split())

# Paket erstellen und verwenden

Hier werden zwei Szenarien vorgestellt:

1. In der Entwicklungsphase wird das Paket häufig modifiziert. Für Tests und die Weiterentwicklung muss immer die aktuelle Version bereitgestellt werden, was einen dynamischen Import notwendig macht.
1. Nach der Entwicklungsphase ändert sich das Paket bis zum nächsten Release nicht mehr, so das die Funktionalität statisch importiert werden kann.

## Entwicklungs-Phase

Um sicherzustellen, dass immer die aktuelle Version zur Verfügung steht, verwendet man [autoreload](https://ipython.readthedocs.io/en/stable/config/extensions/autoreload.html). Dieses Werkzeug lädt geänderte Komponenten vor jedem Aufruf neu.

In [None]:
%load_ext autoreload
%autoreload 1

Der folgende Befehl installiert die Pakete in unserem Projekt im Edit-Modus. Dadurch ist sichergestellt, dass in der Entwicklungsphase stets die aktuelle Version verwendet wird. Durch das Flag *--user* wird erreicht, dass Dateien im Home-Verzeichnis des Benutzers gespeichert werden.

In [None]:
! add_float 3 4

Mit *%aimport* wird das Modul importiert, aber vor jeder Verwendung aktualisiert, falls dies nötig ist.

In [None]:
%aimport calculator.add_sub

In [None]:
calculator.add_sub.my_add(3, 5)

Bei einer Änderung der Funktion *my_add* ändert sich die Ausgabe der vorhergehenden Zelle entsprechend (bitte ausprobieren).

Wir können das Paket einfach wieder loswerden.

In [None]:
!pip uninstall -y calculator

## Verwendung des Pakets

Nachdem die Entwicklung abgeschlossen ist, wird eine statische wheel-Datei erzeugt, die mit pip installiert und anschließend verwendet werden kann.

In [None]:
%cd $project_path
!python -m build
!pip install dist/calculator-0.0.1-py3-none-any.whl

Wieder können Kommandozeilen-Anwendungen direkt aufgerufen werden.    

In [None]:
! add_float 3 4

Da sich das Paket *calculator* erst beim nächsten Release wieder ändert, erfolgt der Import statisch.

In [None]:
import calculator.add_sub

calculator.add_sub.my_add(3, 4)

Auch dieses Paket können wir einfach und restlos mit *pip* entfernen.

In [None]:
!pip uninstall -y calculator

# Weitere Bearbeitung in der Entwicklungsumgebung

Jupyter Notebooks sind sehr gut für die Lösung kleinerer, isolierter Probleme geeignet. Die Ergebnisse (z.B. Funktionen oder Klassen) können anschließend in einer integrierten Entwicklungsumgebung zu größeren Modulen kombiniert und weiterentwickelt werden.

## Vorbereitungen 

1. Passen Sie die Einstellungen oben in diesem Notebook an das konkrete Projekt an.
1. Führen Sie die Schritte bis einschließlich "Versionsverwaltung" durch.
1. Installieren Sie das Projekt mit *pip -e* wie im Abschnitt "Paket erstellen und verwenden - Entwicklungs-Phase" beschrieben.
1. Öffnen Sie das Projekt-Verzeichnis (Variable *base_path*) in der Entwicklungsumgebung.

## Ergänzung von Funktionalität

Implementieren Sie neue Funktionalität in der Entwicklungsumgebung oder übernehmen Sie Komponenten, die Sie in einem Jupyter-Notebook entwickelt haben. Vergessen Sie nicht, geeignete Tests zu erstellen.

## Formatierung des Source-Codes

Um zu erreichen, dass die Formatierung des Codes einheitlich ist, kann das Programm [black](https://pypi.org/project/black/) verwendet werden. Wechseln Sie dazu ins Projekt-Verzeichnis und geben Sie folgenden Befehl ein:

    black -l 79 .
    
*black* formatiert die Python-Dateien in sämtlichen Unterverzeichnissen neu, sofern diese nicht bereits dem Standard entsprechen. Der Parameter *-l 79* gibt die maximal zu verwendende Zeilenlänge an. Der hier verwendete Wert entspricht dem Standard und erlaubt es, auf aktuellen Monitoren zwei Dateien nebeneinander zu editieren.

## Aktualisierung der Dokumentation 

Um die html-Dokumentation zu aktualisieren, gehen Sie wie folgt vor:

    cd docs
    make html
    
Sphinx fügt dabei die Dokumentation für neue Klassen und Funktionen, die in existierenden Modulen neu entstanden sind, automatisch hinzu. Falls Sie neue Module erstellt haben, müssen Sie die weiter unten beschriebenen Ergänzungen vornehmen.

## Tests und Code-Qualität

**Tests** inklusive doctests können Sie vom Projekt-Verzeichnis aus wie folgt durchführen:

    pytest --doctest-modules --ignore docs
    
Dabei durchsucht *pytest* alle Unterverzeichnisse nach Tests.

Die Einhaltung von **Typ-Angaben** (type hints) überpfüfen Sie mit [mypy](http://www.mypy-lang.org):

    mypy {package_name} tests

Die **Code-Qualität** können Sie mit [pylint](https://pylint.org) vom Projekt-Verzeichnis aus wie folgt überprüfen:

    pylint {package_name} tests
    
Dabei werden Abweichungen vom Coding-Standard angezeigt und ein Score (maximal 10) vergeben.

{package_name} entspricht dem Namen des Pakets, z.B. *calculator*.

## Hinzufügen eines neuen Moduls 

Um ein Modul hinzuzufügen, das Sie nicht in der Liste *module_names* aufgeführt haben, gehen Sie wie folgt vor:

1. Erzeugen Sie die neue Modul-Datei im Paket-Verzeichnis (*package_path*).
1. Erzeugen Sie eine entsprechende Test-Datei im Verzeichnis (*test_path*).
1. Integrieren Sie die beiden neuen Dateien mit *git add* in die Versionsverwaltung.
1. Erweitern Sie die Datei *docs/{package_name}.rst*, indem Sie einen existierenden *module*-Eintrag kopieren und die Namen und Einstellungen entsprechend anpassen. 
1. Aktualisieren Sie die Dokumentation und stellen Sie sicher, dass das neue Modul aufgeführt wird.

## Erzeugung eines Pakets

Um eine installierbare *whl*-Datei zu erzeugen, geben Sie vom Projekt-Verzeichnis aus folgende Befehle ein:

    pip uninstall -y {package_name}
    python setup.py bdist_wheel
    
Die im Unterverzeichnis *dist* entstandene *whl*-Datei können Sie wie gewohnt mit pip installieren und auch weitergeben.