# Python Fortgeschritten: Packaging und Libraries
## Tag 5 - Notebook 24
***
In diesem Notebook wird behandelt:
- Package-Struktur
- setup.py
- pip install und Virtual Environments
- Externe Libraries nutzen
- Best Practices
***


## 1 Package-Struktur

Ein Python-Package ist ein Verzeichnis mit `__init__.py` Dateien, das mehrere Module zusammenfasst und eine strukturierte Organisation von Code ermöglicht.

### Was ist ein Package?

Ein **Package** ist eine Sammlung von Python-Modulen, die in einem Verzeichnis organisiert sind. Im Gegensatz zu einem einzelnen Modul (einer `.py` Datei) kann ein Package mehrere Module und sogar Unterpackages enthalten.

### Package vs. Modul

- **Modul**: Eine einzelne `.py` Datei mit Python-Code
- **Package**: Ein Verzeichnis mit `__init__.py` Datei, das Module und/oder Unterpackages enthält

### Die __init__.py Datei

Die `__init__.py` Datei hat mehrere wichtige Funktionen:

1. **Package-Erkennung**: Sie markiert ein Verzeichnis als Python-Package
2. **Initialisierung**: Code in `__init__.py` wird beim ersten Import des Packages ausgeführt
3. **API-Definition**: Sie definiert, welche Funktionen/Klassen öffentlich verfügbar sind (über `__all__`)
4. **Import-Vereinfachung**: Sie kann häufig verwendete Funktionen direkt aus dem Package importierbar machen

### Absolute vs. Relative Imports

**Absolute Imports** verwenden den vollständigen Pfad vom Package-Root:




In [None]:
from textutils.cleaning import remove_whitespace

**Relative Imports** verwenden relative Pfade (mit `.` für aktuelles Package, `..` für übergeordnetes):

In [None]:
from .cleaning import remove_whitespace  # Im gleichen Package
from ..validators import validate_email  # Im übergeordneten Package

Relative Imports sind nützlich innerhalb eines Packages, aber absolute Imports sind klarer und werden außerhalb bevorzugt.

### Namespace Packages (PEP 420)

Seit Python 3.3 können **Namespace Packages** existieren - Packages ohne `__init__.py` Datei. Diese werden automatisch erkannt, wenn Python nach Modulen sucht. Sie sind nützlich für:

- Packages, die über mehrere Verzeichnisse verteilt sind
- Plugin-Systeme
- Packages, die von verschiedenen Quellen zusammengesetzt werden

Für die meisten Anwendungsfälle ist es jedoch empfehlenswert, `__init__.py` Dateien zu verwenden, da sie expliziter und klarer sind.

### Subpackages und verschachtelte Strukturen

Packages können Unterpackages enthalten, die wiederum eigene `__init__.py` Dateien haben. Dies ermöglicht eine hierarchische Organisation von Code.

In [None]:
# Beispiel 1: hello_package - Einfaches Package
# Schauen wir uns die Struktur an:
import os

print("hello_package Struktur:")
if os.path.exists('hello_package'):
    for root, dirs, files in os.walk('hello_package'):
        level = root.replace('hello_package', '').count(os.sep)
        indent = ' ' * 2 * level
        print(f"{indent}{os.path.basename(root)}/")
        subindent = ' ' * 2 * (level + 1)
        for file in files:
            if file != '__pycache__':
                print(f"{subindent}{file}")


In [None]:
# Beispiel 2: hello_package verwenden

import sys
sys.path.insert(0, '.')

from hello_package import say_hello

result = say_hello("Python Seminar")
print(result)


In [None]:
# Beispiel 3: textutils Package - Komplexeres Beispiel
# Dieses Package zeigt eine vollständige Struktur mit mehreren Modulen und Subpackages

print("\ntextutils Package Struktur:")
if os.path.exists('textutils'):
    for root, dirs, files in os.walk('textutils'):
        level = root.replace('textutils', '').count(os.sep)
        indent = ' ' * 2 * level
        print(f"{indent}{os.path.basename(root)}/")
        subindent = ' ' * 2 * (level + 1)
        for file in files:
            if file != '__pycache__':
                print(f"{subindent}{file}")


In [None]:
# Beispiel 4: textutils Package verwenden
# Zeigt verschiedene Import-Möglichkeiten

# Import aus dem Hauptpackage
from textutils import remove_whitespace, capitalize_words, word_count

text = "  Dies   ist   ein   Beispiel  "
print(f"Original: '{text}'")
print(f"Nach Whitespace-Entfernung: '{remove_whitespace(text)}'")
print(f"Kapitalisiert: '{capitalize_words(text)}'")
print(f"Wortanzahl: {word_count(text)}")


In [None]:
# Beispiel 5: Import aus Subpackages
from textutils.validators import validate_email, validate_phone

# Email-Validierung
emails = ["test@example.com", "invalid-email", "user@domain.co.uk"]
for email in emails:
    print(f"{email}: {validate_email(email)}")

# Telefon-Validierung
phones = ["1234567890", "123-456-7890", "12345"]
for phone in phones:
    print(f"{phone}: {validate_phone(phone)}")


In [None]:
# Beispiel 6: __init__.py zeigt verfügbare Funktionen
import textutils

# Zeige alle verfügbaren Funktionen
print("Verfügbare Funktionen in textutils:")
print(textutils.__all__)
print(f"\nPackage-Version: {textutils.__version__}")


## 2 setup.py - Packages installierbar machen

`setup.py` ist eine Konfigurationsdatei, die Python-Packages installierbar macht. Sie verwendet `setuptools`, um Metadaten zu definieren und das Package für die Installation vorzubereiten.

### Was ist setup.py?

`setup.py` ist eine Python-Datei, die die `setup()` Funktion von `setuptools` aufruft. Sie definiert:

- **Package-Metadaten**: Name, Version, Autor, Beschreibung
- **Package-Struktur**: Welche Dateien gehören zum Package
- **Abhängigkeiten**: Welche anderen Packages benötigt werden
- **Entry Points**: Konsolen-Skripte oder Plugin-Punkte

### Warum setup.py verwenden?

Mit `setup.py` können Sie:

- Ihr Package mit `pip install` installieren
- Ihr Package auf PyPI veröffentlichen
- Ihr Package als Abhängigkeit in anderen Projekten verwenden
- Konsolen-Skripte erstellen, die global verfügbar sind

### Grundlegende setup.py Struktur

Eine minimale `setup.py` Datei enthält:
- `name`: Der Package-Name
- `version`: Die Version des Packages
- `packages`: Die zu installierenden Packages (oder `find_packages()`)
- `install_requires`: Liste der Abhängigkeiten

### Development Mode Installation

Mit `pip install -e .` kann man ein Package im "Development Mode" installieren. Änderungen am Code werden sofort wirksam, ohne Neuinstallation.


In [None]:
# Beispiel 7: setup.py für hello_package ansehen
with open('hello_package/setup.py', 'r', encoding='utf-8') as f:
    print(f.read())


In [None]:
# Beispiel 8: setup.py für textutils ansehen
with open('textutils/setup.py', 'r', encoding='utf-8') as f:
    print(f.read())


In [None]:
# Beispiel 9: Package im Development Mode installieren
# Hinweis: Dies würde normalerweise im Terminal ausgeführt:
# pip install -e .

# Hier zeigen wir, wie man die Installation testen könnte:
import subprocess
import sys

# Prüfe, ob das Package bereits installiert ist
try:
    import hello_package
    print("hello_package ist bereits verfügbar")
except ImportError:
    print("hello_package ist nicht installiert")
    print("Zum Installieren im Terminal ausführen: pip install -e hello_package/")


### Weitere setup.py Optionen

Eine vollständigere `setup.py` kann zusätzlich enthalten:

- **author** und **author_email**: Autor-Informationen
- **description** und **long_description**: Beschreibungen
- **url**: Projekt-URL
- **entry_points**: Konsolen-Skripte oder Plugin-Punkte
- **classifiers**: PyPI-Kategorien (z.B. "Programming Language :: Python :: 3")
- **python_requires**: Minimale Python-Version

### Entry Points

Entry Points ermöglichen es, Konsolen-Befehle zu erstellen, die nach der Installation global verfügbar sind:

In [None]:
# in setup.py datei
entry_points={
    'console_scripts': [
        'mycommand=my_package.module:function',
    ],
}

## 3 pip install und Virtual Environments

`pip` ist Pythons Standard-Package-Manager und ermöglicht die Installation von Packages aus verschiedenen Quellen.

### Was ist pip?

**pip** (Python Package Installer) ist das Standard-Tool zum Installieren von Python-Packages. Es:

- Installiert Packages von PyPI (Python Package Index)
- Verwaltet Abhängigkeiten automatisch
- Unterstützt Installation aus verschiedenen Quellen (Git, lokale Dateien, etc.)
- Ermöglicht Versionsverwaltung

### Virtual Environments - Warum?

**Virtual Environments** sind isolierte Python-Umgebungen, die:

- **Abhängigkeiten isolieren**: Verschiedene Projekte können verschiedene Package-Versionen verwenden
- **Konflikte vermeiden**: Verhindern, dass Packages sich gegenseitig beeinflussen
- **Sauberkeit**: Halten das System-Python sauber
- **Reproduzierbarkeit**: Ermöglichen exakte Versionskontrolle

### Virtual Environment erstellen und aktivieren

**Windows:**
```bash
python -m venv venv
venv\Scripts\activate
```

**Linux/Mac:**
```bash
python -m venv venv
source venv/bin/activate
```

Nach der Aktivierung zeigt der Prompt `(venv)` an.

### Wichtige pip-Befehle

- `pip install package`: Package installieren
- `pip uninstall package`: Package deinstallieren
- `pip list`: Alle installierten Packages anzeigen
- `pip show package`: Details zu einem Package anzeigen
- `pip freeze`: Installierte Packages mit Versionen ausgeben
- `pip install -r requirements.txt`: Packages aus Datei installieren


In [None]:
# Beispiel 10: Installierte Packages anzeigen
import subprocess
import sys

# Zeige einige installierte Packages
result = subprocess.run([sys.executable, '-m', 'pip', 'list'], 
                       capture_output=True, text=True)
print(result.stdout[:500])  # Erste 500 Zeichen


In [None]:
# Beispiel 11: Package-Informationen anzeigen
# Zeige Details zu einem installierten Package
result = subprocess.run([sys.executable, '-m', 'pip', 'show', 'numpy'], 
                       capture_output=True, text=True)
if result.returncode == 0:
    print(result.stdout)
else:
    print("numpy nicht installiert")


### requirements.txt

Die `requirements.txt` Datei listet alle Abhängigkeiten eines Projekts auf. Sie ermöglicht:

- **Reproduzierbarkeit**: Andere können exakt die gleichen Versionen installieren
- **Versionskontrolle**: Abhängigkeiten werden im Repository gespeichert
- **Einfache Installation**: `pip install -r requirements.txt` installiert alles

### Versions-Pinning

In `requirements.txt` können Versionen spezifiziert werden:

- `package==1.2.3`: Exakte Version
- `package>=1.2.0`: Mindestversion
- `package~=1.2.0`: Kompatible Version (>=1.2.0, <1.3.0)
- `package`: Neueste Version (nicht empfohlen für Produktion)


In [None]:
# Beispiel 12: requirements.txt Beispiel ansehen
with open('requirements_example.txt', 'r', encoding='utf-8') as f:
    print(f.read())


In [None]:
# Beispiel 13: pip freeze - Erstelle requirements.txt
# Dies zeigt, wie man die aktuell installierten Packages exportiert
result = subprocess.run([sys.executable, '-m', 'pip', 'freeze'], 
                       capture_output=True, text=True)
print("Aktuell installierte Packages (pip freeze Ausgabe):")
print(result.stdout[:300])  # Erste 300 Zeichen
print("\n...")
print("\nHinweis: Speichere die vollständige Ausgabe in requirements.txt")


### Installation aus verschiedenen Quellen

pip kann Packages aus verschiedenen Quellen installieren:

- **PyPI**: `pip install package` (Standard)
- **Git Repository**: `pip install git+https://github.com/user/repo.git`
- **Lokale Datei**: `pip install /path/to/package`
- **Wheel-Datei**: `pip install package.whl`
- **Tar-Archiv**: `pip install package.tar.gz`

### Development vs. Production Dependencies

Oft werden Abhängigkeiten in zwei Kategorien geteilt:

- **Production**: Packages, die für die Ausführung benötigt werden
- **Development**: Packages nur für Entwicklung (Tests, Linting, etc.)

Üblich ist die Verwendung von `requirements.txt` für Production und `requirements-dev.txt` für Development.


## 4 Externe Libraries nutzen

Python hat eine riesige Ökosystem von externen Libraries, die fast jede Aufgabe erleichtern können.

### Packages finden

**PyPI** (Python Package Index) ist die Hauptquelle für Python-Packages:
- Website: https://pypi.org
- Suche nach Packages nach Funktionalität
- Lies Dokumentation und Bewertungen

**Conda-Forge** ist eine Alternative für wissenschaftliche Packages:
- Besonders für NumPy, SciPy, Pandas, etc.
- Bietet auch nicht-Python-Abhängigkeiten

### Import Best Practices

1. **Standard-Library zuerst**: Importiere Standard-Library-Module vor externen Packages
2. **Gruppiere Imports**: Standard → Externe → Lokale
3. **Vermeide `import *`**: Explizite Imports sind klarer
4. **Verwende Aliase**: Kurze, klare Aliase für lange Namen (`import numpy as np`)

### Versionskompatibilität

- **Prüfe Dokumentation**: Welche Python-Version wird benötigt?
- **Teste früh**: Installiere und teste Packages früh im Projekt
- **Pinne Versionen**: In Production sollten Versionen gepinnt sein
- **Update vorsichtig**: Teste Updates in Development-Umgebung


In [None]:
# Beispiel 14: Externe Packages importieren und verwenden
# Zeigt verschiedene externe Packages

# NumPy für numerische Berechnungen
try:
    import numpy as np
    arr = np.array([1, 2, 3, 4, 5])
    print(f"NumPy Array: {arr}")
    print(f"NumPy Version: {np.__version__}")
except ImportError:
    print("NumPy nicht installiert")

print()

# Pandas für Datenanalyse
try:
    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print("Pandas DataFrame:")
    print(df)
    print(f"Pandas Version: {pd.__version__}")
except ImportError:
    print("Pandas nicht installiert")


In [None]:
# Beispiel 15: Import-Fehler elegant behandeln
def safe_import(module_name, package_name=None):
    """Versuche ein Modul zu importieren, gebe None zurück wenn nicht verfügbar."""
    try:
        return __import__(module_name)
    except ImportError:
        if package_name:
            print(f"{package_name} nicht installiert. Installiere mit: pip install {package_name}")
        else:
            print(f"{module_name} nicht verfügbar")
        return None

# Teste verschiedene Packages
requests = safe_import('requests', 'requests')
matplotlib = safe_import('matplotlib', 'matplotlib')

if requests:
    print(f"requests Version: {requests.__version__}")
if matplotlib:
    print(f"matplotlib Version: {matplotlib.__version__}")


In [None]:
# Beispiel 16: Package-Versionen prüfen
import sys

packages_to_check = ['numpy', 'pandas', 'matplotlib', 'requests']

print("Installierte Package-Versionen:")
for package in packages_to_check:
    result = subprocess.run([sys.executable, '-m', 'pip', 'show', package], 
                           capture_output=True, text=True)
    if result.returncode == 0:
        # Extrahiere Version
        for line in result.stdout.split('\n'):
            if line.startswith('Version:'):
                version = line.split(':')[1].strip()
                print(f"  {package}: {version}")
                break


### Abhängigkeitskonflikte

Abhängigkeitskonflikte entstehen, wenn:

- Zwei Packages verschiedene Versionen derselben Abhängigkeit benötigen
- Ein Package eine neuere Python-Version benötigt als verfügbar ist
- Packages inkompatible Abhängigkeiten haben

**Lösungen:**
- Verwende Virtual Environments für Isolation
- Prüfe Konflikte mit `pip check`
- Aktualisiere Packages vorsichtig
- Verwende `pip-tools` für bessere Abhängigkeitsverwaltung

### Sicherheitsüberlegungen

- **Vertrauenswürdige Quellen**: Installiere nur von PyPI oder vertrauenswürdigen Quellen
- **Regelmäßige Updates**: Halte Packages auf dem neuesten Stand für Sicherheitspatches
- **Prüfe Abhängigkeiten**: `pip-audit` kann bekannte Sicherheitslücken finden
- **Minimale Abhängigkeiten**: Installiere nur, was wirklich benötigt wird


In [None]:
# Beispiel 17: Abhängigkeitskonflikte prüfen
# pip check zeigt Konflikte zwischen installierten Packages
result = subprocess.run([sys.executable, '-m', 'pip', 'check'], 
                       capture_output=True, text=True)
if result.stdout.strip():
    print("Gefundene Konflikte:")
    print(result.stdout)
else:
    print("Keine Abhängigkeitskonflikte gefunden")


## 5 Best Practices

### Package-Organisation

1. **Klare Struktur**: Organisiere Code logisch in Modulen
2. **Ein Verantwortlichkeit**: Jedes Modul sollte eine klare Aufgabe haben
3. **Subpackages für Komplexität**: Bei vielen Modulen, verwende Subpackages
4. **Konsistente Namensgebung**: Verwende klare, beschreibende Namen

### Namenskonventionen

- **Package-Namen**: Kleinbuchstaben, Unterstriche erlaubt (`my_package`)
- **Modul-Namen**: Kleinbuchstaben, Unterstriche erlaubt (`my_module.py`)
- **Klassen**: PascalCase (`MyClass`)
- **Funktionen/Variablen**: snake_case (`my_function`)

### Dokumentation

- **Docstrings**: Dokumentiere alle öffentlichen Funktionen und Klassen
- **README.md**: Erkläre, was das Package macht und wie man es installiert
- **Beispiele**: Zeige typische Verwendungsfälle
- **Type Hints**: Verwende Type Hints für bessere Dokumentation

### Versionsverwaltung

- **Semantic Versioning**: MAJOR.MINOR.PATCH (z.B. 1.2.3)
- **Changelog**: Dokumentiere Änderungen zwischen Versionen
- **Git Tags**: Markiere Releases mit Git-Tags

### Häufige Fehler vermeiden

1. **Vergessene `__init__.py`**: Ohne diese Datei wird das Verzeichnis nicht als Package erkannt
2. **Zirkuläre Imports**: Vermeide zirkuläre Abhängigkeiten zwischen Modulen
3. **Zu viele Imports in `__init__.py`**: Importiere nur, was wirklich häufig verwendet wird
4. **Fehlende Abhängigkeiten**: Liste alle benötigten Packages in `setup.py` oder `requirements.txt`
5. **Keine Virtual Environments**: Verwende immer Virtual Environments für Projekte


In [None]:
# Beispiel 18: Gute Package-Struktur demonstrieren
# Zeige die Struktur von textutils als Beispiel für gute Organisation

print("textutils Package-Struktur (Beispiel für gute Organisation):")
print("\n1. Klare Modul-Trennung:")
print("   - cleaning.py: Text-Bereinigung")
print("   - formatting.py: Text-Formatierung")
print("   - analysis.py: Text-Analyse")
print("   - validators/: Subpackage für Validierung")

print("\n2. __init__.py exportiert wichtige Funktionen:")
print("   - Definiert __all__ für klare API")
print("   - Macht häufig verwendete Funktionen direkt verfügbar")

print("\n3. Subpackages für logische Gruppierung:")
print("   - validators/ gruppiert alle Validierungs-Funktionen")


#### Aufgaben:

> (a) Erstelle eine Package-Struktur mit mindestens zwei Modulen und einem Subpackage. <br>
> (b) Erstelle eine `setup.py` Datei für dein Package. <br>
> (c) Installiere ein externes Package mit pip und verwende es in einem Beispiel. `!` oder `%` lässt aus Python escapen um Konsolenbefehle auszuführen in .ipynb<br>
> (d) Erstelle eine `requirements.txt` Datei mit mindestens drei Abhängigkeiten.


In [None]:
# Deine Lösung:



#### Lösung:


In [None]:
# Musterlösung (a) - Package-Struktur
# Erstelle Verzeichnisstruktur:
# myutils/
#   __init__.py
#   string_utils.py
#   math_utils.py
#   validators/
#     __init__.py
#     number_validator.py

# In string_utils.py:
# def reverse_string(text: str) -> str:
#     return text[::-1]

# In math_utils.py:
# def factorial(n: int) -> int:
#     if n <= 1:
#         return 1
#     return n * factorial(n - 1)

# In validators/number_validator.py:
# def is_positive(n: float) -> bool:
#     return n > 0

# In validators/__init__.py:
# from .number_validator import is_positive

# In __init__.py:
# from .string_utils import reverse_string
# from .math_utils import factorial
# from .validators import is_positive

print("Musterlösung (a): Package-Struktur erstellt")


In [None]:
# Musterlösung (b) - setup.py
# In myutils/setup.py:
# from setuptools import setup, find_packages
# 
# setup(
#     name='myutils',
#     version='0.1.0',
#     description='Utility functions package',
#     author='Dein Name',
#     packages=find_packages(),
#     python_requires='>=3.8',
#     install_requires=[],
# )

print("Musterlösung (b): setup.py erstellt")
print("Installation: pip install -e myutils/")


In [None]:
# Musterlösung (c) - Externes Package verwenden
# Terminal: pip install requests
# Dann:
try:
    import requests
    print(f"requests Version: {requests.__version__}")
    
    # Beispiel-Verwendung
    # response = requests.get('https://api.github.com')
    # print(f"Status Code: {response.status_code}")
    print("requests erfolgreich importiert und verwendbar")
except ImportError:
    print("requests nicht installiert. Führe aus: pip install requests")


In [None]:
# Musterlösung (d) - requirements.txt
# Inhalt von requirements.txt:
# numpy>=1.20.0
# pandas>=1.3.0
# matplotlib>=3.4.0

# Installation: pip install -r requirements.txt

print("Musterlösung (d): requirements.txt erstellt")
print("Beispiel-Inhalt:")
print("numpy>=1.20.0")
print("pandas>=1.3.0")
print("matplotlib>=3.4.0")
