# Python-Typannotationen

Typannotationen sind Hinweise im Code, die angeben, welche Art von Daten von Variablen, Funktionsparametern oder Rückgabewerten erwartet werden. Sie haben keinen Einfluss auf die Ausführung des Codes, sondern dienen der Dokumentation und unterstützen die statische Typprüfung.

Man kann zum Beispiel die folgende Funktion ohne Typannotationen erstellen:

In [21]:
def get_full_name(first_name, last_name):
    full_name = f"{first_name.capitalize()} {last_name.capitalize()}"
    return full_name

print(get_full_name("buzz", "lightyear"))

Buzz Lightyear


Diese Funktion nimmt den Vornamen und Nachnamen als Eingabedaten und konvertiert den ersten Buchstaben in die Großschreibweise. Außerdem wird zwischen den zwei Strings ein Leerzeichen hinzugefügt und anschließend als String ausgegeben. Ein sehr einfaches Programm oder?

Beim schreiben des Programms fällt folgendes auf: Wenn wir `first_name.capitali...` schreiben, funktioniert nicht die sogenannte "autocompletion". Auch wenn man `first_name.` schreibt und direkt nach dem Punktoperatur die Tastenkombination `Crtl+Space` verwendet, kommen keine Vorschläge der autocompletion. Es erscheint lediglich die Benachrichtigung: No suggestions.
<br>
<br>
Wir fügen der Funktion nun Typannotationen hinzu und versuchen die autocompletion nochmal zu verwenden:

In [None]:
def get_full_name(first_name: str, last_name: str):
    full_name = f"{first_name.capitalize()} {last_name.capitalize()}"
    return full_name

print(get_full_name("buzz", "lightyear"))

Wenn man jetzt nach dem Punktoperator `first_name.` die Tastenkombination `Crtl+Space` betätigt, wird die autocompletion funktionieren. Die Ursache ist, dass der Editor oder die IDE diese Informationen nutzt um den Entwickler bei der Programmierung zu unterstützen.
<br>
<br>
Wenn wir also in unsere Funktion angeben das `first_name` und `last_name` vom Datentyp `str` sind, dann weiß die IDE genau, welche Datentypen für die Parameter, Variablen und Rückgabewerte zu erwarten sind. Dadurch kann sie Vorschläge für Methoden und Attribute machen, die für diese Typen relevant sind.
<br>
<br>
Ein weiterer Vorteil der Typannotation ist die bessere Fehlerüberprüfung. Statische Typprüfer wie mypy, pyright (oft in VS Code integriert), oder ähnliche Tools prüfen den Code basierend auf den angegebenen Typannotationen. Sie erkennen mögliche Typfehler, noch bevor der Code ausgeführt wird.
<br>
<br>
**Achtung:** Jupyter Notebooks bieten von Haus aus keine Echtzeit-Typprüfung oder Fehlermeldungen basierend auf Typannotationen. In Jupyter wird der Code eher als Skript ausgeführt, und Typen werden dynamisch zur Laufzeit geprüft. Dadurch gehen einige der Vorteile von Typannotationen, wie die Echtzeit-Fehlerüberprüfung, verloren. Durch die Installation von `pip install mypy` kann man jedoch die Echtzeit-Typprüfung in seinem Notebook hinzufügen. Dazu wird jedoch auch die Extension `Mypy Type Checker` benötigt.

Betrachten wir dazu folgendes triviales Beispiel:

In [None]:
def add_numbers(x: int, y: int) -> int:
    return x + y

result = add_numbers(2, "10")
print(result)

Bevor man den code ausführt, erscheint bereits die Meldung: `Argument 2 to "add_numbers" has incompatible type "str"; expected "int" (Mypyarg-type)`

**Wozu nun Typannotationen?**

Viele Bibliotheken und Frameworks wie FastAPI oder Pydantic unterstützen Typannotationen und verwenden sie, um ihre eigenen Funktionen besser in die IDE zu integrieren. Das bedeutet, dass Methoden und Parameter mit Typannotationen dokumentiert sind, was Autovervollständigung erheblich erleichtert.
<br>
<br>
In modernen Python-Projekten spielen Typannotationen eine entscheidende Rolle bei der Verbesserung der Code-Qualität, Lesbarkeit und Wartbarkeit. Sie ermöglichen es Entwicklern, den Datentyp von Variablen, Funktionsparametern und Rückgabewerten explizit zu definieren, was nicht nur den Entwicklungsprozess erleichtert, sondern auch dazu beiträgt, potenzielle Fehler frühzeitig zu erkennen.
<br>
<br>
Python ist eine dynamisch typisierte Sprache, was bedeutet, dass die Typen der Variablen zur Laufzeit bestimmt werden. Während diese Flexibilität viele Vorteile bietet, kann sie auch zu Unsicherheiten führen, insbesondere bei größeren Codebasen. Typannotationen schaffen Abhilfe, indem sie Klarheit über die erwarteten Daten schaffen und Entwicklerwerkzeuge wie IDEs und Linter unterstützen.

Bisher hatten wir die Datentypen: `int` und `str` gesehen, jedoch gibt es noch mehr wie zum Beispiel `bool` oder `bytes` (kommt in der Praxis selten vor). Betrachten wir folgendes Beispiel für eine Benutzerregistrierung:

In [9]:
import json # Um die Ausgabe der funktion als json-Objekt zu formatieren

def register_user(name: str, age: int, email: str, is_active: bool = True) -> dict:
    """
    Registriert einen Benutzer und gibt die Registrierungsdetails zurück.

    :param name: Der Name des Benutzers (str).
    :param age: Das Alter des Benutzers (int).
    :param email: Die E-Mail-Adresse des Benutzers (str).
    :param is_active: Gibt an, ob der Benutzer aktiv ist (bool, Standardwert True).
    :return: Ein Wörterbuch mit den Benutzerdaten (dict).
    """
    if age < 18:
        return {"error": "Benutzer muss mindestens 18 Jahre alt sein"}

    return {
        "name": name,
        "age": age,
        "email": email,
        "is_active": is_active,
        "status": "registriert"
    }

user_data = register_user("Alice", 25, "alice@example.com")
print(user_data)
print()
user_data_json = json.dumps(user_data, indent=4, ensure_ascii=False)
print(user_data_json)

{'name': 'Alice', 'age': 25, 'email': 'alice@example.com', 'is_active': True, 'status': 'registriert'}

{
    "name": "Alice",
    "age": 25,
    "email": "alice@example.com",
    "is_active": true,
    "status": "registriert"
}


Erklärung der Typannotationen
- name: `str` Der Name des Benutzers muss eine Zeichenkette (str) sein.
- age: `int` Das Alter muss eine Ganzzahl (int) sein.
- email: `str` Die E-Mail-Adresse muss eine Zeichenkette (str) sein.
- is_active: `bool` Optionaler Parameter, der einen Wahrheitswert (bool) angibt, ob der Benutzer aktiv ist.Standardwert ist True.
- Rückgabe: `-> dict` Die Funktion gibt ein Wörterbuch (dict) mit den Benutzerdaten oder einer Fehlermeldung zurück.


## Generische Typen

Generische Typen in Python ermöglichen es, Funktionen und Klassen so zu gestalten, dass sie mit verschiedenen Datentypen arbeiten können, ohne den genauen Typ im Voraus festzulegen. Dies fördert die Wiederverwendbarkeit und Flexibilität des Codes.
<br>
<br>
Einige Datenstrukturen wie zum Beispiel `dict`, `list`, `set` oder `tuple` können unterschiedliche Werte beinhalten, welcher wiederum vom unterschiedlichen Datentyp sein können. Mit generischen Typen können wir spezifizieren, welchen Typ die Elemente der Liste haben sollen. Man verwendet in der Python Welt häufig das `typing` Modul. Dieses Modul ist ein Standardmodul in Python, das eingeführt wurde, um Typannotationen zu unterstützen. Es bietet Werkzeuge und Klassen, mit denen man den Typ von Variablen, Funktionsparametern, Rückgabewerten und komplexen Datenstrukturen definieren kann.
<br>
<br>
Betrachten wir einige Beispiele:

**List:**

In [12]:
from typing import List

def process_numbers(numbers: List[int]) -> int:
    return sum(numbers)

result = process_numbers([1, 2, 3, 4])  
print(result)

# Fehler: Erwartet eine Liste von Ganzzahlen:
# process_numbers(["a", "b"]) 


10


**Dictionary:**

In [17]:
from typing import Dict
import json

def get_prices() -> Dict[str, float]:
    data = {"Apfel": 1.99, "Banane": 0.7, "Zitrone": 0.35, "Kirsche": 1.49}
    return json.dumps(data, indent=4, ensure_ascii=False)

prices = get_prices()
print(prices)


{
    "Apfel": 1.99,
    "Banane": 0.7,
    "Zitrone": 0.35,
    "Kirsche": 1.49
}


**Tuple:**

In [18]:
from typing import Tuple

def create_point(x: int, y: int) -> Tuple[float, float]:
    return (x, y)

# Beispielaufruf
point = create_point(3, 7)
print(point)


(3, 7)


**Optional:**<br>
Manchmal kann ein Wert fehlen, dann kann ein generischer Typ wie `Optional` verwendet werden.
In dem folgenden Beispiel kann der Rückgabewert entweder ein `str` oder `None` sein.

In [19]:
from typing import Optional

def find_user(user_id: int) -> Optional[str]:
    """
    Findet einen Benutzer anhand der ID. Gibt None zurück, wenn der Benutzer nicht existiert.
    """
    if user_id == 1:
        return "Alice"
    return None

print(find_user(1))  
print(find_user(2)) 


Alice
None


**Union:**<br>
Ein Wert kann mehrere Typen haben. In dem folgenden Beispiel kann der Parameter `value`, entweder eine Ganzzahl (int) oder eine Zeichenkette (str) sein.

In [20]:
from typing import Union

def process_value(value: Union[int, str]) -> str:
    """
    Verarbeitet einen Wert, der entweder eine Ganzzahl oder eine Zeichenkette sein kann.
    """
    if isinstance(value, int):
        return f"Nummer: {value}"
    return f"Text: {value}"

print(process_value(42))  
print(process_value("Hallo"))


Nummer: 42
Text: Hallo


**Klassen als Datentyp:**
<br>
Dies ist nützlich, um sicherzustellen, dass Variablen, Parameter und Rückgabewerte bestimmte Klassen (bzw. deren Instanzen) sind. Betrachten wir folgendes Beispiel, welches oft in der Praxis vorzufinden ist:


In [21]:
from typing import List

class Customer:
    def __init__(self, customer_id: int, name: str):
        self.customer_id = customer_id
        self.name = name

    # Wird immer aufgerufen wenn "print()" verwendet wird:
    def __str__(self) -> str:
        return f"Kunde {self.customer_id}: {self.name}"

class Order:
    # Der Parameter "customer" ist vom Datentyp einer Klasse!
    def __init__(self, order_id: int, customer: Customer, items: List[str]):
        self.order_id = order_id
        self.customer = customer
        self.items = items

    def __str__(self) -> str:
        return (f"Bestellung {self.order_id} von {self.customer.name}: "
                f"{', '.join(self.items)}")


def process_order(order: Order) -> str:
    """
    Verarbeitet eine Bestellung und gibt eine Bestätigung zurück.
    :param order: Eine Bestellung vom Typ Order
    :return: Eine Bestätigungsnachricht
    """
    return (f"Bestellung {order.order_id} von {order.customer.name} "
            f"mit {len(order.items)} Artikeln wurde verarbeitet.")

# --- MAIN --- #
customer_1 = Customer(101, "Alice")
order_1 = Order(1, customer_1, ["Laptop", "Tastatur", "Maus"])

print(order_1) 
print(process_order(order_1))


Bestellung 1 von Alice: Laptop, Tastatur, Maus
Bestellung 1 von Alice mit 3 Artikeln wurde verarbeitet.


## Grundlagen der Pydantic Bibliothek

Pydantic ist eine Python-Bibliothek, die für Datenvalidierung und Datenserialisierung verwendet wird.
<br>
<br>
- **Datenvalidierung:** Bedeutet, zu überprüfen, ob die Eingabedaten korrekt und vollständig sind. Sie stellt sicher, dass die Daten bestimmten Regeln, Formaten oder Typen entsprechen, bevor sie weiterverarbeitet werden.
- **Datenserialisierung:** Bedeutet, Daten in ein formatgerechtes und übertragbares Format umzuwandeln, damit sie gespeichert, über Netzwerke gesendet oder mit anderen Systemen geteilt werden können.

Datenalidierung ist wichtig weil:
- Daten können aus externen Quellen kommen, z. B. Benutzereingaben, APIs, Dateien oder Datenbanken. Hier können die Daten Fehlerbehaftet sein oder nicht konsistent sein.
- Falsche oder unvollständige Daten können zu Fehlern oder Sicherheitslücken führen.

Datenserialisierung ist wichtig weil:
- Für die Datenübertragung wichtig, damit verschiedene Systeme (z. B. APIs, Datenbanken) korrekt miteinander kommunizieren können.
- Es wird sichergestellt, dass korrekte Daten in einer Datei oder Datenbank gespeichert werden, z. B. in JSON oder CSV.

| Merkmal    | Datenvalidierung                                             | Datenserialisierung                                  |
| ---------- | ------------------------------------------------------------ | ---------------------------------------------------- |
| Zweck      | Überprüfung der Korrektheit und Vollständigkeit von Daten    | Umwandlung von Daten in übertragbare Formate         |
| Beispiel   | Prüfen, ob eine Zahl größer als 0 ist oder ob ein Feld fehlt | Umwandlung eines Objekts in JSON für die Speicherung |
| Verwendung | Sicherheit und Integrität der Eingabedaten                   | Kommunikation zwischen Systemen oder Speicherung     |
| Tools      | Pydantic, Validators                                         | Pydantic, JSON, Pickle                               |

Was ist nun der unterschied zwischen dem `pydantic` und dem `typing` Modul?

| Merkmal                    | Pydantic                                                                                  | Typing                                                       |
| -------------------------- | ----------------------------------------------------------------------------------------- | ------------------------------------------------------------ |
| Zweck                      | Validierung und Konvertierung von Eingabedaten                                            | Beschreibung der Typen, keine Validierung oder Konvertierung |
| Automatische Konvertierung | Kann Eingaben automatisch in die richtigen Typen umwandeln                                | Keine Konvertierung, Eingaben bleiben unverändert            |
| Validierung                | Führt Laufzeitprüfungen durch, um die Datenintegrität sicherzustellen                     | Keine Laufzeitprüfung                                        |
| Benutzung                  | Klassenbasiert (BaseModel)                                                                | Einfach als Typannotationen (int, List[str], etc.)           |
| Fehlermeldungen            | Detaillierte Fehler bei ungültigen Eingaben                                               | Keine Fehlerprüfung                                          |
| Integration mit Frameworks | Häufig in Frameworks wie FastAPI verwendet, um Eingaben zu validieren und zu konvertieren | Wird in Python-Typprüfern wie mypy verwendet                 |                                          

Betrachten wir folgendes Beispiel:

In [9]:
from pydantic import BaseModel

class User(BaseModel):
    id: int
    name: str
    signup_ts: str
    is_active: bool = True

user_data = {"id": "123", "name": "Alice", "signup_ts": "2023-12-27", "is_active": "false"}
user = User(**user_data) # Hier findet die Datenvalidierung statt
serialized_user_json = user.model_dump_json(indent=4) # Hier findet eine Datenserialisierung statt
print(serialized_user_json)

{
    "id": 123,
    "name": "Alice",
    "signup_ts": "2023-12-27",
    "is_active": false
}


1. **Codeblock:**

```python
    class User(BaseModel):
    id: int
    name: str
    signup_ts: str
    is_active: bool = True
```

- Definition der Klasse `User`:
    - Die Klasse `User` erbt von `BaseModel`, was sie zu einem sogenannten Pydantic-Modell macht.
    - Unter einem Pydantic-Modell versteht man eine Klasse welche von `BaseModel`erbt. Man spricht auch von einer Datenstruktur, welche die Eigenschaften (Felder) der daten beschreibt.
- Jede Klasse, die von BaseModel erbt, unterstützt:
    - Datenvalidierung: Überprüfung der Eingaben auf Übereinstimmung mit den Typannotationen (id, name, etc.).
    - Datenserialisierung: Automatische Konvertierung von Eingabewerten in die erwarteten Typen.

2. **Codeblock:**

```python
    user_data = {"id": "123", "name": "Alice", "signup_ts": "2023-12-27", "is_active": "false"}
```

- `user_data` ist ein Wörterbuch (dictionary) mit den Daten eines Benutzers.
-  Die Datentypen im Wörterbuch stimmen nicht genau mit den Datenzypen überein, die in der Klasse `User` definiert sind:
    - `id: "123"` ist ein String, sollte aber laut der `User` Klasse vom Datentyp Integer sein.
    - `"is_active": "false"`ist ebenfalls ein String, sollte aber ein Boolean sein.

3. **Codeblock:**

```python
    user = User(**user_data)
```

- Dieser Code erstellt eine Instanz der Klasse `User` und übergibt die Werte aus dem Wörterbuch user_data an den Konstruktor `(__init__)` der Klasse.
- Das Doppelsternchen `(**)` ist ein Argumententpacker. Es wird verwendet, um ein Wörterbuch oder ein ähnliches Objekt zu entpacken und dessen Schlüssel-Wert-Paare als benannte Argumente (keyword arguments) an eine Funktion oder einen Konstruktor zu übergeben.
- Pydantic übernimmt die übergebenen Argumente und führt eine Datenvalidierung durch:
    - `id` wird überprüft, ob es eine int ist, und "123" wird in 123 (Ganzzahl) konvertiert.
    - `name` wird überprüft, ob es ein str ist (dies ist bereits korrekt).
    - Nach erfolgreicher Validierung und Konvertierung wird ein User-Objekt mit den validierten Daten erstellt.
4. **Codeblock:**

```python
    serialized_user_json = user.model_dump_json(indent=4)
```

- Die Methode `model_dump_json` in Pydantic wird verwendet, um ein Pydantic-Modell direkt in einen JSON-String zu serialisieren. Dabei kann man das Format des JSON-Outputs anpassen, z. B. die Einrückung (über indent) für bessere Lesbarkeit.

### 1. Beispiel: 

In [10]:
from pydantic import BaseModel, Field

class Product(BaseModel):
    name: str
    price: float = Field(..., gt=0, description="Price must be greater than 0")
    stock: int = Field(..., ge=0, description="Stock cannot be negative")

# Gültige Daten:
product = Product(name="Laptop", price=1200.99, stock=10)
print(product)

# Ungültige Daten:
try:
    Product(name="Laptop", price=-5, stock=-1)
except Exception as e:
    print(e)


name='Laptop' price=1200.99 stock=10
2 validation errors for Product
price
  Input should be greater than 0 [type=greater_than, input_value=-5, input_type=int]
    For further information visit https://errors.pydantic.dev/2.10/v/greater_than
stock
  Input should be greater than or equal to 0 [type=greater_than_equal, input_value=-1, input_type=int]
    For further information visit https://errors.pydantic.dev/2.10/v/greater_than_equal


**Definition des Product-Modells:**

```python
    class Product(BaseModel):
    name: str
    price: float = Field(..., gt=0, description="Price must be greater than 0")
    stock: int = Field(..., ge=0, description="Stock cannot be negative")
```

- Der key `price`:
    - Erwartet einen float-Wert für den Preis des Produkts.
    - `Field`: Eine Funktion von Pydantic, die es ermöglicht, Feldern in einem Modell zusätzliche Einschränkungen (z. B. Mindestwerte, Beschreibungen) hinzuzufügen.
    - `...`: Bedeutet, dass dieses Feld erforderlich ist (kein Standardwert).
    - `gt=0:` Der Wert muss größer als 0 sein (gt = "greater than").
    - `description`: Eine Beschreibung des Felds, die für Dokumentationszwecke nützlich ist.

- Bei dem Produkt mit ungültigen Daten schlägt die Datenvalidierung fehl:
    - `price=-5` verletzt die Einschränkung gt=0 (der Preis muss größer als 0 sein).
    - `stock=-1` verletzt die Einschränkung ge=0 (der Lagerbestand darf nicht negativ sein).

### 2. Beispiel:

In [13]:
from pydantic import BaseModel
from typing import List

class Address(BaseModel):
    street: str
    city: str
    zip_code: str

class User(BaseModel):
    id: int
    name: str
    addresses: List[Address] # hier sieht man: Pydantic unterstützt verschachtelte Datenmodelle

# Die Eingabedaten:
user_data = {
    "id": 1,
    "name": "Alice",
    "addresses": [
        {"street": "123 Main St", "city": "New York", "zip_code": "10001"},
        {"street": "456 Elm St", "city": "Los Angeles", "zip_code": "90001"},
    ],
}

user = User(**user_data)
serialized_user_json = user.model_dump_json(indent=4)
print(serialized_user_json)

{
    "id": 1,
    "name": "Alice",
    "addresses": [
        {
            "street": "123 Main St",
            "city": "New York",
            "zip_code": "10001"
        },
        {
            "street": "456 Elm St",
            "city": "Los Angeles",
            "zip_code": "90001"
        }
    ]
}


### 3. Beispiel:

In [17]:
from pydantic import BaseModel
from datetime import datetime

class Event(BaseModel):
    name: str
    start_time: datetime

# Die Eingabedaten (start_time ist interessant):
event_data = {"name": "Conference", "start_time": "2024-01-01 10:00:00"}
event = Event(**event_data)

# Hier sehen wir das "start_time" ei datetime-Object ist:
print(event) 
print(type(event.start_time)) # Pydatic konvertiert die Eingabedaten automatisch
print(f"Startzeit (Datetime-Objekt): {event.start_time}")


name='Conference' start_time=datetime.datetime(2024, 1, 1, 10, 0)
<class 'datetime.datetime'>
Startzeit (Datetime-Objekt): 2024-01-01 10:00:00


### 4. Beispiel:

In [20]:
from pydantic import BaseModel
from enum import Enum

# Mit Enum erzwingt man bestimmte Werte:
class Status(str, Enum):
    active = "active"
    inactive = "inactive"
    banned = "banned"

class User(BaseModel):
    id: int
    name: str
    status: Status

# Gültige Eingabedaten:
user = User(id=1, name="Alice", status="active")
serialized_user_json = user.model_dump_json(indent=4)
print(serialized_user_json)

# Ungültige Eingabedaten:
try:
    User(id=2, name="Bob", status="unknown")
except Exception as e:
    print(e)


{
    "id": 1,
    "name": "Alice",
    "status": "active"
}
1 validation error for User
status
  Input should be 'active', 'inactive' or 'banned' [type=enum, input_value='unknown', input_type=str]
    For further information visit https://errors.pydantic.dev/2.10/v/enum
