# Python-Objekte

## Warum Objekte?

Eigenschaften (*properties*) und Verhalten (*behavior*) können in individuellen Objekten gebündelt werden.

Objekt-orientierte Programmierung (OOP) steht im Gegensatz zu prozeduralem Programmieren. 
- **prozedural** Struktur wie ein Kochrezept, im Zentrum stehen die Daten und der Datenfluss
- **objekt-orientiert** Sytem wird modelliert in Form von Objekten (Eigenschaften und Verhalten) und deren Beziehung zueinander

Oft kann ein Problem aus der Realität einfacher mit Hilfe einer OO-Struktur modelliert werden als mit einem (Koch-) Rezept.

<div class="alert alert-block alert-warning">
⚠ Oft wird "Classes are for combining related data and functions that act on that data" missverstanden und es wird der gesamte Code eines Projekts in einer <a href="https://de.wikipedia.org/wiki/Gottobjekt">Gott-Klasse</a> gebündelt.
Dadurch wird meistens der Code extrem unübersichtlich, Zusammenhänge werden verschleiert und die Wartbarkeit erschwert (wenn man etwas ändern möchte muss man gleich alles ändern).
</div>
<div class="alert alert-block alert-success">
Regel: <a href="https://de.wikipedia.org/wiki/Single-Responsibility-Prinzip">Single Responsibility Prinzip</a>:
Bei einer Änderung am Code, sollte es nie mehr als einen Grund geben, eine Klasse zu ändern.
</div>

## Klassen - Objekte

Eine *Klasse* ist eine Vorlage, um *Objekte* zu bauen.    
Eine Objekt-Instanz (kurz *Instanz* oder *Objekt*) ist ein Datenstruktur, welche im Arbeitsspeicher des Computers "lebt" (d.h. instanziiert ist).

Einfachste Form einer Klasse in Python:

In [None]:
# Klasse definieren
class Server:
    pass

# Klasse instanziieren, d.h. Objekt erzeugen
my_server = Server()

print(my_server)

### Initialisierungsfunktion

Die Initialisierungsfunktion ist eine Spezialmethode mit dem Namen `__init__()`. Sie wird von Python automatisch aufgerufen, wenn eine Instanz des Objekts instanziert wurde.
Zweck:
* Klassenvariablen mit Argumenten befüllen
* Default-Werte setzen
* ...

In [None]:
class Server:
    """Klasse mit Konstruktor."""
    def __init__(self, hostname, os="Linux", number_of_cores=1):
        """Konstruktor."""
        self.hostname = hostname
        self.os = os
        self.number_of_cores = number_of_cores
    
my_server = Server("skynet")

print(my_server)
print(my_server.number_of_cores)
print(my_server.os)

<div class="alert alert-block alert-info">
    ℹ das Schlüsselwort <code>self</code> bezeichnet die Instanz der Klasse. In <code>__init__</code> wird <code>self</code> automatisch mitgegeben. Bei Methoden muss die Instanz übergeben werden, auf welche die Methode angewendet wird.
</div>

### Spezialmethoden

Python bietet für Klassen diverse Spezialmethoden an. Diese sind durch einen doppelten Unterstrich am Anfang und am Ende gekennzeichnet. Mit der Methode `__str__()` kann beispielsweise die String-Repräsentation der Klasse festgelegt werden.    
Übersicht über die Python-Spezialmethoden auf "[Enriching Your Python Classes With Dunder (Magic, Special) Methods](https://dbader.org/blog/python-dunder-methods)".

Beispiel der Spezialmethode `__add__()`: Diese definiert den `+`-Operator einer Klasse.

In [None]:
class Server:
    def __init__(self, hostname, os="Linux", number_of_cores=1):
        self.hostname = hostname
        self.os = os
        self.number_of_cores = number_of_cores
        
    def __str__(self):
        return f"The {self.os} server has {self.number_of_cores} cores."
    
my_server = Server("skynet")

print(my_server)
print(my_server.number_of_cores)
print(my_server.os)

In [None]:
class Server:
    def __init__(self, software):
        self.installed = software
    
    def __add__(self, other):
        """+ operator for `Server`."""
        self.installed += other.installed
        return self
    
s1 = Server(software=["Apache", "Python", "Jenkins"])
s2 = Server(software=["Outlook", "Office365"])

combined = s1 + s2
print(combined.installed)

### Methoden

Methoden sehen ähnlich aus wie Funktionen. Methoden können nur auf Instanzen eine Klasse aufgerufen werden. Das `self`-Schlüsselwort verdeutlicht, dass eine Methode auf einem Objekt wirkt.   

Methoden ändern den Zustand eines Objekts oder führen auf dem Objekt ein gewisses Verhalten aus. Der Zustand eines Objekts wird durch die Instanzvariablen einer Klasse definiert. Mit Klassenvariablen kann ein bestimmter Zustand über alle Instanzen eines Objekts geteilt werden.

In [None]:
class Server:
    def __init__(self):
        self.installed = []  # initialize instance variable
    
    def install(self, software):
        self.installed.append(software)
        return len(self.installed)
        
my_server = Server()
number_of_installed = my_server.install("Apache")

my_server2 = Server()

print(my_server.installed)
print(number_of_installed)
print(my_server2.installed)

### Statische Variablen

In [None]:
class Server:
    pre_installed = ("coreutils",)  # define static class variable (good practice: should be immutable).
    def __init__(self):
        self.installed = list(self.pre_installed)  # initialize instance variable
    
    def install(self, software):
        self.installed.append(software)
        return self
        
web_server = Server()
web_server.install("Apache")

linux_server = Server()

print(web_server.installed)
print(linux_server.installed)

# test static variable
print(web_server.pre_installed)
print(linux_server.pre_installed)
print(Server.pre_installed)
# ⚠️ Bad practice:
Server.pre_installed += ("windows",) 
print(linux_server.pre_installed)
print(web_server.pre_installed)
print(Server.pre_installed)

### Vererbung

Bei der Vererbung wird das Verhalen der Elternklasse (d.h. deren Methoden) an die Kindklasse weitergegeben. Die Kindklasse kann mit eigenen Methoden spezifisches Verhalten implementieren.

In [None]:
class Server:
    def __init__(self):
        print("Creating new server")
        self.installed = []
    
    def install(self, software):
        self.installed.append(software)
    
class MailServer(Server):
    def __init__(self):
        print("Creating new mail server")
        super().__init__()
        self.accounts = []
        
    def add_mail_box(self, account_id):
        self.accounts.append(account_id)
        
mail_server = MailServer()

print(isinstance(mail_server, Server))
print(isinstance(mail_server, MailServer))

other_server = Server()
print(isinstance(other_server, MailServer))

Beispiel eines Systems mit mehreren Objekten, die in Beziehung zueinenader stehen:

In [None]:
class System:
    def __init__(self):
        self.servers = []
        
    def add_server(self, server):
        self.servers.append(server)
        
class Server:
    def __init__(self, hostname, os="Linux"):
        self.hostname = hostname
        self.os = os
        self.installed = []
    
    def install(self, software):
        self.installed.append(software)
        
class Software:
    def __init__(self, name):
        self.name = name

my_system = System()

linux1 = Server("skynet")
linux2 = Server("darknet")
windows = Server("M$", os="Windows")

my_system.add_server(linux1)
my_system.add_server(linux2)
my_system.add_server(windows)

apache = Software("Apache")
firefox = Software("Firefox")
outlook = Software("Outlook")

linux1.install(apache)
my_system.servers[1].install(apache)  # navigate using dot-notation
windows.install(firefox)
windows.install(outlook)

for server in my_system.servers:
    for software in server.installed:
        print(f"{software.name} on server {server.hostname}.")

```mermaid
---
title: Objektdiagramm dieses Systems
---
classDiagram
  class System["my_system: System"]
  class linux1["linux1: Server"]{
    hostname = "skynet"
    os = "linux"
  }
  class linux2["linux2: Server"]{
    hostname = "darknet"
    os = "linux"
  }
  class windows["windows: Server"]{
    hostname = "M$"
    os = "Windows"
  }
  System o-- linux1 : add_server
  System o-- linux2 : add_server
  System o-- windows : add_server
  class apache["apache: Software"] {
    name = "Apache"
  }
  class firefox["firefox: Software"] {
    name = "Firefox"
  }
  class outlook["outlook: Software"] {
    name = "Outlook"
  }
  linux1 o-- apache : install
  linux2 o-- apache : install
  windows o-- firefox : install
  windows o-- outlook : install
```

## Übung: Software-Installation
Wir erweitern das obige Beispiel um eine Logik für die Software-Installation.
Ausgangspunkt:
```python
class Server:
    def __init__(self, hostname, os="Linux"):
        self.hostname = hostname
        self.os = os
        self.installed = []
    
    def install(self, software):
        self.installed.append(software)
        
class Software:
    def __init__(self, name):
        self.name = name
```

**Schritt 1**: Verwandle die Klasse `Software` in eine "abstrakte" Klasse durch Hinzufügen einer Methode `install(self)`, die nichts anderes macht als `raise NotImplementedError("The install method needs to be implemented by a concrete derived class.")`.

Diese Methode soll vor `self.installed.append(software)` in `Server.install` für die zu installierende Software aufgerufen werden.

**Schritt 2:** Schreibe 2 konkrete Klassen, die von `Software` abgeleitet sind: `PythonPackage` und `InstallerScript`.
Beide Klassen überschreiben die Methode `install(self)`. Stellvertretend für eine reale Installation sollen die beiden Klassen jedoch nur auf die Standard-Ausgabe schreiben, wie sie Software installieren würden:
* `PythonPackage`: `pip install {self.name}`,
* `Installer`: `sh {self.script}`, wobei `__init__(self, software)` um eine weiteres Argument `script` erweitert werden soll, auf welches hier in `install(self)` zugegriffen wird.

**Schritt 3:** Teste den Code:
* Erstelle einen Server `skynet` mit `hostname="skynet"` und `os="Linux"` (default),
* Insalliere `PythonPackage("numpy")` und `InstallerScript("cool inhouse software", script="/usr/local/bin/inhouse.sh")`,
* Überprüfe, ob die Ausgabe richtig ist und ob `print([software.name for software in skynet.installed])` korrekt ist.

## Lösung

In [None]:
class Server:
    def __init__(self, hostname, os="Linux"):
        self.hostname = hostname
        self.os = os
        self.installed = []
    
    def install(self, software):
        software.install()
        self.installed.append(software)

class Software:
    def __init__(self, name):
        self.name = name
    def install(self):
        raise NotImplementedError("The install method needs to be implemented by a concrete derived class.")

class PythonPackage(Software):
    def install(self):
        print(f"pip install {self.name}")

class InstallerScript(Software):
    def __init__(self, name, script):
        super().__init__(name)
        self.script = script

    def install(self):
        print(f"sh {self.script}")

numpy = PythonPackage("numpy")
inhouse = InstallerScript("cool inhouse software", script="/usr/local/bin/inhouse.sh")

skynet = Server("skynet")
skynet.install(numpy)
skynet.install(inhouse)
print([software.name for software in skynet.installed])

## Spezialform *Dataclass*

Gut strukturiertes Datenobjekt. Mit *frozen=True* kann das Objekt auf einfache Weise schreibgeschützte (*read-only*) werden.

Solche Klassen sind beispielsweise bei einem Log-File-Parser oder zum Deserialisieren von Config-Files nützlich.
Z.B. kann ein einzelner Log-Eintrag als *Dataclass* modelliert werden und erlaubt so in der Folge einen übersichtlichen Zugriff auf die Bestandteile des Log-Eintrags.

In [None]:
from dataclasses import dataclass

@dataclass(frozen=True)
class Host:
    ipv4: tuple[int, int, int, int]
    hostname: str
    
gitlab_ethz_ch = Host(ipv4=(129, 132, 202, 219), hostname="gitlab.ethz.ch")

ip_str = ".".join(str(part) for part in gitlab_ethz_ch.ipv4)
print(f"{gitlab_ethz_ch.hostname} ({ip_str})")

In [None]:
# 💥 This will raise an error due to frozen=True:
gitlab_ethz_ch.hostname = "github.ethz.ch"

## Beispiele

### Informationen aus Outlook-Mails extrahieren

*Ausgangslage*: Der Kunde hat ca. 200 Outlook-Mails, welche die Benutzereingabe eines Web-Formulars enthalten. Der Kunde möchte aus diesen E-Mails gewisse Informationen extrahieren und in eine CSV-Tabelle zusammenführen, damit diese Eingaben in Excel ausgewertet werden können.

*Umsetzung*: Alle E-Mails liegen im Outlook-Format in einem Verzeichnis. In der Funktion `mail_dir2csv()` wird das Modul *win32com.client* verwendet, um den Inhalt von Outlook-Mails auszulesen. Für jedes E-Mail wird eine Instanz der Klasse `SurveyResponse` erzeugt. Mit dieser Hilfsklasse können die aus der E-Mail extrahierten Informationen gesammelt und überprüft werden. Sind alle gewünschten Informationen vorhanden, werden diese mit der Methode `to_csv()` in eine Zeile im CSV-Format ausgeschrieben und der Liste `lines` angehängt. Als letzer Schritt wird der Inhalt dieser Liste in das Output-File geschrieben.

In diesem Fall helfen die Objekte des Typs `SurveyResponse`, die Antworten von dem Webformular zu validieren und eine Zeile im zukünftigen CSV-File aufzubauen. 

In [2]:
%%writefile surveyresponse.py
#!/bin/env python3

import os
from os import listdir
from os.path import isfile, join

if os.name == 'nt':
    import win32com.client

# constants
PATH = "./" # path to directory containing the mails
HEADER = ("Typ", "Vorname", "Nachname", "E-Mail", "Lehrveranstaltungsreihe", "Passwort", "E-Mail-ID")

@dataclass
class Mail:
    """Representation of a single mail."""
    body: str = ""
    subject: str = ""
    to: str = ""


from dataclasses import dataclass

@dataclass
class SurveyResponse:
    first_name: str = ""
    name: str = ""
    mail: str = ""
    lecture: str = ""
    kind: str = ""
    with_pwd: bool = False
    
    @classmethod
    def from_body(cls, body: str):
        lines = filter(None, body.splitlines())
        # All lines containing a ":", split at the first ":" (iterable of 2-tuples):
        entry_lines = (line.split(":", 1) for line in lines if ":" in line)
        # Remove leading / trailing whitespaces from keys and values:
        entries = {key.strip(): val.strip() for key, val in entry_lines}
        # If certain entries have keys which do not match the field names of SurveyResponse,
        # map them:
        key_mapping = {"First name": "first_name", "Vorname": "first_name"}
        entries = {key_mapping.get(key, key): val for key, val in entries.items()}
        return cls(**entries)

        
    def to_csv(self):
        return ";".join(format(field) for field in (self.kind, self.first_name, self.name, self.mail, self.lecture, self.with_pwd, ""))

def mail_dir2csv():
    outlook = None #win32com.client.Dispatch("Outlook.Application").GetNamespace("MAPI")
    
    msgs = [f for f in listdir(PATH) if isfile(join(PATH, f))]
    for msg in msgs:
        mail = Mail() #outlook.OpenSharedItem(join(PATH, msg))
        lines.append(SurveyResponse.from_body(mail.body).to_csv())    

    with open('./mail_extract.csv', 'w') as out_file:
        out_file.write(";".join(HEADER) + "\n")
        for line in lines:
            out_file.write(line + "\n")

if __name__ == "__main__":
    mail_dir2csv()

Overwriting surveyresponse.py


## Übung: Config file

Schreibe eine `dataclass` namens `Config`, die über eine `@classmethod` namens `from_json()` ein json-File folgender Art laden kann:

```json
{
  "version": "0.1.0",
  "compression": {
    "algorithm": "gzip",
    "level": 4
  },
  "confidential": true
}
```

Das Feld `compression` soll dabei mit einer eigenen `dataclass` namens `Compression` modelliert werden (verschachtelte `dataclasses`).

In [None]:
path = "config.json"

json_contents = """{"version":"0.1.0","compression":{"algorithm":"gzip","level":4},"confidential":true}"""
with open(path, "w") as f:
    f.write(json_contents)

In [None]:
from dataclasses import dataclass
import json

@dataclass
class Config:
    ... # Your code here
    
    @classmethod
    def from_json(cls, path: str):
        with open(path, "rb") as content:
            ...
        return ... # Your code here

path = "config.json"
config = Config.from_json(path)
print(config)

### Lösung

In [None]:
from dataclasses import dataclass
import json

@dataclass
class Compression:
    algorithm: str
    level: int

@dataclass
class Config:
    version: str
    compression: Compression
    confidential: bool
    
    @classmethod
    def from_json(cls, path: str):
        with open(path, "rb") as content:
            data = json.load(content)
        compression = Compression(**data.pop("compression"))
        return cls(**data, compression=compression)

path = "config.json"

config = Config.from_json(path)
print(config)

## Übung: Abstraktion AD / LDAP

Szenario:
Eine Skript zur LDAP / AD verwaltung muss sich häufig mit entweder AD oder LDAP verbinden.

Ziel: Es soll eine abstrakte Klasse `Connector` verwendet werden, so dass in der Codebasis nicht mehr zwischen AD / LDAP spezifischen Details unterschieden werden muss.

- [ ] Schreibe eine abstrakte Klasse `Connector` mit einer methode `def connect(server, user, password)`.
  Abstrakt heisst, dass alle Methoden nichts anderes machen als
  ```py
  raise NotImplementedError("This method must be specialized in a derived class.")
  ```
- [ ] Schreibe 2 Spezialisierungen `class LdapConnector(Connection): ...`, `class AdConnector(Connection): ...`,
  die die methode `connect()` gemäss dem Abschnitt [Talking to LDAP servers](./03_ldap_servers.ipynb) implementieren.

### Lösung

In [None]:
from ldap3 import Server, Connection

def ldap_connect(server: str, user_path: str, password: str) -> Connection:
    conn = Connection(
        server=Server(server, use_ssl=True), 
        user=user_path,
        password=password
    )
    conn.bind()
    return conn

class Connector:
    def connect(server: str, user: str, password: str) -> Connection:
        raise NotImplementedError("This method must be specialized in a derived class.")

class LdapConnector(Connector):
    def connect(server: str, user: str, password: str) -> Connection:
        return ldap_connect(server, user_path=f"cn={user},OU=ETHUsers,DC=d,DC=ethz,DC=ch", password=password)

class AdConnector(Connector):
    def connect(server: str, user: str, password: str) -> Connection:
        return ldap_connect(server, user_path=f"d\\{user}", password=password)       