# Python Fortgeschritten: __slots__
## Tag 4 - Notebook 19
***
In diesem Notebook wird behandelt:
- __slots__ für Speicher-Optimierung
- Einschränkungen
- Performance-Vergleich
***


## 1 __slots__

`__slots__` ist ein spezielles Klassenattribut, das die Attribute begrenzt, die eine Instanz haben kann. Es spart Speicher, indem es verhindert, dass Python für jede Instanz ein `__dict__` Dictionary erstellt.

### Was ist __slots__?

Normalerweise speichert Python Instanzattribute in einem `__dict__` Dictionary. Jedes Objekt hat sein eigenes Dictionary, das alle Attribute enthält. `__slots__` ersetzt dieses Dictionary durch eine feste Liste von Attributen, die direkt im Objekt gespeichert werden.

### Wann und warum verwenden?

`__slots__` sollte verwendet werden, wenn:
- **Viele Instanzen** erstellt werden: Bei Tausenden oder Millionen von Objekten spart `__slots__` erheblich Speicher, da das `__dict__` Dictionary eliminiert wird
- **Feste Attribute-Struktur**: Wenn die Anzahl und Namen der Attribute bekannt und fest sind
- **Performance-kritische Anwendungen**: Der Zugriff auf Attribute kann schneller sein, da kein Dictionary-Lookup nötig ist
- **Speicher-kritische Umgebungen**: In eingebetteten Systemen oder bei begrenztem Speicher
- **Typsicherheit**: `__slots__` verhindert, dass versehentlich neue Attribute hinzugefügt werden

### Vorteile

- **Speicherersparnis**: Kann 40-50% Speicher sparen bei Klassen mit wenigen Attributen
- **Schnellerer Attributzugriff**: Direkter Zugriff ohne Dictionary-Lookup
- **Verhindert Tippfehler**: Neue Attribute können nicht versehentlich hinzugefügt werden
- **Klarere API**: Die erlaubten Attribute sind explizit definiert

### Einschränkungen

- **Keine dynamischen Attribute**: Neue Attribute können nicht zur Laufzeit hinzugefügt werden
- **Vererbung**: Erfordert besondere Aufmerksamkeit bei Vererbung (siehe Best Practices)
- **Weniger flexibel**: Die Klasse ist weniger dynamisch als ohne `__slots__`


In [None]:
class WithoutSlots:
    def __init__(self, x, y):
        self.x = x
        self.y = y

class WithSlots:
    __slots__ = ['x', 'y']
    def __init__(self, x, y):
        self.x = x
        self.y = y

obj1 = WithoutSlots(1, 2)
obj2 = WithSlots(1, 2)
# obj2.z = 3  # Würde AttributeError werfen


## 2 Best Practices

### Best Practices

1. **Nur bei vielen Instanzen verwenden**: `__slots__` lohnt sich erst bei Tausenden von Instanzen. Bei wenigen Objekten ist der Overhead nicht relevant.

2. **Alle Attribute auflisten**: Alle Instanzattribute müssen in `__slots__` aufgeführt werden, auch die, die in `__init__` gesetzt werden.

3. **Vererbung beachten**: Wenn eine Klasse mit `__slots__` von einer Klasse ohne `__slots__` erbt, funktioniert es nicht. Beide müssen `__slots__` haben oder beide nicht.

4. **Messung vor Optimierung**: Nur verwenden, wenn Speicherverbrauch tatsächlich ein Problem ist. Profiling hilft dabei.

### Wann NICHT verwenden?

- **Wenige Instanzen**: Bei weniger als 1000 Instanzen ist der Overhead nicht relevant
- **Dynamische Attribute**: Wenn Attribute zur Laufzeit hinzugefügt werden müssen
- **Komplexe Vererbung**: Bei komplexen Vererbungshierarchien kann `__slots__` problematisch sein

### Häufige Fehler

- **Vergessene Attribute**: Attribute, die nicht in `__slots__` stehen, können nicht gesetzt werden → `AttributeError`
- **Vererbung ohne __slots__**: Kindklassen ohne `__slots__` funktionieren nicht mit Elternklassen mit `__slots__`


#### 3.1 Aufgaben:

> (a) Erstelle eine Klasse mit `__slots__` für eine `Point` Klasse. <br>
> (b) Vergleiche den Speicherverbrauch mit und ohne `__slots__`.


In [None]:
# Deine Lösung:



> (c) Erstelle eine `LogEntry` Klasse mit `__slots__` für strukturierte Log-Einträge. <br>
> Die Klasse soll folgende Attribute mit `__slots__` definieren: `timestamp`, `level`, `message`, `module_name`. <br>
> Implementiere `__init__` um alle Attribute zu initialisieren und `__repr__` für eine lesbare Darstellung. <br>
> Erstelle dann 2-3 Beispiel-Instanzen mit realistischen Log-Daten.

In [None]:
# Deine Lösung:

class LogEntry:
    __slots__ = []  # TODO: Definiere die Attribute hier
    
    def __init__(self, timestamp, level, message, module_name):
        # TODO: Implementiere die Initialisierung
        pass
    
    def __repr__(self):
        # TODO: Implementiere eine lesbare Darstellung
        pass

# TODO: Erstelle 2-3 Beispiel-Instanzen zum Testen


> (d) Erstelle zwei Klassen für Sensor-Daten: `SensorReadingWithoutSlots` und `SensorReadingWithSlots`. <br>
> Beide sollen die Attribute `sensor_id`, `timestamp`, `temperature`, `humidity`, `location` haben. <br>
> Erstelle jeweils 10.000 Instanzen beider Klassen mit Beispieldaten. <br>
> Messe den gesamten Speicherverbrauch beider Varianten und berechne die prozentuale Speicherersparnis.

In [None]:
# Deine Lösung:

import sys
from datetime import datetime

class SensorReadingWithoutSlots:
    # TODO: Initialisiere die Attribute
    pass

class SensorReadingWithSlots:
    __slots__ = []  # TODO: Definiere die Attribute
    pass


# TODO: Erstelle 10.000 Instanzen beider Klassen
# Hinweis: Verwende eine Schleife und sys.getsizeof() für die Speichermessung
# for i in range(10000):
#     instanz erzeugen

> (e) Verwende die `LogEntry` Klasse aus Aufgabe (c) um Log-Dateien zu parsen. <br>
> Lies die Datei `../data/system.log` Zeile für Zeile ein. <br>
> Parse jede Zeile um Timestamp, Level und Message zu extrahieren. <br>
> Erstelle für jede Zeile ein `LogEntry` Objekt (nutze `__slots__` für Speichereffizienz). <br>
> Zähle wie viele Einträge es pro Log-Level gibt und gib eine Zusammenfassung aus.

**Hinweis:** Format der Log-Zeilen: `YYYY-MM-DD HH:MM:SS - LEVEL - Message`

In [None]:
# Deine Lösung:

# LogEntry Klasse aus Aufgabe (c) hier verwenden oder erneut definieren

# Datei einlesen und parsen
log_entries = []
log_level_count = {}

# TODO: Öffne die Datei ../data/system.log
# TODO: Parse jede Zeile (Format: "timestamp - level - message")
# TODO: Erstelle LogEntry Objekte
# TODO: Zähle die Log-Levels
# TODO: Gib die Statistik aus



#### Lösung:


In [None]:
# Musterlösung (a)
class Point:
    __slots__ = ['x', 'y']
    def __init__(self, x, y):
        self.x = x
        self.y = y

p = Point(3, 4)
print(p.x, p.y)

# Musterlösung (b)
import sys

class WithoutSlots:
    def __init__(self, x, y):
        self.x = x
        self.y = y

class WithSlots:
    __slots__ = ['x', 'y']
    def __init__(self, x, y):
        self.x = x
        self.y = y

w1 = WithoutSlots(1, 2)
w2 = WithSlots(1, 2)
print(f"Ohne slots: {sys.getsizeof(w1)} bytes")
print(f"Mit slots: {sys.getsizeof(w2)} bytes")

# Musterlösung (c)
class LogEntry:
    __slots__ = ['timestamp', 'level', 'message', 'module_name']
    
    def __init__(self, timestamp, level, message, module_name):
        self.timestamp = timestamp
        self.level = level
        self.message = message
        self.module_name = module_name
    
    def __repr__(self):
        return f"LogEntry({self.timestamp}, {self.level}, '{self.message}', {self.module_name})"

# Beispiel-Instanzen
log1 = LogEntry("2025-11-28 10:15:23", "INFO", "System started", "main")
log2 = LogEntry("2025-11-28 10:15:30", "WARNING", "High memory usage", "monitor")
log3 = LogEntry("2025-11-28 10:15:40", "ERROR", "Connection failed", "network")

print(log1)
print(log2)
print(log3)

# Musterlösung (d)
import sys
from datetime import datetime

class SensorReadingWithoutSlots:
    def __init__(self, sensor_id, timestamp, temperature, humidity, location):
        self.sensor_id = sensor_id
        self.timestamp = timestamp
        self.temperature = temperature
        self.humidity = humidity
        self.location = location

class SensorReadingWithSlots:
    __slots__ = ['sensor_id', 'timestamp', 'temperature', 'humidity', 'location']
    
    def __init__(self, sensor_id, timestamp, temperature, humidity, location):
        self.sensor_id = sensor_id
        self.timestamp = timestamp
        self.temperature = temperature
        self.humidity = humidity
        self.location = location

# Erstelle 10.000 Instanzen und messe Speicher
readings_without_slots = []
readings_with_slots = []

for i in range(10000):
    r1 = SensorReadingWithoutSlots(
        sensor_id=i,
        timestamp=datetime.now(),
        temperature=20.0 + i % 10,
        humidity=50.0 + i % 20,
        location=f"Room-{i % 5}"
    )
    readings_without_slots.append(r1)
    
    r2 = SensorReadingWithSlots(
        sensor_id=i,
        timestamp=datetime.now(),
        temperature=20.0 + i % 10,
        humidity=50.0 + i % 20,
        location=f"Room-{i % 5}"
    )
    readings_with_slots.append(r2)

# Speicherverbrauch messen
memory_without = sum(sys.getsizeof(r) for r in readings_without_slots)
memory_with = sum(sys.getsizeof(r) for r in readings_with_slots)

print(f"Speicher ohne __slots__: {memory_without:,} bytes")
print(f"Speicher mit __slots__: {memory_with:,} bytes")
print(f"Ersparnis: {memory_without - memory_with:,} bytes")
print(f"Prozentuale Ersparnis: {((memory_without - memory_with) / memory_without * 100):.1f}%")

# Musterlösung (e)
class LogEntry:
    __slots__ = ['timestamp', 'level', 'message', 'module_name']
    
    def __init__(self, timestamp, level, message, module_name='system'):
        self.timestamp = timestamp
        self.level = level
        self.message = message
        self.module_name = module_name
    
    def __repr__(self):
        return f"LogEntry({self.level}: {self.message})"

# Datei einlesen und parsen
log_entries = []
log_level_count = {}

with open('../data/system.log', 'r', encoding='utf-8') as file:
    for line in file:
        line = line.strip()
        if not line:
            continue
        
        # Parse: "2025-11-28 10:15:23 - INFO - Message"
        parts = line.split(' - ', 2)
        if len(parts) == 3:
            timestamp = parts[0]
            level = parts[1]
            message = parts[2]
            
            # LogEntry erstellen
            entry = LogEntry(timestamp, level, message)
            log_entries.append(entry)
            
            # Log-Level zählen
            log_level_count[level] = log_level_count.get(level, 0) + 1

# Statistik ausgeben
print(f"\nLog-Datei Analyse:")
print(f"Gesamte Einträge: {len(log_entries)}")
print(f"\nEinträge pro Log-Level:")
for level, count in sorted(log_level_count.items()):
    print(f"  {level}: {count}")

# Beispiele anzeigen
print(f"\nErste 3 Einträge:")
for entry in log_entries[:3]:
    print(f"  {entry}")
