# Komplexe Datenstrukturen filtern

Die Inhalte dynamischer Webseiten werden häufig nach bestimmten Regeln generiert. Diese Regeln werden durch Programmierer_innen festgelegt und beim Aufruf einer Seite ausgeführt.

## Beispiel: Suchmaschine

Ein bekanntes Beispiel sind Suchmaschinen: Die Eingabe der Suchbegriffe entscheidet darüber, wie die Inhalte der Seite nach der Antwort des Servers aussehen.

In [1]:
from IPython.display import IFrame
IFrame("https://duckduckgo.com", width="100%", height=300)

Die eingebenen Suchbegriffe werden mit dem HTTP-Request zum Server des Suchmaschinenbetreibers geschickt. Dort wird eine Abfrage an dessen Datenbank gestellt, die rohe Daten zurückliefert. Mit den Suchbegriffen wird also die gesamte Menge der Daten in der Datenbank gefiltert. Es kommen nur die Daten zurück, zu denen die Suchbegriffe passen.

Wir werden das Konzept einer solchen Abfrage im Folgenden an einem einfachen Beispiel nachvollziehen. Dafür bauen wir uns zunächst eine entsprechende Datenbankstruktur auf, ohne gleich ein [Datenbankmanagementsystem](https://de.wikipedia.org/wiki/Datenbank#Datenbankmanagementsystem) wie [SQLite](https://www.sqlite.org/), [MySQL](https://www.mysql.com/) oder [MongoDB](http://mongodb.com/) einzusetzen.

## Dictionarys in Python

Der Datentyp [Dictionary](https://www.python-kurs.eu/python3_dictionaries.php) lässt sich mit "Verzeichnis" übersetzen. Dieses kann beliebig umfangreich sein, ergänzt und durchsucht werden. Visuelles Merkmal für Dictionarys ist die geschweifte Klammer.

In [2]:
tier = {
    "art": "Hund",
    "alter": 4, 
    "farbe": "braun"
}

Die Ausgabe des gesamten Dictionarys erledigen wir wieder mit `print()`

In [3]:
print(tier)

{'art': 'Hund', 'alter': 4, 'farbe': 'braun'}


Einzelne Daten des Dictionarys können wir mit dem **Indexoperator** ansprechen:

In [4]:
print(tier["alter"])

4


Versuchen Sie es selbst: Geben Sie die Farbe des Hundes aus!

In [5]:
# Ihr Code

Wir können das Dictionary auch verändern und erweitern:

In [6]:
tier["alter"] = 5 # Änderung

In [7]:
print(tier["alter"])

5


In [8]:
tier["herkunft"] = "Österreich" # Erweiterung

In [9]:
print(tier)

{'art': 'Hund', 'alter': 5, 'farbe': 'braun', 'herkunft': 'Österreich'}


### Mehrere Dictionarys gleicher Struktur speichern

Mal angenommen, wir haben wieder ein Tierheim zu verwalten: Wie erreichen wir es, die Daten mehrerer Tiere mit diesen Angaben zu speichern?

Wir speichern mehrere Dictionarys in einer Liste:

In [10]:
tiere = [
    {
        "art": "Hund",
        "alter": 4,
        "farbe": "braun"
    },
    {
        "art": "Katze",
        "alter": 9,
        "farbe": "schwarz"
    }
]

Wie kommen wir nun an die einzelnen Daten heran? Schauen wir uns zunächst die Ausgabe der Liste an:

In [11]:
print(tiere)

[{'art': 'Hund', 'alter': 4, 'farbe': 'braun'}, {'art': 'Katze', 'alter': 9, 'farbe': 'schwarz'}]


Die Speicherplätze oder *Indizes* in einer Liste lassen sich - **von `0` an gezählt** - numerisch ansprechen:

In [12]:
print(tiere[0])

{'art': 'Hund', 'alter': 4, 'farbe': 'braun'}


Ein Kombination beider Schreibweisen zur Ansprache von Listen und Dictionarys verschafft uns Zugang zu den einzelnen Daten:

In [13]:
print(tiere[0]["alter"])

4


Großartig! Nun können wir eine Schleife verwenden, um die Daten nacheinander auszugeben. Dabei übernimmt die Schleife das Durchzählen der Datensätze in unserem Dictionary, womit sich die Adressierung der Daten etwas vereinfacht:

## Daten mit einer Schleife ausgeben

In [14]:
for tier in tiere:
    print(tier["art"])

Hund
Katze


[**Warum eigentlich einrücken?**](https://www.python-kurs.eu/python3_bloecke.php)

In Python sind manche Einrückungen optional, einige obligarisch. Optional ist z.B. die Formatierung von Listen und Dictionarys, hier geht es um bessere Lesbarkeit durch Einrückung.

Obligatorisch sind hingegen die Einrückungen bei bestimmten Konstrukten wie Schleifen, if-Anweisungen und Funktionsdefinitionen. Machen wir uns das an einem Beispiel klar. Die gleiche Schleife wie zuvor, aber mit einer zusätzlichen Linie, die ausgegeben werden soll:

In [15]:
for tier in tiere:
    print(tier["art"])
    print("-----------------")

Hund
-----------------
Katze
-----------------


Beobachtung: Die Linie wird nach jedem Tier ausgegeben.  
Erklärung: Durch die Einrückung unter dem Schleifenkopf "weiß" Python, dass auch diese Anweisung in der Schleife ausgeführt werden soll.

In [16]:
for tier in tiere:
    print(tier["art"])
print("-----------------")

Hund
Katze
-----------------


Beobachtung: Die Linie wird nur am Ende der Ausgabe einmal ausgegeben.  
Erklärung: Zeile 3 ist nicht mehr eingerückt, dadurch zählt die Anweisung auch nicht mehr zur Schleife.

## Daten bei der Ausgabe filtern

Tun wir einmal so, als würden uns für die Ausgabe nur bestimmte Tiere aus der Datenbank interessieren. Um einen Filter setzen zu können, müssen zwei Bedingungen erfüllt sein:

1. Die Daten müssen Merkmale aufweisen, nach denen sich filtern lässt.
1. Der Filter muss gesetzt sein.

Um das zu zeigen, erweitern wir unsere Tierdatenbank ein wenig. Das tun wir, indem wir die Methode `append()` ("anhängen") auf dem Listenobjekt aufrufen: 

In [17]:
tiere.append(
    {
        "art": "Krokodil",
        "alter": 42,
        "farbe": "grün"
    }
)

tiere.append(
    {
        "art": "Löwe",
        "alter": 14,
        "farbe": "gelb"
    }
)

Nun fügen wir den vier Tieren noch ein Merkmal für das Geschlecht hinzu:

In [18]:
tiere[0]["geschlecht"] = "m"
tiere[1]["geschlecht"] = "w"
tiere[2]["geschlecht"] = "w"
tiere[3]["geschlecht"] = "m"

In [19]:
print(tiere)

[{'art': 'Hund', 'alter': 4, 'farbe': 'braun', 'geschlecht': 'm'}, {'art': 'Katze', 'alter': 9, 'farbe': 'schwarz', 'geschlecht': 'w'}, {'art': 'Krokodil', 'alter': 42, 'farbe': 'grün', 'geschlecht': 'w'}, {'art': 'Löwe', 'alter': 14, 'farbe': 'gelb', 'geschlecht': 'm'}]


Die Datenbank ist ja nun schon einigermaßen umfangreich! Lassen wir wieder unsere Schleife über die Daten laufen, können wir einen Filter einbauen. Wir erkundigen uns nach dem Wert eines bestimmten Bezeichners des aktuellen Datensatzes in der Schleife und treffen eine **Entscheidung**:

In [20]:
for tier in tiere:
    if tier["geschlecht"] == "m":
        print(tier)

{'art': 'Hund', 'alter': 4, 'farbe': 'braun', 'geschlecht': 'm'}
{'art': 'Löwe', 'alter': 14, 'farbe': 'gelb', 'geschlecht': 'm'}


### Dictionarys in Liste = Tabelle

Die Datenstruktur, die wir bis hierhin aufgebaut und in der Variablen `tiere` gespeichert haben, entspricht einer **Tabelle**. Dabei ist jedes Element der Liste eine **Zeile** der Tabelle - Unterschied: Die Zählung der Zeilen beginnt bei `0`. Die Schlüssel (*keys*) der Dictionarys hingegen entsprechen den **Spalten** der Tabelle. 

![Tabelle](img/Tabelle.png)

## Entscheidungen treffen

Unser Filter basiert auf einer [if-Anweisung](https://www.python-kurs.eu/python3_bedingte_anweisungen.php). Der Ausgabebefehl in Zeile 3 ist daher eine *bedingte Anweisung*, da sie nur ausgeführt wird, wenn die in Zeile 2 formulierte Bedingung erfüllt ist. Das ist das Potenzial der if-Anweisung: Sie ermöglicht es uns, **Entscheidungen** in unserem Programm zu treffen. Ein anderer Begriff dafür ist **Verzweigung**.

Filtern wir unsere Daten erneut: Uns interessieren nur die Tiere, die älter sind als zehn Jahre:

In [21]:
for tier in tiere:
    if tier["alter"] >= 10:
        print(tier)

{'art': 'Krokodil', 'alter': 42, 'farbe': 'grün', 'geschlecht': 'w'}
{'art': 'Löwe', 'alter': 14, 'farbe': 'gelb', 'geschlecht': 'm'}


Filterkriterien lassen sich mit [logischen Operatoren](https://www.python-kurs.eu/python3_operatoren.php) auch kombinieren:

In [22]:
for tier in tiere:
    if tier["alter"] >= 10 and tier["geschlecht"] == "m":
        print(tier) 

{'art': 'Löwe', 'alter': 14, 'farbe': 'gelb', 'geschlecht': 'm'}


## Abschließende Überlegungen

Um die Idee einer Suchmaschine zu implementieren, ist es nun kein weiter Weg mehr: Es fehlt noch ein Benutzerinterface, über das die Eingabe der Kriterien erfolgen kann, mit denen die Abfrage an unsere Datenbank gestellt wird. Hier bieten sich HTML-Formulare an.

## Aufgaben

1. Erweitern Sie die Tierdatenbank um eine Bildinformation für jedes Tier!
1. Der Löwe hat heute Geburtstag und ist nun ein Jahr älter. Ändern Sie den entsprechenden Wert in der Datenbank.
1. Das Krokodil hat ein neues Zuhause gefunden. Löschen Sie seinen Datensatz mit `del`.
1. Erstellen Sie ein HTML-Fragment, das ein Bild eines jeden Tieres zusammen mit seinen Daten zeigt.
1. Setzen Sie die dynamische Generierung des HTML mit Python um. Nutzen Sie die Daten aus dem Tierheim-Beispiel oder eigene.

### Aufgabe 1:

In [23]:
# Ihre Lösung

### Aufgabe 2

In [24]:
# Ihre Lösung

### Aufgabe 3

In [25]:
# Ihre Lösung

### Aufgabe 4

In [26]:
# Ihre Lösung

### Aufgabe 5

In [27]:
# Ihre Lösung