<a href="http://datamics.com/de/courses/"><img src=../DATA/bg_datamics_top.png></a>

<em text-align:center>© Datamics</em>
# Implementierung der Tiefensuche ((DFS)Depth-First Search)

In dieser Lektion wird die Tiefensuche(DFS) behandelt, welche, wie der Name schon sagt, mögliche Knoten (von einer mitgelieferten Wurzel) entlang jedes Zweiges(branch) vor dem Backtracking untersucht. Diese Eigenschaft ermöglicht es, den Algorithmus sowohl in iterativen als auch in rekursiven Formen bündig zu implementieren. Im Folgenden findest du eine Liste der Aktionen, die bei jedem Besuch eines Knotens durchgeführt werden.

* Kennzeichnung des aktuellen Knotens als besucht.
* Durchsuchung jedes benachbarten Knotens, der nicht in der besuchten Menge(visited set) enthalten ist.

Wir gehen von einer vereinfachten Version eines Graphen in der folgenden Form aus:

In [1]:
graph = {'A': set(['B', 'C']),
         'B': set(['A', 'D', 'E']),
         'C': set(['A', 'F']),
         'D': set(['B']),
         'E': set(['B', 'F']),
         'F': set(['C', 'E'])}

## Zusammenhangskomponente (Connected Component)

Die folgende Implementierung verwendet die Stapeldatenstruktur(stack data-structure), um einen Satz von Knoten aufzubauen und zurückzugeben, die innerhalb der Zusammenhangskomponente von den Probanden zugänglich sind. Mit Pythons Überladung des Subtraktionsoperators (mit der wir Elemente aus einer Menge entfernen können), sind wir in der Lage, nur die unbesuchten benachbarten Eckpunkte einzufügen.

In [2]:
def dfs(graph, start):
    visited, stack = set(), [start]
    while stack:
        vertex = stack.pop()
        if vertex not in visited:
            visited.add(vertex)
            stack.extend(graph[vertex] - visited)
    return visited

dfs(graph, 'A') 

{'A', 'B', 'C', 'D', 'E', 'F'}

Die zweite Implementierung bietet die gleiche Funktionalität wie die erste, aber diesmal verwenden wir die kürzere rekursive Form. Aufgrund eines gemeinsamen Python gotcha mit Standardparameterwerten, die nur einmal erstellt werden, müssen wir bei jedem Aufruf eines Benutzers ein neues besuchtes Set(visited set) erstellen. Ein weiteres Detail der Python-Sprache ist, dass Funktionsvariablen per Referenz übergeben werden, so dass der besuchte veränderliche Mengensatz(visited mutable set) nicht bei jedem rekursiven Aufruf neu zugeordnet werden muss.

In [3]:
def dfs(graph, start, visited=None):
    if visited is None:
        visited = set()
    visited.add(start)
    for nxt in graph[start] - visited:
        dfs(graph, nxt, visited)
    return visited

dfs(graph, 'A') 

{'A', 'B', 'C', 'D', 'E', 'F'}

## Pfade
Wir sind in der Lage, die beiden vorherigen Implementierungen zu optimieren, um alle möglichen Pfade zwischen einem Start- und einem Zielpunkt zurückzugeben. Die folgende Implementierung verwendet die Stack-Datenstruktur(stack data-structure) erneut, um das Problem iterativ zu lösen und liefert jeden erdenklichen Pfad, sobald wir das Ziel gefunden haben. Die Verwendung eines Generators ermöglicht es dem Benutzer, lediglich die gewünschte Anzahl von alternativen Pfaden zu berechnen.

In [4]:
def dfs_paths(graph, start, goal):
    stack = [(start, [start])]
    while stack:
        (vertex, path) = stack.pop()
        for nxt in graph[vertex] - set(path):
            if nxt == goal:
                yield path + [nxt]
            else:
                stack.append((nxt, path + [nxt]))

list(dfs_paths(graph, 'A', 'F'))

[['A', 'C', 'F'], ['A', 'B', 'E', 'F']]

### Quellen
* [Depth-and Breadth-First Search](http://jeremykun.com/2013/01/22/depth-and-breadth-first-search/)
* [Connected component](https://en.wikipedia.org/wiki/Connected_component_(graph_theory))
* [Adjacency matrix](https://en.wikipedia.org/wiki/Adjacency_matrix)
* [Adjacency list](https://en.wikipedia.org/wiki/Adjacency_list)
* [Python Gotcha: Default arguments and mutable data structures](https://developmentality.wordpress.com/2010/08/23/python-gotcha-default-arguments/)
* [Generators](https://wiki.python.org/moin/Generators)