# Graphen in Python
Um Graphen mit Python zu verarbeiten, gibt es verschiedene Bibliotheken. Eine der einsteigerfreundlichsten ist NetworkX.

## Inhaltsverzeichnis
- [Über NetworkX](#Über-NetworkX)
- [Erstellung des Graphen](#Erstellung-des-Graphen)
- [Adjazenzmatrix und -liste](#Adjazenzmatrix-und--liste)
- [Pfade und Zusammenhang](#Pfade-und-Zusammenhang)
- [Struktur des Graphen](#Struktur-des-Graphen)
- [Graphen aus Dateien](#Graphen-aus-Dateien)

## Über NetworkX
NetworkX ist eine freie Python-Bibliothek zur Erstellung, Transformation und Analyse von Graphen und ähnlich gearteten Netzwerken. Neben verschiedenen Arten von Graphen stehen viele Standardalgorithmen, Analysefunktionen und Zeichnungsmethoden zur Verfügung, die demnach nicht selbst implementiert werden müssen. Die Bibliothek ist vollständig in Python geschrieben [und leidet bei großen Graphen deshalb unter Performanceproblemen](https://graph-tool.skewed.de/performance), ist dafür aber einfach zu installieren, bietet ein einfaches Interface und eine ausführliche Dokumentation.

Importieren Sie als erstes das Paket `networkx`. Die Entwickler empfehlen, wie Sie das eventuell bereits von Pandas oder NumPy kennen, die Verwendung eines kurzen Alias.

In [None]:
import networkx as nx

## Erstellung des Graphen
NetworkX unterstützt unterschiedliche Arten von Graphen. Der ungerichtete Graph mit einfachen Kanten wird als `Graph` bezeichnet. Ein gerichteter Graph mit einfach Kanten verwendet dagegen die Bezeichnung `DiGraph`.

In [None]:
G = nx.Graph()

Standardmäßig ist ein Graph leer. Er enthält also weder Knoten noch Kanten. Zum Hinzufügen von Knoten verwenden Sie entweder die Funktion `add_node`, um einzelne Knoten hinzuzufügen, oder `add_nodes_from`, um mehrere Knoten hinzuzufügen.

In [None]:
G.add_node('Knoten 1')
G.add_nodes_from(['Knoten 1', 'Knoten 2', 'Knoten 3', 'Knoten 4'])

Knoten werden anhand ihres Namens identifiziert. Wird der selbe Name mehrfach verwendet, verbleibt dennoch nur ein einzelner Knoten mit eben diesem Namen im Graphen.

Kanten werden analog zu den Knoten mit den Funktion `add_edge` und `add_edges_from` hinzugefügt. Kanten sind immer Paare aus einem Startknoten und einem Zielknoten, die anhand ihres Namens vorgegeben werden. In Graphen mit einfachen Kanten wird das Hinzufügen einer zweiten Kante mit dem selben Start- und Zielknoten ignoriert. Verläuft eine Kante zwischen Knoten, die bisher noch nicht im Graphen enthalten sind, werden diese automatisch hinzugefügt. (In zusammenhängenden Graphen kommt man also vollständig ohne das explizite Hinzufügen von Knoten aus.)

In [None]:
G.add_edge('Knoten 1', 'Knoten 3')
G.add_edge('Knoten 4', 'Knoten 5')  # Knoten 5 ist noch nicht vorhanden

G.add_edges_from([
    ('Knoten 1', 'Knoten 2'),
    ('Knoten 1', 'Knoten 4'),
    ('Knoten 5', 'Knoten 2')
])

Zum Zeichnen eines Graphen steht die Funktion `draw` zur Verfügung.

In [None]:
nx.draw(G, with_labels=True)

Einige [verwandte Funktionen](https://networkx.org/documentation/stable/reference/drawing.html) können zusätzlich andere Layouts erzeugen. Für kleine Graphen reicht jedoch die Funktion `draw` in der Regel aus.

## Adjazenzmatrix und -liste
Ist der Graph einmal erstellt, lassen sich die üblichen Repräsentationen mit NetworkX leicht erstellt. Die Adjazenzliste wird durch die Funktion `generate_adjlist` erzeugt. Dabei wird von einem Generator jeder Knoten nacheinander aufgeführt. Der erste Eintrag ist dabei immer der Name des Quellknotens, während alle weiteren genannten Knoten durch eine Kante verbunden sind.

In [None]:
list(nx.generate_adjlist(G))

Die Adjazenzmatrix wird zum Beispiel durch die Funktion `to_numpy_array` erzeugt. Es gibt Alternativen, die andere Datenstrukturen zur Speicherung verwenden, wie beispielsweise `adjacency_matrix`.

In [None]:
nx.to_numpy_array(G)

## Pfade und Zusammenhang
Zur Suche von Pfaden steht die Funktion `shortest_path` zur Verfügung. Dem Namen folgend bestimmt Sie den kürzesten Pfad zwischen zwei vorgegebenen Knoten.

In [None]:
nx.shortest_path(G, 'Knoten 3', 'Knoten 5')

Falls Sie an allen kürzesten Pfaden interessiert sind, existiert zusätzlich die Funktion `all_shortest_paths`.

In [None]:
list(nx.all_shortest_paths(G, 'Knoten 3', 'Knoten 5'))

Den Zusammenhang können Sie nun entweder durch Finden eines Pfades zwischen jeder paarweisen Kombination zweier Knoten prüfen oder mit Hilfe der Funktion `is_connected`. Gibt diese `False` zurück, ist der Graph nicht zusammenhängen. `True` lautet der Rückgabewert bei einem Zusammenhängenden Graphen.

In [None]:
nx.is_connected(G)

Mit `connected_components` gibt es außerdem die Möglichkeit, die einzelnen Komponenten aufzählen zu lassen. Diese Funktion gibt Liste mit Mengen von Knoten zurück, die jeweils einer Komponente angehören. Ist im Ergebnis nur eine Menge vorhanden, ist der Graph folglich zusammenhängend.

In [None]:
list(nx.connected_components(G))

## Struktur des Graphen

Zur Bestimmung der **Dichte** stellt NetworkX die Funktion `density` bereit. Im Beispielgraphen sind fünf Kanten vorhanden, während der vollständig verbundene Graph $K_5$ zehn Kanten besitzt und damit die obere Grenze für die Anzahl an Kanten in einem Graphen mit fünf Knoten setzt.

In [None]:
nx.density(G)

Der **Knotengrad** repräsentiert ein einfaches Merkmal, um die Relevanz eines Knotens einzuschätzen. Die Funktion `degree` gibt ein Objekt zurück, das jedem Knoten seinen Grad zuordnet.

In [None]:
nx.degree(G)

## Graphen aus Dateien
NetworkX erlaubt das Schreiben in und das Lesen aus Dateien. Zum Schreiben steht die Funktion `write_edgelist` bereit, die zeilenweise durch Leerzeichen getrennte Tupel bestehend aus Quellknoten, Zielknoten und Metadaten enthält. Mit den Parameters `data` und `delimiter` lassen sich gewöhnliche CSV-Dateien erzeugen.

In [None]:
nx.write_edgelist(G, 'graph.csv', data=False, delimiter=',')

Mit der Methode `read_edgelist` lassen sich diese Dateien auch wieder einlesen. Mit `is_isomorphic` lassen sich zwei Graphen auf Isomorphie prüfen. (Achtung: Bei großen Graphen kann diese Prüfung sehr viel Zeit in Anspruch nehmen!)

In [None]:
G2 = nx.read_edgelist('graph.csv', data=False, delimiter=',')

nx.is_isomorphic(G, G2)

Endet ein Dateiname mit `.gz` oder `.bz2`, wird automatisch eine Kompression oder Dekompression aktiviert. Außerdem stehen [weitere Formate](https://networkx.org/documentation/stable/reference/readwrite/index.html) zur Verfügung, sodass Graphen aus NetworkX in einer Vielzahl anderer Software geladen werden können und umgekehrt.