# Kennzahlen

## Inhaltsverzeichnis
- [Vorbereitung](#Vorbereitung)
- [Struktur des Graphen](#Struktur-des-Graphen)
  - [Vollständige Verbundenheit](#Vollständige-Verbundenheit)
  - [Dichte](#Dichte)
  - [Kürzeste Pfade](#Kürzeste-Pfade)
  - [Zusammenhängende Teilgraphen](#Zusammenhängende-Teilgraphen)
- [Graphanalyse](#Graphanalyse)
  - [Knotengrad](#Knotengrad)
  - [Nähe](#Nähe)
  - [Betweenness-Zentralität](#Betweenness-Zentralität)
  - [Pagerank](#Pagerank)
  - [Cliquen](#Cliquen)
  - [Communities](#Communities)

## Vorbereitung
Importieren Sie zunächst `networkx` und laden Sie den Graphen.

In [None]:
import networkx as nx
from networkx import community, clique

G = nx.read_edgelist('g.csv', data=False, delimiter=',')
nx.draw(G, with_labels=True)

## Struktur des Graphen
### Vollständige Verbundenheit
Ein Graph heißt vollständig verbunden, wenn jeder Knoten eine Kante zu jedem anderen Knoten besitzt. In NetworkX existiert zur Überprüfung die Funktion `is_connected`.

In [None]:
nx.is_connected(G)

### Dichte
Die Dichte eines Graphen gibt an, wie viele der möglichen Kanten vorhanden sind. Ein Wert von $1$ entspricht einem vollständig verbundenen Graphen, während $0$ einen Graphen ohne Kanten widerspiegelt. Die Dichte wird wie folgt berechnet:

$$
d(G) = \dfrac{\left|E\right|}{\binom{\left|V\right|}{2}}
$$

NetworkX stellt die Funktion `density` bereit.

In [None]:
nx.density(G)

### Kürzeste Pfade
Ein Pfad ist eine Verbindung zweier Knoten über eine Folge von Kanten. Der kürzeste Pfad ist dabei derjenige, der am wenigsten Kanten einschließt. Zum Auffinden eines kürzesten Pfades existiert die Funktion `shortest_path`.

In [None]:
nx.shortest_path(G, source='d', target='z')

### Zusammenhängende Teilgraphen
Ein Graph heißt zusammenhängend, wenn seine Knoten paarweise durch einen Pfad verbunden sind. Ist ein Graph nicht zusammenhängend, lässt er sich in zwei oder mehr zusammenhängende Teilgraphen spalten. Mit der Funktion `connected_components` wird nach solchen gesucht.

In [None]:
list(nx.connected_components(G))

## Graphanalyse
### Knotengrad
Der Knotengrad gibt an, wie viele Kanten von einem Knoten ausgehen. Die Funktion `degree` gibt ein Objekt zurück, das zu jedem Knoten den Grad enthält.

In [None]:
nx.degree(G)

### Nähe
Die Nähe *("Closeness Centrality")* ist ein Wert für die Entfernung eines Knotens zu allen anderen. Die Funktion `closeness_centrality` berechnet das Reziproke der durchschnittlichen Entfernung eines Knotens zu allen anderen. Je höher der Wert ist, desto zentraler liegt der Knoten hinsichtlich der Entfernungen.

In [None]:
nx.closeness_centrality(G)

### Betweenness-Zentralität
Die Betweenness-Zentralität richtet sich nach der Anzahl der kürzesten Wege, die einen Graphen durchlaufen. NetworkX stellt die Funktion `betweenness_centrality` bereit.

In [None]:
nx.betweenness_centrality(G)

### Pagerank
Pagerank wurde ursprünglich als Algorithmus zur Bewertung der Relevanz von Webseiten in Suchergebnissen entwickelt. NetworkX implementiert dazu die Funktion `pagerank`.

In [None]:
nx.pagerank(G)

### Cliquen
Cliquen sind Teilgraphen, die vollständig verbunden sind. Die Methode `find_clique` findet alle Teilmengen, die eine Clique bilden. (Teilgraphen, die aus zwei verbundenen Knoten bestehen, sind immer Cliquen.)

In [None]:
list(clique.find_cliques(G))

### Communities
Communities sind eine Partitionierung des Graphen, sodass Knoten innerhalb einer Community dichter sind als außerhalb. NetworkX stellt zum Auffinden von Communities unter anderem die Funktion `greedy_modularity_communities` zur Verfügung.

In [None]:
community.greedy_modularity_communities(G)