**Theorie - Netzwerke**

---
Wie kommen wir von den Koautorschaften zu den Netzwerken?
- Nodes
- Edges

**Theorie - Netzwerke**

---
#### Ein mittelgroßes Beispiel:

[<img src="images/samplenet.png" width="1200"/>](images/samplenet.png)

In [None]:
# zentrales package: networkx (oft mit nx abgekürzt)
import networkx as nx

# package mit selbst geschriebenen Inhalten:
import src
from src.bokeh_graph import BokehGraph

In [None]:
# initialisiert ein Graph Objekt namens "show"
show = nx.Graph()
 
# füge zwei Autoren nodes und einen Artikel node über eine Liste von dictionaries hinzu
show.add_nodes_from([
    (1, {'name':'Barabasi', 'type':'Author', 'color':0}),
    (2, {'name':'Albert', 'type':'Author', 'color':0}),
    ('A', {'name':'Emergence of Scaling ...', 'type':'Article', 'color':1})
])

In [None]:
# plot definieren
plot = BokehGraph(show, width=600, height=600, inline=True)

# layout initialisieren
plot.layout()
import copy # um das layout wiederzuverwenden
lay = copy.deepcopy(plot._layout)

In [None]:
# plot anzeigen
plot.draw(
    color_by="color", palette="viridis",
    edge_alpha=0.01, max_colors=5, node_size=25
)

In [None]:
# edges zwischen Autoren und dem Artikel hinzufügen
show_add = copy.deepcopy(show)
show_add.add_edges_from([
    (1,'A'),
    (2,'A')
])

In [None]:
# ohne edges
plot = BokehGraph(
    show,
    width=400,
    height=400,
    inline=True
)
plot._layout = lay
plot.draw(
    color_by="color", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# Plotvorgang mit neuem edge
plot = BokehGraph(
    show_add,
    width=400,
    height=400,
    inline=True
)
plot._layout = lay
plot.draw(
    color_by="color", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# "show" neu (leer) initialisieren
show_simple = nx.Graph()

# nur Autoren nodes hinzufügen
show_simple.add_nodes_from([
    (1, {'name':'Barabasi', 'type':'Author'}),
    (2, {'name':'Albert', 'type':'Author'})
])

# direkten edge zwischen den Autoren per tupel hinzufügen
show_simple.add_edge(1,2)

In [None]:
# mit Artikel edges
plot = BokehGraph(
    show,
    width=400,
    height=400,
    inline=True
)
plot.draw(
    color_by="color", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# Plotvorgang des vereinfachten Netzwerkes
plot = BokehGraph(
    show_simple,
    width=400,
    height=400,
    inline=True
)
plot.draw(
    color_by="type", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

**Theorie - Netzwerke**

---
Es gibt verschiedene Arten von Edges:
- ungerichtete (siehe oben)
- gerichtete (z.B. bei Zitationen)
- ungewichtete (siehe oben)
- gewichtete (Häufigkeit von Kooperation)
- *self-loops* (z.B. selbst-Zitation)

**Theorie - Netzwerke**

---
Etwas mehr Komplexität:
- Dyaden und Triaden
- Teilnetzwerke
- *Isolates*

In [None]:
# list Objekt mit Autorendictionaries
node_list = [
    (1, {'lastname':'Erhard', 'firstname':'Lukas', 'mark':0}),
    (2, {'lastname':'Koss', 'firstname':'Chris', 'mark':0}),
    (3, {'lastname':'Unger', 'firstname':'Said', 'mark':0}),
    (4, {'lastname':'Heiberger', 'firstname':'Raphael', 'mark':1}),
    (5, {'lastname':'Wieczorek', 'firstname':'Oliver', 'mark':2}),
    (6, {'lastname':'Riebling', 'firstname':'Jan', 'mark':0}),
    (7, {'lastname':'Munoz-Najar Galvez', 'firstname':'Sebastian', 'mark':1}),
    (8, {'lastname':'McFarland', 'firstname':'Daniel', 'mark':1}),
    (9, {'lastname':'Schwemmer', 'firstname':'Carsten', 'mark':2}),
    (10,{'lastname':'Barabasi', 'firstname':'Albert-Laszlo', 'mark':3}),
    (11,{'lastname':'Albert', 'firstname':'Reka', 'mark':3}),
    (12,{'lastname':'Merton', 'firstname':'Robert King', 'mark':4})    
]

In [None]:
# list Objekt mit edgetupeln
edge_list = [
    # Mapping the Field
    (1,2), (1,3), (1,4), (1,5), (1,6),
    (2,3), (2,4), (2,5), (2,6),
    (3,4), (3,5), (3,6),
    (4,5), (4,6),
    (5,6),
    # Paradigm Wars
    (4,7), (4,8),
    (7,8),
    # Methodological Divide
    (5,9),
    # Emergence of Scaling
    (10,11)
]

In [None]:
# Graph Objekt initialisieren
comp = nx.Graph()

# alle nodes der node_list per "add_nodes_from" Funktion hinzufügen
comp.add_nodes_from(node_list)

# alle edges der node_list per "add_edges_from" Funktion hinzufügen
comp.add_edges_from(edge_list)

In [None]:
import copy

In [None]:
# Einstellungen für das graphing Tool:
from bokeh.io import output_file, reset_output # speichert die Plots extern um platz im Notebook zu sparen

#(src.PATH / "tmp").mkdir(exist_ok=False)
output_file(src.PATH / "tmp/myoutput.html")

# Plotten
plot = BokehGraph(comp, width=1920, height=1080, inline=True)
plot.layout()
lay = copy.deepcopy(plot._layout)
plot.draw(
    color_by='mark', palette='viridis',
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# nur das große verbundene Netzwerk -> largest connected component
delete = [10,11,12]
for node in list(comp.nodes()):
    if node in delete:
        comp.remove_node(node)

In [None]:
comp_add = copy.deepcopy(comp)

In [None]:
# neuer Edge: McFarland - Unger
comp_add.add_edge(3,8)
# so kann ein attribut bei einem einzelnen node angewählt bzw. geändert werden
# ähnlich wie bei dictionaries
comp_add.nodes()[3]['mark']=1

In [None]:
# ohne neue Bindung, nur LCC
reset_output()
plot = BokehGraph(
    comp,
    width=600,
    height=550,
    inline=True
)
plot.layout()
lay = copy.deepcopy(plot._layout)
plot.draw(
    color_by='mark', palette='viridis',
    edge_alpha=0.5, max_colors=5, node_size=15
)

In [None]:
# mit neuer Bindung
plot = BokehGraph(
    comp_add,
    width=600,
    height=550,
    inline=False
)
plot._layout = lay

plot.draw(
    color_by='mark', palette='viridis',
    edge_alpha=0.5, max_colors=5, node_size=15
)

**Theorie - Netzwerke**

---
## *Centrality*:
- Welche Nodes im Netzwerk sind zentral?
- Verschiedene Herangehensweisen:
    - *Degree Centrality*
        - Anzahl der Edges
    - *Closeness Centrality*
        - "Erreichbarkeit"
    - *Betweenness Centrality*
        - "Vermittlung"
    - *Eigenvector Centrality*
        - "Beziehungen der Beziehungen"

- &rarr; soziales Kapital

In [None]:
# Diverse centrality Funktionen aus networkx:
dc = nx.degree_centrality(comp_add)
cc = nx.closeness_centrality(comp_add)
bc = nx.betweenness_centrality(comp_add)
ec = nx.eigenvector_centrality(comp_add)

In [None]:
# Was geben uns die Funktionen eigentlich aus?
print(dc)

{1: 0.625, 2: 0.625, 3: 0.75, 4: 0.875, 5: 0.75, 6: 0.625, 7: 0.25, 8: 0.375, 9: 0.125}


In [None]:
# Mit der Funktion "set_node_attributes" können dictionary Objekte*
# als Attribut zum Netzwerk hinzugefügt werden
nx.set_node_attributes(comp_add, name='degree', values=dc)
nx.set_node_attributes(comp_add, name='closeness', values=cc)
nx.set_node_attributes(comp_add, name='betweenness', values=bc)
nx.set_node_attributes(comp_add, name='eigenvector', values=ec)

# __________________________________________________________________________________________
# *Auch einzelne Werte können hinzugefügt werden, jeder node erhält dann diesen Wert

In [None]:
# Hier wird in der "draw" Funktion angegeben, dass die nodes nach
# closeness centrality eingefärbt werden sollen
plot = BokehGraph(comp_add, width=1024, height=600, inline=True)
plot._layout = lay
plot.draw(
    color_by="closeness", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# degree centrality statt closeness centrality plotten
plot._layout = lay
plot.draw(
    color_by="degree", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# betweenness
plot._layout = lay
plot.draw(
    color_by="betweenness", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

In [None]:
# eigenvector
plot._layout = lay
plot.draw(
    color_by="eigenvector", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)

**Theorie - Netzwerke**

---
## Kennzahlen auf Netzwerkebene
- Größe
- Dichte
- Cluster

In [None]:
# Funktionen für die erwähnten Kennzahlen
nodesize = len(comp.nodes())
edgesize = comp.size()
den = nx.density(comp)
clust = nx.average_clustering(comp)

# Kennzahlen anzeigen
print('Node Size                      |', nodesize)
print('Edge Size                      |', edgesize)
print('Network Density                |', den)
print('Average Clustering Coefficient |', clust)

Node Size                      | 9
Edge Size                      | 19
Network Density                | 0.5277777777777778
Average Clustering Coefficient | 0.798941798941799


**Theorie - Netzwerke**

---
## Besondere Netzwerke
- *Scale Free Networks* / *Preferential Attachment*
    - [Barabasi & Albert, 1999](https://science.sciencemag.org/content/286/5439/509)
    - Matthäus Effekt
- *Small World Networks* / *Six Degrees of Separation*
    - [Watts & Strogatz, 1998](https://www.nature.com/articles/30918)
    - [Milgram, 1967](http://files.diario-de-bordo-redes-conecti.webnode.com/200000013-211982212c/AN%20EXPERIMENTAL%20STUDY%20by%20Travers%20and%20Milgram.pdf)
    - Erreichbarkeit

Barabasi-Albert Graph mit **10** Nodes und jeweils einem edge:

In [None]:
# spezielle Algorithmen zur Generierung spezieller Netzwerke importieren
from networkx.generators import barabasi_albert_graph, connected_watts_strogatz_graph

# Barabasi-Albert-Graph mit 10 nodes und jeweils einem edge generieren
bag = barabasi_albert_graph(10, 1)

# plotten
plot = BokehGraph(bag, width=800, height=400, inline=False)
plot.layout()
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=25
)

Barabasi-Albert Graph mit **100** Nodes und jeweils einem edge:

In [None]:
# Diesmal mit 100 nodes
bag = barabasi_albert_graph(100, 1)

plot = BokehGraph(bag, width=800, height=400, inline=False)
plot.layout()
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=10
)

In [None]:
# Module pandas und altair importieren
import pandas as pd
import altair as alt

# pandas dataframe aus dem degree dictionary erstellen
deg_frame = pd.DataFrame(bag.degree(), columns=['node', 'degree'])

# einfaches Histogramm plotten
alt.Chart(deg_frame).mark_bar().encode(
    alt.X("degree:Q"),
    y='count()',
)

Watts-Strogatz Graph

In [None]:
# mit der Funktion "connected_watts_strogatz_graph" ein Graph Objekt
# mit 50 nodes, jeweils zwei Nachbarschaftsedges und einer 
# Neuverbindungswahrscheinlichkeit von 10% (p=0.1) initialisieren
wsg = connected_watts_strogatz_graph(50, 2, 0.1)

In [None]:
# plotten
plot = BokehGraph(wsg, width=700, height=400, inline=False)
plot.layout(layout=nx.fruchterman_reingold_layout(wsg))
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=15
)

In [None]:
# plotten
plot = BokehGraph(wsg, width=600, height=600, inline=False)
plot.layout(layout=nx.circular_layout(wsg))
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=15
)

In [None]:
# p=0.5
wsg = connected_watts_strogatz_graph(50, 2, 0.5)

# plotten (circular layout)
plot = BokehGraph(wsg, width=600, height=600, inline=False)
plot.layout(layout=nx.circular_layout(wsg))
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=15
)

In [None]:
# plotten (F-R layout)
plot = BokehGraph(wsg, width=800, height=600, inline=False)
plot.layout(layout=nx.fruchterman_reingold_layout(wsg))
plot.draw(
    edge_alpha=0.5, max_colors=5, node_size=15
)

**Theorie - Netzwerke**

---
### Was ist das besondere an der Netzwerkperspektive
- Einbettung von Akteuren in Netzwerke
- Abhängigkeit der Beobachtungen voneinander

**Theorie - Netzwerke**

---
###  Weitere Mechanismen
- Transitivität / Triadische Schließung
- Reziprozität
- Homophilie
    - [McPherson et al., 2001](https://www.annualreviews.org/doi/abs/10.1146/annurev.soc.27.1.415)
- *Strength of weak ties*
    - [Granovetter, Mark S., 1973](https://www.jstor.org/stable/2776392)
- *Structural holes*
    - [Burt, Ronald S., 2004](https://www.jstor.org/stable/10.1086/421787?seq=1#metadata_info_tab_contents)

**Theorie - Netzwerke**

---
## Community Detection
- verschiedene Algorithmen
    - *Modularity*
    - *k-Cliques*
    - ...
- Idee: Communities haben innerhalb mehr *edges* als außerhalb

In [None]:
# community detection Algorithmen von networkx importieren
from networkx.algorithms import community

# wir benutzen einen modularity alorithmus
communities = community.naive_greedy_modularity_communities(comp)

In [None]:
communities

[frozenset({1, 2, 3, 5, 6, 9}), frozenset({4, 7, 8})]

In [None]:
# Zuweisung der nodes zu den communities

com_dict = {}
com_number = 0
for com in communities:
    com_number += 1
    for node in com:
        com_dict[node] = com_number

In [None]:
print(com_dict)

{1: 1, 2: 1, 3: 1, 5: 1, 6: 1, 9: 1, 8: 2, 4: 2, 7: 2}


In [None]:
# Zuweisung im Graph Objekt
nx.set_node_attributes(comp, name='community', values=com_dict)

In [None]:
# Plotten, mit unterschieldichen Farben für unterschiedliche communities
plot = BokehGraph(comp, width=1024, height=700, inline=False)
plot.layout()
plot.draw(
    color_by="community", palette="viridis",
    edge_alpha=0.5, max_colors=5, node_size=25
)