# Materiały do zadań - grafy

Popularne biblioteki do przetwarzania grafów
* [graph-tool](https://graph-tool.skewed.de/)
* [igraph](https://igraph.org/)
* [networkit](https://networkit.github.io/)
* [networkX](https://networkx.org/)
* [scikit-network](https://scikit-network.readthedocs.io/en/latest/)
* [snap](https://snap.stanford.edu/)

Porównanie wydajności bibliotek [[LINK]](https://www.timlrx.com/blog/benchmark-of-popular-graph-network-packages)

## Podstawowa funkcjonalność biblioteki networkx

Biblioteka Networkx jest napisana w Pythonie, w porównaniu do innych gdzie są napisane w C/C++ i Python pełni role interfejsu. Biblioteka posiada przejrzysty interfejs użytkownika i ma też wysokie pokrycie testami. Niestety wykorzystanie samego Pythona wiąże się z tym, że przy większych grafach czas przetwarzania z wykorzystaniem biblioteki może być zbyt duży, dlatego zalecane jest wtedy korzystanie z algorytmów zaimplementowanych w innych bibliotekach. 


W materiałach opisany został tylko fragment możliwości biblioteki. Pełna dokumentacja znajduje się pod adresem: [[LINK]](https://networkx.org/documentation/stable/_downloads/networkx_reference.pdf), gdzie można znaleźć np. inne metody wczytywania grafów, algorytmy, narzędzia itp.

### Import 

Bibliotekę networkx zazwyczaj importuje się wykorzystująć skrót `nx`

In [None]:
import networkx as nx

### Tworzenie grafu

Możemy teraz przejść do stworzenia grafu. Graf możemy utworzyć korzystając z klasy `nx.Graph`

In [None]:
graph = nx.Graph()

Krawędzie dodajemy do grafu za pomocą metody `add_edge`

In [None]:
graph.add_edge(1, 2)
graph.add_edge(1, 3)
graph.add_edge(2, 3)
graph.add_edge(1, 4)
graph.add_edge(2, 4)

Możemy też dodawać wierzchołki za pomocą metody `add_node`

In [None]:
graph.add_node(5)

Dodanie samego wierzchołka bez krawędzi powoduje pojawienie się wierzchołków izolowanych (nie posiadających krawędzi). W celu sprawdzenia czy w grafie mamy izolowane wierzchołki możemy wykorzystać metodę `isolates()` z modułu `networkx`

In [None]:
list(nx.isolates(graph))

Listę krawędzi możemy wyświetlić za pomocy metody `edges`

In [None]:
graph.edges()

Warto zauważyć, że zwracany obiekt nie jest pythonową listą, lecz obiektem `EdgeView`. Obiekty `View` w networkx często ograniczają dostęp do elementów tylko do ich wyświetlania. W celu uniknięcia błedów przy przetwarzaniu z pominięciem interfejsów zdefiniowanych w bibliotece lepiej sprowadzić typ do standardowej listy lub `np.ndarray`.

Graf możemy również stworzyć z wykorzystaniem listy krawędzi

In [None]:
nx.from_edgelist(
    edgelist=[(1, 2), (1, 3), (1, 4), (2, 3), (2, 4)]
).edges()

```{hint}

NetworkX posiada też wiele innych formatów do importowania i eksportowanai grafów. Więcej szczegółów znajdziecie w dokumentacji [[LINK]](https://networkx.org/documentation/stable/reference/readwrite/index.html)
```

Dostęp do listy wierzchołków odbywa się za pomocą metody `nodes`. Tutaj także zwracany jest obiekt networkx `NodeView`

In [None]:
graph.nodes()

### Podstawowe statystyki grafowe

Liczba wierzchołków

In [None]:
len(graph)

In [None]:
graph.number_of_nodes()

Liczba krawędzi

In [None]:
graph.number_of_edges()

Stopnie wierzchołków

In [None]:
graph.degree()

### Operacje na "słowniku" w networkx

`Networkx` pod spodem wykorzystuję strukturę opartą o słowniki, co daje dostęp do wielu operacji w podobny sposób jak do słowników.

Za pomocą standardowego indeksowania mamy dostęp do sąsiadów danego wierzchołka

In [None]:
graph[1]

Widok wyświetla również atrybuty wyrzchołków, w przypadku tego grafu nie ma atrybutów, dlatego zwracane są puste słowniki. W celu wyświetlenia samej listy sąsiadów możemy wykorzystać metodę `neighbors`. Przy korzystaniu z tej metody musimy wcześniej przemapować ją na listę.

In [None]:
list(graph.neighbors(1))

Wykorzystanie dwupoziomowego indeksu zwraca atrybuty danego wierzchołka

In [None]:
graph[1][2]

Sprawdzenie czy wierzchołek występuje w grafie

In [None]:
4 in graph

In [None]:
6 in graph

### Inne typy grafów

`nx.Graph` nie jest jedynem typem grafu wspieranym przez bibliotekę `networkx`. Główną różnicą jest wspierany typ krawędzi, rozróżnia się: skierowanie krawędzie (posiadają kierunek); oraz równoległe krawezie (powtórzone krawędzie - przydatne w przypadku grafów temporalnych); Porównania typów zawrto w poniższej tabeli.

| Typ | Skierowane krawędzie | Równoległe Krawędzie |
| --- | --- | -- | 
| `nx.Graph` | - | - | 
| `nx.DiGraph` | + | - |
| `nx.MultiGraph` | - | + |
| `nx.MultiDiGraph` | + | + |

Skierowanie krawędzi w grafie możemy zmienić za pomocą metody `to_directed()` lub `to_undirected()`

In [None]:
directed_graph = graph.to_directed()

In [None]:
directed_graph.edges()

## Rysowanie grafów

Do rysowania grafów możemy wykorzystać interfejs `nx.draw`

In [None]:
nx.draw(graph)

Niestety domyślny interfejs jest bardzo ograniczony, dlatego autorzy rekomendują wykorzystanie bibliotek dedykowanych do rysowania grafów takich jak [`Cytoscape`](https://cytoscape.org/), [`Gephi`](https://gephi.org/) czy [`PyGraphviz`](https://pygraphviz.github.io/).

### Interaktywne wykresy z wykrozystaniem plotly

W materiałach wykorzystamy inną ścieżkę, wykorzystując plotly do rysowania grafów. Materiał przygotowany jest na bazie tutorialu https://plotly.com/python/network-graphs/. Niestety plotly nie oferuje gotowych interfejsów do wizualizacji grafów, także musimy przejść ręcznie przez ich utworzenie.

Pierwszym wymaganym elementem jest wypozycjonowanie wierzchołków w grafie. Do tego możemy wykorzystać gotowe funkcje znajdujące się w module `networkx.drawing.layout`. 

Do interaktywnych wykresów wykorzystamy graf z większą liczbą wierzchołków i krawędzi w tym celu wykorzystamy generator.

In [None]:
graph = nx.fast_gnp_random_graph(n=50, p=0.03)

Wizualizacja z wykorzystaniem domyślnego interfejsu

In [None]:
nx.draw(graph, pos=nx.drawing.layout.shell_layout(graph))

Ekstrakcja samych pozycji

In [None]:
positions = nx.drawing.layout.shell_layout(graph)

Następnie mając pozycje wyrysujmy najpierw wierzchołki z wykorzystaniem metody `go.Scatter`.

In [None]:
import plotly.graph_objects as go

node_x = []
node_y = []

for node in graph:
    x, y = positions[node]
    node_x.append(x)
    node_y.append(y)

node_trace = go.Scatter(
    x=node_x,
    y=node_y,
    mode="markers",
    hoverinfo="text",
    text=list(graph.nodes()),
    marker=dict(
        size=10,
        line_width=2,
    ),
)

Możemy teraz wyświetlić obecny stan naszego wykresu.


In [None]:
fig = go.Figure(node_trace)
fig.show()

Teraz dodajmy krawędzie

In [None]:
edge_x = []
edge_y = []

for edge in graph.edges():
    x0, y0 = positions[edge[0]]
    x1, y1 = positions[edge[1]]
    edge_x.append(x0)
    edge_x.append(x1)
    edge_y.append(y0)
    edge_y.append(y1)
    
edge_trace = go.Scatter(
    x=edge_x,
    y=edge_y,
    line=dict(width=0.5, color="#888"), # Dodane w celu poprawy czytelności
    hoverinfo="none",
    mode="lines",
    showlegend=False
)

In [None]:
fig = go.Figure([edge_trace, node_trace])
fig.show()

Teraz wprowadźmy jeszcze kilka poprawek usprawniającyh czytelność wykresu

In [None]:
fig = go.Figure(
    data=[edge_trace, node_trace],
    layout=go.Layout(
        title="Interaktywny wykres",
        titlefont_size=16,
        showlegend=False,
        hovermode="closest",
        xaxis=dict(showgrid=False, zeroline=False, showticklabels=False),
        yaxis=dict(showgrid=False, zeroline=False, showticklabels=False),
    ),
)

fig.show()

Możemy oznaczyć również grupowanie wierzchołków. Wygenerujmy przykładowe mapowanie.

In [None]:
import numpy as np

groups = np.array_split(graph.nodes(), 4)

Wystarczy że zmienimy teraz tylko metodę do rysowania wierzchołków

In [None]:
node_traces = []
for group_id, node_group in enumerate(groups):
    node_x = []
    node_y = []
    for node in node_group:
        x, y = positions[node]
        node_x.append(x)
        node_y.append(y)

    node_traces.append(
        go.Scatter(
            x=node_x,
            y=node_y,
            mode="markers",
            hoverinfo="text",
            text=node_group,
            name=group_id,
            marker=dict(
                size=10,
                line_width=2,
            ),
            legendgroup=f"{group_id}",
        
        )
    )
    
fig = go.Figure(
    data=[edge_trace, *node_traces],
    layout=go.Layout(
        title="Interaktywny wykres z wyróżnieniem grup",
        titlefont_size=16,
        showlegend=True,
        hovermode="closest",
        xaxis=dict(showgrid=False, zeroline=False, showticklabels=False),
        yaxis=dict(showgrid=False, zeroline=False, showticklabels=False),
        legend_title_text="Grupa"
    ),
)

fig.update_layout(legend_itemclick=False)
fig.show()

## Materiały pomocnicze

### Wykrywanie społeczności


Zadanie wykrywania społeczności jest niczym innym jak znalezieniem grup wierzchołków w grafie, które posiadają podobną strukturę. Przekładając to na język techiczny zadanie można zdefiniować jako znalezienie grup wierzchołków, które są gęsto połączone między sobą i luźno połaczone pomiędzy innymi społecznościami. W zależności od typu i źródła danych społeczności mogą mieć różne interpretacje. Wykrywanie społeczności jest to obecnie szeroka gałeź i obejmuje zarówno tradycyjne metody i te oparte o sieci głębokie oraz uwzględnia zarówno strukturę sieci i atrybuty. Więcej informacji na temat wykrywania społeczności można znaleźć w pracach przeglądowych lub wykorzystać repozytoria aggregujące obecny stan wiedzy (artykuły, metody, zbiory danych) np. [[LINK]](https://github.com/FanzhenLiu/Awesome-Deep-Community-Detection)


Metody do wykrywania społecnzości i ewaluacji znajdziemy w module [`nx.algorithms.community`](https://networkx.org/documentation/stable/reference/algorithms/community.html) lub możemy wykorzystać inne biblioteki. Przydatna może się okazać biblioteka [`cdlib`](https://networkx.org/documentation/stable/reference/algorithms/community.html), która nie potrzebuje dodatkowych konwersji. 

Przykład wykorzystania bilioteki **cdlib** (z dokumentacji):

```python
from cdlib import algorithms
import networkx as nx
G = nx.karate_club_graph()
coms = algorithms.louvain(G, weight='weight', resolution=1., randomize=False)
```
