# 教養としてのアルゴリズムとデータ構造

木構造と木構造を一般化したグラフ構造を扱うことの出来るモジュール `networkx` について簡単な使い方を説明します

参考

- https://networkx.github.io/

なお、ノートを読まなくても（木構造の）課題を解くのに影響はありません。課題では木構造などを可視化するのに利用されている場合があります。

# 木構造


Pythonにおいて木構造を扱う為のモジュールには `networkx` というモジュールがあります。

In [None]:
import networkx

一般的には、`nx` という略称を用いることが多い様です。

In [None]:
import networkx as nx

以下では、略称の `nx` を用いて説明します。

## 木構造の作成

まず木を作成してみます。木を作成するには、関数 **`nx.Graph()`** を用います。

`nx.Graph()` を実行すると、木（実際には、木を一般化したグラフ）のオブジェクト（正式には**NetworkXグラフオブジェクト**）が返ってきます。

---
```Python
nx.Graph()
```
---

In [None]:
nx_tree1 = nx.Graph()

これだけでは（見た目では）何も起こりません。

木を作成（表示）するには、点と枝の情報を木（上のセルで言う `nx_tree1` ）に加えてやる必要があります。

木に点を加えるには、NetworkXグラフオブジェクトのメソッド `add_node` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` に点 `v` を加えたい場合、以下の様にします。

---
```Python
nx_tree1.add_node(v)
```
---

実際に、`1` と `2` という名前の2つの点を `Tree1` に追加してみます。

In [None]:
nx_tree1.add_node(1)
nx_tree1.add_node(2)

この木（と言っても枝はまだありませんが）をMatplotlibライブラリを使って表示してみます。

NetworkXグラフオブジェクト `nx_tree1` を表示するには、**`nx.draw_networkx`** を使います。

---
```Python
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
```
---

`pos = nx.spring_layout(nx_tree1)` は頂点の位置を決定する方法を指定しています。

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

木に枝を加えるには、NetworkXグラフオブジェクトのメソッド `add_edge` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` に点 `v` と点 `u` の間の枝を加えたい場合、以下の様にします。

---
```Python
nx_tree1.add_edge(v, u)
```
---

実際に、点 `1` と点 `2` の間に枝を `nx_tree1` に追加してみます。

In [None]:
nx_tree1.add_edge(1, 2)

表示してみましょう。

In [None]:
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

一度に複数の点を追加する場合、 `add_nodes_from` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` にリスト `list1` に格納されている全ての点を加えたい場合、以下の様にします。

---
```Python
nx_tree1.add_nodes_from(list1)
```
---

実際に、リスト `["a", "b", "c", "d"]` の4つの点を `nx_tree1` に追加してみます。

In [None]:
nx_tree1.add_nodes_from(["a", "b", "c", "d"])

表示してみましょう。

In [None]:
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

一度に複数の枝を追加する場合、 `add_edges_from` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` にリスト `list1` に格納されている全ての枝を加えたい場合、以下の様にします。

---
```Python
nx_tree1.add_edges_from(list1)
```
---

実際に、リスト `[("a", "b"), ("a", "c"), ("a", "d"), (2, "a")]` の4つの枝を `nx_tree1` に追加してみます。

In [None]:
nx_tree1.add_edges_from([("a", "b"), ("a", "c"), ("a", "d"), (2, "a")])

表示してみましょう。

In [None]:
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

実は枝を追加したときに、その枝を構成する点が存在しないと自動的にその存在しない点も追加されます。

In [None]:
nx_tree1.add_edge(1, 3) # 点3は存在しないが、枝が自動的に追加される
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

それでは、適当な木を作成してみます。

In [None]:
#pptで使われているファイルとフォルダの階層構造
nx_tree2 = nx.Graph()
nx_tree2.add_nodes_from(list(range(0, 14)))
list_edge = [[1,2,3], [4, 5], [6, 7], [], [8, 9, 10], [11], [12, 13], [], [], [], [], [], [], []]
for i in range(0, len(list_edge)):
    list_child = list_edge[i]
    for vtx in list_child:
        nx_tree2.add_edge(i, vtx)
nx.draw_networkx(nx_tree2, pos = nx.spring_layout(nx_tree2))
plt.axis('off')
plt.show();

In [None]:
#ランダムに木を作成
import random
random.seed(a=0)
int_nodenum = 50
int_nodecnt = 1
nx_tree3 = nx.Graph()
nx_tree3.add_nodes_from(list(range(0, int_nodenum)))
list_edge = [0] * int_nodenum
list_edge[0] = []
for i in range(1, int_nodenum):
    int_parent = random.randint(0, int_nodecnt-1)
    list_edge[int_nodecnt] = []
    list_edge[int_parent].append(int_nodecnt)
    int_nodecnt += 1
for i in range(0, len(list_edge)):
    list_child = list_edge[i]
    for vtx in list_child:
        nx_tree3.add_edge(i, vtx)
nx.draw_networkx(nx_tree3, pos = nx.spring_layout(nx_tree3))
plt.axis('off')
plt.show();

巨大な木を描画すると見難くなりますので、`plt.figure` を適宜変更して木を表示する範囲を調整して下さい。

In [None]:
plt.figure(figsize=(30, 30))#描画する横と縦の幅を設定する
nx.draw_networkx(nx_tree3, pos = nx.spring_layout(nx_tree3))
plt.axis('off')
plt.show();

## 木構造からの点や枝の削除

これまでとは逆に木から枝を除くには、NetworkXグラフオブジェクトのメソッド `remove_edge` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` から点 `v` と点 `u` の間の枝を除きたい場合、以下の様にします。

---
```Python
nx_tree1.remove_edge(v, u)
```
---

実際に、点 `1` と点 `2` の間の枝を `nx_tree1` から除いてみます。

In [None]:
nx_tree1.remove_edge(1, 2)

表示してみましょう。

In [None]:
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

存在しない枝を除こうとするとエラーが出ますので注意して下さい。

In [None]:
nx_tree1.remove_edge(1, "a") #1とaの間には枝がないのでエラーがでる

木から点を除くには、NetworkXグラフオブジェクトのメソッド `remove_node` を使います。

具体的には、NetworkXグラフオブジェクト `nx_tree1` から点 `v` を除きたい場合、以下の様にします。

---
```Python
nx_tree1.remove_node(v)
```
---

実際に、点 `a` を除いてみます。

In [None]:
nx_tree1.remove_node("a")
nx.draw_networkx(nx_tree1, pos = nx.spring_layout(nx_tree1))
plt.axis('off')
plt.show();

削除した点（この例でいうところの `a`）から出ている枝も一緒に全て削除されます。

# グラフ構造

モジュール `networkx` は本来、木構造を一般化したグラフ構造を扱うためのものです。

## グラフ構造の作成

実は先に紹介した関数 `nx.Graph()` は木構造を一般化したグラフ構造、しかも無向グラフを扱う為のものでした。

有向グラフを扱う場合は、 `nx.DiGraph()` を使います。

---
```Python
nx.DiGraph()
```
---

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
nx_dg1 = nx.DiGraph()
nx_dg1.add_edges_from([(0, 1), (1, 0), (0, 2), (2, 1), (3, 2)])
nx.draw_networkx(nx_dg1, pos = nx.spring_layout(nx_dg1))
plt.axis('off')
plt.show();

同じ枝 `[(0, 1), (1, 0), (0, 2), (2, 1), (3, 2)]` を与えても、無向グラフの場合は、`(0, 1)` と `(1, 0)` は同じ枝と見なされます。

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
nx_g1 = nx.Graph()
nx_g1.add_edges_from([(0, 1), (1, 0), (0, 2), (2, 1), (3, 2)])
nx.draw_networkx(nx_g1, pos = nx.spring_layout(nx_g1))
plt.axis('off')
plt.show();

NetworkXグラフオブジェクト `nx_g1` の枝を調べるには、`edges()` というメソッドを使います。

---
```Python
nx_g1.edges()
```
---

In [None]:
nx_dg1.edges() #上記の有向グラフの枝

In [None]:
nx_g1.edges() #上記の無向グラフの枝

## 重み付きグラフの作成

グラフの枝に重みをもたせる場合、 `add_edge` の3番目以降の引数で指定します。

具体的には、NetworkXグラフオブジェクト `nx_dg2` の点 `v` と点 `u` の間の枝に重み `w` を加えたい場合、以下の様にします。

---
```Python
nx_dg2.add_edge(v, u, weight=w)
```
---

実際に、点 `1` と点 `2` の間に重み `10` の枝を `nx_dg2` に追加してみます。

In [None]:
nx_dg2 = nx.DiGraph()
nx_dg2.add_edge(1, 2, weight=10)
pos = nx.spring_layout(nx_dg2)
nx.draw_networkx_edge_labels(nx_dg2, pos)
nx.draw_networkx(nx_dg2, pos, with_labels=True)
plt.axis('off')
plt.show();

実際には、3番目以降の引数で枝に持たせるキーとキーに対応付ける値を設定しています。

ですので、どの様な値でも指定することが可能です。

In [None]:
nx_dg2.add_edge(2, 3, weight=20, length=150)
nx_dg2.add_edge(1, 3, status="Good")
pos = nx.spring_layout(nx_dg2)
nx.draw_networkx_edge_labels(nx_dg2, pos)
nx.draw_networkx(nx_dg2, pos, with_labels=True)
plt.axis('off')
plt.show();

 `add_edges_from` を使って枝に何らかの値を持たせることも出来ます。

具体的には、NetworkXグラフオブジェクト `nx_g1` の枝 `(0, 1)` と `(2, 3)` に `weight=10` と `length=25` という値を加えたい場合、以下の様にします。

---
```Python
nx_g1.add_edges_from([(0, 1, {'weight':10}), (2, 3, {'length':25})])
```
---

実際に実行してみます。

In [None]:
nx_dg2 = nx.DiGraph()
nx_dg2.add_edges_from([(0, 1, {'weight':10}), (2, 3, {'length':25, 'Name':'Panda'})])
nx_dg2.add_edge(1,3, status="Bad", weather="Rainy")
pos = nx.spring_layout(nx_dg2)
nx.draw_networkx_edge_labels(nx_dg2, pos)
nx.draw_networkx(nx_dg2, pos)
plt.axis('off')
plt.show();

## グラフアルゴリズム

`networkx` では幾つかのグラフアルゴリズムを実行する為の関数やメソッドが用意されています。

### 探索

木構造を探索する為の関数が用意されています。

NetworkXグラフオブジェクト `nx_tree1` による木を点 `v` を起点にして幅優先探索を実行するには以下の様にします。

---
```Python
    nx.bfs_predecessors(nx_tree1, source=v)
```
---

この関数の返り値は、訪問順で枝（訪問先の点の名前、訪問前の点の名前の順で格納した大きさ2のタプル）を生成するジェネレータです。



In [None]:
nx_tree2 = nx.Graph()
nx_tree2.add_nodes_from(list(range(0, 14)))
list_edge = [[1,2,3], [4, 5], [6, 7], [], [8, 9, 10], [11], [12, 13], [], [], [], [], [], [], []]
for i in range(0, len(list_edge)):
    list_child = list_edge[i]
    for vtx in list_child:
        nx_tree2.add_edge(i, vtx)
nx.draw_networkx(nx_tree2, pos = nx.spring_layout(nx_tree2))
plt.axis('off')
plt.show();
gen1 = nx.bfs_predecessors(nx_tree2, source=0)
print("訪問順で枝を表示：", *gen1)

NetworkXグラフオブジェクト `nx_tree1` による木を点 `v` を起点として深さ優先探索を実行するには以下の様にします。

---
```Python
nx.dfs_preorder_nodes(nx_tree1, source=v)
```
---

この関数の返り値は、訪問順で点を生成するジェネレータです。

実行してみます。

In [None]:
nx.draw_networkx(nx_tree2, pos = nx.spring_layout(nx_tree2))
plt.axis('off')
plt.show();
gen1 = nx.dfs_preorder_nodes(nx_tree2, source=0)
print("訪問順で頂点を表示：", *gen1)

### 最短経路・最短距離

NetworkXグラフオブジェクト `nx_g1` によるグラフの点 `v` からの各点の最短距離を求めるには以下の様にします。

---
```Python
nx.shortest_path(nx_g1, source=v)
```
---

この関数の返り値は、キーを点 `u` とし、その値を点 `v` から点 `u` までの最短経路上の点の名前を格納したリストです。

実行してみます。

In [None]:
nx_g1 = nx.Graph()
list_adjlist2 = [[1, 2, 3], [0, 4, 5, 6, 7], [0, 3, 5], [0, 2, 5, 6, 7], [1, 5, 7], [1, 2, 3, 4, 7], [1, 3], [1, 3, 4, 5]]
for node1 in range(0, len(list_adjlist2)):
    for node2 in list_adjlist2[node1]:
        nx_g1.add_edge(node1, node2)
initnode = 0
list_cliques = nx.shortest_path(nx_g1, source=initnode)
print(list_cliques)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
fig, npar_axval = plt.subplots(1, 1, figsize=(4, 4));npar_axval.set_axis_off();nx.draw_networkx(nx_g1, ax=npar_axval)

### 子孫の取得

NetworkXグラフオブジェクト `nx_g1` による閉路を持たない有向グラフ（つまり、木構造を含みます）の点 `v` の子孫を求めるには以下の様にします。

---
```Python
nx.descendants(nx_g1, source=v)
```
---

この関数の返り値は、点 `v` の子孫の点を格納した集合です。

実行してみます。

In [None]:
list_adjlist1=[[1, 2], [2], [], [2, 4], [5], []]
nx_g1 = nx.DiGraph()
for node1 in range(0, len(list_adjlist1)):
    for node2 in list_adjlist1[node1]:
        nx_g1.add_edge(node1, node2)
initnode = 0
set_desc = nx.descendants(nx_g1, source=initnode)
print(set_desc)
initnode = 3
set_desc = nx.descendants(nx_g1, source=initnode)
print(set_desc)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
fig, npar_axval = plt.subplots(1, 1, figsize=(4, 4));npar_axval.set_axis_off();nx.draw_networkx(nx_g1, ax=npar_axval)

### トポロジカルソート

NetworkXグラフオブジェクト `nx_g1` による閉路を持たない有向グラフのトポロジカルソートを求めるには以下の様にします。

---
```Python
nx.topological_sort(nx_g1)
```
---

この関数の返り値は、トポロジカルソートの順で点を生成するジェネレータです。

実行してみます。

In [None]:
list_adjlist1=[[1, 2], [2], [], [2]]
nx_g1 = nx.DiGraph()
for node1 in range(0, len(list_adjlist1)):
    for node2 in list_adjlist1[node1]:
        nx_g1.add_edge(node1, node2)
list_tpsorted1 = list(nx.topological_sort(nx_g1))
print(list_tpsorted1)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
fig, npar_axval = plt.subplots(1, 1, figsize=(4, 4));npar_axval.set_axis_off();nx.draw_networkx(nx_g1, ax=npar_axval)

### クリークの列挙（Bron-Kerbosch アルゴリズム）

NetworkXグラフオブジェクト `nx_g1` による無向グラフの極大クリークを全て求めるには以下の様にします。

---
```Python
nx.find_cliques(nx_g1)
```
---

この関数の返り値は、全ての極大クリーク（を表す点集合によるリスト）を生成するジェネレータです。

ジェネレータはリストに変換したり、for文の `in` の後ろで使うことが出来ます。

実行してみます。

In [None]:
nx_g1 = nx.Graph()
list_adjlist2 = [[1, 2, 3], [0, 4, 5, 6, 7], [0, 3, 5], [0, 2, 5, 6, 7], [1, 5, 7], [1, 2, 3, 4, 7], [1, 3], [1, 3, 4, 5]]
for node1 in range(0, len(list_adjlist2)):
    for node2 in list_adjlist2[node1]:
        nx_g1.add_edge(node1, node2)
#極大クリークを生成するジェネレータ
gen_cq1 = nx.find_cliques(nx_g1)
list_cliques = list(gen_cq1) # ジェネレータをリストに変換する
print(list_cliques)# [[1, 0], [1, 4, 5, 7], [1, 6], [2, 3, 0], [2, 3, 5], [3, 6], [3, 7, 5]]

In [None]:
#ジェネレータは一度使うと再度作り直す必要があります
#for cq1 in gen_cq1:
#    print(cq1) #何も表示されない
gen_cq1 = nx.find_cliques(nx_g1)
for cq1 in gen_cq1:
    print(cq1)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
fig, npar_axval = plt.subplots(1, 1, figsize=(4, 4));npar_axval.set_axis_off();nx.draw_networkx(nx_g1, ax=npar_axval)

### 各点を含む三角形の数

NetworkXグラフオブジェクト `nx_g1` による無向グラフの各点が幾つの三角形に含まれるか調べるには以下の様にします。

---
```Python
nx.triangles(nx_g1)
```
---

この関数の返り値は、点の名前をキー、対応する値をその点を含む三角形とした辞書です。

実行してみます。

In [None]:
nx_g1 = nx.Graph()#無向グラフにしか使えない
nx_g1.add_edge(0, 1)
nx_g1.add_edge(1, 2)
nx_g1.add_edge(2, 0)
nx_g1.add_edge(1, 3)
nx_g1.add_edge(3, 0)
nx_g1.add_edge(3, 4)
nx_res = nx.triangles(nx_g1)
print(nx_res)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
fig, npar_axval = plt.subplots(1, 1, figsize=(4, 4));npar_axval.set_axis_off();nx.draw_networkx(nx_g1, ax=npar_axval)

この値を使えば三角形が幾つこのグラフに含まれるか求めることが出来ます。

`nx.triangles` の第2引数として頂点名を指定すると、その頂点を含む三角形の数だけを求めることが出来ます。

In [None]:
nx_res = nx.triangles(nx_g1, 0)
print(nx_res)
nx_res = nx.triangles(nx_g1, 3)
print(nx_res)
nx_res = nx.triangles(nx_g1, 4)
print(nx_res)