<a href="https://colab.research.google.com/github/vitroid/PythonTutorials/blob/master/2%20Advanced/090Graph.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# グラフ理論

2つの構造の近さや同一性は、幾何学的な形で(=座標で)直接比較するよりも、つながり方(=ネットワークトポロジー)で表現したほうがわかりやすい場合がある。化学の分子式はつながり方の表現方法であり、ネットワークでの表現に向いている。

また、幾何学情報が実数の情報であるのに対し、ネットワークの情報は整数である。整数であれば、同一か否かの判定が容易で、誤差を生じない。また計算機のアーキテクチャにも非常によくなじむ。

グラフ理論はEulerによる一筆描きの考察から生まれたと言われている。

The similarity or identity of two structures is sometimes easier to understand when expressed in terms of the way they are connected (=network topology) rather than by directly comparing them geometrically. Molecular formulas in chemistry express the way atoms are connected by chemical bonds, and are suited for expression in networks.

Also, geometric information is real number information, whereas network information is digital (discrete). It is easy to determine whether they are identical or not, and no error occurs. It also fits very well into the architecture of computers.

It is said that graph theory was born from Euler's consideration of a single stroke.

![](https://upload.wikimedia.org/wikipedia/commons/5/5d/Konigsberg_bridges.png)
![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/91/7_bridges.svg/200px-7_bridges.svg.png)
![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/96/Königsberg_graph.svg/200px-Königsberg_graph.svg.png)

> Königsbergの7つの橋の問題「このプレーゲル川に架かっている7つの橋を2度通らずに、全て渡って、元の所に帰ってくることができるか。ただし、どこから出発してもよい。」(Wikipedia: Seven Bridges of Königsberg)

この問題は、橋の位置や川の流れ方といった、空間情報(幾何情報)がなくても、陸地と陸地の間の隣接関係(トポロジー情報)だけで答えをみつけることができる。

『「つながり方」に着目して抽象化された「点(頂点)とそれをむすぶ線(辺)」の概念がグラフであり、グラフが持つ様々な性質を探求するのがグラフ理論である。』(Wikipedia: グラフ理論)

ひと筆書き、あみだくじなど、グラフの性質(トポロジー)を使った遊びは多数ある。

## グラフ理論の基礎

辺$e$は必ず2つの頂点を結ぶ。以下 $e(i,j)$ あるいは $e(i\rightarrow j)$ と表記する。一方、1つの頂点$v$には0本以上の辺が連結する。1つの頂点に連結する辺の本数を、頂点の**次数**と呼び$d(v)$で表わす。有向グラフの場合には、**入次数**と**出次数**の区別がある。次数0の頂点を**孤立点**と呼ぶ。

1つの頂点につながる辺は互いに**隣接**しているという。1つの辺の両端の頂点は互いに**隣接**していると言う(?)

辺には矢印を描く場合と描かない場合がある。辺が矢印である(辺が方向性を持つ、有向辺)グラフを有向グラフ、すべての辺が矢印でない(無向辺)グラフを**無向グラフ**と呼ぶ。有向グラフは双六を想像すると良い。それぞれのコマから進める方向は決まっていて、逆行は許されない。通常、ひとつのグラフで有向辺と無向辺を混在して使うことはない。また、無向グラフの辺$e(i,j)$を2本の有向辺$e(i\rightarrow j)$と$e(j\rightarrow i)$に置きかえて、等価な有向グラフを作ることができる。 道路は一方通行があるので、有向グラフで表現される。日本の鉄道路線はほぼ無向グラフで表わせるが、わずかに例外がある。

それぞれの辺に**重み**(コスト)を付与することがある。重みが付いているグラフを**重み付きグラフ**と呼ぶ。重み付きグラフは、反応流束を計算したり、物資の輸送容量を計算する場合に多用する。頂点にも重みを与えることがある。

頂点iから頂点jまで 隣接する辺をつたって (有向グラフの場合は辺の向きに沿って) たどりつける場合、その頂点と辺の系列を**歩道**,walkと呼ぶ。
そのうち、すべての辺が異なるものを **路** , trailと呼ぶ。
さらに、すべての頂点が異なるものを **パス** ,path、
始点と終点が同じ頂点であるパスを **循環** cycle( **巡回路** 、**環路** )と呼ぶ。


2頂点間の最短経路における辺数を**距離** distanceと呼ぶ。 グラフの最大頂点間距離を**直径** diameterと呼ぶ。

頂点 $i$ と $i$ をつなぐ(つまり出発点に戻ってくる)辺を**ループ** *loop*と呼ぶ。

頂点 $i$ から $j$ への辺が複数ある場合、それらを**多重辺**と呼ぶ。

ループも多重辺も持たないグラフを**単純グラフ**と呼ぶ。

無向グラフが**連結**であるとは、グラフの任意の2つの頂点の間をつなぐ経路が存在することを言う。非連結なグラフは孤立した2つ以上の連結なグラフの集まりである。(有向グラフの場合には、連結であっても、任意の頂点から頂点に行けるとは限らない)

どの頂点も次数が同じグラフのことを**正則グラフ**と呼ぶ。また、すべての異なる頂点対の間に辺がある正則グラフのことを**完全グラフ**と呼ぶ。立方体グラフは3-正則グラフ(すべての頂点が次数3のグラフ)、四面体グラフは完全グラフ$K_4$である。

頂点のうち $n$ 個を白、残りの $m$ 個を黒で塗りわけた時に、白同士、黒同士を結ぶ辺を持たないグラフを**二部グラフ**と呼ぶ。すべての白と黒の組みあわせの間に辺を持つグラフを**完全二部グラフ** $K_{n,m}$と呼ぶ。


The edge $e$ always connects two vertices. It is denoted $e(i,j)$ or $e(i\rightarrow j)$. The number of edges connected to a vertex $v$ is called the **degree** of the vertex and is denoted by $d(v)$. For directed graphs, there is a distinction between **in-degree** and **out-degree**. A vertex of degree 0 is called an **isolated vertex**.

Edges leading to one vertex are said to be **adjacent** to each other; vertices at both ends of one edge are said to be **adjacent** to each other (?).

An edge may or may not have an arrow drawn on it. A graph whose edges have arrows (directed edges) is called a directed graph or a *digraph*; a graph whose edges do not all have arrows (undirected edges) is called an **undirected graph**. The direction of progression from each frame is fixed, and no retrogression is allowed. Usually, directed edges and undirected edges are not mixed in a single graph. We can also replace the edge $e(i,j)$ of an undirected graph with two directed edges $e(i\rightarrow j)$ and $e(j\rightarrow i)$ to make an equivalent digraph. Roads are represented as directed graphs because they have one-way traffic. Japanese railroad lines are almost always represented as undirected graphs, with a few exceptions.

Each edge may be assigned a **weight** (cost). A graph with weights is called a **weighted graph**. Weighted graphs are often used to calculate reaction fluxes or to calculate the transport capacity of goods. Sometimes weights are given to vertices as well.

If we trace from vertex i to vertex j along adjacent edges (or along the direction of the edges in the case of a directed graph), the sequence of vertices and edges is called a **walk**.
If all of them have different edges, they are called **trail**.
Furthermore, a **path** is one in which all vertices are different,
A path whose starting and ending vertices are the same is called a **cycle**.

The number of edges in the shortest path between two vertices is called **distance**. The maximum distance between vertices of a graph is called **diameter**.

The edge connecting vertices $i$ and $i$ (i.e., returning to the starting point) is called a **loop**.

If there is more than one edge from vertex $i$ to $j$, they are called **multiple edges**.

A graph with neither loops nor multiple edges is called a **simple graph**.

An undirected graph is **connected** if there exists a path connecting any two vertices of the graph. A disconnected graph is a collection of two or more isolated connected graphs. (In the case of directed graphs, it is not necessarily possible to go from any vertex to any vertex, even if they are connected.)

A graph in which every vertex has the same degree is called a **regular graph**. Also, a regular graph with edges between every distinct vertex pair is called a **complete graph**. A cube graph is a 3-regular graph (all vertices have degree 3) and a tetrahedral graph is a complete graph $K_4$.


![K3,3](https://upload.wikimedia.org/wikipedia/commons/thumb/1/11/Complete_bipartite_graph_K3%2C3.svg/200px-Complete_bipartite_graph_K3%2C3.svg.png)
![K5](https://upload.wikimedia.org/wikipedia/commons/thumb/6/6a/Complete_Graph_K5_with_labels.svg/200px-Complete_Graph_K5_with_labels.svg.png)
![Cube graph](https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Graph_isomorphism_b.svg/200px-Graph_isomorphism_b.svg.png)
![Tetrahedral graph K4](https://upload.wikimedia.org/wikipedia/commons/1/1f/Graphe_complet_K4.png)

> 典型的なグラフの例: 左から完全2部グラフ$K_{3,3}$、完全グラフ$K_5$, 立方体グラフ、四面体グラフ$K_4$。なお、グラフを平面に描く時には、辺を自由に曲げても構わない。

> Examples of typical graphs: from left to right: complete bipartite graph $K_{3,3}$, complete graph $K_5$, cube graph, tetrahedral graph $K_4$. Note that when the graph is drawn on a plane, the edges may be bent freely.


**部分グラフ**：グラフ$G$から、頂点と辺を抜きだして作ったグラフ

**真部分グラフ**: 部分グラフのうち、$G$そのもの以外。

**n連結グラフ**: $n$個の頂点をうまく選んで取り除くと分割されてしまう($n$頂点切断)ようなグラフ。

2つのグラフ$G$と$G’$が同じ個数の頂点を持ち、同一の辺のつながりかたをしている(グラフ$G$の頂点のラベルを書き換えることで、グラフ$G’$に完全に重ねることができる)時、それらは**同型** *isomorphic*であるという。

**Subgraph**: A graph $G$ with vertices and edges taken from $G$.

**true subgraph**: a subgraph other than $G$ itself.

**n-connected graph**: a graph such that it is partitioned ($n$-vertex truncation) if $n$ vertices are well chosen and removed.

When two graphs $G$ and $G'$ have the same number of vertices and the same edge connection (they can be completely superimposed on a graph $G'$ by rewriting the vertex labels of the graph $G$), they are **isomorphic**.


![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/9a/Graph_isomorphism_a.svg/200px-Graph_isomorphism_a.svg.png)
![](https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Graph_isomorphism_b.svg/200px-Graph_isomorphism_b.svg.png)

> 同型グラフの例。 An example of graph isomorphism.

## NetworkX

ネットワークをPythonで扱うのは、他の言語を使う場合に比べてかなり容易だが、グラフ理論のライブラリNetworkXを利用すると、さらに簡単になる。(ほかにSage http://doc.sagemath.org/html/en/index.html というのもあるらしい)

Working with networks in Python is considerably easier than with other languages, but it is even easier with NetworkX, a graph theory library. (An alternative is Sage http://doc.sagemath.org/html/en/index.html)

NetworkXで、以下のグラフを扱ってみよう。

Let's try to make the following graphs with NetworkX.

![](https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Graph_isomorphism_b.svg/200px-Graph_isomorphism_b.svg.png)

`Graph()`は無向グラフを生成する。

`Graph()` prepares an undirected graph.

In [None]:
import networkx as nx

g = nx.Graph([[1,2],[2,3],[3,4],[4,1],[1,5],[5,6],[6,2],[6,7],[7,3],[7,8],[8,4],[8,5]])
nx.draw_networkx(g, with_labels=True)

もう一方のグラフも作ってみよう。

Another graph.

![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/9a/Graph_isomorphism_a.svg/200px-Graph_isomorphism_a.svg.png)

In [None]:
import networkx as nx

h = nx.Graph([["a","g"],["b","h"],["c","i"],["d","j"],["a","h"],["a","i"],
              ["b","g"],["b","j"],["c","g"],["c","j"],["d","h"],["d","i"]])
nx.draw_networkx(h, with_labels=True)

これらは同型グラフですよね?

Are they isomorphic?

In [None]:
nx.is_isomorphic(g,h)

同型性をチェックするプログラムは自分で書けないこともないが、かなり面倒で、慎重なチェックが必要なので、NetworkXを使ったほうが良い。なお、厳密な同型性チェックに要する時間は、頂点の数の指数に比例するため、グラフが大きくなるとかなり難しくなる。NetworkXには、近似的かつ高速に同型性をチェックするいくつかのアルゴリズムもある。

It is not impossible to write your own program to check isomorphisms, but it is quite tedious and requires careful checking, so it is better to use NetworkX. NetworkX also has several algorithms for approximate and fast isomorphism checking.

## 平面性 / Planarity
平面グラフとは、平面上に描いた時に、辺が交わらないようにできるグラフのこと。

A planar graph is a graph that, when drawn on a plane, can be made so that the edges do not intersect.

上のグラフは一見すると辺が交わりまくっているが、下のように変形することで交わりなく平面に描けるので、これらは平面グラフと言える。

At first glance, the graphs above have intersecting edges, but by transforming them as shown below, they can be drawn in a plane without intersections, so these graphs can be said to be planar.

![](https://upload.wikimedia.org/wikipedia/commons/thumb/9/9a/Graph_isomorphism_a.svg/200px-Graph_isomorphism_a.svg.png)


![](https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Graph_isomorphism_b.svg/200px-Graph_isomorphism_b.svg.png)


一般に、正多面体グラフはすべて平面的である。フラーレンも、ひとつのリングを大きくひろげれば平面に射影できる。ちなみに、化学物質の命名法は、立体分子は平面化したあとで環を数えることになっている(らしい)ので、例えば立方体分子cubaneの正式名はPentacyclo[4.2.0.0<sup>2,5</sup>.0<sup>3,8</sup>.0<sup>4,7</sup>]octaneとなり、5個の環を持つオクタンと呼ぶ。

In general, all regular polyhedral graphs are planar. Fullerenes can also be projected onto a plane if one ring is greatly expanded. In the nomenclature of chemical substances, three-dimensional molecules are supposed to count rings after planarization, so for example, cubane, a cubic molecule, is officially called Pentacyclo[4.2.0.0<sup>2,5</sup>.0<sup>3,8</sup>.0<sup>4,7</sup>]octane, which has five rings.

平面グラフに関しては、非常に重要な定理がある。

Here is a very important theorem on the planarity.

### Kuratowskiの定理 / Kuratowski's theorem
グラフGが平面的グラフであるための必要十分条件は、Gが$K_5$と$K_{3,3}$のどちらの細分も含まないことである。

Kuratowski's Theorem states that a graph is planar if and only if it contains no subdivision of $K_5$ or $K_{3,3}$.

![K_5](https://upload.wikimedia.org/wikipedia/commons/thumb/2/2d/4-simplex_graph.svg/231px-4-simplex_graph.svg.png)

$K_5$

![K_3,3](https://upload.wikimedia.org/wikipedia/commons/thumb/1/11/Complete_bipartite_graph_K3%2C3.svg/317px-Complete_bipartite_graph_K3%2C3.svg.png)

$K_{3,3}$

与えられたグラフが平面的かどうかを自力で判定するのはかなり大変だが、もちろんNetworkXには判定関数がある。

It is quite difficult to determine whether a given graph is planar or not, but of course NetworkX has a function.

In [None]:
nx.algorithms.planarity.check_planarity(g)

### 距離 / Distance

立方体グラフは整いすぎて面白くないので、もう少し複雑なグラフを準備してみる。ここでは、球を格子に切ったようなグラフを作る。

We prepare a carve a sphere from a 3-D grid graph to make a spheric graph.

In [None]:
import numpy as np

vertices = np.mgrid[-2:3, -2:3, -2:3].astype(float)
# make them coordinates
vertices = vertices.reshape(3,-1).T

# Collect the vertices which is within 2.1 from the origin.
vertices = vertices[np.linalg.norm(vertices, axis=1) < 2.1]
vertices

In [None]:
import networkx as nx

G = nx.Graph()
N = len(vertices)
for i in range(N):
    for j in range(i):
        v1 = vertices[i]
        v2 = vertices[j]
        d = v1-v2
        L = d@d  # 内積
        # 隣接しているなら内積は1
        if L == 1:
            G.add_edge(i,j)

nx.draw_networkx(G, with_labels=True)

グラフ`h`の頂点10と頂点32の最短経路は

In [None]:
nx.shortest_path(G,10,32)

In [None]:
nx.shortest_path_length(G,10,32)

In [None]:
nx.has_path(G,10,32)

直径とは、グラフのなかの最長路の長さのこと。

In [None]:
nx.diameter(G)

ほかにも、半径や中心や離心率や周といった指標もある。

Other indices include radius, center, eccentricity, and circumference.

ある頂点vの離心率とは、vからほかの頂点までの最大距離のこと。

The eccentricity of a vertex v is the maximum distance from v to any other vertex.

In [None]:
nx.eccentricity(G, 1)

半径とは、グラフの離心率の最小値。

Radius is the minimum value of the graph's eccentricity.

In [None]:
nx.radius(G)

中心とは、離心率が半径に一致するような頂点のこと。(一点とは限らない)

The center is the vertex such that the eccentricity matches the radius. (Not necessarily a single point.)


In [None]:
nx.center(G)

In [None]:
vertices[16]

確かに中心だ。

Certainment.

> ルービックキューブのとりうる面の状態(43252003274489856000通り、4325京通り)それぞれをグラフの頂点とし、一回の操作でたどりつける状態を辺で結んだグラフを考える。任意の状態から、完全状態(すべての面がそろった状態)に戻すのに最低何回操作する必要があるか、という問題は、このグラフの半径を求める問題である。Googleは2010年に半径が20であることを証明した。 https://www.cube20.org

> Consider a graph with each of the possible states of the faces of the Rubik's cube (43252003274489856000 possible states) as a vertex of the graph, and the states that can be reached with a single operation connected by an edge. The least number of operations required to return from an arbitrary state to a perfect state (all surfaces aligned) is equivalent to find the radius of this graph.  
Google proved in 2010 that the radius is 20. https://www.cube20.org


もっと複雑なグラフを考える。例えば、20個の頂点の間に、ランダムに辺を30本つないだグラフ。

Consider a more complex graph. For example, a graph with 30 random edges connected between 20 vertices.

In [None]:
import random
import itertools as it

H = nx.Graph()
nodes = range(20)

for node in nodes:
    H.add_node(node)

pairs = [pair for pair in it.combinations(nodes, 2)]

for j,k in random.sample(pairs, 30):
    H.add_edge(j,k)

nx.draw_networkx(H, with_labels=True)

辺の数が少ないと、ひとつながりのグラフにならない場合もある。つながったグラフそれぞれを成分(component)と呼ぶ。連結なグラフとは、成分が1つしかないグラフのことである。

If the number of edges is small, the graph may not be connected. Each connected clusters are called a component. A connected graph is a graph with single component.

In [None]:
nx.is_connected(H)

それぞれの成分に含まれる頂点は?

Member nodes in each component.

In [None]:
for x in nx.connected_components(H):
    print(x)

それぞれの成分に対して、簡単な分析をしてみよう。

Let's analyze them.

In [None]:
from matplotlib import pyplot as plt

for members in nx.connected_components(H):
    subg = H.subgraph(members)
    nx.draw_networkx(subg, with_labels=True)
    plt.show()

    # check_planarity returns two values. We need the first one only.
    isplanar, e = nx.algorithms.planarity.check_planarity(subg)
    if isplanar:
        print("A planar graph.")
    else:
        print("A non-planar graph.")
    print("Diameter", nx.diameter(subg))

## Exercise 1

JRの路線は、(今のところ)連結で、JRのどの駅へも、JRの列車だけで行ける。

しかし、私鉄は連結でないところも多い。例えば、名鉄には瀬戸線のように、名鉄本線と全くつながっていない支線がある。

日本最大の私鉄である近鉄もまた、歴史的経緯によりとても複雑な路線を持つ。近鉄の路線を、グラフ理論を使ってざっと分析してみよう。(http://travelstation.tokyo/station/kinki/kintetsu/)

近鉄の駅名は`kintetsu.txt`に以下のような形で入っている。連続している駅名は、隣接していることを意味し、空行は隣接していないことを意味する。

JR (Japan Rail) lines are (so far) consolidated, and any JR station can be reached by JR trains only.

However, many private railways are not connected. For example, Meitetsu has branch lines, such as the Seto Line, that are not connected to the Meitetsu Main Line at all.

Kintetsu, Japan's largest private railway company, also has very complicated lines due to its historical background. Let's take a quick analysis of Kintetsu's lines using graph theory. (http://travelstation.tokyo/station/kinki/kintetsu/)

Kintetsu station names are contained in `kintetsu.txt` as follows. Consecutive station names mean that they are adjacent, and empty lines mean that they are not adjacent.

とりあえず読んでみる。

Read it anyway.

In [None]:
# ファイルをcolabにとりこむ。
! wget https://raw.githubusercontent.com/vitroid/PythonTutorials/2020m0/2%20Advanced/kintetsu.txt

file = open("kintetsu.txt")

stations = [station for station in file.readlines()]
stations

行末の最後の文字(`\n`)を除きたいので、`strip()`関数を追加する。

Add a strip() function to remove the newline characters.

In [None]:
file = open("kintetsu.txt")
stations = [station.strip() for station in file.readlines()]
stations

隣りあう駅をedgeでつなぐ。

Connect the adjacent stations by an edge.



In [None]:
# Add feature to show Japanese characters in a plot
!pip install japanize-matplotlib


In [None]:
import networkx as nx
from   matplotlib import pyplot as plt
import japanize_matplotlib
japanize_matplotlib.japanize()

K = nx.Graph()
for i in range(len(stations)-1):
    # adjacent pairs of stations in the list.
    s1, s2 = stations[i:i+2]
    if s1 != "" and s2 != "":
        K.add_edge(s1, s2)


# prepare plot
fig = plt.figure(figsize=(10,10), dpi=150)
plt.title('Kintetsu', fontsize=10)
plt.axes().set_aspect('equal', 'datalim')
# Set up for a graph with Japanese labels
nx.draw_networkx(K, 
                 node_color='#ccf', 
                 node_size=20, 
                 with_labels=True, 
                 font_size=5, 
                 font_family='IPAexGothic')
fig.savefig("kintetsu.pdf")

さっきのコードをそのまま使って、分析。

Reuse the code to analyze it.

In [None]:
for members in nx.connected_components(K):
    subg = K.subgraph(members)
    plt.figure(3,figsize=(10,10), dpi=150) 
    # Set up for a graph with Japanese labels
    nx.draw_networkx(subg, 
                    node_color='#ccf', 
                    node_size=20, 
                    with_labels=True, 
                    font_size=5, 
                    font_family='IPAexGothic')
    plt.show()

    # check_planarity returns two values. We need the first one only.
    isplanar, e = nx.algorithms.planarity.check_planarity(subg)
    if isplanar:
        print("A planar graph.")
    else:
        print("A non-planar graph.")
    print("Diameter", nx.diameter(subg))

3つの成分があり、主成分の直径(一番遠い駅の間)は68駅離れているようです。どのグラフも平面グラフです。(平面グラフでない路線図を持つ鉄道は日本にあるでしょうか?)

生駒山上へ行く路線はロープウェイのようですね。

There are three components, and the diameter of the main component appears to be 68 stations away. All graphs are planar. (Is there any railroad company in Japan that has a route map that is not a planar graph?)

The shortest linear line seems to be a ropeway to Mt. Ikoma.

68駅離れているのはどの駅とどの駅でしょうね?

Which pair of stations are 68 steps away?

## Exercise 2

オクタンには、直鎖のn-オクタンのほかに、多数の異性体があります。立体異性は別として、枝分かれ方の違うすべての異性体を列挙すると、いくつあるでしょうか。

これを考えるには、まずメタンの異性体からはじめます。メタンには異性体はありません(それ自身を数えて、異性体の数は1とします)。

ではエタンは? エタンも自明ですね、プロパンも自明です。そして、ブタンになってはじめて、イソブタンが異性体として出現します。プロパンに、新たに炭素を追加する時に、どこに付けるかで構造が違ってきます。

その先も同様です。ペンタンの異性体は、ブタン(とその異性体)のどこに炭素を追加するかで、いろんな構造になります。

この手順をNetworkXを使ってプログラム化してみましょう。

Octane has numerous isomers in addition to the linear n-octane. Aside from stereoisomerism, how many isomers can we list for all the different ways of branching?

To answer this question, let us start with the isomers of methane. Methane has no isomers other than itself (counting itself, the number of isomers is 1).

Ethane and propane also has single isomer. And isobutane is the smallest isomer in the alkane family. When you add a new carbon to propane, the structure differs depending on where you attach it.

The same is true beyond that. The pentane isomer can have many different structures depending on where you add the carbon to butane (and its isomers).

Let's program this procedure using NetworkX.


ひとまず水素は無視し、炭素の鎖だけをグラフで表すことにします。

First of all, we only consider the carbon chain and ignore the hydrogens.

In [None]:
import networkx as nx

ethane = nx.Graph()
ethane.add_edge(0,1)
nx.draw_networkx(ethane, with_labels=True, font_size=10)


与えられたグラフに、節点を一つ追加したグラフを生成する関数を作ります。エタンの場合には、0番の節点に追加するのか、1番かの2択ですが、結果は同じ形(位相同形)のグラフになります。でも ひとまずこの関数はそんなことを気にせず、全部別ものとして返すことにします。

Create a function that generates a graph with one additional node added to the given graph. In the case of ethane, we have two choices: add to node 0 or 1, but the result will be a graph of the same shape (isomorphism). But for the moment, this function doesn't care about that and returns them all as separate graphs.

In [None]:
from matplotlib import pyplot as plt

def add_node(g):
    # Number of nodes == the label for the next vertex
    N = len(g)
    # An empty list for new candidate graphs
    newgraphs = []
    # for each node in g,
    for node in g:
        # make a copy of g not to destroy g
        newg = g.copy()
        # Add an edge to newg
        newg.add_edge(node, N)
        # and store
        newgraphs.append(newg)
    # return all candidate graphs
    return newgraphs

In [None]:
propanes = add_node(ethane)

# each graph in propanes
for p in propanes:
    # draw it
    nx.draw_networkx(p, with_labels=True, font_size=10)
    plt.show()


ブタンに進む前に、明らかに同じ形のグラフは排除しておきましょう。NetworkXに手頃な関数があるとよかったのですが、ないようなので、自作します。

与えられたグラフのリストのうち、同形なものを除いていく関数です。

Before proceeding to Butane, let's eliminate graphs that are  isomorphic; I wish NetworkX had an affordable function, but it doesn't seem to exist, so I'll make my own.

This is a function that eliminates isomorphic graphs from a given list of graphs.

In [None]:
def anisomorphics(graphs):
    '''
    Make a set of anisomorphic graphs.
    '''
    # 
    aniso = []
    # for each graph in graphs,
    for g in graphs:
        for memb in aniso:
            if nx.is_isomorphic(g, memb):
                break
        # This "else" block is executed when the for loop ends without interruption.
        else:
            aniso.append(g)
    return aniso

In [None]:
A = anisomorphics(propanes)
for p in A:
    nx.draw_networkx(p, with_labels=True, font_size=10)
    plt.show()


1個になりました。では、次はブタンです。でも、その前に。

上で定義した、add_node関数は、引数に1つのグラフしか与えることができませんでした。でも、butaneの次のペンタンを作る場合は、butaneに複数の構造があるので、n-butaneとisobutaneそれぞれに対して、add_nodeして新しいpentane構造を作る必要があります。そこで、次のような関数を作ります。

Only one isomer for propane. Good. But wait.

The add_node function, defined above, could only give one graph as an argument. But if we want to create the next pentane after butane, we need to create a new pentane structure by add_node for each of n-butane and isobutane, since butane has multiple structures. So we create the following function.

In [None]:
def add_node_to_graphs(graphs):
    """
    Add a node to given set of graphs.

    Returns all possible graphs.
    """
    newgraphs = []
    for g in graphs:
        # add_node returns multiple graphs as a list
        # They are concatenated to newgraphs.
        newgraphs += add_node(g)
    return newgraphs

これで万全です。では、propanesからbutanesを作ってみましょう。

In [None]:
butanes = anisomorphics( add_node_to_graphs( propanes ) )
for b in butanes:
    nx.draw_networkx(b, with_labels=True, font_size=10)
    plt.show()


In [None]:
pentanes = anisomorphics( add_node_to_graphs( butanes ) )
hexanes = anisomorphics( add_node_to_graphs( pentanes ) )
heptanes = anisomorphics( add_node_to_graphs( hexanes ) )
octanes = anisomorphics( add_node_to_graphs( heptanes ) )

for o in octanes:
    nx.draw_networkx(o, with_labels=True, font_size=10)
    plt.show()


できた! と思ったけど、なんか変なのがいますね。5級炭素とか6級炭素は、さすがにありえないので、生じないようにする必要があります。

さて、どこに手を加えればいいでしょうか。

ある頂点に連結している辺の数のことを、頂点の次数(degree)と呼び、NetworkXではdegree()関数で調べることができます。次数が4の節点に、さらに炭素をくっつけようとするのを阻止しましょう。

Done! ... but there is something strange.... some carbons have 5th or 6th edges, which are indeed impossible, so we need to make sure it does not occur.

Now, where should we make the changes?

The number of edges connected to a vertex is called the degree of the vertex, which can be found in NetworkX with the `degree()` function. Let's stop trying to attach more carbon to a node with degree 4.

In [None]:
def add_node(g):
    """
    A new add_node function that does not try to add an edge to
    a vertex whose degree is 4.
    """
    N = len(g)
    newgraphs = []
    for node in g:
        newg = g.copy()
        # add this condition
        if newg.degree(node) < 4:
            newg.add_edge(node, N)
            newgraphs.append(newg)
    return newgraphs


そして再度実行。

In [None]:
pentanes = anisomorphics( add_node_to_graphs( butanes ) )
hexanes = anisomorphics( add_node_to_graphs( pentanes ) )
heptanes = anisomorphics( add_node_to_graphs( hexanes ) )
octanes = anisomorphics( add_node_to_graphs( heptanes ) )

for o in octanes:
    nx.draw_networkx(o, with_labels=True, font_size=10)
    plt.show()
len(octanes)

オクタンの異性体の数は? "octane isomers number"で[検索](https://www.google.com/search?q=octane%20isomers%20number)してみて下さい。

What is the number of isomers of octane? [Google it](https://www.google.com/search?q=octane%20isomers%20number).

## Practice

正多面体グラフは、上ででてきた立方体グラフ以外に4つあります。この4つを作成し、上と同じように表示・分析して下さい。

* 平面グラフかどうか
* 直径
* 正則グラフかどうか (すべての頂点の次数が同じかどうか)

There are four regular polyhedron graphs in addition to the cube graph above. Create these four and display and analyze them in the same way as above.

* Planarity
* Diameter
* Regularity (whether all vertices have the same degree or not)

(Note: NetworkX has functions to generate regular polyhedron graphs, but you can also build them by yourself.)
