<a href="https://colab.research.google.com/github/kameda-yoshinari/DataAlgo-UT/blob/main/DataAlgo_UT(008)_ShortestPath1N.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 4.2. １対Ｎの最短経路問題

ここではある頂点を開始頂点としたときの最短経路問題とそれを解くDijkstraのアルゴリズムについて学ぶ．

**いつもの約束**  
１つのコードセルだけの実行は Ctrl + Enter．  
エディタで「インデント幅（スペース）は4で表示」「行番号を表示」「インデントガイドを表示」．  
挿入図は Google Colaboratory 以外では見れない可能性あり．  
内部では日本語はUTF-8で表現されている．


# 準備

インスタンスに接続し起動する．  
下記の手順でGoogle Driveをマウントする．  
マウント先に移動し，作業フォルダとする．  
これによって，インスタンスがリセットされてもGoogle Drive内にファイルが保存されるようにする．

In [None]:
!echo "Google Driveをマウントします"
from google.colab import drive
drive.mount('/content/drive')

In [None]:
!echo "今回の作業用フォルダを作成しそこに移動します"
%cd /content/drive/My\ Drive/
%mkdir -p UT_DataAlgo/DA_008
%cd       UT_DataAlgo/DA_008
!ls
!echo "日本時間表示"
!rm /etc/localtime
!ln -s /usr/share/zoneinfo/Japan /etc/localtime
!date

本節での説明には，グラフ6を利用する．  
頂点数は8．無向グラフ．重みは全て正．  
自己ループ（ある頂点から同じ頂点への辺）の重みは 0 とする．  
プログラムの解析用に，グラフ7, グラフ8も用意しておく．  

グラフG7とG8も用意してある．グラフG7は有向グラフである．
G7とG8をノートに実際に描いてみてください（人間の脳はグラフを視覚的に理解することは得意である）．

なお、2つの頂点間の辺がないことをNCで表現する．  
NCは理想的には無限大である．  
残念ながら、C言語では無限を表現する良い方法がないため，代わりにNCにはかなり大きな数字を指定しておく．



![008-GraphG6](https://user-images.githubusercontent.com/45651568/119325594-fc232500-bcbb-11eb-80b4-f25270057bad.png)


In [None]:
%%writefile graph6.h
// 8 nodes, undirected, no loop, positive weight.
// NC means no edges.
// NC will be treated as "inifinity" on searching the shortest path.
#define N 8
#define NC 9999 // this big value means both no path and infinity
int edge[N][N] = {
//     0   1   2   3   4   5   6   7
	{  0,100, NC, NC,145,200, NC, NC}, // 0
	{100,  0, 23, NC, NC, 80, NC, 70}, // 1
	{ NC, 23,  0, 21, NC, 45, 37, NC}, // 2
	{ NC, NC, 21,  0, NC, NC, 18,  5}, // 3
	{145, NC, NC, NC,  0, 20, NC, NC}, // 4
	{200, 80, 45, NC, 20,  0,  2, NC}, // 5
	{ NC, NC, 37, 18, NC,  2,  0,  1}, // 6
	{ NC, 70, NC,  5, NC, NC,  1,  0}  // 7
};

In [None]:
%%writefile graph7.h
// 4 nodes, directed, positive weight.
// NC means no edges.
// NC will be treated as "inifinity" on searching the shortest path.
#define N 4
#define NC 9999 // this big value means no path
int edge[N][N] = {
//     0   1   2   3
	{  0, 10, NC, 40}, // 0
	{ NC,  0, NC, 20}, // 1
	{ NC, NC,  0, NC}, // 2
	{ NC, NC, NC,  0}, // 3
};

In [None]:
%%writefile graph8.h
// 12 nodes, directed, positive weight.
// NC means no edges.
// NC will be treated as "inifinity" on searching the shortest path.
#define N 12
#define NC 9999 // this big value means no path
int edge[N][N] = {
    { 0, 4,NC,NC, 3,NC,NC,NC,NC,NC,NC,NC},
    { 4, 0, 1,NC,NC,NC, 2,NC,NC,NC,NC,NC},
    {NC, 1, 0, 1,NC,NC,NC, 2,NC,NC,NC,NC},
    {NC,NC, 1, 0,NC,NC,NC,NC,NC,NC,NC,NC},
    { 3,NC,NC,NC, 0, 1,NC,NC, 1,NC,NC,NC},
    {NC,NC,NC,NC, 1, 0, 2,NC,NC, 2, 3,NC},
    {NC, 2,NC,NC,NC, 2, 0,NC,NC,NC, 3,NC},
    {NC,NC, 2,NC,NC,NC,NC, 0,NC,NC,NC,NC},
    {NC,NC,NC,NC, 1,NC,NC,NC, 0,NC,NC,NC},
    {NC,NC,NC,NC,NC, 2,NC,NC,NC, 0,NC,NC},
    {NC,NC,NC,NC,NC, 3, 3,NC,NC,NC, 0, 1},
    {NC,NC,NC,NC,NC,NC,NC,NC,NC,NC, 1, 0}
};

# １対Ｎの最短経路問題を解くDijkstraのアルゴリズム

**内容**

グラフとして重み付き有向グラフを考える．辺に重みとして数値が付与されている．
本節では，辺の重みは正値とする．
隣接する頂点aと頂点bの間の辺の重みをedge(a,b)で表現する．edge(a,b)は正値である．  

最短経路問題とは，与えられた重み付き有向グラフにおいて，指定された２頂点間を結ぶ道を考える時，最も重みの軽い道の重みを求める問題である．ここでは，頂点Aから頂点Bへの「道」には，同じ頂点は高々一度しか現れないものとする．ある道（経路）が与えられた時，その辺の重みの合計のことを経路（道）の重み或いは経路値と呼ぶ．

指定された２頂点間に道がない場合は，その経路値は無限大として扱う．  

解を示す道（経路）ももちろん求めるべきである．  


一般に，指定された２頂点について最短経路問題を解く計算時間と，開始頂点を指定してその他すべての頂点への（１対Ｎの）最短経路問題を解く計算時間はオーダー表現において同じであるとされている．（到着頂点を指定してその他すべての頂点を開始頂点にした場合でも同じ．）

**Dijkstraのアルゴリズム**

１対Ｎの最短経路問題を解くアルゴリズムとして，Dijkstra（ダイクストラ）のアルゴリズムを学習する．

Dijkstraのアルゴリズムは，貪欲法(Greedy algorithm)の１つとして知られる．

>**（貪欲法）**
>
>貪欲法の定義の詳細は本授業では省くが，簡単に言えば，解を求める途中で，その時点で最適と思われる方に進む方法である．
>
>例えば，街で目的地の高い建物が見えているとき，その方向に向かって真っすぐ進む方法がこの一例として考えられる．途中に壁があったり一方通行があったりすると，真っすぐ進むのはかえって結果的に遠回りになるかもしれない．しかし，それはあとになってしかわからないことだと割り切ってその場では真っすぐ進むことはよくあるだろう．人間の普段の行動によく似ているとも言える．
>
>貪欲法に基づくアルゴリズムでは，一般には最適解を得る保証はない．しかしながら，Dijkstraのアルゴリズムは数少ない例外である．
すなわち，Disktraのアルゴリズムは貪欲法でありながら，このアルゴリズムによって最短経路問題の最適解が得られることが証明されている．

以下では，最短を最小と置き換えて説明する．

1. 開始頂点から開始頂点への経路値は0とする．開始頂点から他の頂点の経路値については全て無限大とする（これは現在たどり着けないという意味ではなく，経路値についてまだ全く未確認であるという状況を表していると考えると分かりやすいだろう）．
2. 全ての頂点を未処理頂点集合Uの要素とする．
3. Uの中で経路値が最小の頂点kを選ぶ．（1.の設定から，初めて3.に来たときは開始頂点が選ばれることになる．）
4. 頂点kをUから削除する．
5. Uの中で頂点kに隣接する頂点について，頂点kを経由して到達する経路値のほうが小さければ，その頂点の経路値を更新する．
6. 未処理頂点集合Uが空集合になるまで，3.から5.を繰り返す．
7. 各頂点の経路値がそのまま開始頂点からの最小経路値となる．

Dijkstraのアルゴリズムは直感的な解決方法に似ていると感じはしないだろうか．順を追って実際にグラフ6で処理を実行してみればその感覚はさらに強まるだろう．

グラフ6での処理進行については，次図を参照されたい．
図中において，頂点枠内の数字は経路値を示している．
三段になっている各小図は，上段が3.，中段が4.と5.の新しい経路値の計算まで，下段が5.の経路値の更新に相当している．
中段では，新しく計算できるようになった経路と頂点を破線で示し，その経路値を頂点枠中の下側に示している．5.で小さい方の値を選択することで下段の状態になる．
辺の表示が有向辺に切り替わるのは，経路値を実現する経路を示すためである．
開始頂点0から見て，曲線の外側が未処理頂点集合Uを表している．

**実装**

残念ながら，Dijkstraのアルゴリズムは，C言語での実装に不向きなものの一つである．

その理由は，処理に集合を用いていることである．C言語の仕様には集合を直接扱える構造がない．  
（深さ優先探索の時はスタック構造が関数呼び出しに埋め込まれていたことを思い出そう）

そのため，集合を扱う関数群を用意してから，アルゴリズムの実装に取り掛かるという２段構成が必要になる．

**備考（雑談）**

私が学生時代に諸君らと同じように初めてDijkstraのアルゴリズムを習った時，教えて下さった先生はfortran言語を使った数値解析が専門であった．
その先生が，"Dijkstra"と板書されたときにやおらこちらに向かって「すごくいい名前ですよね？気に入っているんです」とおっしゃられた．
何を言い出したのだろう，と不思議に思った．
すると，先生は，「名前に"i","j","k"がこの順に入っている．これはプログラミングの申し子のような名前ですごくいいと思うんです」と．
それから30年近く経つが，その時の先生のとても楽しそうな顔が今でも忘れられない．
ああ，本当にこの先生はこういうことが好きなのだな，大学の先生とはこういう方なのだな，と強く思ったことを今でも覚えている．
だからなんだと言われると困るが，不思議な縁で大学の教員となった今，こうしたことを伝えておこうと思うのである．
（プログラミングでループ変数は伝統的に i を用いる．これは iteration/繰り返し の頭文字である．２重ループ，３重ループとなると，それに続くアルファベットを使うのが伝統であるので，３重ループではi,j,kが順に使われることが多い．数値解析などでは多重ループがよく出てくるので，i,j,kを連続して使うことはままある）

![da2024-figc-c_s08](https://github.com/kameda-yoshinari/DataAlgo-UT/assets/45651568/b5a2f07c-8aab-4537-8d2b-0d95c597366f)

---

![da2024-figc-c_s09](https://github.com/kameda-yoshinari/DataAlgo-UT/assets/45651568/50258d82-90b4-4efc-ae29-f7f76390a259)

---

![da2024-figc-c_s10](https://github.com/kameda-yoshinari/DataAlgo-UT/assets/45651568/f7e6f4e7-a700-473b-9318-fbed5da2640d)

---

![da2024-figc-c_s11](https://github.com/kameda-yoshinari/DataAlgo-UT/assets/45651568/5cc92c6a-f8c2-4959-804c-a040905419fd)




# Dijkstraのアルゴリズムに基づくプログラム

**目標**

正値重みの辺で構成される有向グラフにおいて，ある頂点を開始頂点としたときの各頂点への最小経路値とその経路を求めるＣプログラムを作成する．

**説明**

Dijkstraのアルゴリズム本体は一つのユーザ定義関数 find_shortest_diskstra() で実装する．集合操作を別ソースファイルで記述する．
集合操作については，これまでに学習した QueueLib / StackLib と同じ要領で SetLib として作成する．

トップダウンプログラミングに馴染めるよう，今回は SetLib_J.h を先に書き，必要なプログラムを実際に実装する形を取ってみよう．

1. SetLib_J.h ... 関数のプロトタイプ宣言．各関数に必要とされる集合操作を説明しておく．どのような集合操作が必要かは，Dijkstraのアルゴリズムを精査して抜き出す．
2. SetLib_J.c ... 各関数の実体を実装する．
3. shortest-dijkstra_J.c ... 引数を解析するmain()関数，上述のfind_shortest_dijkstra() の他，経路値情報を表示する関数も用意する．

**コード**

SetLib_J.h でプロトタイプ宣言を並べたあと，そのファイルをコピーして SetLib_J.c とし，関数名・引数に続いて実際にそれぞれの関数についてのプログラム記述していく形が取れれば，トップダウンプログラミングが出来ていると言えよう．

**備考**

集合操作にどのような関数が必要か見通すためには，Dijkstraのアルゴリズムを正確に理解できていることが必須である．

In [None]:
%%writefile SetLib_J.h
// Set management
// 2020/05/26 kameda[at]ccs.tsukuba.ac.jp

// １つの集合のみ扱う．
// その集合の要素は非負の整数とする．

// 集合の初期化
// 引数：確保する要素数
// 返値：成功...確保した整数配列のポインタ, 失敗...NULL
int *initset(int );

// 集合への追加
// 指定された（非負）整数を集合に追加する．
// 引数：集合に加える要素番号
// 返値：成功 ... 指定された整数, 失敗 ... 負値
int addelement(int );

// 集合から要素vを削除
// 指定された整数を集合から削除する．
// 引数：集合から削除する要素番号
// 返値：成功 ... 指定された整数, 失敗 ... 負値
int deleteelement(int );

// 要素vが集合内にあるかどうかを調査
// 引数：調査対象とする要素番号
// 返値：成功 ... 指定された要素番号, 失敗 ... 負値
int checkelement(int );

// 集合の要素一覧の入手
// 引数：要素を納める配列へのポインタ、配列の要素数
// 返値：成功時には要素数、失敗時は負値
int obtainelementlist(int *, int );

// 集合の状態表示
// 引数：なし
// 返値：成功時には現在の要素数、失敗時は負値
int showset(void);



In [None]:
%%writefile SetLib_J.c
// Set management
// 2021/05/26 kameda[at]ccs.tsukuba.ac.jp
#include <stdio.h> // printf()
#include <stdlib.h> // calloc()
#include "SetLib_J.h" // プロトタイプ宣言の整合確認

int *setU = NULL;  // 頂点集合 U を表す配列
int setsize = 0; // 集合 U の最大要素数

// 集合の初期化
// 引数：確保する要素数
// 返値：成功...確保した整数配列のポインタ, 失敗...NULL
int *initset(int n) {
    if (setU != NULL) {
		printf("【失敗】%d 要素分がすでに確保済です。\n", setsize);
        return NULL;
    }
	setU = calloc(n, sizeof(*setU));
	if (setU == NULL) {
		printf("【失敗】 %d要素分の集合用配列を確保できませんでした．\n", n);
        return NULL;
	}
    setsize = n;
	return setU;
}

// 集合への追加
// 指定された（非負）整数を集合に追加する．
// 引数：集合に加える要素番号
// 返値：成功 ... 指定された整数, 失敗 ... 負値
int addelement(int v) {
    if (setU == NULL) {
        printf("【失敗】 集合が用意できていません．\n");
        return -1;
    } else if (v < 0 || v >= setsize) {
        printf("【失敗】 指定された要素番号 %d は有効範囲 (0 - %d) 外です\n", v, setsize - 1);
        return -2;
    }
    setU[v] = 1;
    return v;
}

// 集合から要素vを削除
// 指定された整数を集合から削除する．
// 引数：集合から削除する要素番号
// 返値：成功 ... 指定された整数, 失敗 ... 負値
int deleteelement(int v) {
    if (setU == NULL) {
        printf("【失敗】 集合が用意できていません．\n");
        return -1;
    } else if (v < 0 || v >= setsize) {
        printf("【失敗】 指定された要素番号 %d は有効範囲 (0 - %d) 外です\n", v, setsize - 1);
        return -2;
    }
    setU[v] = 0;
    return v;
}

// 要素vが集合内にあるかどうかを調査
// 引数：調査対象とする要素番号
// 返値：成功 ... 指定された要素番号, 失敗 ... 負値
int checkelement(int v) {
    if (setU == NULL) {
        printf("【失敗】 集合が用意できていません．\n");
        return -1;
    } else if (v < 0 || v >= setsize) {
        printf("【失敗】 指定された要素番号 %d は有効範囲 (0 - %d) 外です\n", v, setsize - 1);
        return -2;
    }

    if (setU[v] == 0)
        return -3;
    return v;
};

// 集合の要素一覧の入手
// 引数：要素を納める配列へのポインタ、配列の要素数
// 返値：成功時には要素数、失敗時は負値
int obtainelementlist(int *array, int n) {
    int t; // 集合中に現在存在している要素数
    int i, j;

    if (setU == NULL) {
        printf("【失敗】 集合が用意できていません．\n");
        return -1;
    }

    for (i = 0, t = 0; i < setsize; i++) {
        if (setU[i] != 0)
            t++;
    }

    if (n < t) {
        printf("【失敗】配列の要素数 %d が集合の現在の要素数 %d より小さいため入りきりません．\n", n, t);
        return -2;
    }

    for (i = 0, j = 0; i < setsize; i++) {
        if (setU[i] != 0) {
            array[j] = i;
            j++;
        }
    }

    return t;
}

// 集合の状態表示
// 引数：なし
// 返値：成功時には現在の要素数、失敗時は負値
int showset(void) {
    int t; // 集合中に現在存在している要素数
    int i;

    if (setU == NULL) {
        printf("【失敗】 集合が用意できていません．\n");
        return -1;
    }

    printf("全要素数 %d\n", setsize);
    printf("  集合 : ");
    for (i = 0, t = 0; i < setsize; i++) {
        if (setU[i] != 0) {
            printf("%d ", i);
            t++;
        }
    }
    printf("\n");
    printf("  現在の要素数 %d\n", t);

    return t;
}



In [None]:
!gcc -Wall -c SetLib_J.c

In [None]:
%%writefile shortest-dijkstra_J.c
// Shortest path by Dijkstra
//    2021/05/26 kameda
#include <stdio.h> // printf()
#include <stdlib.h> // atoi()
#include "SetLib_J.h"
#include "graph6.h" // edge[][], N, NC

// 頂点のための構造体変数
typedef struct {
	int cost; // 現時点でこの頂点に到達するのにかかると思われる最安コスト cost
	int from; // 最短経路利用時，この頂点には 頂点from から来る
} CostFrom;

CostFrom vertexinfo[N]; // 到着頂点i に対する最短経路情報

// 頂点状態の表示
void print_vertex_status(char *show_str, int show_v){
	int i;

	printf("%s at %d:", show_str, show_v);
	printf(" cost(");
	for (i = 0; i < N; i++)
 		if (vertexinfo[i].cost == NC)
   			printf("--- ");
		else
			printf("%3d ", vertexinfo[i].cost);
	printf(") from(");
	for (i = 0; i < N; i++)
 		printf("%2d ", vertexinfo[i].from);
	printf(")\n");

	showset();
	return ;
}

// Dijkstraのアルゴリズムの本体
// 引数：開始頂点番号
void find_shortest_dijkstra(int StartVertex){
	int v; // 頂点
	int i;
	int restelements = 0; // 未処理の頂点数
	int restS[N]; // 未処理頂点のリスト（個数はrestelements）
	int min_vertex; // 経路が暫定最短となる頂点
	int min_cost;   // その頂点min_nodeまでの暫定最短経路値

    // 集合を確保
	printf("Dijkstra: 集合を%d要素分確保します．\n", N);
	initset(N);

	// 集合 U に全頂点を追加
	printf("Dijkstra: 集合に全要素を追加します．\n");
	for (v = 0; v < N; v++) {
		addelement(v);
		restelements++;
	}

	// 初期化
	// 開始頂点以外の初期解（コスト）は無限大(NC)
	printf("Dijkstra: 初期化します．\n");
	for (v = 0; v < N; v++) {
		if (v == StartVertex){
			vertexinfo[v].cost = 0;
			vertexinfo[v].from = StartVertex;
		} else {
			vertexinfo[v].cost = NC;
			vertexinfo[v].from = -1; // どこから行くわけでもない
		}
	}

	// いよいよスタート
	print_vertex_status("Start", restelements);
	while (restelements > 0) {

	  	print_vertex_status("Loop ", restelements);

		// 未処理頂点集合を獲得
		obtainelementlist(restS, N);

		// 未処理頂点集合の中で、最小コスト min_cost を与える頂点 min_vertex を探す
		// 先頭の要素を、初期的に min_vertex/min_cost として扱う
		min_vertex = restS[0];
		min_cost = vertexinfo[min_vertex].cost;
		for (i = 1; i < restelements; i++) {
			v = restS[i];
			if (vertexinfo[v].cost < min_cost) {
				min_vertex = v;
				min_cost = vertexinfo[v].cost;
			}
		}
		printf("未処理頂点集合内で最小の頂点は %d でそのコストは %d\n", min_vertex, min_cost);

		// 未処理頂点集合から min_vertex を削除
		deleteelement(min_vertex);
		restelements--;

        // 未踏で現在の最小コスト頂点に隣接している頂点のコストを更新
		for (v = 0; v < N; v++) {
			if (checkelement(v) >= 0) {
				if (vertexinfo[min_vertex].cost + edge[min_vertex][v] < vertexinfo[v].cost) {
					vertexinfo[v].cost = vertexinfo[min_vertex].cost + edge[min_vertex][v];
					vertexinfo[v].from = min_vertex;
				}
			}
		}
	}

	// Show the result
	for (v = 0; v < N; v++) {
		printf("To %2d : ", v);
		if (v == StartVertex) {
			printf("----");
		} else if (vertexinfo[v].cost == NC) {
			printf("No path");
		} else {
			int s;
			printf("cost %3d : ", vertexinfo[v].cost);
			for (s = v; s != StartVertex; s = vertexinfo[s].from)
				printf("%2d <- ", s);
			printf("%2d", StartVertex);
		}
		printf("\n");
	}
}

// Main function
int main(int argc, char *argv[]){
    int startvertex = 0;

    if (argc == 1) {
        printf("指定がなかったので頂点0を開始頂点にします．\n");
        startvertex = 0;
    } else if (argc == 2) {
        startvertex = atoi(argv[1]);
        if (startvertex < 0 || startvertex >= N) {
            printf("不正な頂点指定だったので終了します．\n");
            return -1;
        }
    }

	find_shortest_dijkstra(startvertex); // 開始頂点番号を引数にして最短経路探索を開始

	return 0;
}



コンパイルしてエラーが無いことを確認．

In [None]:
!gcc -Wall -c shortest-dijkstra_J.c

In [None]:
!gcc -Wall -o shortest-dijkstra_J shortest-dijkstra_J.o SetLib_J.o

実行．

In [None]:
!./shortest-dijkstra_J 0

# 節末課題

1. 最短経路の表示の仕組み  
shortest_dijkstra_J プログラムにおいて，それぞれの頂点への最小経路値を実現する経路を表示する仕組みを説明せよ．  
このとき，構造体CostFromのメンバ from に格納されている値について言及すること．


2. 計算量  
shortest_diskstra_J プログラムの時間計算量と空間計算量を議論せよ．


3. 重みが零の辺  
グラフ中に重みが0の辺があった場合，最短経路問題に与える影響について論ぜよ．


4. エラーハンドリング  
shortest-dijkstra_J.c では SetLibで定義された関数を使うときにエラーハンドリングをしていない．エラーハンドリングすべき箇所を示せ．そのうちの１か所（最初）について，対策をした改変例を示せ．


5. フェイルセーフ  
SetLib_J.c のいずれかの関数において、予期しない引数が与えられた場合に警告を発するよう改変することを考える．想定しうる状況を説明せよ．またそれに対応するプログラム改変結果を示せ．

6. プログラムの健全化  
shortest-dijkstra_J.c ではDijkstraのアルゴリズムの5.を正確に実装していない．「Uの中で頂点kに隣接する頂点について」に相当する部分をその通りに行うようプログラムを書き換えてみよ．  
 (これによって，NCに対する加算による桁あふれの心配はしなくてよくなる）  

7. NCの値の検討
上記6.の書き換えを行った場合，NCは「十分に大きな値」である必要はなくなる．ではどのような値を指定してはいけないのか，議論せよ．  





# 出典

筑波大学工学システム学類  
データ構造とアルゴリズム  
担当：亀田能成  
2022/05/25 文言修正  
2022/04/13 フォルダ構成を更新  
2021/05/26 初版  

