<a href="https://colab.research.google.com/github/kameda-yoshinari/DataAlgo-UT/blob/main/DataAlgo_UT(010)_Matching.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 5. マッチング

グラフを利用した別の例として，マッチングを取り上げます．


**いつもの約束**  
１つのコードセルだけの実行は Ctrl + Enter．  
エディタで「インデント幅（スペース）は4で表示」「行番号を表示」「インデントガイドを表示」．  
挿入図は Google Colaboratory 以外では見れない可能性あり．  
内部では日本語はUTF-8で表現されている．


# 準備

インスタンスに接続し起動する．  
下記の手順でGoogle Driveをマウントする．  
マウント先に移動し，作業フォルダとする．  
これによって，インスタンスがリセットされてもGoogle Drive内にファイルが保存されるようにする．

In [None]:
!echo "Google Driveをマウントします"
from google.colab import drive 
drive.mount('/content/drive')

In [None]:
!echo "今回の作業用フォルダを作成しそこに移動します"
%cd /content/drive/My\ Drive/
%mkdir -p UT_DataAlgo/DA_010
%cd       UT_DataAlgo/DA_010
!ls
!echo "日本時間表示"
!rm /etc/localtime
!ln -s /usr/share/zoneinfo/Japan /etc/localtime
!date

# マッチング

**グラフとしてのマッチング**

グラフの辺の部分集合で，どの頂点もその中に２度以上は現れないものをマッチング(matching) という．  
１つのマッチングに関して，グラフの全ての頂点は，

* そのマッチングの辺の両端点として対を成す
* そのマッチングに含まれないで残る

のどちらかとなる．

**最大マッチング**

最も多くの辺からなるマッチングを最大マッチング (maximum matching) という．  
言い換えるなら，残される頂点数が最小のマッチングである．  
特に，全ての頂点が１度ずつマッチングの辺に現れる場合を完全マッチング (perfect matching) という．

**２部グラフ**

頂点集合が２分割され，辺がその部分集合の間を結ぶものに限られるグラフを２部グラフ (bipertite graph) という．



# 安定結婚問題

**内容**  

２部グラフにおける問題である．  
２種の頂点集合でそれぞれの頂点数がNで同数とする．  
各頂点は，相手頂点の好みを第1位から第N位までつける．  
この好み順 (preference list) は皆違うかもしれないし全員同じかもしれない．  
目標は，この元で完全マッチングを実現することである．

こうした問題の典型例は，男女同数の合コンであろう．  
実は，工学システム学類の主専攻振り分け，総合学域の進路振り分けも全く同じ問題である．

このような好み順がどちらの集合の頂点にも用意してある状態で，「満足できる」完全マッチングは必ず見つかるアルゴリズムが知られている．  
（つまり，君たちが合コンの幹事をすることになったとして，この方法に従えば，男女同数N人ずつ参加なら必ずNペアを作って帰すことができる)  
このアルゴリズムのことを求婚アルゴリズム (proposal algorithm) という．  
このアルゴリズムは，実際に上記の本学での問題解決に利用されている．  

**求婚アルゴリズム**

上記でみんなが「満足できる」完全マッチングとはどういうものであろうか．  
それは，「不満足ペア」を含まない完全マッチングを指す．  
**この解を見つける求婚アルゴリズムについては，UCB（米国でコンピュータサイエンスでは超有名校；シリコンバレーすぐそばに立地）のコンピュータサイエンス専攻の講義資料を読んで理解すること．読んで理解するのはAnalysisの前まででよい．**

https://people.eecs.berkeley.edu/~jfc/cs174lecs/lec7/lec7.html

>例年はこの資料を事前準備なしに授業中配布して各学生に１行ずつ解説してもらっていた．英語が得意ではないと自分で感じている学生は多いであろう．しかし，実は，理工系の授業においては，英語で書かれていてる資料は読むのは難しくない．そのことを実感してもらいたい．そのため，**自動翻訳にかけたりせず，まずは原文のままで理解してもらいたい．**そのあと自動翻訳を利用するのは構わない．余談だがgoogleの自動翻訳がBERT技術を導入して飛躍的に精度を高めたのは2019年秋からである．2019年度までの授業では自動翻訳は使い物にならないレベルであった．時代の流れは速いものである．

>本資料のAnalysis以降の解説が，コンピュータサイエンスとしてアルゴリズム論を教える場合に出てくる正確な議論である．アルゴリズムの分析，正しさの証明，最悪事例ではなく一般的に予想しうる状況での計算量の議論などが登場している．興味のある学生は読んでみると面白いと思う．

重要な「不満足ペア(dissatisfied pair)」についてだけ補足しておく．

> Pref_A(d) > Pref_A(c) > Pref_A(b) > Pref_A(a)  
Ａ君はdさんと１番結婚したくて、次にcさんと、それがダメならbさんと‥という順で好きだということをこの式は表現している．  
Stableであるとは、どこにもdissatisfied pairがないこと．  
X-x, Y-yがそれぞれペアであるとすると、以下の両式が成立するとき，  
X-yはdissatisfied pairであるという。  
Pref_X(y) > Pref_X(x)「X君は自分の嫁さんxより他人の嫁さんyが好きで」  
Pref_y(X) > Pref_y(Y)「yさんは自分の旦那Yより他人の旦那Xが好き！」

記号でピンと来ないときは，差しさわりのない範囲で具体化するとわかりやすいだろう．  

今，コータロー君とミユキさんが公認の仲だとする．また，ケンタ君とメイさんも公認の仲だとする．
あるとき，みんなで集まって飲み会をやっていた．男子側の席で，ふとしたはずみに誰かがコータロー君に女子のことをどう思っているのかこっそり聞いてみたら「俺，実はミユキさんよりメイさんがいいと思ってるんだ」と爆弾発言をしてきた．周りは全員，ええー！，と思ったことであろう．一方，別の席ではメイさんに女子組がこっそり同じようなことを聞いてみていた．すると，なんとメイさん，「ケンタ君よりコータロー君が気になっているの」とか言い出した．早晩，この２組はそれぞれ破局し，コータロー＆メイというペアだけが残るであろう（残されたミユキさんとケンタ君を含めて全体が修羅場になるかどうか当局は関知しない）．

これが不満足ペアである．諸君の周りの実名を入れてみれば，より簡単に状況が理解できるあろう．

**備考**

LGBTなどのこともあり，男女の仲の代わりになる題材もいろいろ思案したが，学生諸君が実感として感じられる例題をまだ思いつけていない．何かよい案があれば是非提案して頂きたい．

# 安定結婚を実現するプログラム

**目標**

２部グラフで最大マッチングを実現する．各頂点は相手頂点の好み順を持つ．最大マッチングに不満足ペアは含まれない．

**説明**

手順はUCB資料そのままである．

**プログラム**

UCB資料では，preference functionは相手を好きなほど大きい値を返すことになっている．ここでの実装では，関数を使う代わりに，新しく用意する配列を用いる．この配列では，相手を好きなほど小さい値が返ることになる．

* mpo[m][o]は男性mの preference order (list)に相当する．
* fpo[f][o]は女性fの preference order (list)に相当する．

いずれも，第二添字o (0 ... N-1) によって，配列に格納された値は，第o番目に好きな女性陣の名前（番号）/男性陣の名前（番号）に相当する．

mpo[][], fpo[][]を元にして，preference functionに代わる新しい配列 smpo[m][f], sfpo[f][m]を用意しプログラムでは利用する．

* smpo[m][f]の値は，男性mが女性fのことを(女性陣の中で)何番目に好きか(0 ... N-1)という値が格納されている．
* sfpo[m][f]の値は，女性fが男性mのことを(男性陣の中で)何番目に好きか(0 ... N-1)という値が格納されている．

preference functionと同等の情報を別の形で格納していることになる．  
こちらでは，配列の値は名前ではなく「好きレベル」を表しており，相手を好きなほど**値が小さくなっている**ことに注意する．

**備考**

検証用の二部グラフは，SAMPLES_OF_4 と SAMPLES_OF_8 の２つを用意してある．  
検証したいほうのマクロ変数をdefineしてコンパイルすること．

In [None]:
%%writefile stable-marriages_J.c
// Stable Marriages by the proposal algorithm
// kameda[at]ccs.tsukuba.ac.jp, 2021.
#include <stdio.h> // printf()

//  The Proposal Algorithm
//    A:dcba     a:ABCD
//    B:dcba     b:ABCD
//    C:dcba     c:ABCD
//    D:dcba     d:ABCD
//  An answer
//    A-d,B-c,C-b,D-a


#define SAMPLES_OF_4 // Choose one of SAMPLES_OF_4 or SAMPLES_OF_8

#ifdef SAMPLES_OF_4
#define N 4
// Male Preference Order 
// 値は女子の名前
// mpo[m][r] = f ; 男mは(女性陣の中で)r番目に女fを好き 
int mpo[N][N] = {
	{3, 2, 1, 0},
	{3, 2, 1, 0},
	{3, 2, 1, 0},
	{3, 2, 1, 0},
};
// Female Preference Order
// 値は男子の名前
// fpo[f][r] = m ; 女fは(男性陣の中で)r番目に男mを好き 
int fpo[N][N] = {
	{0, 1, 2, 3},
	{0, 1, 2, 3},
	{0, 1, 2, 3},
	{0, 1, 2, 3},
};
#endif

#ifdef SAMPLES_OF_8
#define N 8
// Male Preference Order 
// 値は女子の名前 
// mpo[m][r] = f ; 男mは(女性陣の中で)r番目に女fを好き 
int mpo[N][N] = {
	{6, 1, 5, 4, 0, 2, 7, 3}, // 0
	{3, 2, 1, 5, 7, 0, 6, 4}, // 1
	{2, 1, 3, 0, 7, 4, 6, 5}, // 2
	{2, 7, 3, 1, 4, 5, 6, 0}, // 3
	{7, 2, 3, 4, 5, 0, 6, 1}, // 4
	{7, 6, 4, 1, 3, 2, 0, 5}, // 5
	{1, 3, 5, 2, 0, 6, 4, 7}, // 6
	{5, 0, 3, 1, 6, 4, 2, 7}  // 7
};
// Female Preference Order
// 値は男子の名前
// fpo[f][r] = m ; 女fは(男性陣の中で)r番目に男mを好き 
int fpo[N][N] = {
	{3, 5, 1, 4, 7, 0, 2, 6}, // 0
	{7, 4, 2, 0, 5, 6, 3, 1}, // 1
	{4, 7, 0, 1, 2, 3, 6, 5}, // 2
	{2, 1, 3, 6, 5, 7, 4, 0}, // 3
	{5, 2, 0, 3, 4, 6, 1, 7}, // 4
	{1, 0, 2, 7, 6, 3, 5, 4}, // 5
	{2, 4, 6, 1, 3, 0, 7, 5}, // 6
	{6, 1, 7, 3, 4, 5, 2, 0}  // 7
};
#endif

int smpo[N][N]; // smpo[m][w] = r ; 男mは女wを女性陣の中でr番目に好き (Sorted Male   Preference Order) 並んでいるのは順位
int sfpo[N][N]; // sfpo[w][m] = r ; 女wは男mを男性陣の中でr番目に好き (Sorted Female Preference Order) 並んでいるのは順位
int m_spouse[N]; // 男性mの結婚相手は m_spouse[m]
int f_spouse[N]; // 女性fの結婚相手は f_spouse[f]
int m_single[N]; // 男性mが独身なら m_single[m] = 1 , 既婚なら0
int f_single[N]; // 女性fが独身なら f_single[f] = 1 , 既婚なら0

int m_challenge[N]; // m_challange[m] = r; 男性mが次に何(r)番目に好きな女性に告白する予定か

// 本当に不満足ペアがないかどうかを検証
// '.' ... no problem; 'D' ... they love each other (that means Dangerous!)
void stabilitychecker(void){
	int m, f;

	printf("Dissatisfied pair check =========\n");
	for (m = 0; m < N; m++) {
		for (f = 0; f < N; f++) {
			if (m == f_spouse[f] || f == m_spouse[m]) 
   				continue;
			printf("Male_%d and Female_%d : ", m, f);
			printf("MPref_%d_(%d)=%d -%s- MPref_%d_(%d)=%d  and  ",
				m, f, smpo[m][f], 
				smpo[m][f] > smpo[m][m_spouse[m]] ? "." : "D",
				m, m_spouse[m], smpo[m][m_spouse[m]]);
			printf("FPref_%d_(%d)=%d -%s- FPref_%d_(%d)=%d  ",
				f, m, sfpo[f][m], 
				sfpo[f][m] > sfpo[f][f_spouse[f]] ? "." : "D",
				f, f_spouse[f], sfpo[f][f_spouse[f]]);
			printf("%s\n",
				((smpo[m][f] > smpo[m][m_spouse[m]]) || (sfpo[f][m] > sfpo[f][f_spouse[f]])) ? "   " : "OUT");
		}
	}

	return ; 
}

// 最終結果表示
void print_answer(void){
	int m, f; // 男性用・女性用ループ変数
	int m_level = 0, f_level = 0; // 幸せ度数, 0 なら最も幸せ
	
	printf("==== Stable Marriage ====\n");
	// 男性 0 - N-1 の結婚相手を順に表示 
	for (m = 0; m < N; m++) {
		f = m_spouse[m];
		printf("Male=%d[rank:%d] <=> Female=%d[rank:%d]\n", m, smpo[m][f], f, sfpo[f][m]);
		// 男性mは配偶者fのことをsmpo[m][f]番目に好きでした
		m_level += smpo[m][f]; 
		// 女性fは配偶者mのことをsfpo[f][m]番目に好きでした
		f_level += sfpo[f][m];
	}
	// 皆幸せなら0, 0になる
	// 和を計算することに意味はない (順序尺度なので)
	printf("Happiness Indigator : %3d + %3d = %3d\n", m_level, f_level, m_level + f_level);
}

// 独身男性１名の番号を選んで返す
//   進行役が独身男性１人を壇上に呼ぶ
//   独身男性なら誰を呼んでもＯＫ
//   UCB資料では適当に呼んでいるが，ここでは番号の小さい方から呼ぶ
int selectonemale(void){
	int k;
	for (k = 0; k < N; k++) 
		if (m_single[k] == 1) 
			return (k);

	// 独身男性がいない場合は-1を返す
	return (-1);
}

// 求婚アルゴリズム
// このプログラムで求婚は男牲から行うものとしている
void runproposalalgorithm(void){
	int m; // 男性用ループ変数
	int f; // 女性用ループ変数
	
	// 独身男性が残っている限り「求婚」をさせる
	while ((m = selectonemale()) >= 0) {
		// 男性mはまだ告白してない中で一番好きな女性fについて考える 
		f = mpo[m][m_challenge[m]]; 

		printf ("Male_%d proposes to Female_%d ... ", m, f);

		// この告白は実を結ぶか？以下の２条件のどちらかが成立すれば成功
		// 条件１：女性fが独身
		// 条件２：女性fは言い寄ってきた男性mが旦那f_spouse[f]より好き
		//         sfpo[m][]は小さいほうが「より好き」を示す
		if (f_single[f] == 1) {
			// 婚姻届
			m_spouse[m] = f;
			f_spouse[f] = m;
			m_single[m] = 0;
			f_single[f] = 0;
			printf("congratulations!\n");
		} else if (sfpo[f][m] < sfpo[f][f_spouse[f]]) {
			// 女性fには、現夫のf_spouse[f]より、言い寄ってきた男性mのほうが素敵に思えた。
			// 女性fは既婚なのでまず離婚処理
			int sad_male; // sad male ... becomes single
			sad_male = f_spouse[f];
			m_single[sad_male] = 1;
			m_spouse[sad_male] = -1;
			
			// 婚姻届
			m_spouse[m] = f;
			f_spouse[f] = m;
			m_single[m] = 0;
			f_single[f] = 0;
			
			printf("congratulations! ... but Male_%d becomes single.\n", sad_male);
		} else {
			// 振られた場合は次の女性へ目標をランクダウン
			printf("failed to rank-%d woman, next target will be rank-%d woman in his mind.\n", m_challenge[m], m_challenge[m]+1);
			m_challenge[m]++;
		}
	}

	// 結果表示
	print_answer();

	return ;
}

// --------------
// プログラム本体
int main(int argc, char *argv[]){
	int m, f, i; // 男性，女性，一般用ループ変数
	
	// 冗長な初期化 (元のpreference orderが正しければ)
	for (m = 0; m < N; m++) {
		for (i = 0; i < N; i++) {
			smpo[m][i] = -1;
		}
	}
	for (f = 0; f < N; f++) {
		for (i = 0; i < N; i++) {
			sfpo[f][i] = -1;
		}
	}

	// 男性mの各女性(i)への結婚願望度　強0 - N-1弱
	for (m = 0; m < N; m++) {
		for (i = 0; i < N; i++)
			smpo[m][mpo[m][i]] = i;
	}
	// 女性fの各男性(i)への結婚願望度　強0 - N-1弱
	for (f = 0; f < N; f++) {
		for (i = 0; i < N; i++)
			sfpo[f][fpo[f][i]] = i;
	}

	// 最初は男性陣みんな独身
	for (m = 0; m < N; m++)
		m_single[m] = 1;
	// 最初は女性陣みんな独身
	for (f = 0; f < N; f++)
		f_single[f] = 1;

	// 男性は一番好きな女性(リストのNo.0)からアタック
	for (m = 0; m < N; m++)
		m_challenge[m] = 0;

	// 新しく作り直した好み順(smpo, sfpo)配列の内容確認
	{
		printf("Sorted Male   Preference Order\n");
		for (m = 0; m < N; m++) {
			printf("Male   %d : ", m);
			for (f = 0; f < N; f++) {
				printf("%d ", smpo[m][f]);
			}
			printf("\n");
		}
		printf("Sorted Female Preference Order\n");
		for (f = 0; f < N; f++) {
			printf("Female %d : ", f);
			for (m = 0; m < N; m++) {
				printf("%d ", sfpo[f][m]);
			}
			printf("\n");
		}
	}

	// 求婚スタート
	runproposalalgorithm();
	stabilitychecker();
	return 0;
}



コンパイルしてエラーが無いことを確認．

In [None]:
!gcc -Wall -o stable-marriages_J stable-marriages_J.c

実行．

In [None]:
!./stable-marriages_J

# 節末課題

1. 計算量  
stable-marriages_J プログラムの時間計算量と空間計算量を議論せよ．


2. 主専攻振り分け  
2019年度まで行われていた工学システム学類生主専攻振り分けでは，工学システム学類生1年生全員が，1年生終了時に4主専攻の希望順を提出し，成績上位者から主専攻割り当てが決まることになっていた．今，4主専攻の定員合計と，1年生の数が同数の場合，これは安定結婚問題と同じとみなせることを示せ．  
形式的に安定結婚問題と同じに扱えるよう、主専攻振り分け問題を定義できればよい．特に，2種の頂点集合は何か，各頂点のその好み順がどう表記されているのか，については具体的に説明すること．なお，学生の成績で同位はないものとする．


3. stable-marriages_J プログラムでの表示  
stable-marriages_J プログラム内のstabilitychecker()関数において，不満足ペアがないことを確認している．実行すると，"Dissatisfied pair check"の表示行のあと，下記のような行が出力される．これがどうして不満足ペアの確認になっているか，特に記号**A**から**P**に該当する数字や文字の意味を丁寧に説明しながら解説せよ．（幾つかの記号は同じ内容であるかもしれないことに注意）．  
Male_**A** and Female\_**B** :  
MPref\_**C**\_(**D**)=**E** 　 -**F**- 　 MPref\_**G**\_(**H**)=**I**  
and  
FPref\_**J**\_(**K**)=**L** 　 -**M**- 　 FPref\_**N**\_(**O**)=**P**  
（※ここでは見易さを確保するために１行を折り返して全角スペースなどを挿入している）

4. preference functionの実装  
stable-marriages_J プログラムにおいて，smpo[][]やsfpo[][]配列を用いる代わりに，UCBの資料にある通り，忠実にPreferenceFunction(m,f)を実装してプログラムを書き換えて見よ．関数は男性用と女性用の２種類必要なことに注意．実行結果は当然同じになる．


5. 安定結婚とは何か  
ここで示した頂点同数２部グラフの完全マッチングは，「安定結婚」であっても「幸福な結婚」とは言えないかもしれない．おそらく諸君もモヤモヤしているであろう．では，前提が同じままで，「幸福な結婚」を独自に定義して見よ．その定義に従うと完全マッチングである解が常には見つけられないことも示せ．（だから合コンの幹事は苦労するし，参加者の多くは帰り道に無常を感じるのであろう）．






# 出典

筑波大学工学システム学類  
データ構造とアルゴリズム  
担当：亀田能成  
2022/05/31 文章を一部更新  
2022/04/13 フォルダ構成を更新  
2021/06/02 初版
