# 最適化の数理 最終課題
## 最小スパニングツリー問題を用いた音楽ストリーミングサービスでの楽曲サジェスチョンサービス  
プリムのアルゴリズムを使用. コストは楽曲間の「距離」. これは, 2つの楽曲をいいねしたユーザーの合計数 / どちらもいいねしたユーザーの数で定義する (レポート参照) 

## Set up

In [2]:
import numpy as np

## Define the graph

In [7]:
V = ["星空のディスタンス/THE ALFEE", "メリーアン/THE ALFEE",
     "赤いスイートピー/松田聖子", "ファッションモンスター/きゃりーぱみゅぱみゅ", 
     "ポリリズム/PERFUME", "名もなき詩/Mr.Children", "honnoji/ZAZEN BOYS",
     "ポテトサラダ/ZAZEN BOYS"]
songs = V
L_songs = [11000, 4445, 9798, 140000, 19000, 16000, 3699, 1732] # 再生数の合計数
L_mutual = [[0, 3000, 3000, 8000, 2000 , 8000 , 1000, 500 ],
            [0, 0   , 3000, 3500, 2000 , 2500 , 500 , 300 ],
            [0, 0   , 0   , 9000, 8000 , 8500 , 1000, 500 ],
            [0, 0   , 0   , 0   , 15000, 10000, 2000, 1000],
            [0, 0   , 0   , 0   , 0    , 10000, 1500, 800 ],
            [0, 0   , 0   , 0   , 0    , 0    , 2000, 800 ],
            [0, 0   , 0   , 0   , 0    , 0    , 0   , 1700],
            [0, 0   , 0   , 0   , 0    , 0    , 0   , 0   ]] # 両方の曲を高評価した人の数
distance = np.zeros((np.size(songs), np.size(songs))) # コスト配列を初期化
E = [] 
for i in range(np.size(distance, 0)):
    for j in range(np.size(distance, 1)):
        if i < j:
            # (1 / (どちらの曲も高評価した人数)) * 二つの曲の高評価の合計値
            # これをnormFac で正規化
            L_total = L_songs[i] + L_songs[j]
#             L_total = L_songs[i] * L_songs[j]
            dist = (1 / (L_mutual[i][j])) * L_total
            E.append([songs[i], songs[j],dist])
v0 = V[0]

In [8]:
E

[['星空のディスタンス/THE ALFEE', 'メリーアン/THE ALFEE', 5.148333333333333],
 ['星空のディスタンス/THE ALFEE', '赤いスイートピー/松田聖子', 6.932666666666666],
 ['星空のディスタンス/THE ALFEE', 'ファッションモンスター/きゃりーぱみゅぱみゅ', 18.875],
 ['星空のディスタンス/THE ALFEE', 'ポリリズム/PERFUME', 15.0],
 ['星空のディスタンス/THE ALFEE', '名もなき詩/Mr.Children', 3.375],
 ['星空のディスタンス/THE ALFEE', 'honnoji/ZAZEN BOYS', 14.699],
 ['星空のディスタンス/THE ALFEE', 'ポテトサラダ/ZAZEN BOYS', 25.464000000000002],
 ['メリーアン/THE ALFEE', '赤いスイートピー/松田聖子', 4.7476666666666665],
 ['メリーアン/THE ALFEE', 'ファッションモンスター/きゃりーぱみゅぱみゅ', 41.27],
 ['メリーアン/THE ALFEE', 'ポリリズム/PERFUME', 11.7225],
 ['メリーアン/THE ALFEE', '名もなき詩/Mr.Children', 8.178],
 ['メリーアン/THE ALFEE', 'honnoji/ZAZEN BOYS', 16.288],
 ['メリーアン/THE ALFEE', 'ポテトサラダ/ZAZEN BOYS', 20.59],
 ['赤いスイートピー/松田聖子', 'ファッションモンスター/きゃりーぱみゅぱみゅ', 16.644222222222222],
 ['赤いスイートピー/松田聖子', 'ポリリズム/PERFUME', 3.5997500000000002],
 ['赤いスイートピー/松田聖子', '名もなき詩/Mr.Children', 3.035058823529412],
 ['赤いスイートピー/松田聖子', 'honnoji/ZAZEN BOYS', 13.497],
 ['赤いスイートピー/松田聖子', 'ポテトサラダ/ZAZEN BOYS', 2

## Initialize some values

In [9]:
P = [v0] # 過去頂点の集合
S = [] # 辺の部分集合
W = 0 # 重みの総和

## Main Loop

In [10]:
while sorted(V) != sorted(P):
    Ecand = []
    for ee in E:
        if (ee[0] in P and not ee[1] in P) or (not ee[0] in P and ee[1] in P):
            if not ee in Ecand:
                Ecand.append(ee)
    if ee:
        print(Ecand)
        wmin = Ecand[np.argmin(np.array(Ecand)[:, 2].astype('float'))]  # 重み最小の辺
        print(wmin)
        W += wmin[2]
        S.append(wmin[0:2])
        if not wmin[0]in P:
            P.append(wmin[0])
        if not wmin[1]in P:
            P.append(wmin[1])

[['星空のディスタンス/THE ALFEE', 'メリーアン/THE ALFEE', 5.148333333333333], ['星空のディスタンス/THE ALFEE', '赤いスイートピー/松田聖子', 6.932666666666666], ['星空のディスタンス/THE ALFEE', 'ファッションモンスター/きゃりーぱみゅぱみゅ', 18.875], ['星空のディスタンス/THE ALFEE', 'ポリリズム/PERFUME', 15.0], ['星空のディスタンス/THE ALFEE', '名もなき詩/Mr.Children', 3.375], ['星空のディスタンス/THE ALFEE', 'honnoji/ZAZEN BOYS', 14.699], ['星空のディスタンス/THE ALFEE', 'ポテトサラダ/ZAZEN BOYS', 25.464000000000002]]
['星空のディスタンス/THE ALFEE', '名もなき詩/Mr.Children', 3.375]
[['星空のディスタンス/THE ALFEE', 'メリーアン/THE ALFEE', 5.148333333333333], ['星空のディスタンス/THE ALFEE', '赤いスイートピー/松田聖子', 6.932666666666666], ['星空のディスタンス/THE ALFEE', 'ファッションモンスター/きゃりーぱみゅぱみゅ', 18.875], ['星空のディスタンス/THE ALFEE', 'ポリリズム/PERFUME', 15.0], ['星空のディスタンス/THE ALFEE', 'honnoji/ZAZEN BOYS', 14.699], ['星空のディスタンス/THE ALFEE', 'ポテトサラダ/ZAZEN BOYS', 25.464000000000002], ['メリーアン/THE ALFEE', '名もなき詩/Mr.Children', 8.178], ['赤いスイートピー/松田聖子', '名もなき詩/Mr.Children', 3.035058823529412], ['ファッションモンスター/きゃりーぱみゅぱみゅ', '名もなき詩/Mr.Children', 15.600000000000001], ['ポリリズム/PERF

In [11]:
np.argmin((np.array(Ecand)[:, 2].astype('float')))

3

In [12]:
print("過去頂点の集合: ", P, end="\n\n")  # 過去頂点の集合
print("辺の部分集合: ", S, end="\n\n")  # 辺の部分集合
print("重みの総和", W, end="\n\n")  # 重みの総和

過去頂点の集合:  ['星空のディスタンス/THE ALFEE', '名もなき詩/Mr.Children', '赤いスイートピー/松田聖子', 'ポリリズム/PERFUME', 'メリーアン/THE ALFEE', 'honnoji/ZAZEN BOYS', 'ポテトサラダ/ZAZEN BOYS', 'ファッションモンスター/きゃりーぱみゅぱみゅ']

辺の部分集合:  [['星空のディスタンス/THE ALFEE', '名もなき詩/Mr.Children'], ['赤いスイートピー/松田聖子', '名もなき詩/Mr.Children'], ['ポリリズム/PERFUME', '名もなき詩/Mr.Children'], ['メリーアン/THE ALFEE', '赤いスイートピー/松田聖子'], ['名もなき詩/Mr.Children', 'honnoji/ZAZEN BOYS'], ['honnoji/ZAZEN BOYS', 'ポテトサラダ/ZAZEN BOYS'], ['ファッションモンスター/きゃりーぱみゅぱみゅ', 'ポリリズム/PERFUME']]

重みの総和 38.30193137254902

