<a href="https://colab.research.google.com/github/niikun/Data-Structure-and-Algorithm/blob/main/GreedyAlgorithm.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# knapsack
- Input :  
        weights w1,...wn and
        walues v1,...vn
        capacity W  
- Output: the maximum total value of fractions of  items that fit into a knapsack capacity W

In [54]:
import random
W = 10
weights =[round(random.random()*10,2) for i in range(10)]
values = [round(random.random()*10,2) for i in range(10)]

In [55]:
print(weights,values)

[7.23, 1.48, 8.01, 8.89, 5.03, 7.91, 7.09, 5.17, 4.37, 4.46] [1.6, 5.37, 9.07, 6.6, 4.65, 3.34, 7.69, 4.0, 3.46, 6.15]


## Bubleバブルソート
バブルソートはネストされたループで実行され、各要素について隣接要素と比較し、必要に応じて交換します。

外側のループ: 𝑛 回実行されます。
内側のループ: 各ステップで 𝑛−1回実行されます。  
したがって、バブルソート全体の時間計算量は $𝑂(𝑛^2)$です。

In [56]:
def sort_by_values1(values,weights):
    for _ in range(len(weights)):
        for i in range(len(weights)-1):
            if values[i]<values[i+1]:
                values[i],values[i+1] = values[i+1],values[i]
                weights[i],weights[i+1] = weights[i+1],weights[i]
    return values, weights

## Timsort アルゴリズム  
あるいは、Pythonの組み込みのソート機能を使って同じ結果を得ることもできます：  
`combined.sort(key=lambda x: x[0] / x[1], reverse=True) `では、価値と重量の比率で降順にソートしています。  
このソート操作は Python の Timsort アルゴリズムを使用し、時間計算量は$𝑂(𝑛log⁡𝑛)$です。
Timsort の時間計算量は、分割統治法を基にしているためです。具体的には、以下の手順で動作します。

- 分割: 配列を小さな部分配列に分割します。
- ソート: 小さな部分配列をソートします。
- マージ: ソートされた部分配列をマージして、最終的なソートされた配列を作成します。
この分割とマージのプロセスは、各ステップでデータを半分に分割し、ログスケールで進行します。また、各マージステップで $𝑂(𝑛)$ の作業が必要となります。したがって、全体の時間計算量は $𝑂(𝑛log𝑛)$となります。

In [57]:
def sort_by_values2(values,weights):
    combined = list(zip(values,weights))
    combined.sort(key=lambda x:x[0],reverse=True)
    values,weights = zip(*combined)
    return values,weights

In [58]:
combined = list(zip(values,weights))
combined

[(1.6, 7.23),
 (5.37, 1.48),
 (9.07, 8.01),
 (6.6, 8.89),
 (4.65, 5.03),
 (3.34, 7.91),
 (7.69, 7.09),
 (4.0, 5.17),
 (3.46, 4.37),
 (6.15, 4.46)]

In [59]:
combined.sort(key=lambda x:x[0],reverse=True)
combined

[(9.07, 8.01),
 (7.69, 7.09),
 (6.6, 8.89),
 (6.15, 4.46),
 (5.37, 1.48),
 (4.65, 5.03),
 (4.0, 5.17),
 (3.46, 4.37),
 (3.34, 7.91),
 (1.6, 7.23)]

In [60]:
values, weights = zip(*combined)
print(values,weights)

(9.07, 7.69, 6.6, 6.15, 5.37, 4.65, 4.0, 3.46, 3.34, 1.6) (8.01, 7.09, 8.89, 4.46, 1.48, 5.03, 5.17, 4.37, 7.91, 7.23)


## Greedy algorithm
貪欲アルゴリズムは、解を一個一個構築し、各ステップで、最も有益な部分を選択します。  
napsack 関数のループ部分:
`for i in range(len(weights)):`で、ソートされたアイテムを順に見てナップサックに詰める処理を行っています。  
このループは最大で$ 𝑛$ 回実行されます。ループ部分: $𝑂(𝑛)$
各ループ内の処理（アイテムの追加）は定数時間$𝑂(1)$で実行されます。

In [61]:
def napsack1(weights,values,W):
    napsack_dict={}
    values,weights = sort_by_values1(values,weights)
    value_sum = 0
    weight_sum = W
    while weight_sum>0:
        for i in range(len(weights)):
            if weight_sum - weights[i] <= 0:
                value_sum += values[i]*weight_sum
                napsack_dict[values[i]] = weight_sum
                weight_sum = 0
                break
            else:
                weight_sum -= weights[i]
                value_sum += values[i]*weights[i]
                if values[i] in napsack_dict:
                    napsack_dict[values[i]] += weights[i]
                else:
                    napsack_dict[values[i]] = weights[i]

    return value_sum,napsack_dict

In [62]:
def napsack2(weights,values,W):
    napsack_dict={}
    values,weights = sort_by_values2(values,weights)
    value_sum = 0
    weight_sum = W
    while weight_sum>0:
        for i in range(len(weights)):
            if weight_sum - weights[i] <= 0:
                value_sum += values[i]*weight_sum
                napsack_dict[values[i]] = weight_sum
                weight_sum = 0
                break
            else:
                weight_sum -= weights[i]
                value_sum += values[i]*weights[i]
                if values[i] in napsack_dict:
                    napsack_dict[values[i]] += weights[i]
                else:
                    napsack_dict[values[i]] = weights[i]

    return value_sum,napsack_dict

In [63]:
%%time
napsack1(weights,values,20)

CPU times: user 35 µs, sys: 0 ns, total: 35 µs
Wall time: 39.1 µs


(159.5128, {9.07: 8.01, 7.69: 7.09, 6.6: 4.9})

In [64]:
%%time
napsack2(weights,values,20)

CPU times: user 27 µs, sys: 3 µs, total: 30 µs
Wall time: 32.7 µs


(159.5128, {9.07: 8.01, 7.69: 7.09, 6.6: 4.9})

## Money Change


In [73]:
def money_change1(change):
    coins = [500,100,50,10,5,1]
    change_dict={}
    while change>0:
        for coin in coins:
            if change-coin>=0:
                change = change-coin
                if coin in change_dict:
                    change_dict[coin]+=1
                    break
                else:
                    change_dict[coin]=1
                    break
    return change_dict

In [76]:
%%time
money_change1(999)

CPU times: user 42 µs, sys: 0 ns, total: 42 µs
Wall time: 62 µs


{500: 1, 100: 4, 50: 1, 10: 4, 5: 1, 1: 4}

In [81]:
def money_change2(change,coins):
    coins.sort(reverse=True)
    change_dict={}
    for coin in coins:
        change_dict[coin] = change//coin
        change = change%coin
    return change_dict

In [78]:
%%time
money_change2(999)

CPU times: user 9 µs, sys: 1 µs, total: 10 µs
Wall time: 16 µs


{500: 1, 100: 4, 50: 1, 10: 4, 5: 1, 1: 4}

### 結論
money_change1 の時間計算量は $O(change)$ です。
money_change2 の時間計算量は $O(n)$ です。
money_change2 の方が効率的です。money_change1 は change の大きさに依存しているため、非常に大きな change の値の場合に効率が悪くなります。一方、money_change2 は硬貨の種類の数に依存しており、通常この数は固定されているため、非常に効率的です。

In [83]:
money_change2(8,[1,4,6])

{6: 1, 4: 0, 1: 2}

In [84]:
u1=3
u2=4/3
u3=6-4/3

In [85]:
5000*u1/4+200*u2/3+10*u3/5

3848.222222222222