## 16.1 活动选择问题
假定有一个 n 个活动的集合 S = {${a_1,a_2,...,a_n}$},这些活动都使用同一个资源，而这个资源在某个时刻只能供一个活动使用。每个活动  $a_i$ 都有一个开始时间 $s_i$ 和一个结束时间 $f_i$ ,其中 $0 \le s_i < f_i < \infty$ ，若被选中，任务 $a_i$ 发生在区间 $[s_i,f_i)$ 期间。如果两个活动开始时间和结束时间不重叠，则称它们是兼容的。在活动选择问题中，希望选出一个最大兼容活动集。假定活动已按结束时间的单调递增序列排序：$$ f_1 \le f_2 \le f_3 \le ... \le f_n $$

| i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: | :-: |
| ${s_i}$ | 1 | 3 | 0 | 5 | 3 | 5 | 6 | 8 | 8 | 2 | 12 |
| ${f_i}$ | 4 | 5 | 6 | 7 | 9 | 9 | 10 | 11 | 12 | 14 | 16 |

$S_{ij}$ 表示活动 $a_i$ 结束之后开始到 $a_j$ 开始之间结束的集合 ，假设 $a_k$ 在 $S_{ij}$ 中  
如果用 $c[i,j]$ 表示集合 $S_{ij}$ 的最优解的大小，可得递归式 $$ c[i,j]=c[i,k]+c[k,j]+1 $$
如果不知道 $S_{ij}$ 最优解包含活动 $a_k$ ，则
$$ c[i,j]=
\begin{cases}
0& \ S_{ij}= \emptyset \\
\max\limits_{a_k \in S_{ij}}\{c[i,k]+c[k,j]+1\}& \ S_{ij} \ne \emptyset\\
\end{cases}$$

直观上，应选择一个活动，选出后剩下的资源能被尽可能多的其他任务应用。因此选择 S 中最早结束的活动，因为活动已经按结束时间单调递增排序，所以贪心选择活动 $a_1$。  
因为$s_i<f_i$ 且 $a_1$ 是最早结束的活动，所以不存在活动结束时间早于 $s_1$ ，因此所有于 $a_1$ 兼容的活动都必须在 $a_1$ 结束之后开始。

In [7]:
a = [[1,4],[3,5],[0,6],[5,7],[3,9],[5,9],[6,10],[8,11],[8,12],[2,14],[12,16]]

def contain(a):
    n = len(a)
    arr = [a[0]]
    end = a[0][0]
    k = 0
    for i in range(1,n):
        if a[i][0]>=a[k][1]:
            arr += [a[i]]
            k = i
    return arr
contain(a)

[[1, 4], [5, 7], [8, 11], [12, 16]]

### 练习  
16.1-2 选择最晚开始的活动进行贪心。

In [10]:
a = [[1,4],[3,5],[0,6],[5,7],[3,9],[5,9],[6,10],[8,11],[8,12],[2,14],[12,16]]
def contain(a):
    n = len(a)
    a.sort(key = lambda k : -k[0])
    arr = [a[0]]
    start = a[0][0]
    k = 0
    for i in range(1,n):
        if a[i][1] < a[k][0]:
            arr = [a[i]] + arr
            k = i
    return arr
contain(a)

[[1, 4], [5, 7], [8, 11], [12, 16]]

## 16.2 贪心算法原理  
贪心算法设计步骤： 
1.将最优化问题转化为这样的形式：对其做出一次选择后，只剩下一个子问题需要求解。  
2.证明做出贪心选择后，原问题总是存在最优解
3.证明做出贪心选择后，剩余子问题满足性质：其最优解于贪心选择组合即可得到原问题的最优解

**贪心选择性质**  
通过局部最优解来构造全局最优解  
**最优子结构**  
一个问题的最优解包含其子问题的最优解

### 练习
16.2-2 用动态规划算法求解 0-1 背包问题（因为不满足贪心条件），要求运行时间为 O(nW) , n 为商品数量， W 是小偷能放进背包的最大商品总重量

In [20]:
def bag(goods,W):
    n = len(goods)
    goods = [[0,0]]+goods
    dp = [[0 for col in range(W+1)] for row in range(n+1)]
    if goods[1][0] <= W:
        for i in range(1,W+1):
            dp[1][i] = goods[1][1]
    for row in range(2,n+1):
        for col in range(1,W+1):
            if col < goods[row][0]:
                dp[row][col] = dp[row-1][col]
            else:
                dp[row][col] = max(dp[row-1][col],goods[row][1]+dp[row-1][col-goods[row][0]])
    return dp

goods = [[3,2000],[1,1500],[4,3000]]
W = 4
bag(goods,W)

[[0, 0, 0, 0, 0],
 [0, 2000, 2000, 2000, 2000],
 [0, 2000, 3500, 3500, 3500],
 [0, 2000, 3500, 3500, 3500]]

## 16.3 赫夫曼编码
给定 S 表示字符与其出现频率，构造满二叉树

In [13]:
class node:
    def __init__(self,x=None):
        self.val = x
        self.left = None
        self.right = None
    def __repr__(self):
        return str(self.val)
S = [node(("a",45)),node(("b",13)),node(("c",12)),node(("d",16)),node(("e",9)),node(("f",5))]
def huff(S):
    while len(S)>1:
        S.sort(key = lambda k:-(k.val[1]))
        left = S.pop()
        right = S.pop()
        temp = node((left.val[0]+right.val[0],left.val[1]+right.val[1]))
        temp.left = left
        temp.right = right
        S.append(temp)
    return S[0]
    
print(S)
result = huff(S)
print(result.left)
print(result.right)

[('a', 45), ('b', 13), ('c', 12), ('d', 16), ('e', 9), ('f', 5)]
('a', 45)
('cbfed', 55)


### 练习
16.3-7 三叉哈夫曼树

In [16]:
class node:
    def __init__(self,x=None):
        self.val = x
        self.left = None
        self.middle = None
        self.right = None
    def __repr__(self):
        return str(self.val)
S = [node(("a",45)),node(("b",13)),node(("c",12)),node(("d",16)),node(("e",9)),node(("f",5))]
def trihuff(S):
    while len(S)>1:
        print(S)
        if len(S)%2 == 0:
            S.sort(key = lambda k:-(k.val[1]))
            left = S.pop()
            right = S.pop()
            temp = node((left.val[0]+right.val[0],left.val[1]+right.val[1]))
            temp.left = left
            temp.right = right
            S.append(temp)
        else:
            S.sort(key = lambda k:-(k.val[1]))
            left = S.pop()
            middle = S.pop()
            right = S.pop()
            temp = node((left.val[0]+middle.val[0]+right.val[0],left.val[1]+middle.val[1]+right.val[1]))
            temp.left = left
            temp.middle = middle
            temp.right = right
            S.append(temp)
    return S[0]
trihuff(S)

[('a', 45), ('b', 13), ('c', 12), ('d', 16), ('e', 9), ('f', 5)]
[('a', 45), ('d', 16), ('b', 13), ('c', 12), ('fe', 14)]
[('a', 45), ('d', 16), ('cbfe', 39)]


('dcbfea', 100)

## 思考题  
16-1用最少的硬币找n美分零钱的问题。假定每种硬币的面额都是整数。
> a.设计贪心算法求解找零问题，假定有25美分、10美分、5美分、和1美分四种面额的硬币。  
> d.设计一个 $O(nk)$ 时间的找零算法，适用于任何 k 种不同面额的硬币，假定总是包含 1 美分硬币

In [49]:
#a
def change(n):
    answer = [0,0,0,0]
    money = [25,10,5,1]
    i = 0
    while n > 0:
        if n < money[i]:
            i += 1
            continue
        else:
            answer[i] = n//money[i]
            n = n - answer[i]*money[i]
            i += 1
    return answer
change(18)

[0, 1, 1, 3]

In [48]:
#d
def change(n,money):
    m = len(money)
    money = [0] + money
    dp = [[0 for col in range(n+1)]for row in range(m+1)]
    for j in range(1,n+1):
        dp[1][j] = j
    for i in range(2,m+1):
        for j in range(1,n+1):
            answer = dp[i-1][j]
            times = 0
            temp = j
            if j%money[i] == 0:
                answer = j//money[i]
            else:
                while money[i] < j:
                    j -= money[i]
                    times += 1
                    if j > money[i]:
                        answer = min(answer,times+dp[i-1][j])
                    else:
                        answer = min(answer,times+dp[i][j])
            j = temp
            dp[i][j] = answer
    return dp

change(18,[1,5,10,25])
                

[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18],
 [0, 1, 2, 3, 4, 1, 2, 3, 4, 5, 2, 3, 4, 5, 6, 3, 4, 5, 6],
 [0, 1, 2, 3, 4, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 2, 3, 4, 5],
 [0, 1, 2, 3, 4, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 2, 3, 4, 5]]