# [Greedy Algorithms, Minimum Spanning Trees, and Dynamic Programming - Week3](https://www.coursera.org/learn/algorithms-greedy/home/week/3)

- Huffman Codes
- Dynamic Programming
- Weighted Independent Sets

## XXIV. Huffman Codes

### [Introduction and Motivation](https://www.coursera.org/learn/algorithms-greedy/lecture/plgXS/introduction-and-motivation)

#### Binary Codes

![](https://i.imgur.com/8A2YuJq.png)
- (video unwatched)
- 註：punctuation=標點符號

#### Ambiguity

![](https://i.imgur.com/fAGsQEW.png)
- (video unwatched)
- Ans: <font style="opacity:.05">not enough information !!</font>
- 思考：這樣的性質是因為每個 character encoding 的 length 不再相等了

#### Prefix-Free Codes

![](https://i.imgur.com/Th32JOw.png)
- Prefix-free codes 就是希望沒有任何 encoding 是別的 encoding 的 prefix
- Example: 假設要 encode 4 個 character A、B、C、D
    - 如果把 A encode 成 0
    - 那剩下(B、C、D)的 encoding 就該把 1 當成第一個 bit
    - B encode 成 10
    - C encode 成 110
        - Q: C 為何不能 encode 成 11?
            - 因為這樣 B 跟 C 就把剩下所有可能的二位都選完了(因為A是0因此00、01已被ban)，這樣就不能 encode D 了！
    - D encode 成 111。
- 為何我們要用長度不等的 encoding 呢? 因為這樣可以從 non-uniform character frequencies 中獲得好處！
- Q: 不過長度相等的 code $\{00,01,10,11\}$ 應該也是一種 Prefix-Free Code 吧?

#### Example

![](https://i.imgur.com/bCcV1bI.png)
- (video unwatched)
- Ans: <font style="opacity:.1">$0.6\times1+0.25\times2+0.1\times3+0.05\times3 = 1.55$</font>
- 延伸思考：那如果機率都是 25%，結果會如何?
    - fixed-length 的 average code length 一樣是 2
    - variable-length 的 average code length 變成 2.25

### [Problem Definition](https://www.coursera.org/learn/algorithms-greedy/lecture/IWxVe/problem-definition)

#### Codes as Trees

![](https://i.imgur.com/jk8XPwC.png)
- (video unwatched)
- 可以把 binary codes 化為 binary trees 的形式，反之同理
- 這招酷喔
- 思考：看到這種問題要怎麼聯想到可以把它看成 tree 呢?
    - 可能這個問題可以想成是在做一連串的 decision (決定下一個 bit 是誰?)，所以可以想成 tree?

#### Prefix-Free Codes as Trees

![](https://i.imgur.com/2pSNCyW.png)
- (video unwatched)
- 用 left child **edges** 表示 0、right child edges 表示 1
- 對於任意 character $i$ 都有一個對應的 node 被 label 成 $i$
- $i$ 的 encoding 就等同 從 root 到 node $i$ 的 path
- Prefix-free constraint 就等同 labeled nodes 必須是 leaves
- 那麼給定一串 encoding，要怎麼 decode 回原本字串呢?
    - 就 repeatedly 從 tree 的 root 開始走，直到走到 leaf 就知道是哪個 character 啦

#### Problem Definition

![](https://i.imgur.com/4VzPeft.png)
- (video unwatched)
- **Input**: 每個 character $i$ 出現的機率 $p_i$
- tree $T$ 就用來代表 $\Sigma$ 的 encodings
- Average Encoding Length $L(T)=\sum_{i\in\Sigma}p_i\cdot[\textrm{depth of }i]$
- **Output**: tree $T$ that minimizing $L(\cdot)$

### [A Greedy Algorithm](https://www.coursera.org/learn/algorithms-greedy/lecture/ZIJwv/a-greedy-algorithm)

#### Codes as Trees

![](https://i.imgur.com/0aRNV7S.png)
- 來看一下我們的 problem
- 跟之前遇到的問題都不太一樣
    - 現在的 input 是 unstructured input (之前都是 given array / graph 之類的)
    - 我們要自己建造合適的 tree

#### Building a Tree

![](https://i.imgur.com/PDa8ab6.png)
- Top-down 的這種方法 (Fanno-Shannon coding) 並不是一個好方法
    - 它希望 left/right tree 各佔 50% 的 frequency
    - Q: 但是為什麼呢?
- Huffman 發現了這點，提出 bottom-up 的方法
    - 從 leaf 開始 build tree！
    - 如 slide 圖
- 猜測：
    - 先從「希望 path 最長的 character」開始選 (因為越早開始 merge 的 node 就會有越長的 path)
    - 所以先從機率最小的 character 開始 merge
    - 然後每次 merge 都避免某個 node 是別的 node 的 ancestor 即可?
    - 感覺不是這樣做 = = 因為這樣的話 top-down 也可以做吧(嗎?

#### A Greedy Approach

![](https://i.imgur.com/jbcRhkE.png)
- Observation: 任何 node 它的 encoding length 就等於它(所在的 component/subtree) 做了幾次 merge 的次數。
    - 每次做 merge，則 merge 的兩顆 subtree 裡的所有 node，depth 都會 +1
- 所以一個 greedy 的啟發就是，在第一個 iteration，先 merge probability 最小的 pair。

#### How to Recurse?

![](https://i.imgur.com/P7FVHNj.png)
- 把兩個 symbol merge 成一個 meta-symbol，那麼該 meta-symbol 的機率該如何以 $p_a$ 及 $p_b$ 表示?
- Ans: <font style="opacity:.05">$p_a+p_b$</font>

#### Example

![](https://i.imgur.com/ptgZTXv.png)
- (video unwatched)
- 先把 symbol set 慢慢合併，再用 tree 表示
- 其實我覺得改成這樣畫比較好理解如何 programming (後面的 pseudocode)
    - ![](https://i.imgur.com/i2KYY8Q.png)

#### Huffman's Algorithm

![](https://i.imgur.com/QVhuq8o.png)
- (video unwatched)
- 先抓出 frequency(or probability) 最小的一對 character $a,b$
- merge $a,b$ 形成新的 symbol set $\Sigma'$
- recursively 畫下一顆 tree (given 新的 $\Sigma'$)

### [A More Complex Example](https://www.coursera.org/learn/algorithms-greedy/lecture/rTB4s/a-more-complex-example)

#### Input and Steps 1 and 2

![](https://i.imgur.com/k2mW7jS.png)
- (video unwatched)

#### Steps 3 and 4

![](https://i.imgur.com/vBvI07J.png)
- (video unwatched)

#### Final Output

![](https://i.imgur.com/6tVb55z.png)
- (video unwatched)
- 水啦

### [Correctness Proof I](https://www.coursera.org/learn/algorithms-greedy/lecture/eSz8f/correctness-proof-i)

#### Correctness of Huffman's Algorithm

![](https://i.imgur.com/xUsXSgZ.png)

#### Inductive Step

![](https://i.imgur.com/jOZQKdL.png)

### [Correctness Proof II](https://www.coursera.org/learn/algorithms-greedy/lecture/l3Ss5/correctness-proof-ii)

#### Proof of Theorem

![](https://i.imgur.com/EeGKjz1.png)

#### Proof of Key Lemma

![](https://i.imgur.com/9nzXWWM.png)

#### Notes on Running Time

![](https://i.imgur.com/f4fVBrR.png)

## XXV. Introduction to Dynamic Programming

### [Introduction: Weighted Independent Sets in Path Graphs](https://www.coursera.org/learn/algorithms-greedy/lecture/WENc1/introduction-weighted-independent-sets-in-path-graphs)

### [WIS in Path Graphs: Optimal Substructure](https://www.coursera.org/learn/algorithms-greedy/lecture/t9XAF/wis-in-path-graphs-optimal-substructure)

### [WIS in Path Graphs: A Linear-Time Algorithm](https://www.coursera.org/learn/algorithms-greedy/lecture/w040v/wis-in-path-graphs-a-linear-time-algorithm)

### [WIS in Path Graphs: A Reconstruction Algorithm](https://www.coursera.org/learn/algorithms-greedy/lecture/TZgJM/wis-in-path-graphs-a-reconstruction-algorithm)

### [Principles of Dynamic Programming](https://www.coursera.org/learn/algorithms-greedy/lecture/VEc7L/principles-of-dynamic-programming)