# [Graph Search, Shortest Paths, and Data Structures - Week3](https://www.coursera.org/learn/algorithms-graphs-data-structures/home/week/3)

SUGGESTED READINGS FOR WEEK 3: Algorithms Illuminated (Part 2), Chapters 10 and 11. 

## XII. HEAPS (Week 3)

### [Data Structures: Overview](https://www.coursera.org/learn/algorithms-graphs-data-structures/lecture/WHOPA/data-structures-overview)

#### Data Structures

![](https://i.imgur.com/NEMBj7Z.png)

#### Take It to the Next Level

![](https://i.imgur.com/gHllh3l.png)
- **Level 2 (Good programmer): 知道各種 data structure 的 operations 以及使用時機，可以根據自己的 task 來選擇合適的 data structure**
    - 這個 level 是本門課主要希望學生擁有的能力。
- **Level 3 (hardcore programmer): 不想只是當 data structures 的 client，而是根據自己的 task 設計出最合適的 data structure !!!**
    - 本門課將這個 level 會需要的內容放在 optional videos 內，想當 hardcore programmer 或有興趣的話可以去看!

### [Heaps: Operations and Applications](https://www.coursera.org/learn/algorithms-graphs-data-structures/lecture/iIzo8/heaps-operations-and-applications)

#### Heap: Supported Operations

![](https://i.imgur.com/Ibl6qLQ.png)
- Heap 可以看成是 a container for objects that have keys
    - 這邊可以把 key 想成 value，但要**注意 key 必須可以比大小** (回想 heap 的特性)。
    - 一些例子：
        - object 是 edges in a graph，key 是 edge length。
        - object 是 events，key 是 event 的開始時間。
        - object 是 員工紀錄，key 是員工的 social security numbers。@@
- 對於任何 data structure，你不只該知道它們支援哪些 operations，也該知道它們的 running time。
- Heaps 支援：
    - **insertion** in $O(\log n)$
    - **extract-min** in $O(\log n)$ (或 extract-max，**只能選其中一個**)
    - **heapify**: initialize 一個 size 為 $n$ 的 heap in $O(n)$
        - 如果直接做 $n$ 次 insert 可能需要花 $O(n\log n)$，但是用 heapify 的方式只需要 $O(n)$
            - > Q: 做 $n$ 次 insert 應該是 $\le c(\log 1 + \log 2 + ... + \log n)$，雖然的確可以寫成 $O(n\log n)$? 但怎麼知道沒有更 tight 的 bound 呢? 改天來推推看好了
        - > Q: 我真的不確定 heapify 的定義是什麼@@ 改天仔細查查
            - 如果說是把 array 整成 heap 的話，(根據網路查到的)步驟似乎是先把 array 變成 binary tree，然後再把 binary tree 變 heap。
    - **delete**: in $O(\log n)$
        - > Q: 這裡指的應該是已經知道 object 的位置了，不包含 search operation 吧(delete by key)??

#### Application: Sorting

![](https://i.imgur.com/606C2uR.png)
- heap 可以加速重複的 minimum computations
- 例如 selection sort，我們做的事情是一直去找剩下 array 的最小值出來，放到 sorted part 裡面
- 這邊「一直找最小值」的部分就可以利用 heap 加速，其實就是 heap sort
    - 先把所有 elements 放到 heap 裡面
    - 一個一個拿出 minimum
    - > Q: 為何說這樣是 $2n$ 個 heap operations? 第二步是 $n$ 次 extract-min 我理解，但第一步不就 heapify 嗎? 一個一個 insert element 是土法煉鋼吧? 還是我對前面說的 heapify 理解有誤?
- summary: heap sort 就是 selection sort 的改良版，從 $O(n^2)$ 變成 $O(n\log n)$，已經達到 comparison-based sort 的 optimal。

#### Application: Event Manager

![](https://i.imgur.com/OBj9mh5.png)
- **Priority Queue 跟 heap 是同義詞**
- 現在有很多個 event 等著被執行，需要找誰是下一個 event?
    - 就挑預定執行時間最早的就好啦
    - 執行完下一個又要繼續找下下一個... 也就是說我們要不斷地找最早的 event
    - 因此我們要不斷 extract minimum of scheduled event time。
    - 顯然要用到 heap A_A，然後 key 就是 scheduled event time。

#### Application: Median Maintenance

![](https://i.imgur.com/BDgDYyj.png)
- 每個 time step $i$ 你會拿到數字 $x_1,...,x_i$，每次都要計算 median。
    - 給定整串數字，我們當然可以在 linear time $O(i)$ 算出來
        - > Q: 修但幾咧，怎麼算我不知道QQ 改天回來想
    - 不過就像題目說的，我們的情境是，數字會逐漸增加，一次來一個數字，那 time step $i$ 要怎麼在 $O(\log i)$ 的時間內算出 median 呢?
- 解法
    - 可以先把資料分兩部分存：
        - 最小的那一半存在 $H_{Low}$，用 max heap 存
        - 最大的那一半存在 $H_{High}$，用 min heap 存
    - 然後保持 invariant: $H_{Low}$ 就是存最小那一半，$H_{High}$ 就是存最大那一半
- You check, in step $i$:
    1. can maintain invariant with $O(\log i)$ work
        - 應該就看 $x_i$ 跟 $H_{Low}$ 的 maximum 跟 $H_{High}$ 的 minimum 比大小，根據比較結果跟 heap size 來決定要 insert 到哪個 heap 吧?
            - 如果 $x_i$ 的大小介於那兩個值之間，才需要根據 heap size 決定ㄅ
            - 還有就是 $x_i$ 插入某個 heap 之後，如果兩個 heap size 不平均，就要把太多的 heap 的極值丟給另外一個 heap，所以還會有一次 extract 跟 insert，都是 $O(\log i)$。
        - 計算 maximum 和 minimum 都是 $O(\log i)$，insert 也是 $O(\log i)$，故總工作量也 $O(\log i)$ 吧
    2. given invariant, can compute median in $O(\log i)$ work
        - 應該也是根據兩個 heap 的 size 決定要提取哪個 heap 的 minimum/maximum，所以也是 $O(\log i)$ 吧

#### Application: Speeding Up Dijkstra

![](https://i.imgur.com/CHRpHzP.png)
- 這個在 week 2 有講過，總之 heap 可以加速 Dijkstra's algorithm 因為他需要一直 extract minimum。
- 再次的呈現了，只要使用得宜的 data structure，就可以幫助 algorithm 加速！

### [Heaps: Implementation Details [Advanced - Optional]](https://www.coursera.org/learn/algorithms-graphs-data-structures/lecture/KKqlm/heaps-implementation-details-advanced-optional)

來不及看這個，下次一定看QQ

## XIII. BALANCED BINARY SEARCH TREES (Week 3)

### [Balanced Search Trees: Operations and Applications](https://www.coursera.org/learn/algorithms-graphs-data-structures/lecture/juAOg/balanced-search-trees-operations-and-applications)

#### Balanced Search Trees: Supported Operations

![](https://i.imgur.com/ugk1UgJ.png)

#### The Height of a BST

![](https://i.imgur.com/35OcEdy.png)
- > Q: best case 跟 worst case 寫反了吧?

#### Searching and Inserting

![](https://i.imgur.com/6gyu61N.png)

#### Quiz: ???

![](https://i.imgur.com/RxSB5vf.png)

#### Min, Max, Pred, and Succ

![](https://i.imgur.com/F70DXtD.png)

#### Quiz: ???

![](https://i.imgur.com/6lactk0.png)

#### In-Order Traversal

![](https://i.imgur.com/J2OKd6W.png)

#### Deletion

![](https://i.imgur.com/QkSiHQx.png)

#### Deletion (con'd)

![](https://i.imgur.com/ql3CuID.png)

#### Select and Rank

![](https://i.imgur.com/ima6VYh.png)

#### Select and Rank (con'd)

![](https://i.imgur.com/6KFqR9i.png)