In [0]:
# Colab 相关设置项
# Mount Google Drive
from google.colab import drive # import drive from google colab

ROOT = "/content/drive"     # default location for the drive
drive.mount(ROOT)           # we mount the google drive at /content/drive
# change to clrs directionary
%cd "/content/drive/My Drive/Colab Notebooks/CLRS/CLRS_notes"

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
/content/drive/My Drive/Colab Notebooks/CLRS/CLRS_notes


In [0]:
%mkdir ch17
!touch ch17/__init__.py

In [0]:
import imp

## 17.0 序论

- 摊还分析通过求数据结构中一个操作序列中所执行的所有操作的平均时间，来评价整体的操作代价
- 摊还分析不同于平均情况分析，不涉及概率，可以保证 **最环情况下每个操作的平均性能**
- 通过摊还分析，通常可获得对某种特定数据结构的认识，这种认识有助于优化设计

## 17.1 聚合分析

- 利用聚合分析， 一个 $n$ 个操作的序列**最坏情况**下花费的总时间为$T(n)$。则**最坏情况**下，每个操作的平均代价，或其摊还代价为 $T(n)/n$

### 栈操作

- 增加一个新的栈操作 MULTIPOP(S, k)，其删除栈 $S$ 栈项的 $k$ 个元素，如果栈中元素少于 $k$， 则将整个元素都弹出

#### 代码实现

In [0]:
from ch10.linkedstack import LinkedStack

def multipop(S, k):
  while not S.is_empty() and k > 0:
    S.pop()
    k = k - 1

LinkedStack.multipop = multipop

In [0]:
S = LinkedStack()
for i in range(10):
  S.push(i)
  print("push: {}, the linked list is: {}".format(i, S))
print("-"*85)
for i in range(5):
  S.multipop(i)
  print("multipop(S, {}), the linked list is: {}".format(i, S))

push: 0, the linked list is: 0 -> None
push: 1, the linked list is: 1 -> 0 -> None
push: 2, the linked list is: 2 -> 1 -> 0 -> None
push: 3, the linked list is: 3 -> 2 -> 1 -> 0 -> None
push: 4, the linked list is: 4 -> 3 -> 2 -> 1 -> 0 -> None
push: 5, the linked list is: 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
push: 6, the linked list is: 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
push: 7, the linked list is: 7 -> 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
push: 8, the linked list is: 8 -> 7 -> 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
push: 9, the linked list is: 9 -> 8 -> 7 -> 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
-------------------------------------------------------------------------------------
multipop(S, 0), the linked list is: 9 -> 8 -> 7 -> 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
multipop(S, 1), the linked list is: 8 -> 7 -> 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
multipop(S, 2), the linked list is: 6 -> 5 -> 4 -> 3 -> 2 -> 1 -> 0 -> None
multipop(S, 3), the linked list is: 3 -> 2 -> 

#### 时间复杂度分析

- 一个由 $n$ 个 `PUSH`、 `POP` 和 `MULTIPOP` 组成的操作序列 $X$ 在一个空栈上的执行的时间复杂度
  - `MULTIPOP` 最坏情况下的运行时间为 $O(n)$， 则 $n$ 个操作序列的最坏运行时间为 $O(n^2)$，每个执行的代价为 $O(n)$
  - 但这不是一个确界，因为一个栈 `POP` 操作的次数（包括 `MULTIPOP` 中 `POP` 的次数）至多与 `PUSH` 的次数相同，所以 $X$ 序列操作的代价至多为 $O(n)$
    - 则平均每个操作的摊还代价为 $O(1)$

### 二进制计数器递增

- $k$ 位二进制计数器递增， 用 $A[0, \cdots, k-1]$ 作为计数器， 其中 $A.length = k$， 初始值全部为0
- 当其中保存的数值为 $x$ 时， 则 $x = \sum_{i=0}^{k-1}A[i]\cdot2^i$

#### 代码实现

In [0]:
%%writefile ch17/increment.py
def increment(A):
  i = 0
  while i < len(A) and A[i] == 1:
    A[i] = 0
    i += 1
  if i < len(A):
    A[i] = 1

Overwriting ch17/increment.py


In [0]:
import array
from ch17.increment import increment
A = array.array('i', [0]*7)
for i in range(17):
  print("i={:2d}, {}".format(i, '-'.join(str(item) for item in reversed(A))))
  increment(A)

i= 0, 0-0-0-0-0-0-0
i= 1, 0-0-0-0-0-0-1
i= 2, 0-0-0-0-0-1-0
i= 3, 0-0-0-0-0-1-1
i= 4, 0-0-0-0-1-0-0
i= 5, 0-0-0-0-1-0-1
i= 6, 0-0-0-0-1-1-0
i= 7, 0-0-0-0-1-1-1
i= 8, 0-0-0-1-0-0-0
i= 9, 0-0-0-1-0-0-1
i=10, 0-0-0-1-0-1-0
i=11, 0-0-0-1-0-1-1
i=12, 0-0-0-1-1-0-0
i=13, 0-0-0-1-1-0-1
i=14, 0-0-0-1-1-1-0
i=15, 0-0-0-1-1-1-1
i=16, 0-0-1-0-0-0-0


#### 执行过程分析

- <img src=https://raw.githubusercontent.com/Lijunjie9502/PicBed/master/20200518115705.png width=800>

#### 时间复杂度分析

- 每次调用 $A[0]$ 即会发生翻转；而每两次调用， $A[1]$ 才会发生翻转 ...
- 则对于一个初值为 $0$ 的计数器执行 $n$ 次 INCREMENT 操作，则 $A[1]$ 翻转 $\lfloor n/2\rfloor$ 次， $A[2]$ 翻转 $\lfloor n/4\rfloor$ 次,  $\cdots$ $A[i]$ 翻转 $\lfloor n/2^i\rfloor$
- 执行 INCREMENT 过程中进行翻转操作的总次数为
  - $$\sum_{i=0}^{k-1}\lfloor {n \over 2^i}\rfloor \le n \sum_{i=0}^{\infty}{1 \over 2^i} = 2n$$
- 则执行 $n$ 次操作的最坏时间代价为 $O(n)$， 每次操作的摊还代价为 $O(1)$

## 17.2 核算法

- 摊还代价
  - 赋予一个操作的费用
  - 不同的操作可能有不同的摊还代价
- 信用
  - 当一个操作的摊还代价超出其实际代价时，将差额存入数据结构中的特定对象，存入的差额称为**信用**
  - 对于后续操作摊还代价小于实际代价的情况，信用可用来支付差额
- 如果用 $c_i$ 表示第 $i$ 个操作的真实代价，用 $\hat{c}_i$ 表示其摊还代价，对于任意 $n$ 个操作序列，应有
  - $$\sum_{i=1}^{n}\hat{c}_i \ge \sum_{i=1}^{n}c_i$$
  - 数据结构中储存的信用等于总的摊还代价与总实际代价的差值，即 $\sum_{i=1}^{n}\hat{c}_i - \sum_{i=1}^{n}c_i$
  - 由定义可知，信用一定为非负值，由此可保证总摊还代价为总实际代价的上界


### 栈操作

- 栈操作的实际代价与摊还代价

| 栈操作      | 实际代价        | 摊还代价 |
|----------|-------------|------|
| PUSH     | 1           | 2    |
| POP      | 1           | 0    |
| MULTIPOP | min\(k, s\) | 0    |