In [2]:
L = 3
R = 10
mid = L + ((R - L) >> 1)
mid

6

In [6]:
def process(list, L, R):
    if L == R:
        return list[L]
    mid = L + ((R - L) >> 1)
    leftMax = process(list, L, mid) # T(N/2)
    rightMax = process(list, mid+1, R) # T(N/2)

    return max(leftMax, rightMax) # O(1)
list = [3,2,5,6,7,4]
process(list, 0, len(list)-1)

7

递归复杂度

master公式：$T(N) = a * T(\frac{N}{b}) + O(N^d)$
- $\log_b a < d \to O(N^d)$
- $\log_b a > d \to O(N^{\log_b a})$
- $\log_b a = d \to O(N^d * \log N)$

process复杂度：

$T(N) = 2 * T(\frac{N}{2})$

$\log_2 2 > 0 \to O(N^{\log_2 2}) = O(N)$

# 归并排序

In [54]:
def MergeSort(list):
    if list is None or len(list) < 2:
        return ;
    return process(list, 0, len(list) - 1)

def process(list, L, R):
    if L == R:
        return ;
    mid = L + ((R - L) >> 1)
    process(list, L, mid) # T(N/2)
    process(list, mid+1, R) # T(N/2)
    merge(list, L, mid, R)
    return list

def merge(list, L, M, R):
    tmp = []
    p1, p2 = L, M + 1
    while p1 <= M and p2 <= R:
        if list[p1] <= list[p2]:
            tmp.append(list[p1])
            p1 += 1
        else:
            tmp.append(list[p2])
            p2 += 1

    while p1 <= M:           # p1 没越界
        tmp.append(list[p1])
        p1 += 1
    while p2 <= R:           # p2 没越界
        tmp.append(list[p2])
        p2 += 1

    list[L:R+1] = tmp

In [55]:
list = [3, 1, 3, 2, 4, 6, 7, 10, 1]
MergeSort(list)

[1, 1, 2, 3, 3, 4, 6, 7, 10]

$T(N) = 2T(\frac{N}{2}) + O(N)$

$\log_2 2 = 1 \to O(N \log N)$

时间复杂度$O(N \log N)$，空间复杂度$O(N)$

## 小和问题

![小和问题](./Images/%E5%B0%8F%E5%92%8C%E9%97%AE%E9%A2%98.png)

In [43]:
def SmallNum(list):
    if list is None or len(list) < 2:
        return ;
    return process(list, 0, len(list) - 1)

def process(list, l, r):
    if l == r:
        return 0;
    mid = l + ((r - l) >> 1)
    return process(list, l, mid) + process(list, mid+1, r) + merge(list, l, mid, r)

def merge(list, l, m, r):
    tmp = []
    p1, p2 = l, m + 1
    res = 0
    while p1 <= m and p2 <= r:
        if list[p1] < list[p2]:
            res += (r - p2 + 1) * list[p1]
            tmp.append(list[p1])
            p1 += 1
        else:
            tmp.append(list[p2])
            p2 += 1
    
    while p1 <= m:           # p1 没越界
        tmp.append(list[p1])
        p1 += 1
    while p2 <= r:           # p2 没越界
        tmp.append(list[p2])
        p2 += 1
    
    list[l:r+1] = tmp
    return res

In [44]:
list = [1, 3, 4, 2, 5]
SmallNum(list)

16

## 逆序对问题

![逆序对问题](./Images/逆序对问题.png)

# 快排

In [303]:
import random
def quickSort(list):
    if list is None or len(list) < 2:
        return ;
    return process(list, 0, len(list) - 1)
def process(list, L, R):
    if L >= R:
        return ;
    sec = random.randint(L, R)
    list[sec], list[R] = list[R], list[sec]
    p = partition(list, L, R)
    process(list, L, p[0]) # < 区
    process(list, p[1], R) # > 区
    return list
def partition(list, L, R):
    less, more = L - 1, R # <右区边界，>区左边界
    while L < more:
        if list[L] < list[R]:
            less += 1
            list[L], list[less] = list[less], list[L]
            L += 1
        elif list[L] > list[R]:
            more -= 1
            list[L], list[more] = list[more], list[L]
        else:
            L += 1
    list[R], list[more] = list[more], list[R]
    return less, more+1

In [268]:
random.randint(0, 5)

0

In [304]:
list = [1, 3, 4, 2, 5, 1, 3, 5, 0]
quickSort(list)

[0, 1, 1, 2, 3, 3, 4, 5, 5]

# 堆排序

In [394]:
def heapSort(list):
    if list is None or len(list) < 2:
        return ;

    for i in range(len(list)): # 向上维护大根堆
        heapInsert(list, i)
    
    heapSize = len(list) - 1
    while heapSize > 0:
        list[0], list[heapSize] = list[heapSize], list[0]
        heapSize -= 1
        heapify(list, 0, heapSize) # 向下维护大根堆
    return list

def heapInsert(list, index):
    while index > 0 and list[index] > list[(index-1) // 2]:
        list[index], list[(index-1) // 2] = list[(index-1) // 2], list[index]
        index = (index - 1) // 2
    return list

def heapify(list, index, heapSize):
    left = index * 2 + 1 # 左孩子下标
    while left < heapSize:
        largest = left
        if left + 1 < heapSize and list[left + 1] > list[left]:
            largest = left + 1
        if list[largest] <= list[index]:
            largest = index
        if largest == index:
            return list
        list[largest], list[index] = list[index], list[largest]
        index = largest
        left = index * 2 + 1
    return list

In [406]:
def heapify(list, index, heapSize):
    left = index * 2 + 1 # 左孩子下标
    largest = index
    if left < heapSize and list[left] > list[largest]:
        largest = left
    if left + 1 < heapSize and list[left + 1] > list[largest]:
        largest = left + 1
    if largest == index:
        return list
    list[largest], list[index] = list[index], list[largest]
    heapify(list, largest, heapSize)
    return list

def heapSort(list):
    if list is None or len(list) < 2:
        return ;

    n = len(list)
    i = n // 2 - 1
    while i >= 0:
        heapify(list, i, n-1)
        i -= 1
    # 排序
    low = n - 1
    while low > 0:
        list[low], list[0] = list[0], list[low]
        low -= 1
        heapify(list, 0, low)
    return list

In [407]:
list = [1, 3, 4, 2, 5, 1, 3, 5, 0]
heapSort(list)

[0, 1, 1, 2, 3, 3, 4, 5, 5]

In [11]:
a = {1:"cheng", 2:"zhuo"}
a.items()

dict_items([(1, 'cheng'), (2, 'zhuo')])

In [18]:
list = [1, 3, 4, 2, 5, 1, 3, 5, 0]
list.insert(0, 10)
list

[10, 1, 3, 4, 2, 5, 1, 3, 5, 0]

# 数组与列表

- 数组元素类型相同
- 数组长度固定

# 栈

In [37]:
class Stack:
    def __init__(self):
        self.stack = []
    def push(self, value):
        self.stack.append(value)
    def pop(self):
        if not self.stack:
            return None
        return self.stack.pop()
    def get_top(self):
        if not self.stack:
            return None
        return self.stack[-1]
    
    def is_empty(self):
        return len(self.stack) == 0

In [34]:
stack = Stack()
stack.push(1)
# stack.push(2)
# stack.push(3)
stack.pop()
stack.get_top()
# stack.pop()

## 括号匹配

In [77]:
def brace_match(s):
    match = {'}':'{', '{':'}', ']':'[', '[':']', ')':'(', '(':')'}
    stack = Stack()
    for ch in s:
        if ch in {'(', '[', '{'}:
            stack.push(ch)
        elif ch in {')', ']', '}'}:
            if stack.get_top() == match[ch]:
                stack.pop()
            else:
                return False
    if stack.is_empty():
        return True
    return False

In [82]:
# brace_match('{aaaa}[{()[]sss}]((()))')
# brace_match('{aaaa}[{()[(])sss}]((()))')
# brace_match('({)}')
brace_match(']{}')

False

# 队列
![环形队列](./Images/%E7%8E%AF%E5%BD%A2%E9%98%9F%E5%88%97.png)

环形队列：当队尾指针rear == MaxSize + 1时，再前进一个位置就自动到0.
- 队首指针前进1：front = (front+1) % MaxSize
- 队尾指针前进1：rear = (rear+1) % MaxSize
- 队空条件：rear == front
- 队满条件：(rear + 1) % MaxSize == front

In [8]:
class Queue:
    def __init__(self, size=100):
        self.queue = [None] * size
        self.size = size
        # 队首和队尾指针
        self.front, self.rear = 0, 0

    def push(self, value):
        if self.is_filled():
            raise IndexError("Queue is filled!")
        self.rear = (self.rear + 1) % self.size
        self.queue[self.rear] = value

    def pop(self):
        if self.is_empty():
            raise IndexError("Queue is empty!")
        self.front = (self.front + 1) % self.size
        return self.queue[self.front]

    def is_empty(self):
        return self.rear == self.front

    def is_filled(self):
        return (self.rear + 1) % self.size == self.front

In [15]:
q = Queue(5)
for i in range(4):
    q.push(i)
q.pop()

0

In [21]:
from collections import deque

q = deque([1,2,3,4,5], maxlen=5)
q.append(6) # 队尾进队
q.popleft() # 队首出队

# # 用于双向队列
# q.appendleft(2) # 队首进队
# q.pop() # 队尾出队

2

In [29]:
def tail(n):
    with open('./File/test.txt', 'r') as f:
        q = deque(f, n)
        return q
for line in tail(5):
    print(line, end='')

555
666
777
888
999

# 栈和队列的应用——迷宫问题
给定一个二维列表，表示迷宫（0表示通道，1表示围墙）。给出算法，求一条走出迷宫的路径。
![迷宫问题](./Images/迷宫问题.png)


## 深度优先搜索（回溯法）
![回溯法](./Images/回溯法.png)

In [72]:
maze = [
    [1,1,1,1,1,1,1,1,1,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,0,0,1,1,0,0,1],
    [1,0,1,1,1,0,0,0,0,1],
    [1,0,0,0,1,0,0,0,0,1],
    [1,0,1,0,0,0,1,0,0,1],
    [1,0,1,1,1,0,1,1,0,1],
    [1,1,0,0,0,0,0,0,0,1],
    [1,1,1,1,1,1,1,1,1,1]
]
# 上， 右，下，左
dirs = [lambda x,y: (x-1,y),
        lambda x,y: (x,y+1),
        lambda x,y: (x+1,y),
        lambda x,y: (x,y-1)
        ]

def maze_path(x1, y1, x2, y2):
    stack = []
    stack.append((x1,y1))
    while stack:
        curNode = stack[-1]
        if curNode == (x2, y2):
            # 走到终点了
            for p in stack:
                print(p)
            return True
        # (x,y) 四个方向 (x-1,y); (x+1,y); 
        # (x,y-1); (x,y+1)
        for dir in dirs:
            nextNode = dir(curNode[0], curNode[1])
            # 如果下个节点能走
            if maze[nextNode[0]][nextNode[1]] == 0:
                stack.append(nextNode)
                maze[nextNode[0]][nextNode[1]] = 2 # 已走过
                break # 找到一个方向即可
        else: # 
            maze[curNode[0]][curNode[1]] = 2
            stack.pop()
    print("没有路！")
    return False

In [73]:
maze_path(1,1,8,8)

(1, 1)
(1, 2)
(2, 2)
(3, 2)
(3, 1)
(4, 1)
(5, 1)
(5, 2)
(5, 3)
(6, 3)
(6, 4)
(6, 5)
(5, 5)
(4, 5)
(4, 6)
(4, 7)
(3, 7)
(3, 8)
(4, 8)
(5, 8)
(6, 8)
(7, 8)
(8, 8)


True

## 广度优先搜索
![广度优先搜索](./Images/广度优先搜索.png)

In [93]:
from collections import deque
maze = [
    [1,1,1,1,1,1,1,1,1,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,0,0,1,1,0,0,1],
    [1,0,1,1,1,0,0,0,0,1],
    [1,0,0,0,1,0,0,0,0,1],
    [1,0,1,0,0,0,1,0,0,1],
    [1,0,1,1,1,0,1,1,0,1],
    [1,1,0,0,0,0,0,0,0,1],
    [1,1,1,1,1,1,1,1,1,1]
]
# 上， 右，下，左
dirs = [lambda x,y: (x-1,y),
        lambda x,y: (x,y+1),
        lambda x,y: (x+1,y),
        lambda x,y: (x,y-1)
        ]

def print_r(path):
    curNode = path[-1] # 终点
    real_path = []

    while curNode[2] != -1:
        real_path.append(curNode[0:2])
        curNode = path[curNode[2]]

    real_path.append(curNode[0:2]) # 起点
    real_path.reverse()
    print(real_path)

def maze_path_queue(x1, y1, x2, y2):
    q = deque()
    q.append((x1, y1, -1))
    path = []
    while q:
        curNode = q.popleft()
        path.append(curNode)
        if curNode[0:2] == (x2,y2):
            # 到达终点
            print_r(path)
            return True
        for dir in dirs:
            nextNode = dir(curNode[0], curNode[1])
            if maze[nextNode[0]][nextNode[1]] == 0:
                q.append((nextNode[0], nextNode[1], len(path)-1)) #后续节点进队，记录上一个节点
                maze[nextNode[0]][nextNode[1]] = 2 # 已走过
    print("没有路！")
    return False

In [94]:
maze_path_queue(1,1,8,8)

[(1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (5, 2), (5, 3), (6, 3), (6, 4), (6, 5), (7, 5), (8, 5), (8, 6), (8, 7), (8, 8)]


True

# 链表
![链表](./Images/链表.png)

In [100]:
class Node:
    def __init__(self, item):
        self.item = item
        self.next = None

a = Node(1)
b = Node(2)
c = Node(3)

a.next, b.next = b, c

a.next.next.item

3

### 创建链表
![创建链表](./Images/创建链表.png)

In [112]:
def create_linklist_head(li):
    head = Node(li[0])
    for element in li[1:]:
        node = Node(element)
        node.next = head
        head = node
    return head

def create_linklist_tail(li):
    head = Node(li[0])
    tail = head
    for element in li[1:]:
        node = Node(element)
        tail.next = node
        tail = node
    return head

### 链表的遍历


In [127]:
def print_linklist(lk):
    while lk:
        print(lk.item, end=',')
        lk = lk.next

In [125]:
lk_head = create_linklist_head([1,2,3,6,8])
lk_tail = create_linklist_tail([1,2,3,6,8])
print_linklist(lk_head)
print("\n")
print_linklist(lk_tail)

8,6,3,2,1,

1,2,3,6,8,

### 链表的插入
- p.next = curNode.next
- curNode.next = p
### 链表的删除
- p = curNode.next
- curNode.next = p.next
- del p

## 双链表

In [128]:
class Node:
    def __init__(self, item=None):
        self.item = item
        self.next = None
        self.prior = None

### 双链表的插入
- p.next = curNode.next
- curNode.next.prior = p
- p.prior = curNode
- curNode.next = p
### 双链表的删除
- p = curNode.next
- curNode.next = p.next
- p.next.prior = curNode
- del p

## 链表——复杂度分析
顺序表（数组/列表）与链表
- 按元素值查找：顺序表O(n)，链表O(n)
- 按下标查找：顺序表O(1)，链表O(n)
- 在某元素后插入：顺序表O(n)，链表O(1)
- 删除某元素：顺序表O(n)，链表O(1)

顺序表（数组/列表）与链表
- 链表在插入和删除的操作上明显快于顺序表
- 链表的内存可以更灵活分配（试利用链表重新实现栈和队列）
- 链表这种链式存储的数据结构对树和图的结构有很大的启发性

In [129]:
# class stack:
#     def __init__(self):
#         self.stack = self.Node(None)

#     def Node(self, item=None):
#         self.item = item
#         self.next = None

#     def insert_head(self, p):
#         p.next = self.stack
#         self.stack = p

#     def delete_tail(self):
#         while self.stack:
#             self.stack = self.stack.next

#     def push(self, value):
#         self.insertNode(value)
    
#     def pop(self):
#         self.delteNode()

# 哈希表
哈希表：一个通过哈希函数来计算数据存储位置的数据结构，通常支持如下操作：
- insert(key, value)：插入键值对(key, value)
- get(key)：如果存在键为key的键值对则返回其value，否则返回空值
- delete(key)：删除键为key的键值对

## 直接寻址表
![直接寻址表](./Images/直接寻址表.png)
直接寻址技术缺点：
- 当域U很大时，需要消耗大量内存，很不实际
- 如果域U很大而实际出现的key很少，则大量空间被浪费
- 无法处理关键字不是数字的情况

## 哈希
直接寻址表：key为k的元素放到k位置上
改进直接寻址表：哈希（Hashing）
- 构建大小为m的寻址表T
- key为k的元素放到h(k)位置上
- h(k)是一个函数，其讲域映射到表T[0,$\dots$,m-1]

![哈希表](./Images/哈希表.png)

## 哈希冲突
由于哈希表的大小是有限的，而要存储的值的总数量是无限的，因此对于任何哈希函数，都会出现两个不同元素映射到同一个位置上的情况，这种情况叫做<font color=red>哈希冲突</font>。

比如$h(k) = k % 7$，$h(0) = h(7) = h(14) = \cdots$

## 解决哈希冲突——开放寻址法
如果哈希函数返回的位置已经有值，则可以向后探查新的位置来存储这个值。
- 线性探查：如果位置$i$被占用，则探查$i+1, i+2, \dots$
- 二次探查：如果位置$i$被占用，则探查$i+1^2, i-1^2, i+2^2, i-2^2, \dots$
- 二度哈希：有$n$个哈希函数，当使用第1个哈希函数$h1$发生冲突时，则尝试使
用$h2, h3, \dots$

## ## 解决哈希冲突——拉链法

拉链法：哈希表每个位置都连接一个链表，当冲突发生时，冲突的元素将被加到该位置链表的最后。

![拉链法](./Images/拉链法.png)

## 哈希表——常见哈希函数

- 除法哈希法：$h(k) = k \% m$
- 乘法哈希法：h(k) = floor(m*(A*k % 1))
- 全域哈希法：$h_{a,b}(k) = ((a*k + b) \% p) \% m$，$a,b = 1, 2, \dots,  p-1$

In [1]:
class LinkList:
    class Node:
        def __init__(self, item=None):
            self.item = item
            self.next = None

    class LinkListIterator:
        def __init__(self, node):
            self.node = node

        def __next__(self):
            if self.node:
                curNode = self.node
                self.node = curNode.next
                return curNode.item
            else:
                raise StopIteration

        def __iter__(self):
            return self

    def __init__(self, iterable=None): # iterable: 列表
        self.head = None
        self.tail = None
        if iterable:
            self.extend(iterable)
    # 尾插法
    def append(self, obj):
        s = self.Node(obj)
        if not self.head:
            self.head, self.tail = s, s
        else:
            self.tail.next = s
            self.tail = s

    def extend(self, iterable):
        for obj in iterable:
            self.append(obj)

    def find(self, obj):
        for n in self:
            if n == obj:
                return True
        return False

    def __iter__(self):
        return self.LinkListIterator(self.head)

    def __repr__(self):
        return "<<" + ",".join(map(str, self)) + ">>"

In [2]:
lk = LinkList([1,2,3,4,5])
print(lk)
for element in lk:
    print(element)

<<1,2,3,4,5>>
1
2
3
4
5


In [9]:
# 类似于集合的结构
class HashTable:
    def __init__(self, size=101):
        self.size = size
        self.T = [LinkList() for i in range(self.size)]

    def h(self, k):
        return k % self.size

    def insert(self, k):
        i = self.h(k)
        if self.find(k):
            print("Duplicated Insert.")
        else:
            self.T[i].append(k)

    def find(self, k):
        i = self.h(k)
        return self.T[i].find(k)

    def __repr__(self):
        return ",".join(map(str, self.T))

In [17]:
ht = HashTable()
ht.insert(0)
ht.insert(1)
ht.insert(3)
ht.insert(102)
ht.insert(508)
# ht.insert(0)

print(ht)

<<0>>,<<1,102>>,<<>>,<<3,508>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>,<<>>


In [24]:
ht.find(203)

False

## 哈希表的应用

### 集合与字典
集合和字典都是通过哈希表来实现的。
a = {'name':'Alex', 'age':18, 'gender':'Man'}\\
使用哈希表存储字典，通过哈希函数将字典的键映射为下标。假设h('name')=3，h('age')=1，h('gender')=4，则哈希表存储为[None, 18, None, 'Alex', 'Man']

如果发生哈希冲突，则通过拉链法或开发寻址法解决

### MD5算法
MD5(Message-Digest Algorithm5)曾经是密码学中常用的哈希函数，可以把任意长度的数据映射为128位的哈希值，其曾经包含如下特征
- 同样的消息，其MD5值必定相同；
- 可以快速计算出任意给定消息的MD5值；
- 除非暴力的枚举所有可能的消息，否则不可能从哈希值反推出消息本身；
- 两条消息之间即使只有微小的差别，其对应的MD5值也应该是完全不同、完全不相关的；
- 不能在有意义的时间内人工的构造两个不同的消息使其具有相同的MD5值。

应用举例：文件的哈希值  
- 算出文件的哈希值，若两个文件的哈希值相同，则可认为这两个文件是相同的。因此：
- - 用户可以利用它来验证下载的文件是否完整。
- - 云存储服务商可以利用它来判断用户要上传的文件是否已经存在于服务器上，从而实现秒传的功能，同时避免存储过多相同的文件副本。

### SHA2算法
历史上MD5和SHA-1曾经是使用最为广泛的cryptographic hash function,但是随着密码学的发展，  
这两个哈希函数的安全性相继受到了各种桃战。

因此现在安全性较重要的场合推荐使用SHA-2等新的更安全的哈希函数。

SHA-2包含了一系列的哈希函数：SHA-224,SHA-256,SHA-384,SHA-512,  
SHA-512/224,SHA-512/256,其对应的哈希值长度分别为224,256,384or512位。

SHA-2具有和MD5类似的性质（参见MD5算法的特征）。

应用举例：

例如，在比特币系统中，所有参与者需要共同解决如下问题：对于一个给定的字符串U，给定的目标哈希值H，  
需要计算出一个字符串V，使得U+V的哈希值与H的差小于一个给定值D。此时，只能通过暴力枚举V来进行猜  
测。首先计算出结果的人可获得一定奖金。而某人首先计算成功的概率与其拥有的计算量成正比，所以其  
获得的奖金的期望值与其拥有的计算量成正比。

# 树
树是一种数据结构（比如，目录结构）  
树是一种可以递归定义的数据结构  
树是由$n$个节点组成的集合：
- 如果$n=0$，那这是一颗空树
- 如果$n>0$，那存在1个节点作为树的根节点，其他节点可以分为$m$个集合，每个集合本身又是一棵树