## Python语言进阶

1. 数据结构和算法

   - 算法：解决问题的方法和步骤

   - 评价算法的好坏：渐近时间复杂度和渐近空间复杂度。

   - 渐近时间复杂度的大O标记：
     - <img src="http://latex.codecogs.com/gif.latex?O(c)" /> - 常量时间复杂度 - 布隆过滤器 / 哈希存储
     - <img src="http://latex.codecogs.com/gif.latex?O(log_2n)" /> - 对数时间复杂度 - 折半查找（二分查找）
     - <img src="http://latex.codecogs.com/gif.latex?O(n)" /> - 线性时间复杂度 - 顺序查找 / 桶排序
     - <img src="http://latex.codecogs.com/gif.latex?O(n*log_2n)" /> - 对数线性时间复杂度 - 高级排序算法（归并排序、快速排序）
     - <img src="http://latex.codecogs.com/gif.latex?O(n^2)" /> - 平方时间复杂度 - 简单排序算法（选择排序、插入排序、冒泡排序）
     - <img src="http://latex.codecogs.com/gif.latex?O(n^3)" /> - 立方时间复杂度 - Floyd算法 / 矩阵乘法运算
     - <img src="http://latex.codecogs.com/gif.latex?O(2^n)" /> - 几何级数时间复杂度 - 汉诺塔
     - <img src="http://latex.codecogs.com/gif.latex?O(n!)" /> - 阶乘时间复杂度 - 旅行经销商问题 - NP

In [12]:
def select_sort(origin_items, comp=lambda x, y: x < y):
    """简单选择排序"""
    items = origin_items[:]
    for i in range(len(items) - 1):
        min_index = i
        for j in range(i + 1, len(items)):
            if comp(items[j], items[min_index]):
                min_index = j
        items[i], items[min_index] = items[min_index], items[i]
    return items

In [13]:
def bubble_sort(origin_items, comp=lambda x, y: x > y):
    """高质量冒泡排序(搅拌排序)"""
    items = origin_items[:]
    for i in range(len(items) - 1):
        swapped = False
        for j in range(i, len(items) - 1 - i):
            if comp(items[j], items[j + 1]):
                items[j], items[j + 1] = items[j + 1], items[j]
                swapped = True
        if swapped:
            swapped = False
            for j in range(len(items) - 2 - i, i, -1):
                if comp(items[j - 1], items[j]):
                    items[j], items[j - 1] = items[j - 1], items[j]
                    swapped = True
        if not swapped:
            break
    return items

In [14]:
def merge_sort(items, comp=lambda x, y: x <= y):
    """归并排序(分治法)"""
    if len(items) < 2:
        return items[:]
    mid = len(items) // 2
    left = merge_sort(items[:mid], comp)
    right = merge_sort(items[mid:], comp)
    return merge(left, right, comp)


def merge(items1, items2, comp):
    """合并(将两个有序的列表合并成一个有序的列表)"""
    items = []
    index1, index2 = 0, 0
    while index1 < len(items1) and index2 < len(items2):
        if comp(items1[index1], items2[index2]):
            items.append(items1[index1])
            index1 += 1
        else:
            items.append(items2[index2])
            index2 += 1
    items += items1[index1:]
    items += items2[index2:]
    return items

In [15]:
def seq_search(items, key):
    """顺序查找"""
    for index, item in enumerate(items):
        if item == key:
            return index
    return -1

In [17]:
def bin_search(items, key):
    """折半查找"""
    start, end = 0, len(items) - 1
    while start <= end:
        mid = (start + end) // 2
        if key > items[mid]:
            start = mid + 1
        elif key < items[mid]:
            end = mid - 1
        else:
            return mid
    return -1

使用生成式（推导式）语法。
说明：生成式（推导式）可以用来生成列表、集合和字典。

In [18]:
prices = {
    'AAPL': 191.88,
    'GOOG': 1186.96,
    'IBM': 149.24,
    'ORCL': 48.44,
    'ACN': 166.89,
    'FB': 208.09,
    'SYMC': 21.29
}
# 用股票价格大于100元的股票构造一个新的字典
prices2 = {key: value for key, value in prices.items() if value > 100}
print(prices2)

{'AAPL': 191.88, 'GOOG': 1186.96, 'IBM': 149.24, 'ACN': 166.89, 'FB': 208.09}


In [20]:
lst = [1,2,3,4,50]
print(lst)
lst2 = [x*x for x in lst]
print(lst2)

[1, 2, 3, 4, 50]
[1, 4, 9, 16, 2500]


In [21]:
set1 = set([1,1,2,3,6,8,9])
print(set1)
set2 = {x for x in set1 if x > 3}
print(set2)

{1, 2, 3, 6, 8, 9}
{8, 9, 6}


In [22]:
# 嵌套的列表
names = ['关羽', '张飞']
courses = ['语文', '数学', '英语']
# 录入五个学生三门课程的成绩
# 错误 - 参考http://pythontutor.com/visualize.html#mode=edit
# scores = [[None] * len(courses)] * len(names)
scores = [[None] * len(courses) for _ in range(len(names))]
print(scores)
for row, name in enumerate(names):
    for col, course in enumerate(courses):
        scores[row][col] = float(input(f'请输入{name}的{course}成绩: '))
        print(scores)

[[None, None, None], [None, None, None]]
请输入关羽的语文成绩: 2
[[2.0, None, None], [None, None, None]]
请输入关羽的数学成绩: 5
[[2.0, 5.0, None], [None, None, None]]
请输入关羽的英语成绩: 48
[[2.0, 5.0, 48.0], [None, None, None]]
请输入张飞的语文成绩: 6
[[2.0, 5.0, 48.0], [6.0, None, None]]
请输入张飞的数学成绩: 8
[[2.0, 5.0, 48.0], [6.0, 8.0, None]]
请输入张飞的英语成绩: 7
[[2.0, 5.0, 48.0], [6.0, 8.0, 7.0]]


In [23]:
# heapq、itertools等的用法
"""
从列表中找出最大的或最小的N个元素
堆结构(大根堆/小根堆)
"""
import heapq

list1 = [34, 25, 12, 99, 87, 63, 58, 78, 88, 92]
list2 = [
    {'name': 'IBM', 'shares': 100, 'price': 91.1},
    {'name': 'AAPL', 'shares': 50, 'price': 543.22},
    {'name': 'FB', 'shares': 200, 'price': 21.09},
    {'name': 'HPQ', 'shares': 35, 'price': 31.75},
    {'name': 'YHOO', 'shares': 45, 'price': 16.35},
    {'name': 'ACME', 'shares': 75, 'price': 115.65}
]
print(heapq.nlargest(3, list1))
print(heapq.nsmallest(3, list1))
print(heapq.nlargest(2, list2, key=lambda x: x['price']))
print(heapq.nlargest(2, list2, key=lambda x: x['shares']))

[99, 92, 88]
[12, 25, 34]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}]
[{'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


In [25]:
"""
迭代工具 - 排列 / 组合 / 笛卡尔积
"""
import itertools

permutation1 = itertools.permutations('ABCD')
combination1 = itertools.combinations('ABCDE', 3)
product1 = itertools.product('ABCD', '123')
print(permutation1)
print([x for x in permutation1])
print(combination1)
print([x for x in combination1])
print(product1)
print([x for x in product1])

<itertools.permutations object at 0x0000021EDF8F9B88>
[('A', 'B', 'C', 'D'), ('A', 'B', 'D', 'C'), ('A', 'C', 'B', 'D'), ('A', 'C', 'D', 'B'), ('A', 'D', 'B', 'C'), ('A', 'D', 'C', 'B'), ('B', 'A', 'C', 'D'), ('B', 'A', 'D', 'C'), ('B', 'C', 'A', 'D'), ('B', 'C', 'D', 'A'), ('B', 'D', 'A', 'C'), ('B', 'D', 'C', 'A'), ('C', 'A', 'B', 'D'), ('C', 'A', 'D', 'B'), ('C', 'B', 'A', 'D'), ('C', 'B', 'D', 'A'), ('C', 'D', 'A', 'B'), ('C', 'D', 'B', 'A'), ('D', 'A', 'B', 'C'), ('D', 'A', 'C', 'B'), ('D', 'B', 'A', 'C'), ('D', 'B', 'C', 'A'), ('D', 'C', 'A', 'B'), ('D', 'C', 'B', 'A')]
<itertools.combinations object at 0x0000021EDF902A98>
[('A', 'B', 'C'), ('A', 'B', 'D'), ('A', 'B', 'E'), ('A', 'C', 'D'), ('A', 'C', 'E'), ('A', 'D', 'E'), ('B', 'C', 'D'), ('B', 'C', 'E'), ('B', 'D', 'E'), ('C', 'D', 'E')]
<itertools.product object at 0x0000021EDF8E3A48>
[('A', '1'), ('A', '2'), ('A', '3'), ('B', '1'), ('B', '2'), ('B', '3'), ('C', '1'), ('C', '2'), ('C', '3'), ('D', '1'), ('D', '2'), ('D', '3')

In [26]:
# collections模块下的工具类
"""
找出序列中出现次数最多的元素
"""
from collections import Counter

words = [
    'look', 'into', 'my', 'eyes', 'look', 'into', 'my', 'eyes',
    'the', 'eyes', 'the', 'eyes', 'the', 'eyes', 'not', 'around',
    'the', 'eyes', "don't", 'look', 'around', 'the', 'eyes',
    'look', 'into', 'my', 'eyes', "you're", 'under'
]
counter = Counter(words)
print(counter.most_common(3))

[('eyes', 8), ('the', 5), ('look', 4)]


- 常用算法：

 - 穷举法 - 又称为暴力破解法，对所有的可能性进行验证，直到找到正确答案。
 - 贪婪法 - 在对问题求解时，总是做出在当前看来最好的选择，不追求最优解，快速找到满意解。
 - 分治法 - 把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题分成更小的子问题，直到可以直接求解的程度，最后将子问题的解进行合并得到原问题的解。
 - 回溯法 - 回溯法又称为试探法，按选优条件向前搜索，当搜索到某一步发现原先选择并不优或达不到目标时，就退回一步重新选择。
 - 动态规划 - 基本思想也是将待求解问题分解成若干个子问题，先求解并保存这些子问题的解，避免产生大量的重复运算。

 穷举法例子：百钱百鸡和五人分鱼。

In [27]:
# 公鸡5元一只 母鸡3元一只 小鸡1元三只
# 用100元买100只鸡 问公鸡/母鸡/小鸡各多少只
for x in range(20):
    for y in range(33):
        z = 100 - x - y
        if 5 * x + 3 * y + z // 3 == 100 and z % 3 == 0:
            print(x, y, z)

0 25 75
4 18 78
8 11 81
12 4 84


In [28]:
# A、B、C、D、E五人在某天夜里合伙捕鱼 最后疲惫不堪各自睡觉
# 第二天A第一个醒来 他将鱼分为5份 扔掉多余的1条 拿走自己的一份
# B第二个醒来 也将鱼分为5份 扔掉多余的1条 拿走自己的一份
# 然后C、D、E依次醒来也按同样的方式分鱼 问他们至少捕了多少条鱼

fish = 6 #第五个人分的时候至少有六条，如果满足不了条件，依次增加五条
while True:
    total = fish
    enough = True
    for _ in range(5):
        if (total - 1) % 5 == 0:
            total = (total - 1) // 5 * 4
        else:
            enough = False
            break
    if enough:
        print(fish)
        break
    fish += 5

3121


     贪婪法例子：假设小偷有一个背包，最多能装20公斤赃物，他闯入一户人家，发现如下表所示的物品。很显然，他不能把所有物品都装进背包，所以必须确定拿走哪些物品，留下哪些物品。

 |  名称  | 价格（美元） | 重量（kg） |
 | :----: | :----------: | :--------: |
 |  电脑  |     200      |     20     |
 | 收音机 |      20      |     4      |
 |   钟   |     175      |     10     |
 |  花瓶  |      50      |     2      |
 |   书   |      10      |     1      |
 |  油画  |      90      |     9      |

In [None]:
"""
贪婪法：在对问题求解时，总是做出在当前看来是最好的选择，不追求最优解，快速找到满意解。
输入：
20 6
电脑 200 20
收音机 20 4
钟 175 10
花瓶 50 2
书 10 1
油画 90 9
"""
class Thing(object):
    """物品"""

    def __init__(self, name, price, weight):
        self.name = name
        self.price = price
        self.weight = weight

    @property
    def value(self):
        """价格重量比"""
        return self.price / self.weight


def input_thing():
    """输入物品信息"""
    name_str, price_str, weight_str = input().split()
    return name_str, int(price_str), int(weight_str)


def main():
    """主函数"""
    max_weight, num_of_things = map(int, input().split())
    all_things = []
    for _ in range(num_of_things):
        all_things.append(Thing(*input_thing()))
    all_things.sort(key=lambda x: x.value, reverse=True)
    total_weight = 0
    total_price = 0
    for thing in all_things:
        if total_weight + thing.weight <= max_weight:
            print(f'小偷拿走了{thing.name}')
            total_weight += thing.weight
            total_price += thing.price
    print(f'总价值: {total_price}美元')


if __name__ == '__main__':
    main()

分治法例子：快速排序。

In [29]:
"""
快速排序 - 选择枢轴对元素进行划分，左边都比枢轴小右边都比枢轴大
"""
def quick_sort(origin_items, comp=lambda x, y: x <= y):
    items = origin_items[:]
    _quick_sort(items, 0, len(items) - 1, comp)
    return items


def _quick_sort(items, start, end, comp):
    if start < end:
        pos = _partition(items, start, end, comp)
        _quick_sort(items, start, pos - 1, comp)
        _quick_sort(items, pos + 1, end, comp)


def _partition(items, start, end, comp):
    pivot = items[end]
    i = start - 1
    for j in range(start, end):
        if comp(items[j], pivot):
            i += 1
            items[i], items[j] = items[j], items[i]
    items[i + 1], items[end] = items[end], items[i + 1]
    return i + 1

回溯法例子：骑士巡逻。

In [30]:
"""
递归回溯法：叫称为试探法，按选优条件向前搜索，当搜索到某一步，发现原先选择并不优或达不到目标时，就退回一步重新选择，比较经典的问题包括骑士巡逻、八皇后和迷宫寻路等。
"""
import sys
import time

SIZE = 5
total = 0


def print_board(board):
    for row in board:
        for col in row:
            print(str(col).center(4), end='')
        print()


def patrol(board, row, col, step=1):
    if row >= 0 and row < SIZE and \
        col >= 0 and col < SIZE and \
        board[row][col] == 0:
        board[row][col] = step
        if step == SIZE * SIZE:
            global total
            total += 1
            print(f'第{total}种走法: ')
            print_board(board)
        patrol(board, row - 2, col - 1, step + 1)
        patrol(board, row - 1, col - 2, step + 1)
        patrol(board, row + 1, col - 2, step + 1)
        patrol(board, row + 2, col - 1, step + 1)
        patrol(board, row + 2, col + 1, step + 1)
        patrol(board, row + 1, col + 2, step + 1)
        patrol(board, row - 1, col + 2, step + 1)
        patrol(board, row - 2, col + 1, step + 1)
        board[row][col] = 0


def main():
    board = [[0] * SIZE for _ in range(SIZE)]
    patrol(board, SIZE - 1, SIZE - 1)


if __name__ == '__main__':
    main()

第1种走法: 
 23  12  3   18  25 
 4   17  24  13  8  
 11  22  7   2   19 
 16  5   20  9   14 
 21  10  15  6   1  
第2种走法: 
 23  14  3   8   25 
 4   9   24  13  16 
 19  22  15  2   7  
 10  5   20  17  12 
 21  18  11  6   1  
第3种走法: 
 23  18  3   8   25 
 4   9   24  19  14 
 17  22  13  2   7  
 10  5   20  15  12 
 21  16  11  6   1  
第4种走法: 
 23  14  3   8   25 
 4   19  24  15  10 
 13  22  9   2   7  
 18  5   20  11  16 
 21  12  17  6   1  
第5种走法: 
 23  8   3   14  25 
 10  15  24  19  4  
 7   22  9   2   13 
 16  11  20  5   18 
 21  6   17  12  1  
第6种走法: 
 23  8   3   18  25 
 14  19  24  9   4  
 7   22  13  2   17 
 12  15  20  5   10 
 21  6   11  16  1  
第7种走法: 
 23  8   3   14  25 
 16  13  24  9   4  
 7   22  15  2   19 
 12  17  20  5   10 
 21  6   11  18  1  
第8种走法: 
 23  18  3   12  25 
 8   13  24  17  4  
 19  22  7   2   11 
 14  9   20  5   16 
 21  6   15  10  1  
第9种走法: 
 23  8   13  18  25 
 14  3   24  7   12 
 9   22  17  2   19 
 4   15  20  11  6  
 21 

 7   12  23  18  1  
第81种走法: 
 5   10  15  20  3  
 16  21  4   9   14 
 11  6   23  2   19 
 22  17  8   13  24 
 7   12  25  18  1  
第82种走法: 
 5   10  15  20  3  
 16  25  4   9   14 
 11  6   21  2   19 
 24  17  8   13  22 
 7   12  23  18  1  
第83种走法: 
 5   10  15  22  3  
 16  21  4   9   14 
 11  6   17  2   23 
 20  25  8   13  18 
 7   12  19  24  1  
第84种走法: 
 5   10  25  20  3  
 24  19  4   9   14 
 11  6   15  2   21 
 18  23  8   13  16 
 7   12  17  22  1  
第85种走法: 
 5   10  23  18  3  
 22  17  4   9   24 
 11  6   13  2   19 
 16  21  8   25  14 
 7   12  15  20  1  
第86种走法: 
 5   10  21  16  3  
 20  15  4   9   22 
 25  6   11  2   17 
 14  19  8   23  12 
 7   24  13  18  1  
第87种走法: 
 5   12  17  22  3  
 18  23  4   9   16 
 13  6   11  2   21 
 24  19  8   15  10 
 7   14  25  20  1  
第88种走法: 
 5   14  19  24  3  
 20  25  4   9   18 
 15  6   13  2   23 
 12  21  8   17  10 
 7   16  11  22  1  
第89种走法: 
 5   16  21  14  3  
 22  13  4   9   20 
 17  6   15  2  

第155种走法: 
 23  16  11  6   21 
 10  3   22  17  12 
 15  24  5   20  7  
 4   9   2   13  18 
 25  14  19  8   1  
第156种走法: 
 23  12  17  4   21 
 18  3   22  11  16 
 13  24  7   20  5  
 8   19  2   15  10 
 25  14  9   6   1  
第157种走法: 
 23  14  19  4   21 
 8   3   22  13  18 
 15  24  9   20  5  
 10  7   2   17  12 
 25  16  11  6   1  
第158种走法: 
 23  14  9   4   21 
 8   3   22  15  10 
 13  24  17  20  5  
 18  7   2   11  16 
 25  12  19  6   1  
第159种走法: 
 23  16  7   12  21 
 8   13  22  17  6  
 3   24  15  20  11 
 14  9   2   5   18 
 25  4   19  10  1  
第160种走法: 
 23  14  7   12  21 
 8   19  22  15  6  
 3   24  13  20  11 
 18  9   2   5   16 
 25  4   17  10  1  
第161种走法: 
 23  10  7   16  21 
 8   15  22  11  6  
 3   24  9   20  17 
 14  19  2   5   12 
 25  4   13  18  1  
第162种走法: 
 23  8   19  14  21 
 18  13  22  9   6  
 3   24  7   20  15 
 12  17  2   5   10 
 25  4   11  16  1  
第163种走法: 
 23  4   11  16  21 
 12  17  22  5   10 
 3   24  7   20  15 
 18  13

 25  4   15  8   17 
 20  9   2   13  22 
 3   14  21  16  1  
第237种走法: 
 5   18  13  24  7  
 12  23  6   19  14 
 17  4   11  8   25 
 22  9   2   15  20 
 3   16  21  10  1  
第238种走法: 
 5   18  23  12  7  
 24  13  6   17  22 
 19  4   25  8   11 
 14  9   2   21  16 
 3   20  15  10  1  
第239种走法: 
 5   18  25  12  7  
 24  13  6   17  22 
 19  4   23  8   11 
 14  9   2   21  16 
 3   20  15  10  1  
第240种走法: 
 5   18  23  12  7  
 22  13  6   17  24 
 19  4   21  8   11 
 14  9   2   25  16 
 3   20  15  10  1  
第241种走法: 
 5   18  21  12  7  
 20  13  6   17  22 
 25  4   19  8   11 
 14  9   2   23  16 
 3   24  15  10  1  
第242种走法: 
 5   24  19  12  7  
 18  13  6   25  20 
 23  4   17  8   11 
 14  9   2   21  16 
 3   22  15  10  1  
第243种走法: 
 5   22  17  12  7  
 16  13  6   23  18 
 21  4   15  8   11 
 14  9   2   19  24 
 3   20  25  10  1  
第244种走法: 
 5   20  15  12  7  
 14  25  6   21  16 
 19  4   13  8   11 
 24  9   2   17  22 
 3   18  23  10  1  
第245种走法: 
 5   14

动态规划例子1：斐波拉切数列。（不使用动态规划将会是几何级数复杂度）

In [31]:
"""
动态规划 - 适用于有重叠子问题和最优子结构性质的问题
使用动态规划方法所耗时间往往远少于朴素解法(用空间换取时间)
"""
def fib(num, temp={}):
    """用递归计算Fibonacci数"""
    if num in (1, 2):
        return 1
    try:
        return temp[num]
    except KeyError:
        temp[num] = fib(num - 1) + fib(num - 2)
        return temp[num]

动态规划例子2：子列表元素之和的最大值。（使用动态规划可以避免二重循环）
说明：子列表指的是列表中索引（下标）连续的元素构成的列表；列表中的元素是int类型，可能包含正整数、0、负整数；程序输入列表中的元素，输出子列表元素求和的最大值，例如：

输入：1 -2 3 5 -3 2

输出：8

输入：0 -2 3 5 -1 2

输出：9

输入：-9 -2 -3 -5 -3

输出：-2

In [32]:
def main():
    items = list(map(int, input().split()))
    size = len(items)
    overall, partial = {}, {}
    overall[size - 1] = partial[size - 1] = items[size - 1]
    for i in range(size - 2, -1, -1):
        partial[i] = max(items[i], partial[i + 1] + items[i])
        overall[i] = max(partial[i], overall[i + 1])
    print(overall[0])


if __name__ == '__main__':
    main()

5
5
