# 算法图解学习
   *  主要目的是学习不同基础算法的优缺点，对症下药

## 二分查找
* 性能的理解：对于有序范围内，需要多少个步骤完成，步骤越少计算复杂度越少
* 二分法只适用于有序列表
* 对数时间 O(log(n, 2))

In [1]:
def binary_search(lst, item):
    # 从lst中找到item
    low = 0
    high = len(lst) - 1
    while low <= high:
        mid = (low + high)//2 # 中间位置
        guess = lst[mid]
        if guess == item:
            return mid
        if guess > item:
            high = mid - 1
        else:
            low = mid + 1
    return None

In [2]:
my_lst = [1, 2, 3, 4, 10, 15, 33]
print(binary_search(my_lst, 10))

4


### 旅行商问题
有个旅行商，旅途中需要经过五个城市，需要总路径最短，设计旅程顺序
* 此处讨论 O(n!)算法
对每个顶点进行计算 是个阶乘问题，但是k近邻会有个近似答案

## 选择排序
* 许多算法都是需要先对数据进行排序才行，例如二分查找， 因此需要优秀的排序算法
* 数据的存储不一定是顺序的，因为顺序，及需要一片连续的内存，不是最大化利用内存的，而内存的为一个小小区域都是有编号的，因此，可以利用编号组成一个 链表
* 但是链表如果当读取某个元素时并不高效，需要知道之前的所有编号，而数组就可以直接读出

|   |数组|链表|
  | ---- | ----  | ----  |
  |读取|O(1)|O(n)|
  |插入|O(n)|O(1)|
  |删除|O(n)|O(1)|
 
 * 数组与list 概念不要混淆，数组中所有元素类型必须相同（int， double）

In [3]:
def find_smallest(arr):
    smallest = arr[0]
    smallest_index = 0
    for i in range(1, len(arr)):
        if arr[i] < smallest:
            smallest = arr[i]
            smallest_index = i
    return smallest_index

In [8]:
def sellection_sort(arr):
    new_arr = []
    for i  in range(len(arr)):
        smallest = find_smallest(arr)
        new_arr.append(arr.pop(smallest))
    return new_arr

In [9]:
print(sellection_sort([5, 2, 4, 6]))

[2, 4, 5, 6]


## 递归
* 三部曲：基本情况、改变状态向基本情况靠近，调用自己（初始条件，缩小规模，调用自身）
* 也有的说：基线条件、递归条件
* “如果使用循环，程序的性能可能更高；如果使用递归，程序可能更容易理解”

### 栈

* 调用栈 call stack
 - 计算机在内部使用被称为调用栈的栈
 - 调用另一个函数时，当前函数处于暂停状态

In [10]:
def greet(name):
    print('hello, '+name+ '!')
    greet2(name)
    print('getting ready to say bye...' )
    bye()

def greet2(name):
    print('how are you, '+ name)

def bye():
    print('ok, bye!')

In [11]:
greet('hudong')

hello, hudong!
how are you, hudong
getting ready to say bye...
ok, bye!


调用greet('hudong'),计算机将为该函数调用分配一块内存，变量将被写入当执行到greet2时，计算机也会为这个函数分配一块内存，计算机使用一个栈来表示这些内存块，greet2内存块在greet上面，当执行完how are you, hudong后，从函数调用返回，栈顶的内存块被弹出,后面的bye()将在getting ready to say bye...后面被分配在greet内存块的上面。

* 递归调用栈

In [12]:
# 计算阶乘
def fact(x):
    if x == 1:
        return 1
    else:
        return x * fact(x-1)

In [13]:
fact(3)

6

## 快速排序
* 分而治之  --通用的问题解决方法(D&C divide and conquer)
* 快速排序使用了分而治之的方法

### 分而治之
* D&C算法是递归的 需要解决三部曲
* 是一种解决问题的思路
* 使用D&C处理列表问题时，基线条件很可能时空数组或者只包含一个元素的数组

In [4]:
def sum_list(lst):
    '''
    其实sum 函数是一种分而治之的思路
    '''
#     if not lst: # 结束条件：
#         return 0
    if len(lst) == 1:
        return lstt[0]
#     else:
    return  lst[0] + sum_list(lst[1:])


In [5]:
lst = [1, 2, 3, 4]
sum_list(lst)

10

In [6]:
# 实现统计列表元素个数的
def tongji_lst_len(lst):
    if not lst: # 结束条件
        return 0
#     else:
    return  1 + tongji_lst_len(lst[1:])

In [7]:
lst = [1, 2, 3, 4]
tongji_lst_len(lst)

4

In [13]:
# 找出列表中最大的数字：
def find_max(lst):
    if not lst: # 结束条件
        return None
#     else:
    cur_max = lst[0]
    last_max = find_max(lst[1:])
    if last_max:
        return last_max if last_max > cur_max  else cur_max
#     else:
    return cur_max


#  图解答案：
def max(list):
    if len(list) == 2:
        return list[0] if list[0] >list[1] else list[1]
    sub_max = max(list[1:])
    return list[0] if list[0] > sub_max else sub_max 

In [14]:
lst = [1, 10, 3, 4]
find_max(lst)

10

In [15]:
# 用分而治之的递归思想写出二分查找：
def binary_search_I(lst, x):
    # 第一步：基线条件：只有一个数时候返回，0个数退出
    if not lst or  len(lst) == 1:
        return 0
    # 第二步缩小规模：
    mid_index = len(lst)//2
    left_lst = lst[:mid_index]
    right_lst = lst[mid_index:]
    if x in left_lst:
        return binary_search_I(left_lst, x)
    elif x in right_lst:
        return mid_index + binary_search_I(right_lst, x)
    else:
        print('Not exist '+ str() +' in lst')
# python数据结构与算法：
def binary_search_II(lst, x):
     # 第一步：基线条件：只有一个数时候返回，0个数退出
    if not lst :
        return False
    # 第二步缩小规模：
    mid_index = len(lst)//2
    if lst[mid_index] == x:
        return True
    else:
        if x < left_lst[mid_index]:
            return binary_search_II(lst[:mid_index], x)
        else:
            return mid_index + binary_search_I(lst[mid_index+1:], x)


In [16]:
lst = [1, 2, 3, 4]
binary_search_I(lst, 3)

2

### 快速排序
* c 语言标准库的qsort()是用快速排序实现的
* 使用了分而治之的思想
* 最坏情况下Olog(n^2, 2) 平均情况下O(n log(n, 2))

### 合并排序(merge sort)
* n log(n)

In [22]:
def quick_sort(lst):
    # 最基本结束条件：
    # 当数组中只有一个或零个，就是原数组
    if len(lst) < 2:
        return lst
    # 找出数组中的基准值 pivot，然后分区 partitioning
    # 因此有[ <pivot] 、pivot、 [ >pivot].
    else:
        pivot = lst[0]
        less = [i for i in lst[1:] if i <= pivot]
        greater = [i for i in lst[1:] if i > pivot]
        return quick_sort(less) + [pivot] + quick_sort(greater)    

In [21]:
quick_sort([1,52,5,23,5])

[1, 5, 5, 23, 52]