In [8]:
import numpy as np
import pandas as pd

### 二分查找

In [5]:
def binary_search(list: list, item) -> int:
    
    """
    通过将有序数组不断折半来查找目标值，直到找到或搜索范围为空
    """

    low = 0
    high = len(list)-1

    while low <= high:
        mid = int((low + high)/2)
        guess = list[mid]
        if guess > item:
            high = mid - 1
        elif guess < item:
            low = mid + 1
        else:
            return mid
    return None


### 算法运行时间及大O法

In [None]:
# 大O法指出算法运行时间的增速
# 常见的大O运行时间
### O(log(n))
### O(n)
### O(n*log(n))
### O(n^2)
### O(n!)

### 数组和链表

In [None]:
# 数组
### 读取:O(1)
###   插入:O(n)
###     删除:O(n)
# 链表
### 读取:O(n)
###   插入:O(1)
###     删除:O(1)
# 链表数组

### 选择排序

In [12]:
class selectionsort():
    """
    通过重复查找未排序部分的最小（或最大）元素并将其移动到排序序列的开头，直到所有元素都被排序
    """
    
    def __init__(self, data):
        self.data = data

    def find_smallest(self, arr: np.array) -> int:
        smallest = arr[0]
        smallest_index = 0
        for i in range(1, len(arr)):
            if arr[i] < smallest:
                smallest = arr[i]
                smallest_index = i
        return smallest_index
    
    def Selectionsort(self, arr: np.array) -> list:
        list = []
        for j in range(len(arr)):
            smallest_index = self.find_smallest(arr)
            list.append(arr.pop(smallest_index))
        return list

### 递归

In [3]:
# 递归
### 函数调用自己
### 基线条件：函数不再调用自己
###   递归条件：函数调用自己
### example
def countdown(i):
    print(i)
    if i <= 1: ### 基线条件
        return
    else: ### 递归条件
        countdown(i-1)

### 栈和调用栈(call stack)

In [None]:
### example
def greet2(name):
    print("how are you, " + name +"?")
def bye():
    print("ok bye!")
def greet(name):
    print("hello, " + name + "!")
    greet2(name) ### 当调用函数greet2时，greet只执行了一部分。调用另一函数，当前函数暂停并处于未完成状态
    print("getting ready to say bye")
    bye()

In [5]:
# 递归调用栈与阶乘
def factorial(x):
    if x == 1: ### 基线条件
        return x
    else: ### 递归条件
        return x*factorial(x-1)

### 分而治之 Divide & Conquer

In [None]:
# 分而治之核心思想
### 找出简单基线条件；确定如何缩小问题规模，使符合基线条件
### 归纳证明的思想

### 快速排序

In [11]:
def quicksort(array: np.array) -> np.array:
    """
    通过选择一个基准值，将数组分为比基准值大和小两部分，然后递归地在这两部分上重复这个过程，直到整个数组有序
    """

    if len(array) < 2:
        return array
    else:
        pivot = array[0]
        less = [i for i in array[1: ] if i < pivot]
        greater = [i for i in array[1: ] if i > pivot]
        return quicksort(less) + [pivot] + quicksort(greater)
        

In [None]:
# 更多关于大O法
## 平均情况
### 对于快排，调用栈高度O(log(n))，每层栈长度O(n)，因此运行时间O(n)*O(log(n))=O(nlog(n))
## 最坏情况
### 对于快排，调用栈高度O(n)，每层栈长度O(n)，因此运行时间O(n)*O(n)=O(n^2)

### 散列表(哈希表/字典)

In [None]:
# 散列函数
### 将输入映射到数字
### 相同输入产生相同输出，不同输入映射到不同数字

In [None]:
# 散列表
### 散列表=散列函数+数组，使用散列函数储存检索键值对
### 键必须hashable
### 散列表实现
book = dict() ### book = {}
book['apple'] = 0.67
book['milk'] = 1.49
book['avocado'] = 1.49
### 散列表应用：查找、防止重复、缓存
cache = {}
def get_page(url):
    if cache.get(url):
        return cache[url]
    else:
        data = data
        cache[url] = data
        return data

In [None]:
# 冲突
### 两个键被分配同一位置
### 解决：在这个位置储存链表
### 避免冲突需要较低填装因子(<0.7)及良好散列函数
# 性能
### 散列表查找、插入和删除均为O(1)
### 最坏情况为O(n)

### 广度优先搜索

In [None]:
# 图
### 由节点和边组成
### 一个节点与众多节点相连，称为邻居

In [None]:
# 广度优先搜索
### 回答A到B是否有路径及寻找最短路径的问题
### 第二个问题需要队列实现
### 队列采用FIFO数据结构

In [None]:
# 图的实现
### 使用散列表
### 有向图与无向图

In [None]:
#算法实现
from collections import deque

graph= {}

def person_is_seller():
    return

def search(name):
    search_queue = deque()
    search_queue += graph[name]
    searched = []
    while search_queue:
        person = search_queue.popleft()
        if person not in searched:
            if person_is_seller(person):
                return person
            else:
                search_queue += graph[person]
                searched.append(person)
    return False
### 运行时间: O(V+E), 其中V为节点数，E为边数


### 迪克斯特拉算法