In [103]:
import time

arr = [1, 5, 4, 0, 10, -3, 6]

# bubble sort
两两相比较，如果前面的比后面的大，就swap，一轮之后，max item会去到最右端。
然后重复，直到完成。
- O(n^2)
- stable

In [10]:
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(1, n-i):
            if arr[j-1]>arr[j]:
                arr[j-1], arr[j] = arr[j], arr[j-1]
    return arr

bubble_time = time.time()
print(bubble_sort(arr.copy()))
print(time.time()-bubble_time)

[-3, 0, 1, 4, 5, 6, 10]
0.0006227493286132812


# bubble optimal version
当不需要swap时，就停止了

In [11]:
def bubble_sort_opt(arr):
    n = len(arr)
    for i in range(n):
        no_sorted = True
        for j in range(1, n-i):
            if arr[j-1]>arr[j]:
                arr[j-1], arr[j] = arr[j], arr[j-1]
                no_sorted = False
        if no_sorted:
            break
    return arr

bubble_opt_time = time.time()
print(bubble_sort_opt(arr.copy()))
print(time.time()-bubble_opt_time)

[-3, 0, 1, 4, 5, 6, 10]
0.0003628730773925781


# selection sort
每次遍历unsorted的，从中选择一个min/max的，放在unsorted的第一位。（swap）
重复，直到完成。
- O(n^2)
- unstable

In [12]:
def sele_sort(arr):
    n = len(arr)
    for i in range(n-1):
        min_value = arr[i]
        min_index = i
        for j in range(i,n):
            if arr[j] < min_value:
                min_value = arr[j]
                min_index = j
        arr[i], arr[min_index] = arr[min_index], arr[i]
    return arr

sele_time = time.time()
print(sele_sort(arr.copy()))
print(time.time()-sele_time)

[-3, 0, 1, 4, 5, 6, 10]
0.0003681182861328125


# insertion sort
每次遍历unsorted的，每遍历一个item，就将它放入前面的sorted中适合的位置。
- O(n^2)
- stable

In [13]:
def insert_sort(arr):
    n = len(arr)
    for i in range(1,n):   
        for j in range(i,0,-1):  
            if arr[j] < arr[j-1]: 
                arr[j], arr[j-1] = arr[j-1], arr[j]
            else:
                break
    return arr

insert_time = time.time()
print(insert_sort(arr.copy()))
print(time.time()-insert_time)

[-3, 0, 1, 4, 5, 6, 10]
0.0012309551239013672


实际运用上，Insertion Sort会比Bubble Sort和Selection Sort快

---

# binary insertion sort 
就是item插入前面的sorted的时候，用binary search的方法寻找位置。
- O(n^2)
- stable

# Merge sort
- divide and conquer
- recursively 拆分数组直到分到不能拆为止。随后排序，再合并。
- 合并时使用two-pointers
- O(nlgn)
- Time complexity: O(n)
- stable

In [7]:
def merge_sort(arr):
    n = len(arr)
    
    # divide
    if(n <= 1):
        return arr
    m = n // 2
    arr1 = merge_sort(arr[:m])
    arr2 = merge_sort(arr[m:])
    # merge
    return __merge(arr1, arr2)
    
def __merge(arr1, arr2):     
    # two-pointers i -> arr1[0], j -> arr2[0]
    result = []
    i,j = 0, 0
    
    while(i < len(arr1) and j < len(arr2)):
        if(arr1[i] >= arr2[j]):
            result.append(arr2[j])
            j += 1
        elif(arr1[i] < arr2[j]):
            result.append(arr1[i])
            i += 1
            
    if(i == len(arr1)):
        result += arr2[j:]
    else:
        result += arr1[i:]
    return result

merge_time = time.time()
print(merge_sort(arr.copy()))    
print(time.time()-merge_time)   

[-3, 0, 1, 4, 5, 6, 10]
0.0004069805145263672


# Merge Optimal Version
- 对小型子阵列使用insertion sort -> 叫做hybrid sort -> python3.5之前，sort/sorted都是用这种（merge+insertion）java/c++用的是quick sort
- 合并时可以检查arr1[n-1]和arr2[m-1]的关系

In [8]:
def merge_sort_opt(arr):
    n = len(arr)
    
    # divide
    if(n <= 1):
        return arr
    m = n // 2
    arr1 = merge_sort_opt(arr[:m])
    arr2 = merge_sort_opt(arr[m:])
    # merge
    return __merge_opt(arr1, arr2)
    
def __merge_opt(arr1, arr2):     
    # two-pointers i -> arr1[0], j -> arr2[0]
    result = []
    i,j = 0, 0
    if(arr1[-1] <= arr2[0]):
        return arr1 + arr2
    if(arr2[-1] <= arr1[0]):
        return arr2 + arr1
    while(i < len(arr1) and j < len(arr2)):
        if(arr1[i] >= arr2[j]):
            result.append(arr2[j])
            j += 1
        elif(arr1[i] < arr2[j]):
            result.append(arr1[i])
            i += 1
            
    if(i == len(arr1)):
        result += arr2[j:]
    else:
        result += arr1[i:]
    return result

merge_opt_time = time.time()
print(merge_sort_opt(arr.copy()))    
print(time.time()-merge_opt_time)   

[-3, 0, 1, 4, 5, 6, 10]
0.0002512931823730469


# quick sort
- bubble sort的改进
- 设定一个pivot，把比它小的放它左边，比它大的放它右边。
- two-pointers 

---
一趟快速排序的算法是：
1. 设置两个变量i、j，排序开始的时候：i=0，j=N-1；
2. 以第一个数组元素作为关键数据，赋值给key，即key=A[0]；
3. 从j开始向前搜索，即由后开始向前搜索(j--)，找到第一个小于key的值A[j]，将A[j]的值赋给A[i]；
4. 从i开始向后搜索，即由前开始向后搜索(i++)，找到第一个大于key的A[i]，将A[i]的值赋给A[j]；
5. 重复第3、4步，直到i=j； 
<br>(3,4步中，没找到符合条件的值，即3中A[j]不小于key,4中A[i]不大于key的时候改变j、i的值，使得j=j-1，i=i+1，直至找到为止。
<br>找到符合条件的值，进行交换的时候i，j指针位置不变。另外，i==j这一过程一定正好是i+或j-完成的时候，此时令循环结束）。

---
- divide and conquer
- 目前最好的sort
- O(nlgn)
- unstable 

In [25]:
# quick sort + recursive
def quick_sort_recursive(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left_num = quick_sort([x for x in arr[1:] if x < pivot])
    right_num = quick_sort([x for x in arr[1:] if x >= pivot])
    return left_num + [pivot] + right_num

quick_time = time.time()
print(quick_sort_recursive(arr.copy()))
print(time.time()-quick_time)  

[-3, 0, 1, 4, 5, 6, 10]
0.0003483295440673828


In [163]:
# original quick sort
def quick_sort(arr, low, high):
    if low >= high:
        return
    position = partition(arr, low, high)
    quick_sort(arr, low, position)
    quick_sort(arr, position+1, high)

def partition(arr, low, high):
    pivot = arr[low]
    i,j = low,high
    while(i < j):
        while(i < j and arr[j] >= pivot):
            j -= 1
        arr[i] = arr[j]
        # find the first item < pivot and change its value to arr[i]
        while(i < j and arr[i] < pivot):
            i += 1
        arr[j] = arr[i]
        # find the first item > pivot and change its value to arr[j]
        if(i < j):
            arr[j] = arr[i]
            j -= 1
    arr[i] = pivot
    return i
    
arr2 = arr.copy()
quick_sort_time = time.time()
quick_sort(arr2,0,len(arr2)-1)
print(arr2)
print(time.time()-quick_sort_time)

[-3, 0, 1, 4, 5, 6, 10]
0.0003139972686767578


# Quick Sort Optimal Version
- 选择pivot为 中位数（第一个 + 最后一个 + 中间那个） -> 三点中值算法
- 在数组很小时使用insertion sort