# PYTHON_数据结构与算法
![python](https://cn.bing.com/th?id=OIP.RD41a80VdU3C-HfFcjAleAHaDI&pid=Api&rs=1)

## 概念引入

### 数据结构

### 算法的提出

### 算法效率衡量

### 常见时间复杂度

### Python内置类型性能分析

## 链表

链表（Linked list）是一种常见的基础数据结构，是一种线性表，但是不像顺序表一样连续存储数据，而是在每一个节点（数据存储单元）里存放下一个节点的位置信息（即地址）。

链表结构可以充分利用计算机内存空间，实现灵活的内存动态管理。

**链表的操作**
* is_empty() 链表是否为空
* length() 链表长度
* travel() 遍历整个链表
* add(item) 链表头部添加元素
* append(item) 链表尾部添加元素
* insert(pos, item) 指定位置添加元素
* remove(item) 删除节点
* remove(item) 删除节点

### 单链表


<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/SingleLinkedList.png" width="600" height="400">

In [None]:
# _*_ conding: UTF-8 _*_

class Node(object):
    """单链表节点"""

    def __init__(self, item):

        # item存放数据元素
        self.item = item
        # next指向下一个节点
        self.next = None


class SingleLinkedList(object):
    """单链表"""

    def __init__(self):
        self.__head = None

    def is_empty(self):
        # 判断链表是否为空
        return self.__head == None

    def length(self):
        # 链表长度
        count = 0
        cur = self.__head
        while cur != None:
            count += 1
            cur = cur.next
        return count

    def traverse(self):
        # 遍历单链表
        cur = self.__head
        while cur != None:
            print(cur.item, end="")
            cur = cur.next
        print("")

    def add(self, item):
        # 头部添加元素
        node = Node(item)
        node.next = self.__head
        self.__head = node

    def append(self, item):
        # 尾部添加元素
        node = Node(item)
        # 先判断链表是否为空
        if self.is_empty():
            self.__head = node
        # 若不为空，则找到尾部，将尾节点的next指向新节点
        else:
            cur = self.__head
            while cur.next != None:
                cur = cur.next
            cur.next = node

    def insert(self, pro, item):
        # 指定位置添加元素
        # 若指定位置为第一个元素之前，执行头查
        if pro <= 0:
            self.add(item)
        # 若第一个元素位置超过链表尾部，执行尾插
        elif pro > (self.length() - 1):
            self.append(item)
        # 一般情况
        else:
            node = Node(item)
            cur = self.__head
            pre = None
            count = 0
            while count < pro:
                pre = cur
                cur = cur.next
                count += 1
            node.next = cur
            pre.next = node

    def remove(self, item):
        # 删除节点
        cur = self.__head
        pre = None
        while cur != None:
            if cur.item == item:
                if cur == self.__head:
                    self._head = cur.next
                else:
                    pre.next = cur.next
                return
            else:
                pre = cur
                cur = cur.next

    def search(self, item):
        # 查找节点是否存在，并返回Ture或False
        cur = self._head
        while cur != None:
            if cur.item == item:
                return True
            cur = cur.next
        return False


if __name__ == "__main__":
    ll = SingleLinkedList()
    print(ll.is_empty())
    print(ll.length())

    ll.append(1)
    print(ll.is_empty())
    print(ll.length())

    ll.append(2)
    ll.add(8)
    ll.append(3)
    ll.append(4)
    ll.append(5)
    ll.append(6)
    # 8 1 2 3 4 5 6

    ll.insert(-1, 9)  # 9 8 1 2 3 4 5 6
    ll.traverse()
    ll.insert(3, 100)  # 9 8 1 100 2 3 4 5 6
    ll.traverse()
    ll.insert(10, 200)  # 9 8 1 100 2 3 4 5 6 200
    ll.traverse()
    ll.remove(100)
    ll.traverse()
    ll.remove(9)
    ll.traverse()
    ll.remove(200)
    ll.traverse()
    print(ll.search(3))
    print(ll.search(200))
    print(ll.length())

### 单向循环链表
<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/SingleCycLinkedList.png" width="600" height="400">

In [None]:
# _*_ conding: UTF-8 _*_

class Node(object):
    """单链表节点"""

    def __init__(self, item):

        # item存放数据元素
        self.item = item
        # next指向下一个节点
        self.next = None


class SingleCycLinkedList(object):
    """单向循环链表"""

    def __init__(self):
        self.__head = None

    def is_empty(self):
        """判断链表是否为空"""
        return self.__head == None

    def length(self):
        """链表长度"""
        if self.is_empty():
            return 0
        count = 1
        cur = self.__head
        while cur.next != self.__head:
            count += 1
            cur = cur.next
        return count

    def traverse(self):
        """遍历单链表"""
        if self.is_empty():
            return False
        cur = self.__head
        while cur.next != self.__head:
            print(cur.item, end="")
            cur = cur.next
        print(cur.item)

    def add(self, item):
        """头部添加元素"""
        node = Node(item)
        if self.is_empty():
            self.__head = node
            node.next = node
        else:
            # 添加的新节点指向原首节点
            node.next = self.__head
            # 移到链表尾部
            cur = self.__head
            while cur.next != self.__head:
                cur = cur.next
            self.__head = node
            cur.next = self.__head

    def append(self, item):
        """尾部添加元素"""
        node = Node(item)
        # 先判断链表是否为空
        if self.is_empty():
            self.__head = node
            node.next = node
        # 若不为空，则找到尾部，将尾节点的next指向新节点
        else:
            cur = self.__head
            while cur.next != self.__head:
                cur = cur.next
            cur.next = node
            node.next = self.__head

    def insert(self, pro, item):
        """指定位置添加元素"""
        # 若指定位置为第一个元素之前，执行头插
        if pro <= 0:
            self.add(item)
        # 若第一个元素位置超过链表尾部，执行尾插
        elif pro > (self.length() - 1):
            self.append(item)
        # 一般情况
        else:
            node = Node(item)
            cur = self.__head
            pre = None
            count = 0
            while count < pro:
                pre = cur
                cur = cur.next
                count += 1
            node.next = cur
            pre.next = node

    def remove(self, item):
        """删除节点"""
        if self.is_empty():
            return
        cur = self.__head
        pre = None
        while cur.next != self.__head:
            if cur.item == item:
                # 判断是否为头节点
                if cur == self.__head:
                    # 找尾节点
                    rear = self.__head
                    while rear.next != self.__head:
                        rear = rear.next
                    self._head = cur.next
                    rear.next = self._head
                else:
                    # 删除在中间节点
                    pre.next = cur.next
                return
            else:
                pre = cur
                cur = cur.next
        # 循环外，cur指向尾节点
        if cur.item == item:
            # 如果链表只有一个节点
            if cur == self.__head:
                self.__head = None
            else:
                pre.next = self.__head

    def search(self, item):
        """查找节点是否存在，并返回Ture或False"""
        if self.is_empty():
            return False
        cur = self.__head
        while cur.next != self.__head:
            if cur.item == item:
                return True
            cur = cur.next
        if cur.item == item:
            return True
        return False


if __name__ == "__main__":
    ll = SingleCycLinkedList()
    print(ll.is_empty())
    print(ll.length())

    ll.append(1)
    print(ll.is_empty())
    print(ll.length())

    ll.append(2)
    ll.add(8)
    ll.append(3)
    ll.append(4)
    ll.append(5)
    ll.append(6)
    # 8 1 2 3 4 5 6

    ll.insert(-1, 9)  # 9 8 1 2 3 4 5 6
    ll.traverse()
    ll.insert(3, 100)  # 9 8 1 100 2 3 4 5 6
    ll.traverse()
    ll.insert(10, 200)  # 9 8 1 100 2 3 4 5 6 200
    ll.traverse()
    ll.remove(100)
    ll.traverse()
#     ll.remove(9)
#     ll.traverse()
    ll.remove(200)
    ll.traverse()
    print(ll.search(3))
    print(ll.search(200))
    print(ll.length())

### 双向链表
<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/DoubleLinkedList.png" width="600" height="400">

In [None]:
# _*_ conding: UTF-8 _*_

class Node(object):
    """单链表节点 """

    def __init__(self, item):

        # item存放数据元素
        self.item = item
        # next指向下一个节点
        self.next = None
        self.pror = None


class DoubleLinkedList(object):
    """双向单链表"""

    def __init__(self):
        self.__head = None

    def is_empty(self):
        """判断链表是否为空"""
        return self.__head == None

    def length(self):
        """链表长度"""
        count = 0
        cur = self.__head
        while cur != None:
            count += 1
            cur = cur.next
        return count

    def traverse(self):
        """遍历单链表"""
        cur = self.__head
        while cur != None:
            print(cur.item, end="")
            cur = cur.next
        print("")

    def add(self, item):
        """头部添加元素"""
        node = Node(item)
        if self.is_empty():
            self.__head = node
            node.pror = None
        else:
            node.next = self.__head
            self.__head = node
            node.pror = None
            node.next.pror = node

    def append(self, item):
        """尾部添加元素"""
        node = Node(item)
        # 先判断链表是否为空
        if self.is_empty():
            self.__head = node
            node.pror = None
        # 若不为空，则找到尾部，将尾节点的next指向新节点
        else:
            cur = self.__head
            while cur.next != None:
                cur = cur.next
            cur.next = node
            node.pror = cur

    def insert(self, pro, item):
        """指定位置添加元素"""
        # 若指定位置为第一个元素之前，执行头查
        if pro <= 0:
            self.add(item)
        # 若第一个元素位置超过链表尾部，执行尾插
        elif pro > (self.length() - 1):
            self.append(item)
        # 一般情况
        else:
            node = Node(item)
            cur = self.__head
            count = 0
            while count < pro:
                cur = cur.next
                count += 1
            node.next = cur
            node.pror = cur.pror
            cur.pror = node
            node.pror.next = node

    def remove(self, item):
        """删除节点"""
        cur = self.__head
        while cur != None:
            if cur.item == item:
                if cur == self.__head:
                    self._head = cur.next
#                   判断是否只有一个节点
                    if cur.next:
                        cur.next.pror = None
                else:
                    cur.pror.next = cur.next
#                   判断是否为尾节点
                    if cur.next:
                        cur.next.pror = cur.pror
                return
            else:
                cur = cur.next

    def search(self, item):
        """查找节点是否存在，并返回Ture或False"""
        cur = self._head
        while cur != None:
            if cur.item == item:
                return True
            cur = cur.next
        return False


if __name__ == "__main__":
    ll = DoubleLinkedList()
    print(ll.is_empty())
    print(ll.length())

    ll.append(1)
    print(ll.is_empty())
    print(ll.length())

    ll.append(2)
    ll.add(8)
    ll.append(3)
    ll.append(4)
    ll.append(5)
    ll.append(6)
    # 8 1 2 3 4 5 6

    ll.insert(-1, 9)  # 9 8 1 2 3 4 5 6
    ll.traverse()
    ll.insert(3, 100)  # 9 8 1 100 2 3 4 5 6
    ll.traverse()
    ll.insert(10, 200)  # 9 8 1 100 2 3 4 5 6 200
    ll.traverse()
    ll.remove(100)
    ll.traverse()
    ll.remove(9)
    ll.traverse()
    ll.remove(200)
    ll.traverse()
    print(ll.search(3))
    print(ll.search(200))
    print(ll.length())

## 栈
栈（stack），有些地方称为堆栈，是一种容器，可存入数据元素、访问元素、删除元素，它的特点在于只能允许在容器的一端（称为栈顶端指标，英语：top）进行加入数据（英语：push）和输出数据（英语：pop）的运算。没有了位置概念，保证任何时候可以访问、删除的元素都是此前最后存入的那个元素，确定了一种默认的访问顺序。

由于栈数据结构只允许在一端进行操作，因而按照后进先出（LIFO, Last In First Out）的原理运作。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/stack.png" width="350" height="350" >

**栈的操作**
* Stack() 创建一个新的空栈
* push(item) 添加一个新的元素item到栈顶
* pop() 弹出栈顶元素
* peek() 返回栈顶元素
* is_empty() 判断栈是否为空
* size() 返回栈的元素个数


### 栈

In [None]:
# _*_ conding: UTF-8 _*_

class Stack(object):
    """栈"""

    def __init__(self):
        self.__list = []

    def push(self, item):
        """添加一个新元素到栈"""
        self.__list.append(item)

    def pop(self):
        """弹出栈顶元素"""
        return self.__list.pop()

    def peek(self):
        """返回栈顶元素"""
        if self.__list:
            return self.__list[-1]
        else:
            return None

    def is_empty(self):
        """判断栈是否为空"""
        return self.__list == []

    def size(self):
        """返回栈的元素个数"""
        return len(self.__list)


if __name__ == "__main__":
    s = Stack()
    s.push(1)
    s.push(2)
    s.push(3)
    s.push(4)
    print(s.pop())
    print(s.pop())
    print(s.pop())
    print(s.pop())

## 队列

队列（queue）是只允许在一端进行插入操作，而在另一端进行删除操作的线性表。

队列是一种先进先出的（First In First Out）的线性表，简称FIFO。允许插入的一端为队尾，允许删除的一端为队头。队列不允许在中间部位进行操作！假设队列是q=（a1，a2，……，an），那么a1就是队头元素，而an是队尾元素。这样我们就可以删除时，总是从a1开始，而插入时，总是在队列最后。这也比较符合我们通常生活中的习惯，排在第一个的优先出列，最后来的当然排在队伍最后。

### 队列


**队列的操作**
* Queue() 创建一个空的队列
* enqueue(item) 往队列中添加一个item元素
* dequeue() 从队列头部删除一个元素
* is_empty() 判断一个队列是否为空
* size() 返回队列的大小


In [None]:
# _*_ conding: UTF-8 _*_

class Queue(object):
    """队列"""

    def __init__(self):
        self.__list = []

    def enqueue(self, item):
        """往队列中添加元素"""
        self.__list.append(item)
#         self.__list.insert(0,item)

    def dequene(self):
        """对队列头部删除元素"""
        return self.__list.pop(0)
#         return self.__list.pop()

    def is_empty(self):
        """判断队列是否为空"""
        return self.__list == []

    def size(self):
        """返回队列的大小"""
        return len(self.__list)


if __name__ == "__main__":
    s = Queue()
    s.enqueue(1)
    s.enqueue(2)
    s.enqueue(3)
    s.enqueue(4)
    print(s.dequene())
    print(s.dequene())
    print(s.dequene())
    print(s.dequene())

### 双端队列

**双端队列的操作**
* Deque() 创建一个空的双端队列
* add_front(item) 从队头加入一个item元素
* add_rear(item) 从队尾加入一个item元素
* pop_front() 从队头删除一个item元素
* pop_rear() 从队尾删除一个item元素
* is_empty() 判断双端队列是否为空
* size() 返回队列的大小


In [None]:
# _*_ conding: UTF-8 _*_

class Deque(object):
    """双端队列"""

    def __init__(self):
        self.__list = []

    def add_front(self, item):
        """往队列头添加元素"""
        self.__list.insert(0, item)

    def add_rear(self, item):
        """往队列尾添加元素"""
        self.__list.append(item)

    def pop_front(self):
        """对队列头部删除元素"""
        return self.__list.pop(0)

    def pop_rear(self):
        """对队列尾部删除元素"""
        return self.__list.pop()

    def is_empty(self):
        """判断队列是否为空"""
        return self.__list == []

    def size(self):
        """返回队列的大小"""
        return len(self.__list)

## 排序与搜索

排序算法（英语：Sorting algorithm）是一种能将一串数据依照特定顺序进行排列的一种算法。

**排序算法的稳定性**

**稳定性**: 稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录R和S，且在原本的列表中R出现在S之前，在排序过的列表中R也将会是在S之前。

当相等的元素是无法分辨的，比如像是整数，稳定性并不是一个问题。然而，假设以下的数对将要以他们的第一个数字来排序。

```
(4, 1)  (3, 1)  (3, 7)（5, 6）
```

在这个状况下，有可能产生两种不同的结果，一个是让相等键值的纪录维持相对的次序，而另外一个则没有：

```
(3, 1)  (3, 7)  (4, 1)  (5, 6)  （维持次序）
(3, 7)  (3, 1)  (4, 1)  (5, 6)  （次序被改变）
```

不稳定排序算法可能会在相等的键值中改变纪录的相对次序，但是稳定排序算法从来不会如此。不稳定排序算法可以被特别地实现为稳定。作这件事情的一个方式是人工扩充键值的比较，如此在其他方面相同键值的两个对象间之比较，（比如上面的比较中加入第二个标准：第二个键值的大小）就会被决定使用在原先数据次序中的条目，当作一个同分决赛。然而，要记住这种次序通常牵涉到额外的空间负担。

### 冒泡排序

**冒泡排序**（英语：Bubble Sort）是一种简单的排序算法。它重复地遍历要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。

**冒泡排序算法的运作如下**:
* 比较相邻的元素。如果第一个比第二个大（升序），就交换他们两个。
* 对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对。这步做完后，最后的元素会是最大的数。
* 针对所有的元素重复以上的步骤，除了最后一个。
* 持续每次对越来越少的元素重复上面的步骤，直到没有任何一对数字需要比较。

**冒泡排序的分析**

交换过程图示(第一次)：
<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/bubblesort.png"/>
那么需要进行n-1次冒泡过程，每次对应的比较次数如下图所示：
![compare.bmp](attachment:compare.bmp)

In [None]:
# _*_ conding: UTF-8 _*_

def bubble_sort(list):
    """冒泡排序"""
    n = len(list)
    # 排序遍数,j:0 ~ n-2
    for j in range(n-1):
        # 元素从头走到尾
        count = 0
        for i in range(0, n-1-j):
            if list[i] > list[i+1]:
                list[i], list[i+1] = list[i+1], list[i]
                count += 1
        if count == 0:
            return


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    bubble_sort(li)
    print(li)

**冒泡排序的时间复杂度**
* 最优时间复杂度：O(n) （表示遍历一次发现没有任何可以交换的元素，排序结束）
* 最坏时间复杂度：O($n^2$)
* 稳定性：稳定

**冒泡排序的演示**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/bubble.gif"/>

### 选择排序

选择排序（Selection sort）是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推，直到所有元素均排序完毕。

选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上，则它不会被移动。选择排序每次交换一对元素，它们当中至少有一个将被移到其最终位置上，因此对n个元素的表进行排序总共进行至多n-1次交换。在所有的完全依靠交换去移动元素的排序方法中，选择排序属于非常好的一种。

**选择排序的分析**

排序过程：

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/selectionsort.bmp"/>

红色表示当前最小值，黄色表示已排序序列，蓝色表示当前位置。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/Selection-Sort-Animation.gif" width="75" height="75" align=center>

In [None]:
# _*_ conding: UTF-8 _*_

def select_sort(list):
    """选择排序"""
    n = len(list)
    for j in range(n-1):
        min_index = j
        for i in range(j+1, n):
            if list[min_index] > list[i]:
                min_index = i
        list[j], list[min_index] = list[min_index], list[j]


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    select_sort(li)
    print(li)

**选择排序的时间复杂度**
* 最优时间复杂度：O($n^2$)
* 最坏时间复杂度：O($n^2$)
* 稳定性：不稳定（考虑升序每次选择最大的情况）

**选择排序的演示**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/selection.gif"/>

### 插入排序

插入排序（英语：Insertion Sort）是一种简单直观的排序算法。它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序在实现上，在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。

**插入排序的分析**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/insert.png"/>

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/Insertion-sort-example.gif"/>

In [None]:
# _*_ conding: UTF-8 _*_

def insert_sort(list):
    """插入排序"""
    n = len(list)
    # 从右边的无序序列中取出多少个元素执行这样的过程
    for j in range(1, n):  # j = [1,2,3,....n-1]
        # i代表内层循环的起始值
        i = j
        # 执行从右边无序序列中取出第一个元素，即i位置的元素进行比较，然后将其插入到前面的正确位置中
        while i > 0:
            if list[i] < list[i-1]:
                list[i], list[i-1] = list[i-1], list[i]
                i -= 1
            else:
                break


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    insert_sort(li)
    print(li)

**插入排序的时间复杂度**
* 最优时间复杂度：O(n) （升序排列，序列已经处于升序状态）
* 最坏时间复杂度：O($n^2$)
* 稳定性：稳定

**插入排序的演示**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/insert.gif"/>

### 快速排序

快速排序（英语：Quicksort），又称划分交换排序（partition-exchange sort），通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

步骤为：

1. 从数列中挑出一个元素，称为"基准"（pivot）
2. 重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区结束之后，该基准就处于数列的中间位置。这个称为分区（partition）操作。
3. 递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序。

递归的最底部情形，是数列的大小是零或一，也就是永远都已经被排序好了。虽然一直递归下去，但是这个算法总会结束，因为在每次的迭代（iteration）中，它至少会把一个元素摆到它最后的位置去。

**快速排序的分析**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/快速排序.jpg" width="650" height="700">

In [None]:
# _*_ conding: UTF-8 _*_

def quick_sort(list, first, last):
    """快速排序"""
    if first >= last:
        return
    mid_value = list[first]
    low = first
    high = last

    while low < high:
        # high指针左移
        while low < high and list[high] >= mid_value:
            high -= 1
        list[low] = list[high]

        while low < high and list[low] < mid_value:
            low += 1
        list[high] = list[low]
    # 从循环退出时，low==high
    list[high] = mid_value

    # 调用递归对low左边的列表执行快速排序
    quick_sort(list, first, low-1)
    # 调用递归对low右边的列表执行快速排序
    quick_sort(list, low+1, last)


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    quick_sort(li, 0, len(li)-1)
    print(li)

**快速排序的时间复杂度**
* 最优时间复杂度：O(nlogn)
* 最坏时间复杂度：O($n^2$)
* 稳定性：不稳定

从一开始快速排序平均需要花费O(n log n)时间的描述并不明显。但是不难观察到的是分区运算，数组的元素都会在每次循环中走访过一次，使用O(n)的时间。在使用结合（concatenation）的版本中，这项运算也是O(n)。

在最好的情况，每次我们运行一次分区，我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此，在到达大小为一的数列前，我们只要作log n次嵌套的调用。这个意思就是调用树的深度是O(log n)。但是在同一层次结构的两个程序调用中，不会处理到原来数列的相同部分；因此，程序调用的每一层次结构总共全部仅需要O(n)的时间（每个调用有某些共同的额外耗费，但是因为在每一层次结构仅仅只有O(n)个调用，这些被归纳在O(n)系数中）。结果是这个算法仅需使用O(n log n)时间。

**快速排序的演示**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/quicksort.gif"/>

### 希尔排序

希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序，是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因DL．Shell于1959年提出而得名。 希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。

**希尔排序过程**

希尔排序的基本思想是：将数组列在一个表中并对列分别进行插入排序，重复这过程，不过每次用更长的列（步长更长了，列数更少了）来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法，算法本身还是使用数组进行排序。

例如，假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ]，如果我们以步长为5开始进行排序，我们可以通过将这列表放在有5列的表中来更好地描述算法，这样他们就应该看起来是这样(竖着的元素是步长组成)：

```
13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10
```

然后我们对每列进行排序：

```
10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
```

将上述四行数字，依序接在一起时我们得到：[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]。这时10已经移至正确位置了，然后再以3为步长进行排序：

```
10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
```

排序之后变为：

```
10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
```

最后以1步长进行排序（此时就是简单的插入排序了）

**希尔排序的分析**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/shellsort.png"/>

In [None]:
# _*_ conding: UTF-8 _*_

def shell_sort(list):
    """希尔排序"""
    # 希尔排序就是优化之后的一种插入排序

    n = len(list)
    gap = n // 2
    # gap变化到0之前，插入算法执行的次数
    while gap >= 1:
        # 希尔排序与插入排序的区别就在于gap步长
        for j in range(gap, n):  # j = [gap,gap+1,gap+2,....n-1]
            # i代表内层循环的起始值
            i = j
            # 执行从右边无序序列中取出第一个元素，即i位置的元素进行比较，然后将其插入到前面的正确位置中
            while i > 0:
                if list[i] < list[i-gap]:
                    list[i], list[i-gap] = list[i-gap], list[i]
                    i -= gap
                else:
                    break
        # 缩短gap步长,实现循环
        gap //= 2


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    shell_sort(li)
    print(li)

**希尔排序的时间复杂度**
* 最优时间复杂度：根据步长序列的不同而不同
* 最坏时间复杂度：O($n^2$)
* 稳定性：不稳定

**希尔排序的演示**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/shellsort.gif"/>

### 归并排序

归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组，再合并数组。

将数组分解最小之后，然后合并两个有序数组，基本思路是比较两个数组的最前面的数，谁小就先取谁，取了后相应的指针就往后移一位。然后再比较，直至一个数组为空，最后把另一个数组的剩余部分复制过来即可。

**归并排序的分析**

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/Merge-sort-example.gif"/>

In [51]:
# _*_ conding: UTF-8 _*_

def merge_sort(list):
    """归并排序"""
    n = len(list)
    if n <= 1:
        return list
    mid = n//2

    # left 采用递归后形成的新的有序的列表
    left = merge_sort(list[:mid])
    # right 采用递归后形成的新的有序的列表
    right = merge_sort(list[mid:])

    # 将两个有序的子序列合并为一个新的列表
    left_point, right_point = 0, 0
    result = []
    while left_point < len(left) and right_point < len(right):
        if left[left_point] < right[right_point]:
            result.append(left[left_point])
            left_point += 1
        else:
            result.append(right[right_point])
            right_point += 1
    result += left[left_point:]
    result += right[right_point:]
    return result


if __name__ == "__main__":
    li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    print(li)
    merge_sorted_li = merge_sort(li)
    print(merge_sorted_li)

[54, 26, 93, 17, 77, 31, 44, 55, 20]
[17, 20, 26, 31, 44, 54, 55, 77, 93]


**归并排序的时间复杂度**
* 最优时间复杂度：O(nlogn)
* 最坏时间复杂度：O(nlogn)
* 稳定性：稳定

### 常见排序算法效率比较


<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/排序比较.bmp"/>

### 搜索

搜索是在一个项目集合中找到一个特定项目的算法过程。搜索通常的答案是真的或假的，因为该项目是否存在。 搜索的几种常见方法：顺序查找、二分法查找、二叉树查找、哈希查找

**二分法查找**

二分查找又称折半查找，优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步查找前一子表，否则进一步查找后一子表。重复以上过程，直到找到满足条件的记录，使查找成功，或直到子表不存在为止，此时查找不成功。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/Binary_search_into_array.png" width="300" height="300">

**二分法查找实现**

（非递归实现）

（递归实现）

**时间复杂度**
* 最优时间复杂度：O(1)
* 最坏时间复杂度：O(nlogn)

## 树与树算法

**树的概念**

树（英语：tree）是一种抽象数据类型（ADT）或是实作这种抽象数据类型的数据结构，用来模拟具有树状结构性质的数据集合。它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：

* 每个节点有零个或多个子节点；
* 没有父节点的节点称为根节点；
* 每一个非根节点有且只有一个父节点；
* 除了根节点外，每个子节点可以分为多个不相交的子树；

比如说：

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/tree.png"/>

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/Treedatastructure.png"/>

**树的术语**

* **节点的度**：一个节点含有的子树的个数称为该节点的度；
* **树的度**：一棵树中，最大的节点的度称为树的度；
* **叶节点**或**终端节点**：度为零的节点；
* **父亲节点**或**父节点**：若一个节点含有子节点，则这个节点称为其子节点的父节点；
* **孩子节点**或**子节点**：一个节点含有的子树的根节点称为该节点的子节点；
* **兄弟节点**：具有相同父节点的节点互称为兄弟节点；
* 节点的**层次**：从根开始定义起，根为第1层，根的子节点为第2层，以此类推；
* 树的**高度**或**深度**：树中节点的最大层次；
* **堂兄弟节点**：父节点在同一层的节点互为堂兄弟；
* **节点的祖先**：从根到该节点所经分支上的所有节点；
* **子孙**：以某节点为根的子树中任一节点都称为该节点的子孙。
* **森林**：由m（m>=0）棵互不相交的树的集合称为森林；

**树的种类**

* **无序树**：树中任意节点的子节点之间没有顺序关系，这种树称为无序树，也称为自由树；
* **有序树**：树中任意节点的子节点之间有顺序关系，这种树称为有序树；
  * **二叉树**：每个节点最多含有两个子树的树称为二叉树；
    * **完全二叉树**：对于一颗二叉树，假设其深度为d(d>1)。除了第d层外，其它各层的节点数目均已达最大值，且第d层所有节点从左向右连续地紧密排列，这样的二叉树被称为完全二叉树，其中**满二叉树**的定义是所有叶节点都在最底层的完全二叉树;
    * **平衡二叉树**（AVL树）：当且仅当任何节点的两棵子树的高度差不大于1的二叉树；
    * **排序二叉树**（二叉查找树（英语：Binary Search Tree），也称二叉搜索树、有序二叉树）；
  * **霍夫曼树**（用于信息编码）：带权路径最短的二叉树称为哈夫曼树或最优二叉树；
  * **B树**：一种对读写操作进行优化的自平衡的二叉查找树，能够保持数据有序，拥有多余两个子树。

**树的存储与表示**

***顺序存储***：将数据结构存储在固定的数组中，然在遍历速度上有一定的优势，但因所占空间比较大，是非主流二叉树。二叉树通常以链式存储。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/树的顺序存储.png"/>

***链式存储***：

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/树的链式存储.png" width="600" height="500">

由于对节点的个数无法掌握，常见树的存储表示都转换成二叉树进行处理，子节点个数最多为2

**常见的一些树的应用场景**

1. xml，html等，那么编写这些东西的解析器的时候，不可避免用到树
2. 路由协议就是使用了树的算法
3. mysql数据库索引
4. 文件系统的目录结构
5. 所以很多经典的AI算法其实都是树搜索，此外机器学习中的decision tree也是树结构

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/网页结构.png"/>

### 二叉树

**二叉树的基本概念**

二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”（left subtree）和“右子树”（right subtree）

**二叉树的性质(特性)**

* **性质1**: 在二叉树的第i层上至多有2^(i-1)个结点（i>0）
* **性质2**: 深度为k的二叉树至多有2^k - 1个结点（k>0）
* **性质3**: 对于任意一棵二叉树，如果其叶结点数为N0，而度数为2的结点总数为N2，则N0=N2+1;
* **性质4**:具有n个结点的完全二叉树的深度必为 log2(n+1)
* **性质5**:对完全二叉树，若从上至下、从左至右编号，则编号为i 的结点，其左孩子编号必为2i，其右孩子编号必为2i＋1；其双亲的编号必为i/2（i＝1 时为根,除外）

(1)完全二叉树——若设二叉树的高度为h，除第 h 层外，其它各层 (1～h-1) 的结点数都达到最大个数，第h层有叶子结点，并且叶子结点都是从左到右依次排布，这就是完全二叉树。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/完全二叉树.png"/>

(2)满二叉树——除了叶结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树。

<img src="https://cdn.jsdelivr.net/gh/Austinwj/Pic_Bed//img/满二叉树.png"/>

### 二叉树的节点表示以及树的创建

### 二叉树的遍历

树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问，即依次对树中每个结点访问一次且仅访问一次，我们把这种对所有节点的访问称为遍历（traversal）。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,**深度优先一般用递归，广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现**。

#### 深度优先遍历

对于一颗二叉树，深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点，尽可能深的搜索树的分支。

那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点，它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历（preorder），中序遍历（inorder）和后序遍历（postorder）。我们来给出它们的详细定义，然后举例看看它们的应用。


#### 广度优先遍历(层次遍历)

从树的root开始，从上到下从从左到右遍历整个树的节点