算法可视化网站，辅助理解：
- https://visualgo.net/zh
- https://www.cs.usfca.edu/~galles/visualization/Algorithms.html


# 列表

数据结构按照逻辑结构分为：线性结构（元素存在一对一的相互关系）、树结构（元素存在一对多的相互关系）、图结构（元素存在多对多的相互关系）
物理结构（是怎样实现的）

列表
- 如何存储的：顺序存储（与数组的区别：数组元素类型要相同、数组长度固定）。python上有预先存储真实值，然后你建的变量和数据结构存的都是指向真实值的地址。
- 列表的基本操作及相应的时间复杂度，除了插入和删除是O(n)，其他都是O(1)。

# 栈

- 是一种数据集合，可以理解为只能在一端进行插入或删除操作的列表。LOFO后进先出。
- 基本操作：pop（出栈）、push（进栈）、gettop（取栈顶）

# 队列

一般队列
- 仅仅允许在列表的一端（队尾）插入，另一端（队头）删除。FIFO先进先出。
- 基本操作：pop(0)(O(n))或者用front指针指向0队头+1、使用环形队列节省存储空间、用rear指针指向队尾
- 环形队列：当队尾指针front==Maxsize+1时，再前进一个位置就自动到0（Maxsize为队列长度）
    - 队列内进元素，队首指针前进1:front==(front+1)%Maxsize
    - 队列内出元素，队尾指针rear=(rear+1)%Maxsize
    - 当队列为空时，rear == front
    - 当队列满了时，(rear+1)%Maxsize==front

In [3]:
# 写一个底层队列

class Queue:
    def __init__(self, size=100) -> None:
        self.queue = [0 for i in range(size)]
        self.size = size
        self.rear = 0
        self.front = 0
    
    def push(self, element):
        if not self.is_full():
            self.rear = (self.rear + 1) % self.size
            self.queue[self.rear] = element
        else:
            raise Exception("Queue is full.")
    
    def pop(self, element):
        if not self.is_empty():
            self.front = (self.front + 1) % self.size
            # self.queue[self.front] = 0  #不能删除，不然不能return了
            return self.queue[self.front]
        else:
            raise Exception("Queue is empty.")

    def is_empty(self):
        return self.front == self.rear

    def is_full(self):
        return (self.rear + 1) % self.size == self.front

q = Queue(6)
for i in range(5):
    q.push(i)
q.is_full()

True

##  双向队列

- 双向队列两端都支持进队和出队操作
- 基本操作：队首进队、队首出队、队尾进队、队尾出队。

## python中的队列

In [5]:
# python中有包可以直接用

from collections import deque
q = deque([1,2,3], 5)  # 1.初始化队列。2.队列长度，队满了时队首自动出队。
# 一般队列
q.append(1)  # 队尾进队
q.popleft()  # 队首出队

# 双向队列
q.appendleft(1) # 队首进队
q.pop()  # 队尾出队


# 应用1:打印文件的后n行（例如打印后5行）
def tail(text, n):
    with open(text, "r") as f:
        q = deque(f, n)
        return q

1

# 链表

- 一系列节点组成的元素集合，每个节点包含两个部分：数据域item和指向下一节点的指针next。
- 链表的插入和删除操作比普通列表（O(n)）快。插入（注意：要先连尾后连头）、删除（直接连接就行）

In [2]:
# 自己写一个链表
class Node:
    def __init__(self, item) -> None:
        self.item = item
        self.next = None
    
a = Node(1)
b = Node(2)
c = Node(3)
a.next = b
b.next = c
a.next.next.item

3

In [15]:
# 1、创建链表
# 头插法和尾插法（添加节点的方向不同，前者弄完后是逆序的，后者弄完后是顺序的）
class Node:
    def __init__(self, item) -> None:
        self.item = item
        self.next = None

def create_linklist_head(li):
    # 头插法
    head = Node(li[0])
    for element in li[1:]:
        node = Node(element)
        node.next = head
        head = node
    return head

def create_linklist_tail(li):
    # 尾插法
    head = Node(li[0])
    tail = head
    for element in li[1:]:
        node = Node(element)
        tail.next = node
        tail = node
    return head

def print_linklist(lk):
    # 从头head遍历链表
    while lk:
        print(lk.item, end=",")
        lk = lk.next

lk = create_linklist_tail([1,2,3,4,5])
print_linklist(lk)

1,2,3,4,5,

## 双链表

- 每个节点有2个指针：一个指向后一个节点，一个指向前一个节点。
- 插入和删除要复杂一些

In [None]:
# 建立一个双链表

class Node:
    def __init__(self, item) -> None:
        self.item = item
        self.next = None
        self.prior = None

## 链表总结

顺序表（列表/数组）与链表
- 链表的插入和删除比顺序表要快
- 链表的内存可以更灵活分配（可以用链表来重新实现栈和队列）
- 链表这种链式存储的数据结构对【树和图】的结构有很大的启发性

# 哈希表（散列表）

- python的字典和集合都是哈希表存储的
- 支持操作：insert、get、delete。

- 直接寻址表：优点-关键字的全域U比较小时很好用，时间复杂度O(1)。缺点：U很大时会消耗很大内存、实际的key很少时会浪费大量内存、无法处理关键字不是数字的情况。说白了就是用空间换时间！
- 直接寻址表+哈希就是哈希表。构建大小为m的寻址表T，key为k的元素放到h(k)的位置上，h(k)是一个函数，其将域U映射到表T[0,1,……,m-1]

- 哈希表hash table，是一种线性表的存储结构，它由一个直接寻址表和一个哈希函数组成。哈希函数h(k)将元素关键字k作为自变量，返回元素的存储下标。
- 哈希冲突（有可能某几个元素经过哈希函数计算下标后相同，即不同元素映射到同一位置）
    - 解决方法1:开放寻址法。如果哈希函数返回的位置已经有值，则可以向后探查新的位置来存储这个值（线性探查+1，二次探查+1^2，二度哈希-当第一个哈希函数计算的位置下标产生冲突那就使用另外一种哈希函数）。这种方法不太好。
    - 解决方法2:拉链法。哈希表的每个位置都连接一个链表，当冲突发生时，冲突的元素将被加到该位置链表的最后。
- 常见的哈希函数，详细见截图。

## 哈希表的实现

In [25]:
# 自己实现哈希表

# 先写一个类，可以创建一个可以迭代的链表
class LinkList:
    class Node:
        def __init__(self, item):
            self.item = item
            self.next = None
    
    class LinkListIterator:
        def __init__(self, node):
            self.node = node
        
        def __next__(self):
            if self.node:
                cur_node = self.node
                self.node = cur_node.next
                return cur_node.item
            else:
                raise StopIteration
        
        def __iter__(self):
            return self
    
    def __init__(self, iterable=None):
        # iterable表示允许传一个列表进来
        self.head = None
        self.tail = None
        if iterable:
            self.extend(iterable)
    
    # 下面的append和extend是模仿python列表写的
    def append(self, obj):
        s = LinkList.Node(obj) #先把传入的这个数据创建成一个节点
        if not self.head: #如果head是空的，那么加入的这个节点就是头节点和尾节点
            self.head = s
            self.tail = s
        else:  #如果不是空的，就用尾插法插入到后边
            self.tail.next = s
            self.tail = s
    
    def extend(self, iterable):
        for obj in iterable:
            self.append(obj)
    
    def find(self, obj):
        for n in self:
            if n == obj:
                return True
        else:
            return False
    
    def __iter__(self):
        #让这个链表支持for循环，写了一个迭代器类
        return self.LinkListIterator(self.head)
    
    def __repr__(self):
        #打印时转换成字符串
        return "<<"+",".join(map(str, self))+">>"


# lk = LinkList([1,2,3,4,5])
# for element in lk:
#     print(element)
# print(lk)

class HashTable:
    def __init__(self, size=101):
        self.size = size
        self.T = [LinkList() for i in range(self.size)]

    def h(self, k):
        #哈希函数
        return k % self.size
    
    def insert(self, k):
        i = self.h(k)
        if self.find(k):
            print("Duplicated Insert.")
        else:
            self.T[i].append(k)
    
    def find(self, k):
        i = self.h(k)
        return self.T[i].find(k)

ht = HashTable()
ht.insert(0)
ht.insert(1)
ht.insert(3)
ht.insert(102)
ht.insert(0)
print(ht.T)
ht.find(3)

Duplicated Insert.
[<<0>>, <<1,102>>, <<>>, <<3>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>, <<>>]


True

## 哈希表的应用

- 集合和字典。它们都是通过哈希表来实现的。
- 如果要存字符串，就先将字符串转化为整数，再用哈希表的方式来存。

- 应用之一：md5算法
- MD5，Message-Digest Algorithm 5。曾经是密码学中常用的哈希函数，可以把任意长度的数据映射为128位的哈希值，其曾经包含如下特征：
    - 1.同样的消息，其MD5值必定相同
    - 2.可以快速计算出任意给定消息的MD5值
    - 3.除非暴力的枚举所有可能的消息，否则不可能从哈希值反推出消息本身
    - 4.两条消息之间即使只有微小的差别，其对应的MD5值也应该是完全不同、完全不相关的
    - 5.不能在有意义的时间内人工的构造两个不同的消息，使其具有相同的MD5值。
- 应用举例：文件的哈希值。（如果两文件哈希值相同则两文件是相同的——用户可以利用这个验证下载的文件是否完整、云存储服务商可以利用它来判断用户要上传的文件是否已经存在于服务器上，从而实现秒传的功能，同时避免存储过多相同的文件副本）

- 应用之二：SHA2算法
- SHA2在安全性较重要的场合推荐使用，拥有一系列的哈希函数，可生成不同长度的位数值。
- 比特币系统：给定字符串U和目标哈希值H，需要计算出一个字符串V，使得U+V的哈希值与H的差小于一个给定值D。只能通过暴力枚举V来进行猜测，猜出结果的人可以获得一定的奖金。

# 树、二叉树、AVL树