<a href="https://colab.research.google.com/github/fxr1115/Learning/blob/main/Python3-Algorithm/3_linked-list/12_7_linked_list.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**程序**=数据结构（数学模型）+算法（处理问题的策略）

## 存储、逻辑结构

数据的**逻辑结构**：
- **线性**结构——一个对一个
    - 对线性表的主要操作：查找、修改、插入和删除等
- **树形**结构——一个对多个
    - 对树型结构的主要操作：查找、修改、插入和删除等
- **图状**结果——多个对多个
    - 网状结果（图型结构）的操作：求一个顶点到另一个顶点的最短路径
- 集合关系（没有关系的数据放在一起，不讨论）

数据的**物理结构**：
- 是数据逻辑结构*在计算机中*的表示和实现
- 不仅要*存储数据本身*，还要存放*数据和数据之间的关系*
    - 存进去之后才能对数据进行相应的操作
    - **顺序存储**：借助元素在存储器中的**相对位置**表示数据元素之间的逻辑关系
    - **链式存储**：借助指针元素存储地址的**指针**表示数据元素之间的逻辑关系



**顺序存储**：
- 存储单元地址连续，以‘**物理位置相邻**’来表示线性表中数据元素间的逻辑关系，可随机存取表中任一元素
- 特点：
    - 可实现对结点的随机存取，即每个结点对应一个序号，*由该序号可以直接计算出结点的存储地址*
    - 对结点的插入、删除运算时，要移动一系列的结点

**链式存储**：
- 逻辑关系通过指针的链接来表示
- 在表示数据元素之间的逻辑关系时，这两部分组成数据元素的存储映像，称为**结点**
    - 除了存储器*本身的信息*
    - 还要存储一个指示其直接后继的信息（即**直接后继的存储位置**）  
- 特点：
    - 结点除自身的信息域外，还有表示关联信息的指针域
        - 故链式存储结构的存储密度小，存储空间利用率低
    - 在逻辑上相邻的结点在物理上不必相邻
        - 故不可以随机存储，只能**顺序**存储
    - 插入和删除操作方便灵活，不必移动结点，只需*移动结点中的指针域*即可


**逻辑结构和存储结构之间的关系**
- 面对一个问题
    - 步骤1：选择某个数据结构——**面向问题**
    - 步骤2：选择某个数据结构的表示——**面向机器**
- 数据结构要研究的内容
    - *面向问题的数据的逻辑结构* 向 *面向机器的数据 的存储结构* **转换的问题**

## 算法和算法分析

**算法**
- 解决某一特定问题的**具体步骤的描述**
- 是指令的有限序列，每一个指令表示一个或多个操作

**特性**：
- 有穷性
- 确定性
- 可行性
- 没有或有若干输入
- 有若干个输出：没有输出的算法是没有意义的

**衡量标准**：
- 正确性
- 可读性
- 健壮性
- 效率与低存储量

**时间复杂度**
- 使用**渐进复杂度**
    - 取决于*最深循环*内包含基本操作的语句重复执行次数
- 根据算法写成的程度在执行时耗费时间的长度
    - 这个长度往往和输入数据的规模有关

空间复杂度（**很少考虑**）
- 除去存储程序本身的输入数据之外
- 会要存储对数据操作的存储单元



## 线性表

**定义**：线性表是相同数据类型的n个数据元素的有限序列
$$A=(a_1, a_2,...,a_{i-1}, a_i, a_{i+1},.., a_n)$$
- 表头元素，无前驱
- $a_i$的直接前驱$a_{i-1}$，$a_{i+1}$直接前驱$a_i$
- 表尾元素，无后继
- `n`表示线性表`A`的长度，`n=0`时，表示`A`是空表

**特点**：
- 存在**唯一**一个被称为**第一个**的数据元素
- 存在**唯一**一个被称为**最后一个**的数据元素
- 除第一个，每个数据元素均**只有一个前**驱
- 除最后一个，每个元素均**只有一个**后继

**实现**：
- **顺序**存储：**顺序表**
    - 将表中元素顺序存放在一大块连续的存储区中
    - 元素之间的顺序关系是由存储顺序体现
- **链式**存储：**链表**
    - 将表元素存放在通过地址连接构造起来的一些列内存中
    - 通过地址的指引来体现数据之间的顺序关系

### 顺序表


**存储器**：
- 外存：长期保持、存储容量大、存取速度慢
- 内存：存取速度快

**CPU只能**直接访问内存，在内存区数据进行操作


**定义**：用一组地址连续的存储单元存放一个线性表

**元素地址计算方法**
- 一个数据元素所占存储空间$L$
- 基地址$LOC(a_1)$
- $a_i$的元素地址：$$LOC(a_1)+(i-1)*L$$

**存储特点**：
- 逻辑上相邻的数据元素，物理地址也相邻
    - 用物理上的相邻表示逻辑上的相邻
- 实现随机存取，时间复杂度$O(1)$

**删除**操作
```
j = i + 1
while j < list.len():
    list.a[j - 1] = list.a[j]
    j += 1
```

**插入**操作
```
j = list.len() - 1
while j >= i:
    list.a[j + 1] = list.a[j]
    j -= 1
list.a[i] = x
```

**结论**：
- 在顺序表中**插入或删除**一个元素时，**平均移动表的一半元素**
- 当`n`很大时，效率很低

Python中顺序表是实现
- Python中的`list`（可变）和`tuple`（不可变）两种类型采用了顺序表的实现技术
    - `list`和`tuple`底层都是基于数组
-
```
list.append(x)
list.insert(index, x)
list.pop(index)
list.pop()
list,remove(x)
list[index]
list[-index]
list[index]=x
list.sort() # 复杂度O(nlogn)
```

顺序表的**结构定义**：
- 应该顺序表的完整信息包括两个部分
    - **数据区**：表中元素集合
    - **表头**：记录表的整体情况信息（两项）
        - 元素存储区的**容量**
        - 已有元素**个数**

**动态顺序表**：
- 当执行插入操作时，列表会自动扩容，即换一块更大的存储区域
- **列表**就是动态顺序表，采用分离式结构
- 列表是**元素外置**顺序表
    - 使得可以存储不同的类型数据


### 链表

**特点**：
- 用一组任意的存储单元（可不连续）存储线性表的数据元素
- 每个元素利用**地址**（**指针**）实现用不同的存储单元存放逻辑上相邻的元素

**结点结构**：
- 数据域：数据元素本身信息
- 链接域：直接后继或直接前驱的存储地址（地址/指针域）

**线性链表的分类**
- **单链表**：每个结点除包含有数据域外，只设置**一个链接域**，用以指向后继结点
- **双向链表**：每个结点除包含数据域外，设置**两个链接域**，分别用以指向前驱结点和后继结点

#### 单链表

##### **结点类**


```
class Node(object):  # 创建一个结点类
    def __init__(self, data):  # 初始化
        self.data = data  # data为自定义数据
        self.next = None  # next为下一个结点的地址

p = Node(100)   # 创建一个类对象
```
- 有`p.data=100` `p.next=None`

##### **单链表类**

```
# 创建一个单链表的类
class List(object):
    def __init__(self):
        self.__head = None  # 表头为空
    
    # 判断链表是否为空
    def is_empty(self):
        if self.__head == None:  # head是否为空
            return 1
        else:
            return 0
        # return self.__head is None  # 直接返回布尔值

    # 头插法添加元素
    def add(self, item):
        s = Node(item)
        s.next = self.__head
        self.__head = s

    # 遍历单链表，并打印输出
    def travel(self):
        p = self.__head   # 指针p从表头开始
        while p != None:  # 判断指针是否指向了链表末尾
            print(p.data, end='')
            p = p.next  # 指针移到下一个元素
        # print() 打印换行符
    
    # 求单链表表长
    def length(self):
        p = self.__head
        count = 0
        while p != None:  # 没有扫描到最后一个结点
            count += 1
            p = p.next
        return count
    
    # 按序号查找
    def searchpos(self, pos):
        p = self.__head
        count = 1
        if pos < 1 or pos > self.length():  # 判断输入的位置是否合法
            return None
        else:
            while p != None and count != pos:  # while count < pos:
                p = p.next
                count += 1
        return p

    # 按值查找
    def search(self, item):
        p = self.__head
        while p != None and p.data != item:
            p = p.next
        return p  # 如果找到了，返回结点；如果没有找到，返回None
        # if p.data == item:
        #     return p
        # elif p == None:
        #     return None

    # 尾插法建立单链表过程
    def append(self, x):
        s = None(x)
        if self.__head is None:  # 链表为空
            self.__head = s
        else:
            p = self.__head
            while p.next != None: # 遍历到链表末尾
                p = p.next
            p.next = s
    
    # 在指定位置插入元素
    def insert(self, pos, x):
        p = self.__head
        count = 0
        if pos >= self.length() or pos < 1:
            return -1
        while count < pos:  # 查找插入的位置
            p = p.next
            count += 1
        s = Node(x)      # 生成待插入结点
        s.next = p.next
        p.next = s
        return 1
    
    # 按值删除元素
    def remove(self, item):
        p = self.__head
        if p.data == item:  # 删除的是第一个结点，单独处理
            self.__head = p.next
        else:
            while p != None:  # 循环查找待删除的结点
                if p.data != item:
                    pre = p
                    p = p.next
                else:
                    pre.next = p.next
                    break
                    # return True
            return p
            # return False


```



**初始化**单链表
- `L1 = List()`：创建一个单链表类对象




判断单链表**是否为空**
- **`is_empty`**



**头插法**添加元素
- **`add`**
- **注**：Python中变量存放的是在内存空间中的**地址**

```
s = Node(5)      # 第一步：生成结点
s.next = self.__head  # 第二步；修改指针1th
self.__head = s    # 第二步：修改指针2nd



**遍历单链表：扫描指针**
- **`travel`**
- 在已知单链表的`head`首地址的情况下，如果需要访问到单链表中的所有结点
- 需要一个**扫描指针**（扫描游标）
    - 设`p`的初值是指向第一个结点，`p = self.__head`
    - 移动指针的操作是:`p = p.next`
    - 直到`p.next`得到的是`None`，到链表尾部
- 性能：对链表中`n`个元素扫描一遍，时间复杂为$O(n)$

**求单链表表长**
- **`length`**
- 性能分析：时间复杂度$O(n)$

**按序号查找**
- **`searchpos`**
- 在链表中，即使知道被访问结点的序号`i`，不能直接按序号`i`访问结点，只能从链表的`head`出发，顺链域逐个结点向下搜索，直到搜索到第`i`个结点为止
- **基本思想**
    - 借助扫描指针，从第一个结点开始扫描
    - 判断当前结点是否是第`i`个，是就返回地址，否则继续向后查找，直到找到或链表结束
- 性能分析：按序号查找操作和`pos`取值有关，平均时间复杂度为$O(n)$

**按值查找**
- **`search`**
- 性能分析：复杂度为$O(n)$

**尾插法建立单链表**过程
- **`append`**
- 先把指针达到链表的末尾，生成结点，修改链接


**在指定位置插入元素**
- **`insert(self, pos, x)`**
- 步骤
    - 找到`a_{i-1}`的存储位置`p`
    - 生成一个数据域为`x`的新结点`s`，`s=Node(x)`
    - 新结点的链接域指向结点`a_i`：`s.next = p.next`
    - 结点`p`的链接域指向新结点`p.next = s`
- 性能分析：定位插入元素的时间复杂度是$O(n)$

**按值删除元素**
- **`remove(self, item)`**
- 步骤
    - 找到`a_{i-1}`的存储位置`pre`
    - 令`p`指向待删除的元素`a_i`
    - 令`p.next`指向`a_i`的直接后继结点`pre.next=p.next`
- **注**：要有一个变量`pre`来记录前一个结点
- 性能分析：按值删除元素的时间复杂度是$O(n)$

**单链表特点**：
- 是一种**动态结构**，整个内存空间为多个链表共用
- **不需要预先分配**空间
- 链接域占用**额外**存储空间
- **不能随机存取**，查找速度慢

#### 双链表

双链表**定义**：
- 每个结点包含两个链接域
    - 一个指向直接前驱（prior）
    - 一个指向直接后继（next）
- 双链表由头指针`head`唯一确定
- 将双链表中的**头结点和尾结点链接起**来可以构成循环链表，并称之为**双向循环链表**


##### 双向链表**结点类**的描述
```
class DLNode(object):
    def __init__(self, data):
        self.data = data
        self.prior = None
        self.next = None
```

双链表**在某个节点$a_i$前插入结点算法**
- 先找到$a_i$的位置`p`
-
```
s = DLNode(b)
s.prior = p.prior
p.prior.next = s
s.next = p
p.prior = s
```

双链表中**删除节点$a_i$**算法
- 先找到$a_i$的位置`p`
-
```
p.prior.next = p.next
p.next.prior = p.prior
```

### 顺序表和链表的**比较**

从**空间**上考虑：
- 线性表**长度变化较大**，难以估计存储规模，则采取**动态链表**作为存储结构更好
- 线性表**长度变化不大**，为**提高存储密度**，采取**顺序表**作为存储结构
    - 存储密度：结点数据本身所占存储量和整个结点结构所占的存储量之比

从**时间**上考虑
- 如果线性表的操作**主要是进行按序号访问数据**元素，很好做插入、删除等操作，采用顺序表更好
- 对于**频繁进行插入和删除**的线性表，采用链表存储结构更好

## 线性表的应用案例

**线性表的合并问题**
- 已知两长度为`m`和`n`的升序序列，是实现将其合并为一个长度为`m+n`的升序序列

### **顺序存储**的线性表合并
- 数量级$O(m+n)$


In [1]:
def merge(la, lb, lc):
    i = 0
    j = 0
    while i < len(la) and j < len(lb):
        if la[i] <= lb[j]:
            lc.append(la[i])
            i += 1
        else:
            lc.append(lb[j])
            j += 1
    if i >= len(la):
        lc.extend(lb[j:])
    else:
        lc.extend(la[i:])
    return lc

la = [1, 3, 5, 7]
lb = [2, 4, 6, 8, 10, 11]
lc = []
lc = merge(la, lb, lc)
print(lc)

[1, 2, 3, 4, 5, 6, 7, 8, 10, 11]


### **链式**存储的线性表合并

- 有递归和非递归两种思想
- **非递归**：**循环**的从两个带合并的列表中取出当前数值较小的结点，追加到新的列表中，直到参与合并的列表中有一个结束为止
    - 一种：**新生成结点**加入新的链表中
        - 两个遍历指针`pa`，`pb`分别指向`La`和`Lb`的第一个结点
        - 还有一个指向新链表最后的`tail`指针（刚开始新链表和`tail`指针都是空）
        - 每次比较取出较小的值，生成结点
        - **注**：时间复杂度O(m+n)，原来的链表`La`和`Lb`都还在
    - 另一种：**采摘节点法**
        - 两个遍历指针`pa`，`pb`分别指向`La`和`Lb`的第一个结点
        - 设置一个头指针`Lc`，作为新链表的表头指针，定义一个`tail`指针记录链表的尾结点
        - 比较`pa`和`pb`结点的数据域的值，将较小的链接在tail`后面，并修改数据小的指针，同时修改 tail`指针
        - 重复上步操作，直到`pa`或`pb`为空，将剩余的直接链接在`tail`后面
        - 注：不用生成新结点，复杂度是O(2n+1)，其中n<=m，但是原来的链表`La`和`Lb`都不复存在


#### 算法实现

In [1]:
class Node:
    def __init__(self, data):
        self.data = data
        self.next = None


class List:
    def __init__(self):
        self._head = None

    def is_empty(self):
        return self._head

    def append(self, data):  # 尾插法
        p = self._head
        n = Node(data)
        if self._head == None:  # 链表为空，直接将新结点作为头结点
            self._head = n
        else:
            while p.next != None:
                p = p.next
            p.next = n

    def printlist(self):
        p = self._head
        while p != None:
            print(p.data, end=' ')  # print中end默认是换行符'\n'
            p = p.next
        print('\n')


In [6]:
la = List()
lb = List()
data = int(input('请输入链表a的值，输入-1结束：'))
while data != -1:
    la.append(data)
    data = int(input('请输入链表a的值，输入-1结束：'))
la.printlist()

data = int(input('请输入链表b的值，输入-1结束：'))
while data != -1:
    lb.append(data)
    data = int(input('请输入链表b的值，输入-1结束：'))
lb.printlist()

请输入链表a的值，输入-1结束：1
请输入链表a的值，输入-1结束：3
请输入链表a的值，输入-1结束：-1
1 3 请输入链表b的值，输入-1结束：2
请输入链表b的值，输入-1结束：4
请输入链表b的值，输入-1结束：6
请输入链表b的值，输入-1结束：-1
2 4 6 

In [7]:
def Merge(la, lb, lc):
    pa = la._head
    pb = lb._head
    tail = lc._head
    while pa != None and pb != None:
        if pa.data < pb.data:
            if lc._head == None:  # 链表是空的时候
                lc._head = pa
            else:
                tail.next = pa  # tail指向pa
            tail = pa  # tail的指针向后移动
            pa = pa.next  # pa指向下一个结点
        else:
            if lc._head == None:  # 链表是空的时候
                lc._head = pb
            else:
                tail.next = pb
            tail = pb
            pb = pb.next
    if pa != None:
        tail.next = pa
    else:
        tail.next = pb

In [8]:
lc = List()
Merge(la, lb, lc)
lc.printlist()

1 2 3 4 6 

### 不使用自带函数实现顺序表基本操作

In [41]:
# 创建一个顺序表类
class seqlist:
    def __init__(self, max_space=30):
        self.max_space = 30
        self.sl = max_space * [0]  # 申请一个列表
        self.length = 0  # 记录实际元素个数

    def append(self, data):
        if self.length == self.max_space:
            print('顺序表已经满了，不能再添加')
        else:
            self.sl[self.length] = data
            self.length += 1

    def printdata(self):
        for i in range(self.length):
            print(self.sl[i], end=' ')
        print('\n')

    def insert(self, index, data):
        if self.length == self.max_space or index < 0 or index >= self.length:
            print('无法插入')
        else:
            for i in range(self.length - 1, index - 1, -1):
                self.sl[i + 1] = self.sl[i]
            self.sl[index] = data
            self.length += 1

    def delete_index(self, index):
        if self.length ==0 or index < 0 or index >= self.length:
            print('无法删除')
        else:
            for i in range(index, self.length - 1):  # 注意取值范围
                self.sl[i] = self.sl[i + 1]
            self.length -= 1

    def search_data(self, data):
        for i in range(self.length):
            if self.sl[i] == data:
                return i
        return i

    def delete_data(self, data):
        i = self.search_data(data)
        if i != -1:
            self.delete_index(i)

### 单链表的基本操作

- `object`是所有类的基类（基类是所有类都默认继承的类），为所有的Python类提供了一些基本方法和功能
    - 所有类会自动视为是从`object`继承的类
    - 可以省略不写

In [11]:
class Node(object):
    def __init__(self, data):
        self.data = data
        self.next = None

class SingleLinkList:
    def __init__(self):
        self._head = None

    def is_empty(self):
        return self._head is None

    def addhead(self, data):
        node = Node(data)
        node.next = self._head
        self._head = node

    def printdata(self):
        p = self._head
        while p != None:
            print(p.data, end=' ')
            p = p.next
        print()

    def length(self):
        p = self._head
        count = 0
        while p != None:
            count += 1
            p = p.next
        print (count)

    def searchdata(self, data):
        p = self._head
        while p != None:
            if p.data == data:
                return True
            p = p.next
        return False

    def insert_index(self, pos, data):
        if pos < 0 or pos > self.length():
            return 'fail'
        node = Node(data)
        p = self._head
        count = 0
        if pos == 0:  # 或者使用self.addhead(data)
            node.next = self._head
            self._head = node
            return
        while count < pos - 1:
            p = p.next
            count += 1
        node.next = p.next
        p.next = node

    def remove_data(self, data):
        p = self._head
        if p != None and p.data == data:  # 处理头结点的删除
            self._head = p.next
            return True
        else:
            pre = None  # pre只有在p向后移动才被更新，不等于_head，直到p移到第二个节点，才会等于_head
            while p != None:
                if p.data == data:
                    pre.next = p.next
                    return True
                pre = p
                p = p.next
        return False

    def searchmaxdata(self):
        p = self._head
        max_data = p.data
        while p.next != None:
            p = p.next
            if max_data < p.data:
                max_data = p.data
        return max_data