# 线性表的概念和表抽象数据类型

线性表(简称表)是组织数据元素的数据结构，是最基本的数据结构之一。表元素之间存在一个基本关系，称为下一个关系。对应表$ L=(e_0,e_1,...,e_{n-1}) $，其下一个关系式二元组的集合$ {<e_0,e_1>,<e_1,e_2>,...,<e_{n-2},e_{n-1}>} $。下一个关系是一种线性关系。  
线性表的实现模型：**顺序表**、**链接表** 
## -----------------------------------------------------------------------------------------------------------------------------------

# 顺序表的实现
顺序表的实现方式：表中顺序存放在一片足够大的连续存储区，首元素存入存储区的开始位置，其余元素一次顺序存放，元素见的逻辑顺序关系通过元素在存储区里的物理位置表示。  
线性表的布局方式如图3.1(a)所示，存储区的起始位置(内存地址)为$ l_0 $，假定表中一个元素所需的存储单元数为$ c = size $,所以元素$ e_i $的地址计算公式为：$ Loc(e_i)=l_0+c*i $。如果表元素的大小不统一，可用3.1(b)所示的布局方式，将实际元素另行存储，在顺序表中各单元位置保存相对应元素的引用信息(链接)。注意，3.1(b)中的c不是数据元素的大小，而是存储一个链接所需的存储量。3.1(b)所表示的顺序表也称为**索引**，这是最简单的索引结构。  
<img src="./图/4.bmp",width = 600, height = 600>  


优点:按位置访问元素的复杂的为O(1)；元素在表里存储紧凑，除表元素存储区之外只需要O(1)空间存放少量辅助信息；  
缺点：需要连续的存储区存在表中的元素，如果表很大则需要大片连续内存空间，如果较大的存储区只保留少量数据会造成存储浪费；执行加入或删除操作时，需要移动许多元素，效率低。  
## 顺序表的结构  
两种基本实现方式：  
<img src="./图/5.bmp",width = 500, height = 500>  
图(a)所示一体式结构，存储表信息的单元与元素存储区以连续的方式安排在一块存储区里。下表访问元素和之前类似，只需加一个表示数据成分max和num的常量C：$ Loc(e_i)=LOC(L)+C+i*size(e) $。此存储方式的缺点是表对象大小不一，另外创建后元素存储区固定。  
图(b)所示分离式结构，表对象只保存与整个表有关的信息(容量和元素个数)，实际元素存放在另一个独立的元素存储去对象里，通过链接与基本表对象关联。这样表对象的大小同意，但不同表对象可以关联不同大小的元素存储区。替换元素存储区更为方便。此存储方式的缺点是一个表同规格多个(两个)独立的对象实现，创建和管理更复杂。

## 顺序表总结
元素存储的集中方式和连续性。最重要的特点是O(1)时间的定位元素访问；尾端插入/删除操作也具有O(1)复杂度，但插入复杂度受元素存储区大小的限制；  
加入/删除操作效率不高；可能需要大片存储区
## -----------------------------------------------------------------------------------------------------------------------------------

# 链接表
链接表用链式关系显示表示元素之间的顺序关系，基本思想是：表中的元素分别存储在一批独立的存储块(称为表的结点)里；保证从组成表结构钟的任一个节点可找到与其相关的下一个结点；在前一结点里用链接的方式显示地记录与下一结点之间的关联。  

## 单链表
单链表的结点是一个二元组，如图(a)所示，其表元素域elem保存着作为表元素的数据项(或数据表的关联信息)，链接域next里保存下一个结点的标识。在最常见形式的单链表里，与表中的n个元素对应的n个结点通过链接形成一条结点链，如图(b)所示。从引用表中的首结点的变量(图(b)中的变量p)出发，可找到表中任一结点。p称为**表头变量**或**表头指针**。为了表示链表的结束，只需给表的表尾结点的链接域设置一个不会作为结点对象标识的值(称为空链接)，python中可以用系统变量None表示，图3.7用$ \perp $表示。
<img src="./图/6.bmp",width = 500, height = 500>

In [3]:
# 定义表结点类
class LNode:
    def __init__(self, elem, next_ = None):#next_是为了区别于Python中的标准函数next
        self.elem = elem
        self.next = next_

### 基本链表操作
**创建空链表**：只需把相应表头变量设置为空链接；  
**删除链表**：Python中将表指针赋值为None即可，系统会自动回收不用的存储；  
**判断表是否为空**：检测表头变量是否为None；  

### 加入元素
**表首端插入**：  
(1)创建新结点并存入数据(图3.8a表示想表头变量head的联保加入新首元素13，创建新结点，变量q指向该结点)  
<img src="./图/7.bmp",width = 500, height = 500>
(2)把原链表首结点的链接存入新结点的链接域next  
(3)修改表头变量，使之指向新结点。  

In [None]:
# 实例代码
'''
q = LNode(13)
q.next = head.next
head = q
'''

**一般情况的元素插入**：  
(1) 创建新结点并存入数据；(2)把pre所指结点next域的值存入新结点的链接域next；(3)修改pre的next域，使之指向新结点。
<img src="./图/8.bmp",width = 500, height = 500>

In [None]:
# 实例代码
'''
q = LNode(13)
q.next = pre.next
pre.next = q
'''

### 删除元素
**删除首元素**：head = head.next  
**一般情况的元素删除**：pre.next = pre.next.next
<img src="./图/9.bmp",width = 500, height = 500>

### 扫描、定位和遍历
**扫描**：从表头变量开始，沿表中链接逐步进行，对表内容进行检查。 
  
    p = head  
    while p is not None and 还需继续的其他条件:  
        对p所致结点里的数据进行所需操作  
        p = p.next  

**按下表定位**：确定第i个元素所在结点  
  
    p = head
    while p is not None and i > 0:
        i -= 1  
        p = p.next  

循环结束前可能出现两种情况：扫描完表中结点还没找到第i个结点，或p所知结点就是所需。通过检查p值是否为None可以区分这两种情况。若需要删除第k个结点，可以先将i设置为k-1，循环后监测i是0且p.next不是None即可执行删除。  
**按元素定位**：假设需要在链表里找到满足谓词pred的元素，检索程序为：  
  
    p = head
    while p is not None and not pred(p.elem):
        p = p.next

### 求表的长度  
  
    def length(head):
        p, n = head, 0
        while p is not None:
            n += 1
            p = p.next
        return n

### 链表操作复杂度
创建空表：O(1)  
删除表：python中O(1)  
判断空表：O(1)  
加入元素：首端加入O(1)，尾端加入O(n)，定位元素O(n)  
删除元素；首端删除O(1)，尾端删除O(n)，定位删除或其他删除O(n)
求表的长度：O(n)  

## 单链表的实现

In [4]:
# 定义表结点类如上

# 简单使用
llist1 = LNode(1)
p = llist1
for i in range(2,11):
    p.next = LNode(i)
    p = p.next
    
p = llist1#从表头开始
while p is not None:#简化方式:while p即可
    print(p.elem)
    p = p.next

1
2
3
4
5
6
7
8
9
10


In [5]:
# 自定义异常
class LinkedListUnderflow(ValueError):
    pass

# LList类的定义，初始化函数和简单操作
class LList:
    def __init__(self):
        self._head = None
        
    def is_empty(self):
        return self._head is None
    
    def prepend(self, elem):#表头增加元素
        self._head = LNode(elem, self._head)
        
    def pop(self):#删除表头结点并返回结点中的数据
        if self._head is None:#无结点，引发异常
            raise LinkedListUnderflow("in pop")
        e = self._head.elem
        self._head = self._head.next
        return e
    
    # 后端插入操作
    def append(self, elem):
        if self._head is None:
            self._head = LNode(elem)
            return
        p = self._head
        while p.next is not None:
            p = p.next
        p.next = LNode(elem)
    
    # 后端删除操作
    def pop_last(self):
        if self._head is None:
            raise LinkedListUnderflow("in pop_last")
        p = self._head
        if p.next is None:#表中只有一个元素
            e = p.elem
            self._head = None
            return e
        while p.next.next is not None:
            p = p.next
        e = p.next.elem
        p.next = None
        return e
    
    # 其他操作：查找、输出、遍历、迭代
    def find(self, pred):
        p = self._head
        while p is not None:
            if pred(p.elem):
                return p.elem
            p = p.next
            
    def printall(self):
        p = self._head
        while p is not None:
            print(p.elem, end = '')
            if p.next is not None:
                print(', ', end ='')
            p = p.next
        print('')
    
    def for_each(self, proc):#proc的实参是可以作用于表元素的操作函数，如print
        p = self._head
        while p is not None:
            proc(p.elem)
            p = p.next
            
    def elements(self):
        p = self._head
        while p is not None:
            yield p.elem
            p = p.next
            
    # 筛选生成器，改进find只能取满足pred的第一个元素的限制
    def filter(self, pred):
        p = self._head
        while p is not None:
            if pred(p.elem):
                yield p.elem
            p = p.next

In [6]:
# 调用输出
mlist1 = LList()
for i in range(10):
    mlist1.prepend(i)
for i in range(11,20):
    mlist1.append(i)
mlist1.printall()

9, 8, 7, 6, 5, 4, 3, 2, 1, 0, 11, 12, 13, 14, 15, 16, 17, 18, 19


## -----------------------------------------------------------------------------------------------------------------------------------
# 链表的变形与操作


## 单链表的简单变形
单链表缺点：尾端操作效率低。  
改进方式一：表对象增加一个表尾结点引用域，如下图；  
<img src="./图/15.bmp",width = 300, height = 300>
改进方式二：通过继承和扩充定义新链表类，以LList为基类，重新定义原有变动操作，初始化时增加一个尾结点引用域，以\_rear作为域名，初始化为None。

In [10]:
# 单链表简单变形
class LList1(LList):
    def __init__(self):
        LList.__init__(self)
        self._rear = None
        
    def prepend(self, elem):#前段插入
        if self._head is None:#空表
            self._head = LNode(elem, self._head)
            self._rear = self._head
        else:
            self._head = LNode(elem, self._head)
            
    def append(self, elem):#后端插入
        if self._head is None:
            self._head = LNode(elem, self._head)
            self._rear = self._head
        else:
            self._rear.next = LNode(elem)
            self._rear = self._rear.next
    
    def pop_last(self):#末端弹出
        if self._head is None:
            raise LinkedListUnderflow("in pop_last")
        p = self._head
        if p.next is None:#表中只有一个元素
            e = p.elem
            self._head = None
            return e
        while p.next.next is not None:#直到p.next是最后节点
            p = p.next
        e = p.next.elem
        p.next = None
        self._rear = p
        return e

In [12]:
# 调用
from random import randint 
mlist1 = LList1()
mlist1.prepend(99)
for i in range(11, 20):
    mlist1.append(randint(1,20))

for x in mlist1.filter(lambda y: y % 2 == 0):
    print(x)

<__main__.LList1 object at 0x000001F4BAC8CE48>
4
16
12
8


## 循环单链表
循环单链表(循环链表)，最后一个节点的next域不用None，而是指向表的第一个结点，如下图a。采用图b所示方式，记录表尾结点更合适，可以同时支持O(1)时间的表头/表尾插入和O(1)时间的表头删除。以下实现基于b图。  
<img src="./图/16.bmp",width = 500, height = 500>

In [4]:
# 循环单链表
class LCList:
    def __init__(self):
        self._rear = None
        
    def is_empty(self):
        return self._rear is None
    
    def prepend(self, elem):
        p = LNode(elem)
        if self._rear is None:
            p.next = p#建立一个结点的环
            self._rear = p
        else:
            p.next = self._rear.next
            self._rear.next = p
            
    def append(self, elem):
        self.prepend(elem)
        self._rear = self._rear.next
        
    def pop(self):#前端弹出
        if self._rear is None:
            raise LinkedListUnderflow("in pop of CLList")
        p = self._rear.next
        if self._rear is p:
            self._rear = None
        else:
            self._rear.next = p.next
        return p.elem
    
    def printall(self):#输出表元素
        if self.is_empty():
            return
        p = self._rear.next
        while True:
            print(p.elem)
            if p is self._rear:
                break
            p = p.next

## 双链表
双链表可支持首尾两端的搞笑操作，如下图，包含一个尾结点引用域。假定结点的下一结点引用域是next，前一结点引用域是prev。
<img src="./图/17.bmp",width = 300, height = 300>
结点操作：  
结点删除的示例代码：p.prev.next = p.next  p.next.prev = p.prev。结点加入也类似，需要四次赋值引用。

双链表的实现采用单链表类LList1派生，空表判断和find、filter、printall都可以继承，执行中只使用next方向的引用。类中变动操作需重新定义，需要设置前一结点引用prev。\_head和\_rear对应，next和prev对应。

In [15]:
# 双链表实现
class DLNode(LNode): #双链表结点类
    def __init__(self, elem, prev = None, next_ = None):
        LNode.__init__(self, elem, next_)
        self.prev = prev

class DLList(LList1): #双链表类
    def __init__(self):
        LList1.__init__(self)
        
    def prepend(self, elem):
        p = DLNode(elem, None, self._head)
        if self._head is None: #空表
            self._rear = p
        else: #非空表，设置prev引用
            p.next.prev = p
        self._head = p
    
    def append(self, elem):
        p = DLNode(elem, self._rear, None)
        if self._head is None: #空表插入
            self._head = p
        else:
            p.prev.next = p
        self._rear = p
        
    def pop(self):
        if self._head is None:
            raise LinkedListUnderflow("in pop of DLList")
        e = self._head.elem
        self._head = self._head.next
        if self._head is not None: 
            self._head.prev = None
        return e
    
    def pop_last(self):
        if self._head is None:
            raise LinkedListUnderflow("in pop_last of DLList")
        e = self._rear.elem
        self._rear = self._rear.prev
        if self._rear is None:
            self._head = None #设置_head保证is_empty正确工作
        else:
            self._rear.next = None
        return e

## 循环双链表
<img src="./图/18.bmp",width = 300, height = 300>

## 两个链表操作：链表反转、链表排序
### 链表反转
链表反转有多种实现方式，下面仅写LList类的一个方法。  
    
    # LList链表反转
    def rev(self):
        p = None
        while self._head is not None:
            q = self._head
            self._head = q.next # 摘下原来的首结点
            q._next = p
            p = q # 将刚摘下的结点加入p引用的结点序列
        self._head = p # 反转后的结点序列，重置表头链接
        
### 链表排序
Python中基本排序方法：lst.sort()或标准函数sorted(lst)。此处考虑单链表的插入排序，基本思想：初始化只包含一个元素，从尚未处理的元素中取出一个元素插入已排序的片段中，直至所以元素排序完成。

In [None]:
# 顺序表的排序
def list_sort(lst):
    for i in range(1, len(lst)): #从第二个数开始
        x = lst[i]
        j = i
        while j > 0 and lst[j-1] > x:
            lst[j] = lst[j-1]
            j -= 1
        lst[j] = x

单链表插入排序的基本状态如下图所示。其中扫描指针crt指向当前考虑的结点（表元素为x）。对一个元素的处理分两步，第一步从头开始扫过小于或等于x的表元素，直至确定了下图所示已排序段中标出的虚线位置，找到了第一个大于x的元素；第二步是将x放入正确位置，将其他表元素后移。
<img src="./图/19.bmp",width = 500, height = 500>

In [None]:
# 如下排序函数定义在LList类中
'''
# 调整元素的方式
def sort1(self):
    if self._head is None:
        return
    crt = self._head.next # 从首结点之后开始处理
    while crt is not Nont:
        x = crt.elem
        p = self._head
        whilr p is not crt and p.elem <= x:
            p = p.next
        while p is not crt:
            y = p.elem
            p.elem = x
            x = y
            p = p.next
        crt.elem = x # 回填最后一个元素
        crt = crt.next

# 调整链接的方式（以2 1 4 3为例画图即可，注意p.next在中间计算中为None，将链表断开）
def sort(self):
    p = self._head
    if p is None or p.next is None:
        return
    
    rem = p.next
    p.next = None
    while rem is not None:
        p = self._head
        q = None
        while p is not None and p.elem <= rem.elem:
            q = p
            p = p.next
        if q is None:
            self._head = rem
        else:
            q.next = rem
        q = rem
        rem = rem.next
        q.next = p
'''

## 链表总结
·基本单链表：前端插入和删除为O(1)时间，定位和尾端操作为O(n)时间；  
·增加尾结点引用域可以高效进行首端/尾端插入和首端弹出，O(1)时间复杂度，但不能高效进行尾端删除；  
·循环单链表也能高效进行首端/尾端插入和首端弹出，担心呀注意结束判断；  
·双链表每个结点有两个方向的链接，可高效的找到前后结点，如果有尾结点引用，两端插入和删除都是O(1)时间。循环双链表性质类似；
·单链表变量和数据检索只能从表头开始，需要O(n)时间；双链表这些操作可以从表头或表尾开始，复杂度不变；与他们对应的两种循环链表，遍历和检索可以从任何一个地方开始，但要注意结束条件。  

链表优点：表结构容易调整和修改；不需要修改或移动结点中的数据元素，只要修改结点链接，就能灵活修改表的结构和数据排序方式；表由小的存储块构成，容易安排和管理。  

链表缺点：定位访问需要线性时间；简单单链表的尾端操作需要线性时间
## -----------------------------------------------------------------------------------------------------------------------------------

# 表的应用
Josephus问题：假设有n个人围坐一圈，要求从第k个人开始报数，报到第m个数的人退出。然后下一个人开始继续报数并按同样规则退出，直至所有人退出。要求按顺序输出各出列人的编号。  

**第一种方案：基于数组**  
基于Python的list和固定大小的“数组”概念，即把list看着元素个数固定的对象，只修改元素的值，不改变表的结构。（相当于摆一圈n把椅子，人可以走但椅子固定）。给每个人赋予一个编号，没有人的情况用0便是，各list的元素记录这些编号。算法梗概：  
    
    ·初始：
        建立一个包含n个人的编号的表
        找到第k个人，从那里开始
    ·循环过程：（把出列元素修改为0）
        数m个尚在坐的人，遇到表的末端就转回下标0继续
        把表示第m个人的表元素修改为0
    ·n个人出列即结束

In [1]:
def josephua_A(n, k, m):
    people = list(range(1, n+1))
    
    i = k-1 #数组下标，k-1代表第k个人
    for num in range(n):
        count = 0
        while count < m:
            if people[i] > 0:
                count += 1
            if count == m:
                print(people[i], end = "")
                people[i] = 0
            i = (i+1) % n
        if num < n-1:
            print(", ", end = "")
        else:
            print("")
    return

# 调用
josephua_A(10, 2, 7)

8, 5, 3, 2, 4, 7, 1, 6, 9, 10


算法复杂度：  
当m = 1时，每次内循环值执行一次迭代，总时间开销是O(n);  
当m = n时，先考虑计算到最后表中只剩下一个元素的情况，不难看出，内层循环需要遍历整个表n遍，每一遍只能把count的值加1，因此，删除这个元素，花费时间为$O(n^2)$。整个计算中，i加1的次数大约是：  
$$n \times \left( \frac{n}{n} + \frac{n}{n-1} + ... + \frac{n}{2} + \frac{n}{1} \right) \approx n^2 \times logn$$

**第二种方案：基于顺序表**  
将保存人员编号的list按表的方式处理，一旦确定了应该退出的人，就将其编号的表元素从表中删除。这样，随着计算的进行，所用的表将变得越来越短。用num表示表的长度，每退有人，表的长度减1，直至表长度为0时计算结束。采用此想法，表中的元素全为有效元素（不会出现表示没人的0），元素计数与下标计数得到同意，下标更新可用i = (i + m - 1) % num描述

In [2]:
def josephus_L(n, k, m):
    people = list(range(1, n+1))
    
    num, i = n, k-1
    for num in range(n, 0, -1):
        i = (i + m - 1) % num
        print(people.pop(i), end = (", " if num > 1 else "\n"))
    return

josephus_L(10, 2, 7)

8, 5, 3, 2, 4, 7, 1, 6, 9, 10


算法复杂度：循环执行n次，但调用pop操作，需要线性时间，所以复杂度为$O(n^2)$

**第三种方案：基于循环单链表**

In [6]:
class Josephus(LCList):
    def turn(self, m):
        for i in range(m):
            self._rear = self._rear.next
            
    def __init__(self, n, k, m):
        LCList.__init__(self)
        for i in range(n):
            self.append(i+1)
        self.turn(k-1)
        while not self.is_empty():
            self.turn(m-1)
            print(self.pop(), end = ("\n" if self.is_empty() else ", "))

Josephus(10, 2, 7)

8, 5, 3, 2, 4, 7, 1, 6, 9, 10


<__main__.Josephus at 0x2264414a2b0>

算法复杂度：初始表的复杂度是O(n)，后面循环的复杂度是O(m\*n)