# 数据结构

## 列表详解

1. list.append(x), 在列表末尾添加一项。 类似于 a[len(a):] = [x]。

In [47]:
a_list = []
a_list.append(1)
a_list.append(2)
a_list

[1, 2]

2. list.extend(iterable), 通过添加来自 iterable 的所有项来扩展列表。 类似于 a[len(a):] = iterable。

In [5]:
a_list = [1, 2]
b_list = [3, 4]
a_list.extend(b_list)
a_list

[1, 2, 3, 4]

3. list.insert(i, x),在指定位置插入元素。第一个参数是插入元素的索引，因此，a.insert(0, x) 在列表开头插入元素， a.insert(len(a), x) 等同于 a.append(x) 。

In [14]:
a_list = []
a_list.insert(0, 'one')
a_list.insert(2, 'three')
a_list.insert(1, 'two')
a_list

['one', 'two', 'three']

4. list.remove(x), 从列表中删除第一个值为 x 的元素。未找到指定元素时，触发 ValueError 异常。

In [15]:
a_list.remove('one')
a_list

['two', 'three']

In [16]:
a_list.remove('one')
a_list

ValueError: list.remove(x): x not in list

5. list.pop([i]),移除列表中给定位置上的条目，并返回该条目。 如果未指定索引号，则 a.pop() 将移除并返回列表中的最后一个条目。 如果列表为空或索引号在列表索引范围之外则会引发 IndexError。

In [60]:
a_list = [1, 2, 3, 4]
num = a_list.pop()
print("num", num)
print("a_list", a_list)

num 4
a_list [1, 2, 3]


In [61]:
num = a_list.pop(0)
print("num", num)
print("a_list", a_list)

num 1
a_list [2, 3]


In [24]:
a_list.pop(5)
a_list

IndexError: pop index out of range

6. list.clear(),移除列表中的所有项。 类似于 del a[:]。

In [25]:
a_list = [1, 2, 3, 4]
a_list.clear()
a_list

[]

7. list.index(x[, start[, end]]),返回列表中第一个值为 x 的元素的零基索引。未找到指定元素时，触发 ValueError 异常。可选参数 start 和 end 是切片符号，用于将搜索限制为列表的特定子序列。返回的索引是相对于整个序列的开始计算的，而不是 start 参数。

In [26]:
a_list = [1, 2, 3, 4]
a_list.index(2)

1

In [35]:
a_list.index(4, 1, 3)

ValueError: 4 is not in list

In [36]:
a_list.index(4, 1, 4)

3

8. list.count(x), 返回列表中元素 x 出现的次数。

In [38]:
a_list = [1, 2, 3, 4, 4]
a_list.count(4)

2

9. list.sort(*, key=None, reverse=False), 就地排序列表中的元素

In [39]:
a_list = [1, 2, 4, 3, 6, 5]
a_list.sort()
a_list

[1, 2, 3, 4, 5, 6]

10. list.reverse(), 翻转列表中的元素。

In [41]:
a_list = [1, 2, 3, 4]
a_list.reverse()
a_list

[4, 3, 2, 1]

11. list.copy(),返回列表的浅拷贝。 类似于 a[:]。

In [43]:
# 浅拷贝-非引用对象

a_list = [1, 2, 3, 4]
b_list = a_list.copy()
print("b_list", b_list)
b_list.pop()
print("b_list", b_list)
print("a_list", a_list)

b_list [1, 2, 3, 4]
b_list [1, 2, 3]
a_list [1, 2, 3, 4]


In [45]:
# 浅拷贝-引用对象

sub_list = [11, 12, 13]
a_list = [1, 2, 3, 4, sub_list]
b_list = a_list.copy()
print("b_list", b_list)
b_list[-1].pop()
print("b_list", b_list)
print("a_list", a_list)

b_list [1, 2, 3, 4, [11, 12, 23]]
b_list [1, 2, 3, 4, [11, 12]]
a_list [1, 2, 3, 4, [11, 12]]


12. 列表实现堆栈,栈式先进后出的线性结构,可采用append(),在列表增加元素实现在栈顶添加元素,采用pop()不指定索引从栈顶取出元素

In [48]:
a_list = []
a_list.append(1)  # 压栈
a_list.append(2)  # 压栈
print("a_list", a_list)
a_list.pop()  # 出栈
print("a_list", a_list)

a_list [1, 2]
a_list [1]


13. 列表实现队列, 队列先进先出,可采用append(),在队列增加元素添加元素,采用pop(0)取出元素

In [50]:
a_list = []
a_list.append(1)  # 入队列
a_list.append(2)  # 入队列
print("a_list", a_list)
a_list.pop(0)  # 出队列
print("a_list", a_list)

a_list [1, 2]
a_list [2]


14. 列表推导式, 列表推导式创建列表的方式更简洁。常见的用法为，对序列或可迭代对象中的每个元素应用某种操作，用生成的结果创建新的列表；或用满足特定条件的元素创建子序列。

In [53]:
# 求10数的平方
squares = [x**2 for x in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [55]:
# 等价于
squares = []
for x in range(10):
    squares.append(x**2)
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

列表推导式的方括号内包含以下内容：一个表达式，后面为一个 for 子句，然后，是零个或多个 for 或 if 子句。结果是由表达式依据 for 和 if 子句求值计算而得出一个新列表。 举例来说，以下列表推导式将两个列表中不相等的元素组合起来：

In [56]:
[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]

[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]

15. 嵌套的列表推导式

16. del 语句,可以按索引而不是按值从一个列表移除条目： 这不同于返回一个值的 pop() 方法。 del 语句还可被用来从列表移除切片或清空整个列表（之前我们通过将一个空列表赋值给切片实现此功能）。 例如:

In [59]:
a_list = [1, 2, 3, 4, 5]
del a_list[0]
a_list

[2, 3, 4, 5]

In [None]:
del 也可以用来删除整个变量：

In [None]:
del a_list

## 元组

元组与列表很像，但使用场景不同，用途也不同。元组是 immutable （不可变的）。

1. 创建元组

- 元组由多个用逗号隔开的值组成，如：

In [None]:
t = (12345, 54321, 'hello')

- 构造 0 个或 1 个元素的元组比较特殊：用一对空圆括号就可以创建空元组；只有一个元素的元组可以通过在这个元素后添加逗号来构建（圆括号里只有一个值的话不够明确）。

In [7]:
# 空元组

t_empty = ()

type(t_empty)

tuple

In [9]:
# 一个元素的元组

singleton = 'hello',
print(singleton)

('hello',)


- 创建元组时最好是使用()，方便区分

## 集合

集合是由不重复元素组成的无序容器

1. 创建集合，使用花括号{}或者set()函数，创建空集合只能使用set()，不能用{}，因为{}是创建空字典的。

In [11]:
# 创建空集合
s_empty = set()
type(s_empty)

set

In [12]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}

In [14]:
print(basket)

{'orange', 'banana', 'pear', 'apple'}


2. 集合成员检测

In [13]:
'apple' in basket

True

3. 集合运算

In [15]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {5 ,6 ,7, 8, 9}

- 并集

In [None]:
set_1 | set_2

In [17]:
set_1.union(set_2)

{1, 2, 3, 4, 5, 6, 7, 8, 9}

- 交集

In [18]:
set_1 & set_2

{5}

In [19]:
set_1.intersection(set_2)

{5}

In [None]:
- 差集

In [20]:
set_1 - set_2

{1, 2, 3, 4}

In [21]:
set_1.difference(set_2)

{1, 2, 3, 4}

In [None]:
- 对称差集，两个集合中不重复的元素

In [22]:
set_1 ^ set_2

{1, 2, 3, 4, 6, 7, 8, 9}

In [23]:
set_1.symmetric_difference(set_2)

{1, 2, 3, 4, 6, 7, 8, 9}

4. 集合关系判断

In [32]:
set_1 = {1, 3,}
sub_set = {1, 3}

- 子集判断

In [33]:
print(f"{sub_set} 是 {set_1} 的子集：", {sub_set <= set_1})
print(f"{sub_set} 是 {set_1} 的子集：", {sub_set.issubset(set_1)})

{1, 3} 是 {1, 3} 的子集： {True}
{1, 3} 是 {1, 3} 的子集： {True}


- 真子集判断

In [34]:
print(f"{sub_set} 是 {set_1} 的真子集：", {sub_set < set_1})

{1, 3} 是 {1, 3} 的真子集： {False}


- 超集判断

In [35]:
print(f"{set_1} 是 {sub_set} 的超集：", {set_1 >= sub_set})
print(f"{set_1} 是 {sub_set} 的超集：", {set_1.issuperset(sub_set)})

{1, 3} 是 {1, 3} 的超集： {True}
{1, 3} 是 {1, 3} 的超集： {True}


- 真超集判断

In [36]:
print(f"{set_1} 是 {sub_set} 的超集：", {set_1 > sub_set})

{1, 3} 是 {1, 3} 的超集： {False}


- 不相交判断

In [42]:
disjoin_set_1 = {10, 11}
disjoin_set_2 = {1, 11}

print(f"{set_1} 和 {disjoin_set_1} 不相交：{set_1.isdisjoint(disjoin_set_1)}")
print(f"{set_1} 和 {disjoin_set_2} 不相交：{set_1.isdisjoint(disjoin_set_2)}")

{1, 3} 和 {10, 11} 不相交：True
{1, 3} 和 {1, 11} 不相交：False


5. 集合更新

In [45]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {1, 3, 5, 7, 9}

- 更新并集

In [46]:
set_1_copy = set_1.copy()
set_1_copy |= set_2  # 等价于 set_1.update(set_2)
print(f"更新并集：", set_1_copy)

更新并集： {1, 2, 3, 4, 5, 7, 9}


- 更新交集

In [48]:
set_1_copy = set_1.copy()
set_1_copy &= set_2  # 等价于 set_1_copy.intersection(set_2)
print(f"更新交集：", set_1_copy)

更新并集： {1, 3, 5}


- 更新差集

In [49]:
set_1_copy = set_1.copy()
set_1_copy -= set_2  # 等价于 set_1_copy.difference_update(set_2)
print(f"更新差集：", set_1_copy)

更新差集： {2, 4}


- 更新对称差集

In [51]:
set_1_copy = set_1.copy()
set_1_copy ^= set_2  # 等价于 set_1_copy.difference_update(set_2)
print(f"更新对称差集：", set_1_copy)

更新对称差集： {2, 4, 7, 9}


6. 注意事项

- 集合是无须的，不能通过索引访问
- 集合元素必须是可哈希的（不可变类型）
- 空集合要用set()创建，不能{}
- 运算符和方法的主要区别：运算符可以用于多个集合，而方法通常只能用于两个集合