# 3 Python 数据结构及函数

## 3.1 数据结构

### 3.1.1 元组

定长、元素不可变的对象序列

#### 3.1.1.1 创建元组

* 逗号分隔序列值

In [7]:
tup1 = 4, 5, 6
tup2 = (1, 2), 3
print(tup1)
print(tup2)

(4, 5, 6)
((1, 2), 3)


* tuple() 将任意序列或迭代器转换为元组

In [8]:
tup3 = tuple([1, 2, 3])
tup4 = tuple('python3')
print(tup3)
print(tup4)

(1, 2, 3)
('p', 'y', 't', 'h', 'o', 'n', '3')


#### 3.1.1.2 元素操作

* 取元素：[]

In [9]:
print(tup3[0])

1


* 修改元素内容

In [14]:
tup = tuple(['python', [1, 2], True])
tup[1].append(3)
print(tup)

('python', [1, 2, 3], True)


**元组存储的元素对象自身内容可进行修改，但各个位置对象无法修改（即换成另一个对象）**

* 连接元组：+

In [15]:
(1, 2) + ('a', 'b') + (True,)

(1, 2, 'a', 'b', True)

* 复制：*

In [17]:
tup = ('a', 'bc')
tup6 = tup * 6
print(tup)
print(tup6)

('a', 'bc')
('a', 'bc', 'a', 'bc', 'a', 'bc', 'a', 'bc', 'a', 'bc', 'a', 'bc')


**对象本身没有复制，对指向对象的引用进行了复制**

#### 3.1.1.3 元组拆包

In [23]:
tup4 = 1, 2, (3, 4)
a, b, c= tup4
print(a, b, c)

1 2 (3, 4)


* 利用元组拆包交换变量

In [24]:
a, b = 1, 2
print(a, b)
a, b = b, a
print(a, b)

1 2
2 1


* 利用拆包遍历元组或列表序列

In [25]:
seq = [(1, 2), (3, 4), (5, 6)]
for a, b in seq:
    print('a = {0}, b = {1}'.format(a, b))

a = 1, b = 2
a = 3, b = 4
a = 5, b = 6


* 特殊语法 *rest

In [26]:
val = 1, 2, 3, 4, 5
a, b, *rest = val
print('a = {0}, b = {1}, rest = {2}'.format(a, b, rest))

a = 1, b = 2, rest = [3, 4, 5]


**rest部分常用于待丢弃数据，且变量名常用下划线_标识**

### 3.1.2 列表

不定长、元素可变的对象序列

#### 3.1.2.1 创建列表

* []

In [27]:
a_list = [1, 2, None]
print(a_list)

[1, 2, None]


* list() 将任意序列或迭代器转换为列表

In [30]:
gen = range(10)
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

#### 3.1.2.2 列表操作

* []取列表元素

In [31]:
a_tup = ('a', 'b', 'c')
a_list = list(a_tup)
print(a_list[1])

b


- 增加或移除元素

In [44]:
# append() 添加至列表尾部

b_list = [1, 'abc']
b_list.append(True)
print(b_list)

[1, 'abc', True]


In [45]:
# insert() 插入列表指定位置

b_list.insert(1, 2)
print(b_list)

[1, 2, 'abc', True]


In [46]:
# pop() 将指定位置元素移除并返回

b_list.pop(1)
print(b_list)

[1, 'abc', True]


In [47]:
# remove() 定位并移除第一个符合要求的值

b_list.remove('abc')
print(b_list)

[1, True]


In [52]:
# 检查是否包含某元素：in、not in

print(b_list)
# 'True' in b_list # 区别字符串类型和bool类型
True in b_list

[1, True]


True

- 【注】
    - insert 需要移动元素，故代价高于 append；序列头尾插入考虑双端队列 collections.deque
    - 检查是否包含某元素的速度： 列表 << 字典、集合。因为前者基于线性查找，后者基于哈希表

#### 3.1.2.3 连接和联合列表

* 连接：+

In [54]:
['ab', 1] + [True]

['ab', 1, True]

* extend()：添加元素到已存在列表

In [57]:
x = ['ab', 1]
x.extend([True, ('c', 'd')])
x

['ab', 1, True, ('c', 'd')]

- 【注】
    - 使用 + 连接列表需要创建新列表并复制对象，故使用 extend() 是更好的方式

#### 3.1.2.4 排序

sort() 列表内部排序，无需新建对象

In [59]:
# 数值排序

num_list = [9, 6, 3, 1, -5]
num_list.sort()
num_list

[-5, 1, 3, 6, 9]

可传递一个用于生成排序值的函数key()，对列表进行二级排序

In [60]:
# 二级排序

str_list = ['a', 'qwe', 'ww']
str_list.sort(key=len)
str_list

['a', 'ww', 'qwe']

#### 3.1.2.5 二分搜索和已排序列表维护

Python 内建 bisect 模块实现二分搜索及已排序列表的插值

In [63]:
import bisect

In [64]:
# bisect 二分查找应插入位置

bisect.bisect(num_list, 4)

3

In [71]:
# bisext 将元素插入相应位置

bisect.insort(num_list, 4)
num_list.pop(4)
num_list

[-5, 1, 3, 4, 4, 4, 6, 9]

- 【注】
    - bisect 模块不会检查列表是否有序（代价过大），故对未排序列表使用该模块虽不会报错，但可能产生错误结果

#### 3.1.2.6 切片

[start:stop]：start 索引包含，stop 索引不包含，共 stop - start 个元素数量

* 切片取数

In [77]:
seq = [1, 2, 3, 4, 5, 6]

seq[1:5]

[2, 3, 4, 5]

* 切片赋值

In [79]:
seq[2:3] = [9]
seq

[1, 2, 9, 4, 5, 6]

* 缺省start、stop

In [80]:
seq[:]

[1, 2, 9, 4, 5, 6]

In [82]:
# 从 i=1 个到末尾
seq[1:]

[2, 9, 4, 5, 6]

In [83]:
# 从初始 i=0 个到第 i=1 个（不包含第 1 个）
seq[:1]

[1]

* 负索引

In [84]:
# 倒数第 2 个开始
seq[-2:]

[5, 6]

In [85]:
# 从初始到倒数第 2 个(不包含倒数第 2 个)
seq[:-2]

[1, 2, 9, 4]

* 步进

[::step]：每隔 step 个元素取一个

In [86]:
# 每隔两个取一个
seq[::2]

[1, 9, 5]

In [87]:
# 翻转列表
seq[::-1]

[6, 5, 4, 9, 2, 1]

- 【注】
    - 步进对元组也适用

### 3.1.3 内建序列函数

#### 3.1.3.1 enumerate

返回 (元素索引, 元素值) 元组序列

In [98]:
# 对数据建立索引 -- 使用 enumerate 构造字典，将序列值映射到索引位置

some_list = ['a', 'b', 'c']
mapping = {}

for i, val in enumerate(some_list):
    mapping[val] = i

mapping

{'a': 0, 'b': 1, 'c': 2}

#### 3.1.3.2 sorted

返回根据任意序列元素新建的已排序列表。参数与 sort() 相同

In [94]:
sorted([3, 2, 1, 6, 5, 4])

[1, 2, 3, 4, 5, 6]

In [96]:
sorted('python3')

['3', 'h', 'n', 'o', 'p', 't', 'y']

#### 3.1.3.3 zip

将列表、元组或其他序列的元素配对，新建一个元组构成的列表

In [90]:
seq1 = ['a', 'b', 'c']
seq2 = ['A', 'B', 'C']

zipped = zip(seq1, seq2)
list(zipped)

[('a', 'A'), ('b', 'B'), ('c', 'C')]

对任意长度序列，生产列表由最短序列决定

In [91]:
seq3 = [True, False]
zipped = zip(seq1, seq2, seq3)
list(zipped)

[('a', 'A', True), ('b', 'B', False)]

对已 zip 序列拆分（将行列表转为列列表）

In [93]:
zipped = [('a', 'A'), ('b', 'B'), ('c', 'C')]
zip1, zip2 = zip(*zipped)
print(zip1)
print(zip2)

('a', 'b', 'c')
('A', 'B', 'C')


#### 3.1.3.4 reversed

生成器，将序列元素倒序排列

In [89]:
list(reversed(range(6)))

[5, 4, 3, 2, 1, 0]

### 3.1.4 字典

### 3.1.5 集合

### 3.1.6 列表、集合和字典的推导式

## 3.2 函数

In [None]:
3.2.1 