# 3.1 数据结构和序列

## 元组

In [1]:
tup = 4, 5, 6  # 这是一个元组
tup

(4, 5, 6)

In [2]:
nested_tup = (4, 5, 6), (7, 8)  # 复杂点的元组
nested_tup

((4, 5, 6), (7, 8))

In [3]:
print(tuple([1, 2, 3]))  # tuple() 函数可以将任意类型转换为元组
tup = tuple('string')
tup

(1, 2, 3)


('s', 't', 'r', 'i', 'n', 'g')

In [4]:
tup[0]  # 访问元组中的元素，编号从 0 开始

's'

In [5]:
tup = tuple(['foo', [1, 2], True])

tup[2] = False  # 元组不可修改

TypeError: 'tuple' object does not support item assignment

In [6]:
tup[1].append(3)  # 如果元组中的某个元素可以修改（例如列表），则可以修改这个元素
tup[1][0] = 0
tup

('foo', [0, 2, 3], True)

In [7]:
(4, None, 'foo') + (6, 0) + ('bar', )  # 加号连接多个元组

(4, None, 'foo', 6, 0, 'bar')

In [8]:
print(('foo', 'bar') * 4)  # 乘号复制元组
print((2, 3) * 4)

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')
(2, 3, 2, 3, 2, 3, 2, 3)


In [9]:
text = ('a', 'b')
text * 4  # 注意：对象本身并没有被复制
text

('a', 'b')

### 拆分元组

In [10]:
tup = (4, 5, 6)
a, b, c = tup  # 将元组赋值给相同数量的变量，会将元组拆分。
a

4

In [11]:
tup = (4, 5, (6, 7))

a, b, (c, d) = tup
e, f, g = tup

print(d)
print(g)

7
(6, 7)


In [12]:
# 利用拆分元祖这个功能，可以替换变量名字
'''
其他语言：
tmp = a
a = b
b = tmp
'''

a, b = 1, 2
b, a = a, b  # Python 可以直接替换

In [13]:
# 变量拆分常用来迭代元组或列表

seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for a, b, c in seq:
    print('a={0}, b={1}, b={2}'.format(a, b, c))

a=1, b=2, b=3
a=4, b=5, b=6
a=7, b=8, b=9


In [14]:
values = 1, 2, 3, 4, 5
a, b, *c = values  # * 拆分元组，可以抓取到任意长度的元素
print(a)
print(b)
print(c)

1
2
[3, 4, 5]


In [15]:
a, b, *_ = values  # *_ 使用下划线舍弃元素

### tuple 方法

In [16]:
a = (1, 2, 2, 2, 3, 4, 2)

a.count(2)  # count() 函数统计元素出现的次数

4

## 列表

In [33]:
a_list = [2, 3, 7, None]  # 使用 [] 定义列表

tup = ('foo', 'bar', 'baz')
b_list = list(tup)  # 使用 list() 函数定义或将其他类型转换为列表

print(b_list)
print(b_list[0])

['foo', 'bar', 'baz']
foo


In [23]:
# list() 函数经常用来实例化迭代器或生成器

gen = range(10)
print(gen)

print(list(gen))  # 实例化迭代器

range(0, 10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### 添加、删除元素

In [34]:
# append() 函数，在末尾添加单个元素

b_list.append('fiejf')
b_list

['foo', 'bar', 'baz', 'fiejf']

In [35]:
# insert() 函数，在特定位置插入元素

b_list.insert(1, 'red')
b_list.insert(-1, '-1')
b_list

['foo', 'red', 'bar', 'baz', '-1', 'fiejf']

In [36]:
# pop() 函数，移除并返回制定位置的元素

a = b_list.pop(2)
print(a)
print(b_list)

bar
['foo', 'red', 'baz', '-1', 'fiejf']


In [37]:
# remove() 函数，移除制定元素，如果存在重复元素，先找到第一个元素并移除。

b_list.append('foo')
print(b_list)

b_list.remove('foo')
b_list

['foo', 'red', 'baz', '-1', 'fiejf', 'foo']


['red', 'baz', '-1', 'fiejf', 'foo']

In [38]:
# in 关键字，检查列表中是否包含某个元素。

'fejikk' in b_list

False

In [39]:
# not in 关键字，是否不包含某个元素。

'fejikk' not in b_list

'''
在列表中检查是否存在元素比在字典和集合中慢很多。
'''

True

## 串联和组合列表

In [40]:
# 使用 + 连接列表

[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [45]:
# extend() 函数，追加多个元素

x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

'''
使用 + 连接列表，由于需要新建列表，所以计算量比 extend() 大，连接大列表时，推荐使用 extend()。
'''

[4, None, 'foo', 7, 8, (2, 3)]

## 排序

[sort() 函数完整参数](http://www.runoob.com/python3/python3-att-list-sort.html)

In [46]:
# sort() 函数，排序列表（原地，不创建新对象）

a = [4, 1, 6, 8, 2, 9]
a.sort()
a

[1, 2, 4, 6, 8, 9]

In [47]:
# sort() 函数的 key 属性，二级排序

b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)  # 按照字符长度排序
b

['He', 'saw', 'six', 'small', 'foxes']

## 二分搜索和维护已排序的列表

bisect 模块支持二分查找，和向已排序的列表插入值。  
bisect.bisect() 函数，可以找到插入值后仍保证排序的位置。  
bisect.insort() 函数，插入值，并保证排序正确。

In [49]:
import bisect

c = [1, 2, 2, 2, 3, 4, 7]

# bisect.bisect() 函数，可以找到插入值后仍保证排序的位置。
print(bisect.bisect(c, 2))

# bisect.insort() 函数，插入值并保证列表排序正确。
bisect.insort(c, 6)
c

'''
注意：bisect 模块并不会检查列表是否已经排序，只会按照当前顺序插入。
'''

4


[1, 2, 2, 2, 3, 4, 6, 7]

## 切片

基本形式：[start : stop : step]  
注意：切片不包含末尾

In [1]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]

seq[1:5]

'''
切片包含起始元素，不包含末尾元素，所以，结果的元素个数为 stop - start
'''

[2, 3, 7, 5]

In [2]:
seq[3:4] = [6, 3]  # 用切片赋值时，包含了起始和结尾元素
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

In [4]:
print(seq[:5])  # 从都开始

print(seq[3:])  # 直到末尾

[7, 2, 3, 6, 3]
[6, 3, 5, 6, 0, 1]


In [5]:
# 负数是从末尾开始，末尾元素编号为 -1

print(seq[-4:])

print(seq[-6:-2])

[5, 6, 0, 1]
[6, 3, 5, 6]


In [6]:
seq[::2]  # 步长

[7, 3, 3, 6, 1]

In [7]:
# 步长为 -1 即可倒序列表

seq[::-1]

[1, 0, 6, 5, 3, 6, 3, 2, 7]

## 序列函数

### enumerate() 函数  
得到当前元素的序号和值。

In [8]:
for i, v in enumerate(seq):
    print(i, v)

0 7
1 2
2 3
3 6
4 3
5 5
6 6
7 0
8 1


In [9]:
# enumerate() 函数通常用来把列表映射到字典中

some_list = ['foo', 'bar', 'baz']
magging = {}

for i, v in enumerate(some_list):
    magging[v] = i
magging

{'foo': 0, 'bar': 1, 'baz': 2}

### sorted() 函数  
返回排序好的列表，创建新变量，不更改原始列表。  
可接受和 sort() 函数相同的参数。

In [13]:
# sorted() 函数，排序（非原地，创建新变量，这就是它和 sort() 的区别）。

a = [7, 1, 2, 6, 0, 3, 2]

print(sorted(a))

print(a)

[0, 1, 2, 2, 3, 6, 7]
[7, 1, 2, 6, 0, 3, 2]


### zip() 函数  
组合多个序列（列表、元组）为一个元组列表。

In [14]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']

zipped = zip(seq1, seq2)
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

In [15]:
# 最终结果的长度，取决于最短的序列。

seq3 = [False, True]

list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

In [16]:
# zip() 的常见用法之一是同时迭代多个序列，可能结合 enumerate() 使用

for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('{}: {}, {}'.format(i, a, b))

0: foo, one
1: bar, two
2: baz, three


In [17]:
# zip(* ) 解压缩序列

pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')]

first_name, last_name = zip(*pitchers)

print(first_name)
print(last_name)

('Nolan', 'Roger', 'Schilling')
('Ryan', 'Clemens', 'Curt')


### reversed() 函数  
逆序迭代一个序列

In [18]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

## 字典  
是键值对的大小可变集合。  

In [19]:
empty_dict = {}  # {} 定义字典

d1 = {'a': 'some value', 'b' : [1, 2, 3, 4]}  # 创建字典

d1

{'a': 'some value', 'b': [1, 2, 3, 4]}

In [21]:
# 访问、插入、修改字典

d1[7] = 'an integer'  # 插入新元素
print(d1)

print(d1['a'])  # 通过键，访问字典元素

d1[7] = 'an int'  # 修改字典元素
print(d1)

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}
some value
{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an int'}


In [22]:
# 检查字典中是否包含某个键

'b' in d1

True

In [23]:
# del 关键字，删除值。pop() 函数，返回并删除值

del d1[7]  # del 关键字，删除
print(d1)

a = d1.pop('a')  # pop() 函数，返回并删除
print(a)
print(d1)

{'a': 'some value', 'b': [1, 2, 3, 4]}
some value
{'b': [1, 2, 3, 4]}


In [25]:
# keys() 函数和 values() 函数，分别返回字典的键和值

print(list(d1.keys()))
print(list(d1.values()))

['b']
[[1, 2, 3, 4]]


In [28]:
# update() 函数，组合一个字典

d1.update({'b' : 'no old', 'c' : 'foo', 'd' : 12})  # update() 函数原地修改字典，如果有重复的键（本例中：b）会被新键值覆盖
d1

{'b': 'no old', 'c': 'foo', 'd': 12}

## 用序列创建字典

In [30]:
# 两个列表创建字典

key_list = ['a', 'b']
value_list = [11, 22]
dic = {}

for k, v in zip(key_list, value_list):
    dic[k] = v

dic

{'a': 11, 'b': 22}

In [31]:
# 字典本质上是 2 元元组的集合，所以 dict 可以接受 2 元元组的列表

mapping = dict(zip(range(5), reversed(range(5))))
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

## 默认值