- Python 也从 ABC 那里继承了用统一的风格去处理序列数据这一特点。不管是哪种数据结构，字符串、列表、字节序列、数组、XML 元素，抑或是数据库查询结果，它们都共用一套丰富的操作：迭代、切片、排序，还有拼接。
- Python 标准库用 C 实现了丰富的序列类型，列举如下。 
    - 容器序列:　list、tuple 和 collections.deque 这些序列能存放不同类型的数据。 \
    - 扁平序列:　str、bytes、bytearray、memoryview 和 array.array，这类序列只能容纳一种类型。
    - 容器序列存放的是它们所包含的任意类型的**对象的引用**，而扁平序列里存放的是**值而不是引用**。换句话说，扁平序列其实是一段连续的内存空间。由此可见扁平序列其实更加紧凑，但是它里面只能存放诸如字符、字节和数值这种基础类型。
 - 序列类型还能按照能否被修改来分类。
    - 可变序列:list、bytearray、array.array、collections.deque 和memoryview。
    - 不可变序列:tuple、str 和 bytes。

# 列表推导

In [1]:
name = 'jack'
a = [ord(j) for j in name]
print(a)

[106, 97, 99, 107]


- 通常的原则是，只用列表推导来创建新的列表，并且尽量保持简短。如果列表推导的代码超过了两行，你可能就要考虑是不是得用 for 循环重写了。就跟写文章一样，并没有什么硬性的规则，这个度得你自己把握。
- 列表推导不会再有变量泄漏的问题,列表推导、生成器表达式，以及同它们很相似的集合（set）推导和字典（dict）推导，在 Python 3 中都有了自己的局部作用域，就像函数似的。表达式内部的变量和赋值只在局部起作用，表达式的上下文里的同名变量还可以被正常引用，局部变量并不会影响到它们。

# 多维列表推导

In [2]:
color = ['black','white']
size = ['S','M','L']
pet = [(c,s) for c in color for s in size]
print(pet)

[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]


# 生成器表达式
- 虽然也可以用列表推导来初始化元组、数组或其他序列类型，但是生成器表达式是更好的选择。这是因为**生成器表达式背后遵守了迭代器协议，可以逐个地产出元素，而不是先建立一个完整的列表，然后再把这个列表传递到某个构造函数里。前面那种方式显然能够节省内存。**
- 生成器表达式的语法跟列表推导差不多，只不过把方括号换成圆括号而已。

In [4]:
import array
name = 'jack'

#生成元组
a = tuple(ord(i) for i in name)
#生成列表
b = list(ord(i) for i in name)
# 生成数组
c = array.array('I',(ord(i) for i in name))
print(a,b,c)

(106, 97, 99, 107) [106, 97, 99, 107] array('I', [106, 97, 99, 107])


# 元组-不可变列表
## 拆包
- for循环可以分别提出元组当中的元素，对于不需要的元素可以采用*_*占位符。

In [5]:
pet = ('dog','cat','fish','pig')
for i in pet:
    print(i)

dog
cat
fish
pig


## 元组拆包

In [8]:
pet = ('dog','cat','fish','pig')
p1,p2,_,p3 = pet
print(p1,p2,p3)

dog cat pig


## 可以用 * 运算符把一个可迭代对象拆开作为函数的参数：

In [9]:
print(divmod(20,8))
num = (50,8)
print(divmod(*num))

(2, 4)
(6, 2)


## 用*来处理剩下的元素

In [10]:
a,b,*rest = range(5)
print(a,b,rest)

0 1 [2, 3, 4]


## 嵌套元组拆包

In [11]:
person = (16,'man',('student','univers'))
age,sex,(major,school) = person
print(age,sex,major,school)

16 man student univers


## 具名元组
- collections.namedtuple 是一个工厂函数，它可以用来构建一个带字段名的元组和一个有名字的类——这个带名字的类对调试程序有很大帮助。
- 创建一个具名元组需要两个参数，一个是类名，另一个是类的各个字段的名字。后者可以是由数个字符串组成的可迭代对象，或者是由空格分隔开的字段名组成的字符串。
- 存放在对应字段里的数据要以一串参数的形式传入到构造函数中（注意，元组的构造函数却只接受单一的可迭代对象）。
- **你可以通过字段名或者位置来获取一个字段的信息。**

In [13]:
import collections
Student = collections.namedtuple('Student','age sex school')
s1 = Student(16,'man','zky')
print(s1.school)
print(s1.sex)
print(s1.age)
print(s1[0])

zky
man
16
16


# 切片
- 在 Python 里，像列表（list）、元组（tuple）和字符串（str）这类序列类型都支持切片操作，但是实际上切片操作比人们所想象的要强大很多。
- s\[a:b:c\] 的形式对 s 在 a 和 b之间以 c 为间隔取值。c 的值还可以为负，负值意味着反向取值。下面的 3 个例子更直观些：

In [None]:
array = [1,2,3,4,5]
print(array[0:2]) #取[0][1]
print(array[0:5:2]) #间隔2
print(array[::2]) #间隔2
#列表生成式
print(array)

## 多维切片
- s\[a:b,c:d,e:f\]
- s\[a,...\]

## 给切片赋值

In [14]:
l = list(range(10))
print(l)
l[2:5] = [20, 30]
print(l)
[0, 1, 20, 30, 5, 6, 7, 8, 9]
del l[5:7]
print(l)
l[3::2] = [11, 22]
print(l)
l[2:5] = 100 ##这里会报错
l[2:5] = [100] #必须是可迭代对象
print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 20, 30, 5, 6, 7, 8, 9]
[0, 1, 20, 30, 5, 8, 9]
[0, 1, 20, 11, 5, 22, 9]


TypeError: can only assign an iterable

# 对序列使用+和*
- + * 都是实现列表的拼接

In [16]:
a = [1,2,3]
b = a + a
c = a*3
print(a,b,c)

[1, 2, 3] [1, 2, 3, 1, 2, 3] [1, 2, 3, 1, 2, 3, 1, 2, 3]


## 建立由列表组成的列表

In [18]:
# 正确
board = [['-']*3 for i in range(3)]
board[0][0] = 'x'
print(board)
# 错误
board = [['-']*3]*3
board[0][0] = 'x'
print(board)

[['x', '-', '-'], ['-', '-', '-'], ['-', '-', '-']]
[['x', '-', '-'], ['x', '-', '-'], ['x', '-', '-']]


# 一个关于+=的谜题

In [20]:
# 早期版本中以下代码运行会报错 同时t中的值也会发生改变 现在的版本直接报错 不会进行改变
# 因为 tuple 不支持对它的元素赋值，所以会抛出 TypeError 异常。
t = (1,2,[50,60])
t[2] += [10,10]
print(t)

TypeError: 'tuple' object does not support item assignment

- 不要把可变对象放在元组里面。
- 增量赋值不是一个原子操作。我们刚才也看到了，它虽然抛出了异常，但还是完成了操作。
- 查看 Python 的字节码并不难，而且它对我们了解代码背后的运行机
制很有帮助。

# list.sort方法和内置函数sorted
- list.sort 方法会就地排序列表，也就是说不会把原列表复制一份。这也是这个方法的返回值是 None 的原因。
- 与 list.sort 相反的是内置函数 sorted，它会新建一个列表作为返回值。这个方法可以接受任何形式的可迭代对象作为参数，甚至包括不可变序列或生成器（见第 14 章）。而不管 sorted 接受的是怎样的参数，它最后都会返回一个列表。
- 不管是 list.sort 方法还是 sorted 函数，都有两个可选的关键字参数。
    - reverse:True 降序 默认false
    - key:按照某种规则排序 key = len 按照长度排序

# 数组(array.array)

# 双向队列

In [26]:
from collections import deque
a = deque(range(10),maxlen=10) #最大长度10
print(a)
a.rotate(3)
print(a)
a.extend([2,3,10]) #左边的元素会被挤掉 右边类似
print(a)
a.appendleft(-1) #左边的元素会被挤掉 右边类似
print(a)

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)
deque([0, 1, 2, 3, 4, 5, 6, 2, 3, 10], maxlen=10)
deque([-1, 0, 1, 2, 3, 4, 5, 6, 2, 3], maxlen=10)


# 小结
- 要想写出准确、高效和地道的 Python 代码，对标准库里的序列类型的掌握是不可或缺的。
- Python 序列类型最常见的分类就是可变和不可变序列。但另外一种分类方式也很有用，那就是把它们分为扁平序列和容器序列。前者的体积更小、速度更快而且用起来更简单，但是它只能保存一些原子性的数据，比如数字、字符和字节。容器序列则比较灵活，但是当容器序列遇到可变对象时，用户就需要格外小心了，因为这种组合时常会搞出一些“意外”，特别是带嵌套的数据结构出现时，用户要多费一些心思来保证代码的正确。

- 列表推导和生成器表达式则提供了灵活构建和初始化序列的方式，这两个工具都异常强大。如果你还不能熟练地使用它们，可以专门花时间练习一下。它们其实不难，而且用起来让人上瘾。

- 元组在 Python 里扮演了两个角色，它既可以用作无名称的字段的记录，又可以看作不可变的列表。当元组被当作记录来用的时候，拆包是最安全可靠地从元组里提取不同字段信息的方式。新引入的 * 句法让元组拆包的便利性更上一层楼，让用户可以选择性忽略不需要的字段。具名元组也已经不是一个新概念了，但它似乎没有受到应有的重视。就像普通元组一样，具名元组的实例也很节省空间，但它同时提供了方便地通过名字来获取元组各个字段信息的方式，另外还有个实用的 .\_asdict()方法来把记录变成 OrderedDict 类型。

- Python 里最受欢迎的一个语言特性就是序列切片，而且很多人其实还没完全了解它的强大之处。比如，用户自定义的序列类型也可以选择支持NumPy 中的多维切片和省略（...）。另外，对切片赋值是一个修改可变序列的捷径。

- 重复拼接 seq * n 在正确使用的前提下，能让我们方便地初始化含有不可变元素的多维列表。增量赋值 += 和 \*= 会区别对待可变和不可变序列。在遇到不可变序列时，这两个操作会在背后生成新的序列。但如果被赋值的对象是可变的，那么这个序列会就地修改——然而这也取决于序列本身对特殊方法的实现。

- 序列的 sort 方法和内置的 sorted 函数虽然很灵活，但是用起来都不难。这两个方法都比较灵活，是因为它们都接受一个函数作为可选参数来指定排序算法如何比较大小，这个参数就是 key 参数。key 还可以被用在 min 和 max 函数里。如果在插入新元素的同时还想保持有序序列的顺序，那么需要用到 bisect.insort。bisect.bisect 的作用则是快速查找。

- 除了列表和元组，Python 标准库里还有 array.array。另外，虽然NumPy 和 SciPy 都不是 Python 标准库的一部分，但稍微学习一下它们，会让你在处理大规模数值型数据时如有神助。

- 本章末尾介绍了 collections.deque 这个类型，它具有灵活多用和线程安全的特性。表 2-3 将它和列表的 API 做了比较。本章最后也提及了一些标准库中的其他队列类型的实现。
