# ch02. 序列
> Python 中存在许多序列，如列表、元组、字典、集合、字符串等，并且具有很多的通用之处，可以对序列进行迭代，拼接，切片，排序等。

<mark>第二章的主要内容有:</mark>
- __列表推导式__ 和 __生成器__ 的基本用法
- 元组的用法
- **序列拆包** 、 **序列模式**
- 专门的序列类型

## 2.2 内置序列

Python的标准库使用 C 语言实现了丰富的序列类型，比如<mark>容器序列</mark>（可以存不同类型的项，并且可以嵌套）、<mark>扁平序列</mark>（只能存一种简单类型的项）

**容器序列**存放的是所包含对象的引用，对象可以是任何类型，如图所示。

<div> <img src="./assets/ch02/img/container-sequence.png" width="600"/> </div>

**扁平序列**在自己的内存空间存储了所含内容的值，而不是存的引用的对象，如图所示。

<div> <img src="./assets/ch02/img/flat-sequence.png" width="600"/> </div>

任何 Python 对象在内存中都有一个标头，里面包含了对象的元数据。

比如最简单的 float 类型，内存标头中存在这个 float 对象的值字段和两个元数据字段
- ob_refcnt: 对象的引用技术
- ob_type: 指向对象类型的指针
- ob_fval: 一个 C 语言 double 类型值，存放 float 的值

对于 float 类型的数组和元组，前者在计算机内存中的分布更加的紧凑，原因如下：

- 数组整体是一个对象，存放了各个项的原始值
- 而元组的每一项是一个对象，需要记录自身和各个对象

__这些序列有些是可变的，而有些是不可变的__

<mark>可变序列</mark>
  - 例如：list, bytearray, array.array, collections.deque

<mark>不可变序列</mark>
  - 例如：tuple, str, bytes

list 是最基本的序列类型，它是一种可变容器。

可以通过列表推导式构造列表

熟悉了列表推导式，就打开了生成器的大门

## 2.3 列表推导式和生成器表达式

> 可以使用列表推导式（针对列表）或者生成器表达式（其他序列类型）可以快速构造一个序列

> 通过这两种方式，写出的代码不仅更容易理解，而且速度很快

以下两段代码的意图是一样的，第一种方式使用的是 for 循环，第二种方式使用的是 列表推导式

In [1]:
symbols = '$¢£¥€¤'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))

codes

[36, 162, 163, 165, 8364, 164]

In [2]:
symbols = '$¢£¥€¤'
codes = [ord(symbol) for symbol in symbols]
codes

[36, 162, 163, 165, 8364, 164]

for 循环可以做很多事情，可以遍历一个序列，统计项数或者挑选部分项，也可以计算总数和平均数等

列表推导式的代码可读性可能会更高，但是要 __防止滥用__

<mark> 如果不打算使用生成的列表，就不要使用列表推导式语句</mark>

<mark> 列表推导式应该保持简洁，若超过两行，最好把语句拆开，或者采用传统的 for 循环的写法 </mark>

Python 会忽略 [], {}, () 内部的换行，因此，列表，列表推导式，元组，字典等结构完全可以分成几行来写，而不需要使用 __续行转义符__`\`

Python3 中的列表推导式、生成器表达式，以及类似的集合推导式和字典推导式，for 子句中的赋值的变量在局部作用域内

<mark> 

- 使用「海象运算符」`:=` 赋值的变量在推导式或者生成器表达式返回后依旧可以访问，这个行为与函数内的局部变量的行为不同。

- 海象运算符赋值的变量，其作用域限定在函数内，除非目标类变量使用 global 或者 nonlocal 声明 
</mark>

In [3]:
x = 'ABC'
codes = [ord(x) for x in x]
x

'ABC'

In [4]:
codes

[65, 66, 67]

In [5]:
codes = [last := ord(c) for c in x]
last

67

可以看到，last 可以访问，因为 last 通过海象运算符修饰

In [6]:
c

NameError: name 'c' is not defined

c 无法被访问，因为 c 定义在for循环内部，是个局部变量

### 列表推导式和 map, filter 的比较

<mark> 列表推导式涵盖了 map 和 filter 两个函数的功能，而且写出的代码不像 lambda 表达式那么晦涩难懂

In [7]:
symbols = '$¢£¥€¤'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]
beyond_ascii

[162, 163, 165, 8364, 164]

In [8]:
beyond_ascii = list(
    filter(
        lambda c: c > 127, 
        map(ord, symbols)
    )
)

beyond_ascii

[162, 163, 165, 8364, 164]

上面两种方式第一种使用的是 __列表推导式__, 第二种方式使用的 map 和 filter，第二种方式不一定快

In [9]:
help(map)

Help on class map in module builtins:

class map(object)
 |  map(func, *iterables) --> map object
 |  
 |  Make an iterator that computes the function using arguments from
 |  each of the iterables.  Stops when the shortest iterable is exhausted.
 |  
 |  Methods defined here:
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __next__(self, /)
 |      Implement next(self).
 |  
 |  __reduce__(...)
 |      Return state information for pickling.
 |  
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.



In [10]:
help(filter)

Help on class filter in module builtins:

class filter(object)
 |  filter(function or None, iterable) --> filter object
 |  
 |  Return an iterator yielding those items of iterable for which function(item)
 |  is true. If function is None, return the items that are true.
 |  
 |  Methods defined here:
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __next__(self, /)
 |      Implement next(self).
 |  
 |  __reduce__(...)
 |      Return state information for pickling.
 |  
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.



### 使用列表推导式构造多个可迭代对象的笛卡尔乘积

> 比如有一个需求，有两种颜色，三种尺寸的衬衫，如何得到所有结果呢？

In [11]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']

shirts = [
    (color, size)
    for color in colors
    for size in sizes
]

shirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

上面这种方式先按照颜色再按尺寸排序，生成一个元组列表

In [12]:
for color in colors:
    for size in sizes:
        print((color, size))

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')


这种方式的两层循环的嵌套顺序与上面列表推导式的for子句的顺序一致

如果想要先按照尺寸再按照颜色排序，只需要调整for子句的顺序，如下所示

In [14]:
shirts = [(color, size)
            for size in sizes
            for color in colors
]

shirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

### 生成器表达式

列表推导式可以生成元组，数组，或者其他类型的序列

但是 __生成器表达式__ 占用更少的内存，因为生成器表达式使用 **迭代器协议** 逐个产出项，而不是一下子构造整个列表

<mark> 生成器表达式的语句和列表推导式几乎一样，只不过列表推导式使用的是`[]`，而生成器表达式使用的是`()`

使用生成器表达式构建一个元组

In [16]:
symbols = '$¢£¥€¤'
tuple(ord(s) for s in symbols)

(36, 162, 163, 165, 8364, 164)

- <mark> 如果生成器是函数唯一的参数，不需要额外再使用()括起来 </mark>

- 如果还有额外的参数，就需要在生成器表达式的两边加上圆括号

In [17]:
import array
array.array('I', (ord(s) for s in symbols))

array('I', [36, 162, 163, 165, 8364, 164])

使用生成器表达式计算笛卡尔积，打印不同色号和型号的衬衫

In [18]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']

for shirt in (f'{c} {s}' for c in colors for s in sizes):
    print(shirt)

black S
black M
black L
white S
white M
white L


In [21]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
shirts_g = ((c, s) for c in colors for s in sizes)
print(type(shirts_g))
for shirt in shirts_g:
    print(f'{shirt[0]} {shirt[1]}')

<class 'generator'>
black S
black M
black L
white S
white M
white L


<mark> 生成器表达式产生的列表并不是在内存中构造的，而是生成器表达式一次产出一项， 提供给for循环。 </mark>

如果两项都有超级多列表, 则使用生成器表达式计算笛卡尔乘积可以节省大量的内存，因为不同先构建 mxn 项的列表给 for 循环

## 2.4 元组不仅仅是不可变列表

> 元组有两个作用：
- 作为不可变列表
- 还可以用作 __没有字段名称的记录__