### 序列构成的数组

1 内置序列类型概览  
>  
> 容器序列  $list$  $tuple$  $collections.deque$ 可存放不同类型的数据  
扁平序列  $str$  $bytes$  $bytearray$  $memoryview$  $array.array$  只能容纳一种类型数据  
可变序列  $list$  $bytearray$  $array.array$  $collections.deque$  $memoryview$  
不可变序列  $tuple$  $str$  $bytes$  
![jupyter](./relation.png)
> 可变序列与不可变序列的差异。箭头从子类指向超类，斜体代表抽象类和抽象方法

2 列表推导和生成器表达式
>
> $list comprehension$ 和 $generator expression$  
列表推导的作用是生成列表  
列表推导和可读性

In [1]:
symbols = '%^&*'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))
    
codes

[37, 94, 38, 42]

In [4]:
# 对比循环可读性强
symbols = '%^&*'
codes = [ord(symbol) for symbol in symbols]
codes

[37, 94, 38, 42]

列表推导的使用原则：一般用于创建新的列表，并尽量保持简短。若推导代码超过两行，则要考虑循环，否则就容易滥用  
Python会忽略代码(),{},[]里的换行

In [5]:
x = 'ABC'
dummy = [ord(x) for x in x]
print(x)
print(dummy)

ABC
[65, 66, 67]


列表推导和$filter$   $map$的比较

In [10]:
# 列表推导
symbols = '%^&¥+*'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]
print(beyond_ascii)

# filter 函数
beyond_ascii = list(filter(lambda c: c>127, map(ord,symbols)))
print(beyond_ascii)

[165]
[165]


In [19]:
# 列表推导和filter谁快？下面是个简单的例子看下

import timeit

TIMES = 100000

SETUP = """
symbols = '$¢£¥€¤'
def non_ascii(c):
    return c > 127
"""

def clock(label, cmd):
    res = timeit.repeat(cmd, setup=SETUP, number=TIMES)
    print(label, *('{:.3f}'.format(x) for x in res))

clock('listcomp        :', '[ord(s) for s in symbols if ord(s) > 127]')
clock('listcomp + func :', '[ord(s) for s in symbols if non_ascii(ord(s))]')
clock('filter + lambda :', 'list(filter(lambda c: c > 127, map(ord, symbols)))')
clock('filter + func   :', 'list(filter(non_ascii, map(ord, symbols)))')

listcomp        : 0.097 0.085 0.084
listcomp + func : 0.133 0.132 0.142
filter + lambda : 0.134 0.131 0.132
filter + func   : 0.125 0.134 0.123


笛卡尔积

In [25]:
# 列表推导
colors = ['black','white']
sizes = ['S','M','L']
tshirts = [(color, size) for color in colors for size in sizes]
print(tshirts)
print()

# 循环
for color in colors:
    for size in sizes:
        print((color,size))

print()
# 列表推导顺序
tshirts = [(color, size) for size in sizes for color in colors]
print(tshirts)

[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')

[('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]


生成器表达式遵循迭代器协议，可逐个产生元素，而不需事先创建列表，节省内存   
其原理在第14章描述

In [26]:
symbols = '$¢£¥€¤'
tuple(ord(symbol) for symbol in symbols)  # 生成器表达式为唯一参数，无需再加括号

(36, 162, 163, 165, 8364, 164)

In [27]:
import array

array.array('I',(ord(symbol) for symbol in symbols)) # 构造方法需多个参数，必须加括号

array('I', [36, 162, 163, 165, 8364, 164])

In [29]:
colors = ['black','white']
sizes = ['S','M','L']

for tshirt in ('%s %s' %(c, s) for c in colors for s in sizes):
    print(tshirt)

black S
black M
black L
white S
white M
white L
