# 列表推导与生成器表达式

列表推导是构建列表的快捷方式，而生成器表达式则可以用来创建其他任何类型的序列。

个人认为列表推导式更加Pythonic，可读性也更强。

## 列表推导和可读性

如下面的例子中，把一个字符串变成Unicode码位的列表：

In [1]:
symbols = '$&@￥^%'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))

codes

[36, 38, 64, 65509, 94, 37]

另一种写法，使用列表推导式：

In [2]:
symbols = '$&@￥^%'
codes = [ord(symbol) for symbol in symbols]

codes

[36, 38, 64, 65509, 94, 37]

如果 `for` 循环中的逻辑比较简单的情况下，使用列表推导式可以让代码更加简洁，且可读性更强。

列表推导可以帮我们把一个序列或其他可迭代类型中的元素过滤或者加工，然后再重新建一个列表。

## 列表推导同filter和map的比较

Pyhon内置的 `filter` 和 `map` 函数组合起来也能达到这一效果，但是可读性上大打折扣。

如下面的例子，在将字符转换成Unicode的同时过滤掉小于127的元素：

In [4]:
# 使用列表推导
symbols = '$&@￥₢^￡%∈'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]

beyond_ascii

[65509, 8354, 65505, 8712]

In [5]:
# 使用filter加map
symbols = '$&@￥₢^￡%∈'
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols)))

beyond_ascii

[65509, 8354, 65505, 8712]

## 笛卡尔积

列表推导也可以方便的生成两个或以上的可迭代类型的笛卡尔积。

如下面的例子中，有两个列表，一个标识衣服的尺寸，一个表示衣服的颜色，通过列表推导来计算两个列表的笛卡尔积：

In [7]:
sizes = ['S', 'M', 'L']
colors = ['black', 'white']
tshirts = [(color, size) for color in colors for size in sizes]
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

改变嵌套的顺序。会发现生成的列表的排序方式发送了改变。

In [8]:
sizes = ['S', 'M', 'L']
colors = ['black', 'white']
tshirts = [(color, size) for size in sizes for color in colors]
tshirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

## 生成器表达式

列表推导的作用只有一个：生成列表。如果想要生成其他类型的序列，就需要用到生成器表达式。

生成器表达式背后遵守了迭代器协议，可以逐个地产出元素，节省内存。

生成器表达式的语法跟列表推导类似，只不过把方括号换成圆括号而已，如下面的例子所示：

In [11]:
symbols = '$&@￥₢^￡%∈'
tuple((ord(symbol) for symbol in symbols))

(36, 38, 64, 65509, 8354, 94, 65505, 37, 8712)

In [12]:
# 如果生成式表达式是一个函数的唯一参数，可以省略括号
symbols = '$&@￥₢^￡%∈'
tuple(ord(symbol) for symbol in symbols)

(36, 38, 64, 65509, 8354, 94, 65505, 37, 8712)

In [13]:
# 如果函数不止一个参数，则必须加括号
import array

symbols = '$&@￥₢^￡%∈'
array.array('I', (ord(symbol) for symbol in symbols))

array('I', [36, 38, 64, 65509, 8354, 94, 65505, 37, 8712])

生成器表达式如果不调用的话，返回的是一个 `generator` 对象。

In [14]:
sizes = ['S', 'M', 'L']
colors = ['black', 'white']
tshirts = ((color, size) for size in sizes for color in colors)
tshirts

<generator object <genexpr> at 0x0000011B8A97B5E8>

只有当使用的时候，才会逐个产生。

In [15]:
for tshirt in tshirts:
    print(tshirt)

('black', 'S')
('white', 'S')
('black', 'M')
('white', 'M')
('black', 'L')
('white', 'L')
