# 推导式（comprehensions）

推导式是Python的一种独有特性。简单地说是一种轻量级循环，可以从一个数据序列构建另一个新的数据序列。总共有三种推导式：
- 列表推导式（list comprehension）
- 字典推导式（dict comprehension）
- 集合推导式（set comprehension）

## 笨拙的`for`循环

在工作中经常有这样的应用场景，已经存在一个序列，需要编列这个序列，对每个元素进行运算，并把运算结果组成一个新的序列。

例如，已存在一个数字序列，希望对序列的每个数字求平方，并创建新的序列。

In [1]:
result_list = []
xs = (10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 95, 90, 95)
for i in xs:
    result_list.append(i * i)

print(result_list)   

[100, 225, 400, 625, 900, 1225, 1600, 2025, 2500, 3025, 3600, 4225, 4900, 5625, 6400, 9025, 8100, 9025]


有时候，还需要做个判断，仅对符合条件的元素进行处理。

In [2]:
result_list = []
xs = (10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 95, 90, 95)
for i in xs:
    if i % 10 != 0:
        result_list.append(i * i)

print(result_list)   

[225, 625, 1225, 2025, 3025, 4225, 5625, 9025, 9025]


类似这类简单的循环，Python提供推导式特性予以处理，可以更简单优雅，而且速度更快。

## 列表推导式

列表推导式是Python内置方法，用来简明扼要第创建列表。

列表推导式的语法是：
```
[expression for item in list if condition]
```

在中括号里包含一个表达式，然后是一个`for`语句，后面包含一个可选的`if`语句。表达式可以是任意的，也就是说可以再列表放入任意类型的对象。列表推导式最终返回一个新的列表。

把上节示例用列表推导式重写一下。

In [3]:
xs = (10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 95, 90, 95)
result_list = [i * i for i in xs]

print(result_list)   

[100, 225, 400, 625, 900, 1225, 1600, 2025, 2500, 3025, 3600, 4225, 4900, 5625, 6400, 9025, 8100, 9025]


In [4]:
xs = (10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 95, 90, 95)
result_list = [i*i for i in xs if i%10 != 0]

print(result_list)   

[225, 625, 1225, 2025, 3025, 4225, 5625, 9025, 9025]


列表推导式的结果是列表

In [5]:
print(type(result_list))

<class 'list'>


可以看出，用列表表达式更简洁。除此之外，我们可以比较一下二者的速度。

In [6]:
%%timeit
result_list = []
for i in range(1024*1024):
    result_list.append(i * i)

151 ms ± 5.63 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [7]:
%%timeit
result_list = [i*i for i in range(1024*1024)]

84.1 ms ± 553 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [8]:
%%timeit
result_list = []
for i in range(1024*1024):
    if i % 2 != 0:
        result_list.append(i * i)

132 ms ± 2.06 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [9]:
%%timeit
result_list = [i*i for i in range(1024*1024) if i%2 != 0]

97.6 ms ± 600 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


列表表达式中的表达式可以是任意的，可以使用`if...else`语句，例如大家小时候常玩的明7暗7游戏

In [10]:
# 明7暗7游戏
alist = ['Pass' if i%7==0 or i%10==7 else i for i in range(1,100)]
print(alist)

[1, 2, 3, 4, 5, 6, 'Pass', 8, 9, 10, 11, 12, 13, 'Pass', 15, 16, 'Pass', 18, 19, 20, 'Pass', 22, 23, 24, 25, 26, 'Pass', 'Pass', 29, 30, 31, 32, 33, 34, 'Pass', 36, 'Pass', 38, 39, 40, 41, 'Pass', 43, 44, 45, 46, 'Pass', 48, 'Pass', 50, 51, 52, 53, 54, 55, 'Pass', 'Pass', 58, 59, 60, 61, 62, 'Pass', 64, 65, 66, 'Pass', 68, 69, 'Pass', 71, 72, 73, 74, 75, 76, 'Pass', 78, 79, 80, 81, 82, 83, 'Pass', 85, 86, 'Pass', 88, 89, 90, 'Pass', 92, 93, 94, 95, 96, 'Pass', 'Pass', 99]


在列表推导式中，循环还可以嵌套。

In [11]:
blist = [m + n for m in '十百千' for n in '123']
print(blist)

['十1', '十2', '十3', '百1', '百2', '百3', '千1', '千2', '千3']


> 可以写多层循环，然而并不推荐这么做。实际上，应该避免写太长的列表推导式。毕竟简单易懂才是王道。

列表推导式从一个已知序列创建出一个列表，已知序列可以是列表、元组、集合，也可以是字典。

> 注意：列表推导式都可以用`for`循环重新实现；但并非所有`for`循环都能用列表推导式实现。

## 字典推导式

字典推导式和列表推导式的使用方法是类似的，可以简单快捷地创建字典。区别在于，使用大括号，表达式中用来指定键值对。

例如，有时候需要把字典的键值对快随对换一下。

In [12]:
adict = {'Python': 'Class 1', 'C':  'Class 2'}
bdict = {v: k for k, v in adict.items()}
print(bdict)

{'Class 1': 'Python', 'Class 2': 'C'}


不过这里存在一个问题，如果字典不是一一对应的话，对换的结果就可能出乎你的意料。

In [13]:
adict = {'Python': 'Class 1', 'C':  'Class 2', 'C++':  'Class 2'}
bdict = {v: k for k, v in adict.items()}
print(bdict)

{'Class 1': 'Python', 'Class 2': 'C++'}


## 集合推导式

与列表推导式的使用方法也是差不多的，可以简单快捷地创建集合。差别在于，集合推导式使用大括号`{}`。

In [14]:
alist = ['Wang Weihua', 'wang weihua', 'Python', 'pythoN', 'python']
aset = {name.lower() for name in alist}
print(aset)

{'python', 'wang weihua'}


In [15]:
print(type(aset))

<class 'set'>


## “元组推导式”

推导式真的很方便！可以快速创建列表、字典、集合。元组是用圆括号括起来的，那就试一试元组推导式。说干就试。

In [16]:
xs = (10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 95, 90, 95)
result = (i*i for i in xs if i%10 != 0)

其它没有异常错误，看起来一切正常。与列表表达式的语法一样，唯一区别就是用圆括号。那么下面我们把结果显示出来，用自省的方式看看返回对象。

In [17]:
print(result)
print(type(result))

<generator object <genexpr> at 0x7f3425580b48>
<class 'generator'>


实际上，返回结果是生成器（`generator`），会在后续章节[函数](../chap08/index.ipynb)予以介绍。

可以用元组转换函数`tuple()`看看生成器的结果：

In [18]:
print(tuple(result))

(225, 625, 1225, 2025, 3025, 4225, 5625, 9025, 9025)


结果还是一样的。因此尽管并不存在元组推导式，但这里的表达式还是非常方便的。