问题:序列中含有一些数据，我们需要提取出其中的值或根据某些标准对序列做删减

解决方案:要筛选序列中的数据，通常最简单的方法是使用列表推导式（list comprehension）。

In [1]:
mylist = [1, 4, -5, 10, -7, 2, 3, -1] 
ans=[i for i in  mylist if i>0]
print(ans)

[1, 4, 10, 2, 3]


使用列表推导式的一个潜在缺点是如果原始输入非常大的话，这么做可能会产生一个庞大的结果。如果这是你需要考虑的问题，那么可以使用生成器表达式通过迭代的方式产生筛选的结果。

In [3]:
pos=(i for i in mylist if i<0)
for i in pos:
    print(i,end=' ')

-5 -7 -1 

有时候筛选的标准没法简单地表示在列表推导式或生成器表达式中。比如，假设筛选过程涉及异常处理或者其他一些复杂的细节。基于此，可以将处理筛选逻辑的代码放到单独的函数中，然后使用内建的 filter()函数处理

In [6]:
values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
    try:
        x = int(val)
        return True
    except ValueError:
        return False
ivals = list(filter(is_int, values))
print(ivals)

['1', '2', '-3', '4', '5']


filter() 函数用于过滤序列，过滤掉不符合条件的元素，返回由符合条件元素组成的新列表。该接收两个参数，第一个为函数，第二个为序列，序列的每个元素作为参数传递给函数进行判断，然后返回 True 或 False，最后将返回 True 的元素放到新列表中。

filter() 函数简单理解为对所有的values进行传入的函数操作，如果返回True则保留否则删除该数据。

filter()创建了一个迭代器，因此如果我们想要的是列表形式的结果，请确保加上了 list()，

列表推导式和生成器表达式通常是用来筛选数据的最简单和最直接的方式。此外，它们也具有同时对数据做转换的能力。

In [8]:
mylist = [1, 4, -5, 10, -7, 2, 3, -1]
import math 
print([math.sqrt(n) for n in mylist if n > 0])

[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]


列表推导式还可以这样用：(通过else语句对不满足if的值进行操作)

In [9]:
clip_neg = [n if n > 0 else 0 for n in mylist]
print(clip_neg)

[1, 4, 0, 10, 0, 2, 3, 0]


另一个值得一提的筛选工具是 itertools.compress()，它接受一个可迭代对象以及一个布尔选择器序列作为输入。输出时，它会给出所有在相应的布尔选择器中为 True 的可迭代对象元素。如果想把对一个序列的筛选结果施加到另一个相关的序列上时，这就会非常有用。

例如，假设有以下两列数据：

In [11]:
addresses = [
 '5412 N CLARK',
 '5148 N CLARK',
 '5800 E 58TH',
 '2122 N CLARK'
 '5645 N RAVENSWOOD',
 '1060 W ADDISON',
 '4801 N BROADWAY',
 '1039 W GRANVILLE',
]
counts = [ 0, 3, 10, 4, 1, 7, 6, 1]

from itertools import compress
more5 = [n > 5 for n in counts] 
print(more5)

print(list(compress(addresses, more5)))#选择了对应位置为True的对象并输出

[False, False, True, False, False, True, True, False]
['5800 E 58TH', '4801 N BROADWAY', '1039 W GRANVILLE']


这里的关键在于首先创建一个布尔序列，用来表示哪个元素可满足我们的条件。然后compress()函数挑选出满足布尔值为 True 的相应元素。

同 filter()函数一样，正常情况下 compress()会返回一个迭代器。因此，如果需要的话，得使用 list()将结果转为列表。