需求:序列中含有一些数据。我们需要提取其中的值或根据某些标准对序列做删减。

解决:列表推导式

In [1]:
mylist = [1, 4, -5, 10, -7, 2, 3, -1]
b = [n for n in mylist if n > 0]
print(b)


[1, 4, 10, 2, 3]


In [2]:
# 列表推导式的缺点就是，原始输入非常大会导致产生庞大的结果。这时可以采取生成器表达式产生结果
pos = (n for n in mylist if n > 0)
pos

<generator object <genexpr> at 0x10aa8ae08>

In [4]:
# 对于一些复杂的筛选。没办法简单表示在列表推导式中的，可以使用filter()。filter()返回的是迭代器，
# 可以使用list()转换成列表类型
values = ['1', '2', '-3', '-', '4', 'N/A', '5']


def is_int(val):
    try:
        x = int(val)
        return True
    except ValueError:
        return False


ivals = list(filter(is_int, values))
print(ivals)
print(filter(is_int, values))


['1', '2', '-3', '4', '5']
<filter object at 0x10aad55c0>


# filter()使用介绍：

- filter()用于过滤序列，过滤不符合条件的元素，返回迭代器（3.0后返回的是迭代器)。
- filter()参数，第一个接收一个函数，第二个接收可迭代对象。序列每个元素作为参数传递给函数进行判断，然后filter()会将判断函数返回为True的元素写入到迭代器里。

- filter语法: `filter(funciton,iterable)`



In [6]:
# 替换序列中不满足要求的值
clip_neg = [n if n > 0 else 0 for n in mylist]
print(clip_neg)
clip_pos = [n if n < 0 else 0 for n in mylist]
print(clip_pos)


[1, 4, 0, 10, 0, 2, 3, 0]
[0, 0, -5, 0, -7, 0, 0, -1]


In [11]:
"""
    itertools.compress(),可以接受一个迭代对象及一个布尔选择器序列作为输入。
    输出时，它会输出所有在相应的布尔选择器中为True的可迭代对象元素。如果想把对一个序列筛选结果施加到另一
    个相关序列上时，是非常有用的。
    
    这里的关键是首先创建一个布尔序列，用来表示哪个元素可以满足我们条件。然后compress()挑选出满足布尔值为True
    的相应元素。
"""
from itertools import compress

address = [
    '5412 N CLARK',
    '5148 N CLARK',
    '5800 E 58TH',
    '2122 N CLARK',
    '5645 N RAVENSWOOD',
    '1060 W ADDISON',
    '4801 N BROADWAY',
    '1039 W GRANVILLE'
]
counts = [0, 3, 10, 4, 1, 7, 6, 1]

from itertools import compress

# 筛选counts
more5 = [n > 5 for n in counts]
print(more5)

# 即使address和more5的元素数量不对等，也能根据匹配到元素返回对应的结果。
result = list(compress(address, more5))
print(result)


[False, False, True, False, False, True, True, False, True, True]
['5800 E 58TH', '1060 W ADDISON', '4801 N BROADWAY']
