# 跳过可迭代对象中的前一部分元素

在对某个可迭代对象做迭代处理时，如果对前面几个元素不感兴趣，只想丢弃。

## 使用itertools.dropwhile()函数
- 只需要提供一个函数和一个可迭代对象
- 该函数返回的迭代器会丢弃掉序列中的前面几个元素， 只要他们在所提供的函数中但会True即可，之后序列中剩余的全部元素都会产生出来

In [1]:
%%writefile text.txt
# 1
# 2
# 3
# 4
5
6
# 7
6

Overwriting text.txt


跳过所有的初始注释行

In [2]:
from itertools import dropwhile
with open("text.txt") as f:
    for line in dropwhile(lambda x: x.startswith('#'), f):
        print(line, end='')

5
6
# 7
6

dropwhile()函数式根据测试函数的结果来跳过前面的元素

## 如果恰好知道要跳过多少个元素，可以使用itertools.islice()函数

In [3]:
from itertools import islice
items = ['a', 'b', 'c', 1, 4, 10, 15]
for x in islice(items, 3, None):
    print(x)

1
4
10
15


dropwhile()和islice()都是很方便实用的函数，可以利用它们来避免写出如下所示的混乱代码

In [4]:
with open("text.txt") as f:
    # 跳过开头的注释
    while True:
        line = next(f, '')
        if not line.startswith('#'):
            break;
    
    # 处理剩余的内容
    while line:
        print(line, end='')
        line = next(f, None)

5
6
# 7
6

只丢弃可迭代对象中的前一部分元素和对全部元素进行过滤也是有所区别的。可以重写如下代码：

In [5]:
with open("text.txt") as f:
    lines = (line for line in f if not line.startswith("#"))
    for line in lines:
        print(line, end='')

5
6
6