## 4.1 手动访问迭代器中的元素

问题：想处理某个可迭代对象中的元素，但是基于某种原因不能使用for循环

解决方案：手动访问可迭代对象中的元素，可以使用`next()`函数，然后自己编写代码捕获StopItratin异常。

## 4.2 委托迭代

问题：我们构建了一个自定义的容器对象，内部持有一个列表、元组或其他可迭代对象。想让新容器完成迭代操作。

解决方案：定义一个\_\_iter\_\_()方法，将迭代请求委托到对象内部持有的容器上。如下所示：

In [1]:
# example 
class Node:
    def __init__(self, value):
        self._value = value
        self._children = []
        
    def __repr__(self):
        return 'Node({!r})'.format(self._value)
    
    def add_child(self, node):
        self._children.append(node)
        
    def __iter__(self):
        return iter(self._children)

Python的迭代协议要求\_\_iter\_\_()返回一个特殊的迭代器对象，有该对象实现的\_\_next\_\_()方法完成实际的迭代。如果要做的知识迭代另一个容器中的内容，我们不必担心底层细节如何工作，要做的是转发迭代请求。



## 4.3 用生成器创建新的迭代模式

问题： 我们想实现一个自定义的迭代模式，使其区别于常见的内建函数（如range(),reversed()等）。

解决方案：可以使用生成器函数来定义新的迭代模式。可以使用for循环对其进行迭代，或通过其他可以访问可迭代对象中元素的函数，如sum()、list()等来使用。

函数中只要出现了`yield`语句就会将其转变成一个生成器。与普通函数不同，生成器只会在相应迭代操作时才会运行。

In [1]:
# example
def Fabonacci(n):
    a = 1
    b = 1
    i = 0
    while True:
        if i < n:
            yield a
            a, b = b, a + b
            i += 1
        else:
            raise StopIteration

In [2]:
for i in Fabonacci(5):
    print(i)

1
1
2
3
5


RuntimeError: generator raised StopIteration

## 4.4 实现迭代协议

问题：构建自定义对象，我们希望它可以支持迭代操作，希望有一种简单的方式实现迭代协议。

解决方案：在对象上实现可迭代功能，最简单的方式是使用生成器函数。

## 4.5 反向迭代

问题：反向迭代序列中的元素

解决方案：使用内建的`reversed()`函数实现。

In [4]:
# example
a = [1,2,3,4]
for v in reversed(a):
    print(v)

4
3
2
1


反向迭代只有待处理对象有确定的大小，或对象实现了\_\_reversed\_\_()特殊方法时才奏效。如果这两个条件都无法满足，必须先将这个对象转换为列表。

## 4.6 定义带有额外状态的生成器函数

问题：想定义一个生成器函数，但它还设计一些额外的状态，我们希望能以某种形式讲这些状态暴露给用户。

解决方案：

## 4.7 对迭代器做切片操作

问题：想对迭代器产生的数据做切片操作，但普通切片操作符在这里不管用。

解决方案：使用`itertools.islice()`函数对迭代器和生成器做切片操作。

In [5]:
# example
import itertools

def count(n):
    while True:
        yield n
        n+=1
        if n>20:
            raise StopIteration

In [6]:
a = count(3)

In [7]:
for x in itertools.islice(a, 4,7):
    print(x)

7
8
9


迭代器和生成器是没办法执行普通的切片操作的，因为不知道它们的长度是多少（而且它们也没有实现索引）。islice()产生的结果是一个迭代器，它可以产生出所需要的切片元素，这是通过**访问并丢弃所有起始索引之前的元素**实现的。之后的元素会由islice对象产生出来，直到到达结束索引为止。

## 4.8 跳过可迭代对象中的前一部分元素

问题：相对某个可迭代对象做迭代处理，但对前面几个元素不感兴趣，只想将它们丢弃掉。

解决方案：`itertools.dropwhile()`函数可以解决这个问题，需要为其提供一个函数和一个可迭代对象。该函数返回的迭代器丢掉序列中的前几个元素

## 4.9 迭代所有可能的组合或排列

问题：想对一系列元素所有可能的元素进行排列或迭代

解决方案：

## 4.10 以索引-值对的形式迭代序列

问题：想迭代一个序列，但是又想记录下序列中当前处理到的元素索引

解决方案：enumerate()函数

## 4.11 同时迭代多个序列

问题：我们想要迭代的元素包含在多个序列中，我们想同时对它们进行迭代。

解决方案：使用`zip()`函数同时迭代多个序列

In [14]:
# example
xpts = [1, 2, 3, 4]
ypts = [5, 6, 7, 8]
for x, y in zip(xpts, ypts):
    print("(x,y) = " f'({x},{y})')

(x,y) = (1,5)
(x,y) = (2,6)
(x,y) = (3,7)
(x,y) = (4,8)


zip(a, b)的工作原理是创建出一个**迭代器**，该迭代器可产生元组(x, y)，这里的x取自序列a，而y取自序列b。当其中某个输入序列中没有元素可以继续迭代时，整个迭代过程结束。因此整个迭代的长度和其中最短的输入序列长度相等。

如果需要将配对的数据保存为列表，需要使用list()函数。

## 4.12 在不同的容器中进行迭代

问题：需要对许多对象执行相同的操作，但这些对象包含在不同的容器中，希望避免嵌套循环处理，保持代码的可读性。

解决方案：itertools.chain()可以简化这个任务。它接受一系列可迭代对象作为输入并返回一个**迭代器**，该迭代器掩盖了一个事实：实际上在对多个容器进行迭代。该方法常用于一次性对所有元素执行某项特定操作，但这些元素分散在不同的集合中。该方法比将各序列合并后再迭代要更高效。

In [15]:
# example 
from itertools import chain
a = [1,2,3]
b = ['a','b','c']
for x in chain(a,b):
    print(x)

1
2
3
a
b
c


## 4.13 创建处理数据的管道

问题：我们想以流水线式的形式对数据进行迭代处理。比方说我们有海量数据需要处理，但无法将其全部加载到内存中。

解决方案：生成器函数是一种实现管道机制的好方法。

In [16]:
# example


## 4.14 扁平化处理嵌套型的序列

问题：我们有一个嵌套形的序列，想将它扁平化处理为一列单独的值。

解决方案：可以通过写一个带有yield from语句的递归生成器函数来解决。

In [23]:
# example
import collections

def flatten(items, ignore_types=(str, bytes)):
    for x in items:
        if isinstance(x, Iterable) and not isinstance(x, ignore_types):
            yield from flatten(x)
        else:
            yield x

使用yield from将可迭代对象作为种子例程进行递归，将其所有值都产生出来。

## 4.15 合并多个有序序列，再对整个有序序列进行迭代

问题：有一组有序序列，想对它们合并在一起后的有序序列进行迭代。

解决方案：使用`heapq.merge()`函数。

In [24]:
# example
import heapq
a = [1, 2, 3, 4]
b = [5, 6, 7, 8]
for c in heapq.merge(a, b):
    print(c)

1
2
3
4
5
6
7
8


`heapq.merge()`的迭代性质意味着它对所有提供的序列都不会做一次性提取。意味着可以用它处理非常长的序列，而且内存开销非常小。

注意：`heapq.merge()`要求所有输入序列都是有序的。他不会预先做任何排序工作。