# 迭代类型

## 迭代器协议

python中的容器都提供了迭代功能，可以通过如`for...in`等语句依次迭代访问容器中的各元素。

In [34]:
l = [1, 2, 3, 4]
for i in l:
    print(i)

1
2
3
4


而python中的迭代功能实际上是通过迭代器协议（Iterator Protocol）实现的。迭代器协议主要提供了两个内建方法，而实现了这两个方法的对象即满足迭代器协议，可以实现迭代功能。

- `iterator.__iter__()`返回一个迭代器对象，该方法使得无论是可迭代容器还是迭代器都可以出现在`for...in`语句中，并完成同样的功能。要求`__iter__()`方法返回的对象实现`__next__()`方法。通过`iter()`函数，即可以调用迭代器对象的`__iter__()`方法。

- `iterator.__next__()`返回容器中的下一项，若已到达最后一项，则抛出`StopIteration`异常。通过`next()`函数，即可调用迭代器对象的`__next__()`方法。

类似的，通过`len()`函数，即可调用对象的`__len__()`方法。

## `collections.abc`模块

python中`collections`模块提供了两个与迭代类型相关的抽象基类，分别为可迭代对象与迭代器提供了接口。

- `collections.abc.Iterable`为可迭代对象提供接口，定义了`__iter__()`方法。
- `collections.abc.Iterator`为迭代器提供接口，定义了`__iter__()`与`__next__()`方法。

可以通过以上两个抽象基类判断一个对象是否为可迭代对象或迭代器对象，即实现了`__iter__()`方法的对象为可迭代对象，而实现了`__iter__()`与`__next__()`方法的对象为迭代器对象。

In [33]:
import collections

In [30]:
class NonIterable:
    pass

non_iterable = NonIterable()
isinstance(non_iterable, collections.abc.Iterable)

False

In [31]:
class IsIterable:
    def __iter__(self):
        pass
    
is_iterable = IsIterable()
isinstance(is_iterable, collections.abc.Iterable)

True

In [32]:
class IsIterator:
    def __next__(self):
        pass
    
    def __iter__(self):
        pass

is_iterator = IsIterator()
isinstance(is_iterator, collections.abc.Iterator)

True

`isinstance(obj, Iterable)`可以判断对象是否包含`__iter__()`方法，但对于通过`__getitem__()`方法实现迭代的对象无法判断。因此，判断某个对象是否是可迭代对象的唯一可靠方法是通过`iter(obj)`。

而根据`collections.abc.Iterable`与`collections.abc.Iterator`两个抽象基类，可以将迭代类型对象分为可迭代对象与迭代器对象两类。

## 可迭代对象

实现了`__iter__()`方法的对象即为可迭代对象，`__iter__()`方法将返回可迭代对象的一个新的迭代器，`iter(obj)`函数将直接调用`obj.__iter__()`方法。

一般的，`tuple`、`list`、`set`、`dict`、`file`、`string`等对象都是可迭代对象。通过`isinstance(obj, Iterable)`可判断对象`obj`是否为可迭代对象。

In [20]:
# list对象为可迭代对象
isinstance([], collections.Iterable)

True

In [22]:
# dict对象为可迭代对象
isinstance({'a': 1, 'b': 2}, collections.Iterable)

True

## 迭代器

迭代器对象需要同时实现`__iter__()`与`__next__()`两个方法，

- `__next__()`方法返回当前可迭代对象的中的下一项，如果已经没有多余项，则抛出`StopIteration`异常。

- `__iter__()`方法返回迭代器对象自身，迭代器对象中的`__iter__()`方法保证可迭代容器对象与迭代器对象都可以在`for...in`语句中使用。

Iterator objects also need to implement this method; they are required to return themselves. For more information on iterator objects, see Iterator Types.

Python supports a concept of iteration over containers. This is implemented using two distinct methods; these are used to allow user-defined classes to support iteration. Sequences, described below in more detail, always support the iteration methods.

One method needs to be defined for container objects to provide iteration support:

container.__iter__()
Return an iterator object. The object is required to support the iterator protocol described below. If a container supports different types of iteration, additional methods can be provided to specifically request iterators for those iteration types. (An example of an object supporting multiple forms of iteration would be a tree structure which supports both breadth-first and depth-first traversal.) This method corresponds to the tp_iter slot of the type structure for Python objects in the Python/C API.


Python defines several iterator objects to support iteration over general and specific sequence types, dictionaries, and other more specialized forms. The specific types are not important beyond their implementation of the iterator protocol.


python为不同的可迭代容器对象提供了不同类型的迭代器对象，这些不同类型的迭代器对象都满足迭代器协议。

通过`type()`函数可以返回对象的类型，可以发现不同的可迭代对象的迭代器类型是不同的。

In [23]:
l = [1, 2, 3]
type(iter(l))

list_iterator

In [24]:
s = {1, 2, 3}
type(iter(s))

set_iterator

In [25]:
d = {'a': 1, 'b': 2}
type(iter(d))

dict_keyiterator

In [26]:
ss = 'abcdefg'
type(iter(ss))

str_iterator

## 生成器类型的迭代器

python的生成器为实现迭代器协议提供了一种方便的方式。

若一个容器对象的`__iter__()`方法以生成器方式实现，则其会自动返回一个迭代器对象，该对象自动支持`__iter__()`与`__next__()`方法。