---

title: Iterable and Iterator
date:  2018.5.7
categories:  Topics
tags:  Topics
keywords:  [iterable,iterator]

---


# 迭代工具

Python中有一类工具叫做迭代工具，他们能从左至右扫描对象。这包括了for循环、列表解析、in成员关系测试以及map内置函数等。

# 可迭代对象

可以用在上述迭代工具环境中，通过一次次迭代不断产生结果的对象。

可迭代对象分为两大类

1.实际保存的序列，即列表、元组，字符串；

2.“不一次性产生所有结果列表，而是可以在for循环中按需一次产生一个结果的对象”。

如：range函数返回值、zip函数返回值、enumerate函数返回值等等，与实际序列相对应，这个叫做按需产生对象的虚拟序列。

# 迭代器

可迭代对象支持内置函数iter，通过对可迭代对象调用iter函数，会返回一个迭代器，而“迭代器”支持内置函数next，通过不断对其调用next方法，会依次前进到序列中的下一个元素并将其返回，最后到达一系列结果的末尾时，会引发StopIteration异常。

补充说明一点，对迭代器调用iter方法，则会返回迭代器自身。

In [8]:
L = [2,3,4]
I = iter(L)
print(iter(L))
print(I is L)
print(I is iter(I))

<list_iterator object at 0x000001F3CB288EB8>
False
True


# 迭代过程

当任何可迭代对象传入到for循环或其他迭代工具中进行遍历时，迭代工具都是先通过iter函数获得与可迭代对象对应的迭代器，然后再对迭代器调用next函数，不断的依次获取元素，并在捕捉到StopIteration异常时确定完成迭代，这就是完整的迭代过程。这也称之为“迭代协议”

In [14]:
L = [2,3,4]
I = iter(L)
print(next(I))
print(next(I))
print(next(I))
# print(next(I)) #报错 StopIteration   

2
3
4


与手动迭代的示例过程相对应，下面是用for循环进行自动迭代的过程

In [16]:
L = [2,3,4]
for x in L:
    print(x)

2
3
4


# 文件对象

open函数返回的已打开的文件对象，也是可以一行一行的读取，直至文件结束，那很显然，他也是可迭代对象。

In [13]:
f = open('myfile.txt')
print(f is iter(f))# 不管f是迭代对象还是迭代器，iter(f) 返回的是迭代器
print(next(f)) # “迭代器”支持内置函数next,说明文件对象是迭代器
print(next(f))
print(next(f)) 

True
hello text file

goodbyt text file

hahahahah


文件对象既是迭代器，又是可迭代对象。

reference:

http://python.jobbole.com/85240/

http://python.jobbole.com/86258/

https://zhuanlan.zhihu.com/p/24376869

https://zhuanlan.zhihu.com/p/32508947

## [可迭代、迭代器、生成器](https://zhuanlan.zhihu.com/p/37049161)


### 可迭代的对象

可迭代的对象，很好理解，我们很熟悉的：字符串，list，dict，tuple，deque等

为了验证我说的，需要借助collections.abc这个模块（Python2没有），使用isinstance()来类别一个对象是否是可迭代的（Iterable），是否是迭代器（Iterator），是否是生成器（Generator）。

In [1]:
import collections
from collections.abc import Iterable, Iterator, Generator


# 字符串
astr = "XiaoMing"
print("字符串：{}".format(astr))
print(isinstance(astr, Iterable))
print(isinstance(astr, Iterator))
print(isinstance(astr, Generator))

# 列表
alist = [21, 23, 32,19]
print("列表：{}".format(alist))
print(isinstance(alist, Iterable))
print(isinstance(alist, Iterator))
print(isinstance(alist, Generator))

# 字典
adict = {"name": "小明", "gender": "男", "age": 18}
print("字典：{}".format(adict))
print(isinstance(adict, Iterable))
print(isinstance(adict, Iterator))
print(isinstance(adict, Generator))

# deque
adeque=collections.deque('abcdefg')
print("deque：{}".format(adeque))
print(isinstance(adeque, Iterable))
print(isinstance(adeque, Iterator))
print(isinstance(adeque, Generator))

字符串：XiaoMing
True
False
False
列表：[21, 23, 32, 19]
True
False
False
字典：{'name': '小明', 'gender': '男', 'age': 18}
True
False
False
deque：deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
True
False
False


从结果来看，这些可迭代对象都不是迭代器，也不是生成器。它们有一个共同点，就是它们都可以使用for来循环。这一点，大家都知道，我们就不去验证了。

> 可迭代对象，是其内部实现了，\__iter__ 这个魔术方法。可以通过，dir()方法来查看是否有\__iter__来判断一个变量是否是可迭代的。

### 迭代器

对比可迭代对象，迭代器其实就只是多了一个函数而已。就是\__next__()，我们可以不再使用for循环来间断获取元素值。而可以直接使用next()方法来实现。

迭代器，是在可迭代的基础上实现的。要创建一个迭代器，我们首先，得有一个可迭代对象。
现在就来看看，如何创建一个可迭代对象，并以可迭代对象为基础创建一个迭代器。

In [3]:
from collections.abc import Iterable, Iterator,Generator

class MyList(object):   # 定义可迭代对象类
    def __init__(self,num):
        self.end = num  # 上边界
        
    def __iter__(self):
        return MyListIterator(self.end)  # 返回一个实现了__iter__和__next__的迭代器类的实例'
    
    
class MyListIterator(object): # 定义迭代器类
    
    def __init__(self,end):
        self.data = end  # 上边界
        self.start = 0
    
    # 返回该对象的迭代器类的实例；因为自己就是迭代器，所以返回self
    def __iter__(self):
        return self
    
    # 迭代器类必须实现的方法，若是Python2则是next()函数
    def __next__(self):
        while self.start < self.data:
            self.start += 1
            return self.start - 1
        raise StopIteration
        
if __name__ == '__main__':
    my_list = MyList(5) # 得到一个可迭代对象
    print(isinstance(my_list, Iterable))
    print(isinstance(my_list, Iterator))
    for i in my_list:
        print(i)
    
    my_iterator = iter(my_list) # 得到一个迭代器
    print(isinstance(my_iterator, Iterable))
    print(isinstance(my_iterator, Iterator))    
    
    print(next(my_iterator))
    print(next(my_iterator))
    print(next(my_iterator))
    print(next(my_iterator))
    print(next(my_iterator))    

True
False
0
1
2
3
4
True
True
0
1
2
3
4


> 迭代器，是其内部实现了，\__iter__  和 \__next__ 这个魔术方法。(Python3.x，Python2中是next()方法)。可以通过，dir()方法来查看是否有\__next__来判断一个变量是否是迭代器的。


### 生成器

生成器的概念在 Python 2.2 中首次出现，之所以引入生成器，是为了实现一个在计算下一个值时不需要浪费空间的结构。

前面我们说，迭代器，是在可迭代的基础上，加了一个next()方法。**而生成器，则是在迭代器的基础上（可以用for循环，可以使用next()）**，再实现了yield。

yield 是什么东西呢，它相当于我们函数里的return。在每次next()，或者for遍历的时候，**都会yield这里将新的值返回回去，并在这里阻塞，等待下一次的调用**。正是由于这个机制，才使用生成器在Python编程中大放异彩。实现节省内存，实现异步编程。

如何创建一个生成器，主要有以下两种方法

In [4]:
# 使用列表生成式
# 使用列表生成式，注意不是[]，而是()
L = (x * x for x in range(10))
print(isinstance(L, Generator))  # True

# 实现了yield的函数
def mygen(n):
    now = 0
    while now < n:
        yield now
        now += 1

if __name__ == '__main__':
    gen = mygen(10)
    print(isinstance(gen, Generator))  # True

True
True


可迭代对象和迭代器，是将所有的值都生成存放在内存中，而**生成器则是需要元素才临时生成，节省时间，节省空间。**

#### 如何运行/激活生成器

由于生成器并不是一次生成所有元素，而是一次一次的执行返回，那么如何刺激生成器执行(或者说激活)呢？

激活主要有两个方法

1. 使用 next()
2. 使用 generator.send(None)

分别看下例子，你就知道了。

In [5]:
def mygen(n):
    now = 0
    while now < n:
        yield now
        now += 1

if __name__ == '__main__':
    gen = mygen(4)
    # 通过交替执行，来说明这两种方法是等价的。
    print(gen.send(None))
    print(next(gen))
    print(gen.send(None))
    print(next(gen))

0
1
2
3


#### 生成器的执行状态

生成器在其生命周期中，会有如下四个状态

- GEN_CREATED     等待开始执行 
- GEN_RUNNING     解释器正在执行（只有在多线程应用中才能看到这个状态）
- GEN_SUSPENDED   在yield表达式处暂停
- GEN_CLOSED      执行结束

In [6]:
from inspect import getgeneratorstate

def mygen(n):
    now = 0
    while now < n:
        yield now
        now += 1
        
if __name__ == '__main__':
    gen = mygen(2)
    print(getgeneratorstate(gen))
    print(next(gen))
    print(getgeneratorstate(gen))
    print(next(gen))
    gen.close()  # 手动关闭/结束生成器
    print(getgeneratorstate(gen))   

GEN_CREATED
0
GEN_SUSPENDED
1
GEN_CLOSED


#### 生成器的异常处理

在生成器工作过程中，若生成器不满足生成元素的条件，就会/应该 抛出异常（StopIteration）。通过列表生成式构建的生成器，其内部已经自动帮我们实现了抛出异常这一步。

In [9]:
L = (x*x for x in range(2))
print(next(L))
print(next(L))
print(next(L))

0
1


StopIteration: 

所以我们在自己定义一个生成器的时候，我们也应该在不满足生成元素条件的时候，抛出异常。

In [11]:
from inspect import getgeneratorstate

def mygen(n):
    now = 0
    while now < n:
        yield now
        now += 1
    raise StopIteration
        
if __name__ == '__main__':
    gen = mygen(2)
    print(next(gen))
    print(next(gen))
    print(next(gen))

0
1


  


StopIteration: 