# Python迭代器

## 1.可迭代对象、系列和迭代器判断

### 1.1 可迭代对象 or 迭代器

**可迭代**：在Python中如果一个对象有__iter__( )方法或__getitem__( )方法，则称这个对象是可迭代的（Iterable）；其中__iter__( )方法的作用是让对象可以用for ... in循环遍历，__getitem__( )方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。换句话说，两个条件只要满足一条，就可以说对象是可迭代的。
**迭代器**：在Python中如果一个对象有__iter__( )方法和__next__( )方法，则称这个对象是迭代器（Iterator）；其中__iter__( )方法是让对象可以用for ... in循环遍历，__next__( )方法是让对象可以通过next(实例名)访问下一个元素。注意：这两个方法必须同时具备，才能称之为迭代器。

一个实现了iter方法的对象是可迭代的，一个实现next方法的对象是迭代器
**可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator。**

利用**collections模块**可以判断可迭代对象还是迭代器，方法如下：

from collections import Iterator  #迭代器
from collections import Iterable  #可迭代对象
 
print(isinstance(s,Iterator))     #判断是不是迭代器
print(isinstance(s,Iterable))       #判断是不是可迭代对象

>判断下列数据类型是可迭代对象or迭代器

In [3]:
s='hello'     #字符串是可迭代对象，但不是迭代器
l=[1,2,3,4]     #列表是可迭代对象，但不是迭代器
t=(1,2,3)       #元组是可迭代对象，但不是迭代器
d={'a':1}        #字典是可迭代对象，但不是迭代器
set={1,2,3}     #集合是可迭代对象，但不是迭代器
# *************************************
# f=open('test.txt') #文件是可迭代对象，是迭代器

from collections import Iterator  #迭代器
from collections import Iterable  #可迭代对象

print(isinstance(s,Iterable),isinstance(s,Iterator))     
print(isinstance(l,Iterable),isinstance(l,Iterator))  
print(isinstance(t,Iterable),isinstance(t,Iterator))  
print(isinstance(d,Iterable),isinstance(d,Iterator))  
print(isinstance(set,Iterable),isinstance(set,Iterator)) 
# print(isinstance(set,Iterable),isinstance(set,Iterator)) 

True False
True False
True False
True False
True False


>小结：
凡是可作用于for循环的对象都是Iterable类型；
凡是可作用于next()函数的对象都是Iterator类型，它们表示一个惰性计算的序列；
集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象；
**文件是可迭代对象，是迭代器**。

### 1.2 可迭代 or 序列

可迭代是任何你可以用 Python 中的 for 循环遍历的东西。可迭代意味着可以遍历，任何可以遍历的东西都是可迭代的。
序列是一种非常常见的可迭代类型，它有一些特定的特征集，它可以从 0 开始索引，以小于序列的长度结束，它有一个长度并且可以被切分。

In [4]:
numbers = [1,2,3,5,7]
coordinates = (4,5,7)
words = "hello there"
fruits = {'lemon','apple','orange','watermelon'}
print(numbers[0])
print(coordinates[2])
print(words[4])
print(fruits[0])

1
7
o


TypeError: 'set' object does not support indexing

>小结：
列表、元组和字符串都是序列。集合不是序列，所以不支持索引。
**集合、字典、文件和生成器都是可迭代的，但是它们都不是序列**

## 2.迭代器的实现

可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator。
next 两种方式 t.__next__()  |  next(t)。

In [1]:
numbers = [1,2,3]
iterator = iter(numbers)
print(iterator)
print(iterator.__next__())
print(next(iterator))
print(next(iterator))
print(next(iterator))
print(next(iterator))

<list_iterator object at 0x0000026B516E8B38>
1
2
3


StopIteration: 

iter()将可迭代对象转化成迭代器。用next()来获取迭代器中的项，但是其中没有更多的项了，将得到一个 StopIteration异常。

## 3.迭代器驱动 for 循环

Python的for循环本质上就是通过不断调用next()函数实现的，例如：

In [None]:
for x in [1, 2, 3, 4, 5]:
    pass

实际上完全等价于

In [None]:
# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
    try:
        # 获得下一个值:
        x = next(it)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break

## 4.使用迭代器协议的东西

（1）for 循环使用了迭代器协议

In [None]:
numbers = [1, 2, 3, 4, 5]
for n in numbers:
    print(n)

（2）多重赋值也使用迭代器协议

In [6]:
a, b = 1, 2
a, b = b, a
print(a, b)

2 1


（3）拆包也是迭代

In [8]:
a, b = [3, 4]
print(a, b)
counts = {'apples': 2, 'oranges': 1}
x, y = counts
print(x, y)
# 比较
for key in counts:
    print(key)

3 4
apples oranges
apples
oranges


当你在字典上循环时，你会得到键；对一个字典进行拆包时，你也会得到键。这两者都用到了迭代器协议。

（4）星型表达式也是用迭代器协议

In [1]:
numbers = [1, 2, 3, 4, 5]
a,b, *rest = numbers
print(*rest)

[3, 4, 5]


（5）许多内置函数/对象依赖于迭代器协议。
Python 的 enumerate 和 reversed 对象就是迭代器；
Python 3 中，zip, map 和 filter 也是迭代器。

In [None]:
numbers = [1, 2, 3, 3, 4, 5]
unique_numbers = set(numbers)

In [5]:
letters = ['a','b','c']
e = enumerate(letters)
print(e)
print(next(e))
z = zip(numbers,letters)
print(z)
print(next(z))

<enumerate object at 0x000001687005E558>
(0, 'a')
<zip object at 0x0000016870059E88>
(1, 'a')


在 Python 中任何与迭代器一起工作的东西都可能以某种方式使用迭代器协议。**每当你在 Python 中遍历一个可迭代对象时，你将依赖于迭代器协议。**

## 5.迭代器的性质

（1）**迭代器是可迭代的**
当我们在可迭代对象上调用 iter 时，它会给我们返回一个迭代器；
**当我们在迭代器上调用 iter 时，它会给我们返回它自己。**

In [2]:
numbers = [1,2,3]
iterator1 = iter(numbers)
print(iterator1)
iterator2 = iter(iterator1)
print(iterator2)
iterator1 is iterator2

<list_iterator object at 0x000001687004D5C0>
<list_iterator object at 0x000001687004D5C0>


True

（2）迭代器没有长度，不能被索引
将其传递给内置的 next 函数，或者对其进行循环遍历(for或list)

In [None]:
numbers = [1,2,3,5,7]
iterator = iter(numbers)
# len(iterator)  # 会报错
# iterator[0]  # 会报错

（3）**迭代器是惰性迭代器**，它们是一次性使用，意味着它们只能循环遍历一次

In [15]:
numbers = [1,2,3,5,7]
iterator = iter(numbers)
for x in iterator:
    print("第一次遍历")
    print(x)
# print(next(iterator))
for x in iterator:
    print("第二次遍历")
    print(x)

第一次遍历
1
第一次遍历
2
第一次遍历
3
第一次遍历
5
第一次遍历
7


In [4]:
numbers = [1,2,3,5,7]
iterator = iter(numbers)
print(next(iterator))
print(list(iterator))
# 第二次循环遍历
print(list(iterator))

1
[2, 3, 5, 7]
[]


## 6 创建你自己的迭代器

下面这个类构造了一个迭代器接受一个可迭代的数字，并在循环结束时提供每个数字的平方。

In [None]:
classsquare_all:
    def__init__(self,numbers):
        self.numbers = iter(numbers)
    def__next__(self):
        return next(self.numbers) * 2
    def__iter__(self):
        return self

我们有一个无限长的可迭代对象 count，你可以看到 square_all 接受 count 而不用完全循环遍历这个无限长的迭代:

In [None]:
from itertools import count
numbers = count(5)
squares = square_all(numbers)
print(next(squares))
print(next(squares))

>这个迭代器类是有效的，但我们通常不会这样做。通常，当我们想要做一个定制的迭代器时，我们会生成一个生成器函数