# 1. 可迭代对象 (Iterable)

<img src="resource/可迭代对象.jpg" style="zoom:80%">

**可迭代对象（Iterable）**：支持使用for循环的方式一次访问自己的一个元素；任何在类中实现了\_\_iter\_\_方法或者在\_\_getitem\_\_方法中实现取出序列操作的类对象都是可迭代对象

<img src="resource/可迭代对象、迭代器、生成器的联系.png" style="zoom:80%">  
<center>Python的可迭代对象</center>

In [1]:
"abc".__iter__ # 字符串对象有__iter__方法，因此字符串是可迭代对象

<method-wrapper '__iter__' of str object at 0x00000209B0C02070>

In [2]:
[1,2,3,4].__iter__ # 列表对象有__iter__方法，因此列表是可迭代对象

<method-wrapper '__iter__' of list object at 0x00000209B567C7C0>

In [3]:
a = 19
a.__iter__ # 整型对象没有__iter__方法，因此int不是可迭代对象

AttributeError: 'int' object has no attribute '__iter__'

也可以用内置函数iter()来判断是否为可迭代对象。

In [None]:
iter([1,2,3])

In [None]:
iter("Hello")

In [None]:
iter(4)

**注意**： iter() 方法返回了一个迭代器

```课堂练习```  

实现一个 is_iterable(param) 函数，判断 param 是不是可迭代对象。

```参考```

In [None]:
def is_iterable(param):
    """判断 param 对象是不是可迭代对象 
    
    >>>is_iterable([1,2,3])
    True
    >>>is_iterable(123)
    False    
    """
    try:
        iter(param)
        return True
    except TypeError:
        return False
    
is_iterable(123)

```课堂练习```  

实现一个扑克牌类，能够进行按张迭代。

In [39]:
import random

class PokerCard:
    
    def __init__(self):
        self.cards = [(pattern, number) for pattern in ('♠','♥','♦','♣') 
                     for number in list("123456789JQK")+["10"]] 
        self.cards.extend(('大王','小王'))
        
        
    def __iter__(self):
        return iter(self.cards)
    
    def shuffle(self):
        """
        洗牌
        """
        return random.shuffle(self.cards)

cards = PokerCard()
cards.shuffle()
for card in cards:
    print(card)

('♦', 'K')
('♥', 'J')
('♦', '8')
('♣', '7')
('♣', '1')
('♥', '6')
('♠', 'J')
('♦', '5')
('♥', '9')
('♥', '2')
('♣', '8')
('♣', '3')
('♥', 'K')
('♣', '6')
('♥', '8')
('♦', '7')
('♦', '6')
('♦', '9')
('♦', '10')
('♠', 'Q')
('♦', '4')
('♥', '3')
('♠', '1')
('♣', 'Q')
('♦', '1')
('♥', '10')
('♠', 'K')
('♠', '8')
('♥', '1')
('♠', '4')
('♣', '4')
('♦', '2')
('♦', 'J')
('♥', '4')
('♦', 'Q')
('♣', '2')
('♣', '10')
('♠', '9')
('♣', 'J')
('♠', '6')
('♥', 'Q')
('♠', '10')
('♣', '9')
大王
('♠', '3')
小王
('♣', '5')
('♦', '3')
('♣', 'K')
('♠', '2')
('♥', '5')
('♠', '7')
('♠', '5')
('♥', '7')


```结果分析```：

任何实现了__iter__方法的类的对象就是可迭代对象。本例其实是基于列表的迭代器来完成的，并没有真正定义迭代的规则。要真正定义迭代规则，须实现一个迭代器。

# 2. 迭代器 Iterator   


**for item in Iterable 循环的本质** 就是先通过 iter() 函数获取可迭代对象 Iterable 的迭代器，然后对获取到的迭代器不断调用next()方法来获取下一个值并将其赋值给item，当遇到StopIteration的异常后循环结束。

In [4]:
sentence = 'hello'
iterator1 = iter(sentence)
iterator1

<str_iterator at 0x209b56f81f0>

In [5]:
iterator1.__next__()

'h'

In [6]:
iterator1.__next__()

'e'

In [7]:
iterator1.__next__()

'l'

In [8]:
iterator1.__next__()

'l'

In [9]:
iterator1.__next__()

'o'

In [10]:
try:
    iterator1.__next__()
except StopIteration:
    print('输出结束')

输出结束


iterator 里的元素已经取完，因此再执行 next() 的时候会引发 StopIteration 的异常。可以说，迭代器就是一个实现了 \_\_iter\__ 和 \_\_next\__ 方法的类。  

```课堂任务```  

使用 while 循环，通过next方法遍历一个列表中的所有元素并打印

In [33]:
alist = list("Python is So Funny")
alist_iter = iter(alist)
while True:
    try:
        elemnt = next(alist_iter)
        print(elemnt,end=',')
    except StopIteration:
        break
        

P,y,t,h,o,n, ,i,s, ,S,o, ,F,u,n,n,y,

这个只是一个示例，我们大多数情况都是使用 for 循环来遍历一个可迭代对象的。但是了解迭代机制对我们自己定义一个可以迭代的类很有帮助。

```例题```  

使用迭代器的方式产生裴波那切数列。  

In [35]:
# 一个实现了iter方法和next方法的对象，就是迭代器
class Fibs:
    
    def __init__(self, N):
        self.a = 1
        self.b = 1
        self.limit = N
        
    def __next__(self):
        self.a, self.b = self.b, self.a + self.b
        if self.b < self.limit:
            return self.a
        else:
            raise StopIteration
    
    def __iter__(self):
        return self

In [37]:
fibs = Fibs(10000)

In [38]:
# 从迭代器中创建序列
print(list(fibs))

[1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181]


```课堂练习``` 



# 3. 生成器 Generator  


如果需要容纳大量数据方便我们取用，可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的，而且创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就**不必创建完整的列表，从而节省大量的空间**。在Python中，这种**一边循环一边计算的机制，称为生成器：generator**

Python中生成器是迭代器的一种，使用 **yield** 返回值，每次调用 yield 会暂停，下一次迭代的时候可以使用next()函数恢复生成器。

### 创建生成器的方法

**方法一：**
只要把一个列表推导式的 \[\] 改为（），就可以创建一个generator

In [None]:
#列表推导式
lst = [x*x for x in range(10)]
lst

In [None]:
#生成器
generator_ex = (x*x for x in range(10))
print(generator_ex)

In [None]:
#生成器
generator_ex = (x*x for x in range(10))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))
print(next(generator_ex))

大家可以看到，generator里面其实保存的是算法，每次调用 **next(generaotr_ex)** 就计算出它的下一个元素的值，直到计算出最后一个元素，没有更多的元素时，抛出StopIteration的错误。  
而且上面这样不断调用是一个不好的习惯。正确的方法是使用for循环（generator也是迭代器，也支持for循环取元素）

In [None]:
#生成器
generator_ex = (x*x for x in range(10))
for i in generator_ex:
    print(i)

**方法二:**  
如果推算下一个元素的算法比较复杂，用类似列表生成式的一行代码无法实现的时候，还可以用函数来实现，并且在生成下一个值的地方使用 **yield** 关键字。这样带有 yield 关键字的函数就返回了一个生成器

In [1]:
# 使用生成器来产生斐波那契数列
def fib2(max_value):
    n,a,b =0,0,1
    while n < max_value:
        yield b
        a,b =b,a+b
        n = n+1

fib_generator = fib2(5)
fib_generator

<generator object fib2 at 0x00000298A512E430>

In [2]:
for i in fib_generator:
    print(i)

1
1
2
3
5


**生成generator函数的执行流程:** 函数是顺序执行的，遇到 return 语句或者函数的最后一行语句就返回，而变成generator 的函数在每次调用 next() 的时候执行，遇到 yield 语句返回，再次被 next（）调用时候从上次的返回 yield 语句处继续执行，也就是用多少，取多少，不占内存。

In [47]:
def count(n):
    while n > 0:
        print('before yield')
        yield n
        n -= 1
        print('after yield')

In [48]:
test = count(3)

In [49]:
test.__next__()

before yield


3

In [50]:
test.__next__()

after yield
before yield


2

In [51]:
test.__next__()

after yield
before yield


1

In [52]:
test.__next__()

after yield


StopIteration: 

```课堂练习```  

输入一个数字 n，写一个程序判断 0 到 n 之间的偶数，并用逗号分隔来输出。

In [53]:
def generate_even(n):
    num = 0
    while num <= n:
        if num%2 == 0:
            yield num
        num += 1

for i in generate_even(20):
    print(i,end=',')

0,2,4,6,8,10,12,14,16,18,20,

```课堂练习```  

按照规则从文件内搜索匹配一定格式的文本行。

In [3]:
def readfile(filename):
    """打开一个文件，并返回每一行文件的内容"""
    with open(filename,'r',encoding='utf-8') as reader:
        for line in reader:
            yield line

def grep(pattern, lines):
    """返回匹配 pattern 字符串的所有行"""
    return (line for line in lines if pattern in line)

def printlines(lines):
    """打印所有行"""
    for line in lines:
        print(line, end="")

def main(pattern, filename):
    lines = readfile(filename)
    lines = grep(pattern, lines)
    printlines(lines)

In [5]:
main('陈冲','data\\movies.txt')

{"index": "44", "image": "https://p0.meituan.net/moviemachine/081194992e014d3d7ff17aa7d0598179919881.jpg@160w_220h_1e_1c", "title": "末代皇帝", "actor": "尊龙,陈冲,彼得·奥图尔", "time": "1987-10-04(日本)", "score": "8.8"}
{"index": "44", "image": "https://p0.meituan.net/moviemachine/081194992e014d3d7ff17aa7d0598179919881.jpg@160w_220h_1e_1c", "title": "末代皇帝", "actor": "尊龙,陈冲,彼得·奥图尔", "time": "1987-10-04(日本)", "score": "8.8"}


# iteratools  
提供了一系列用于操作iterator的函数

In [None]:
import itertools

In [None]:
# 累加
x = itertools.accumulate(range(10))
x

In [None]:
list(x)

In [None]:
# 连接多个列表或者迭代器
x = itertools.chain(range(3), range(4), [3,2,1])
list(x)

In [None]:
# 求列表或生成器中指定数目的元素不重复的所有组合
x = itertools.combinations(range(4), 3)
list(x)

In [None]:
# 允许重复元素的组合
x = itertools.combinations_with_replacement('ABC', 2)
list(x)

In [None]:
# 按照真值表筛选元素
x = itertools.compress(range(5), (True, False, True, True, False))
list(x)

In [None]:
# 切片 start, stop, step
x = itertools.islice(range(10), 0, 9, 2)
list(x)

In [None]:
# 计数器,可以指定起始位置和步长
x = itertools.count(start=20, step=-1)
list(itertools.islice(x, 0, 10, 1))

In [None]:
# 循环指定的列表和迭代器
x = itertools.cycle('ABC')
list(itertools.islice(x, 0, 10, 1))

In [None]:
# 按照真值函数丢弃掉列表和迭代器前面的元素
x = itertools.dropwhile(lambda e: e < 5, range(10))
list(x)

In [None]:
# 与dropwhile相反，保留元素直至真值函数值为假。
x = itertools.takewhile(lambda e: e < 5, range(10))
list(x)

In [None]:
# 保留对应真值为False的元素
x = itertools.filterfalse(lambda e: e < 5, (1, 5, 3, 6, 9, 4))
list(x)

In [None]:
# 按照分组函数的值对元素进行分组
x = itertools.groupby(range(10), lambda x: x < 5 or x > 8)             
for condition, numbers in x:       
    print(condition, list(numbers)) 

In [None]:
# 产生指定数目的元素的所有排列(顺序有关)
x = itertools.permutations(range(4), 3)
list(x)

In [None]:
# 产生多个列表和迭代器的(积)
x = itertools.product('ABC', range(3))
list(x)

In [None]:
# 简单的生成一个拥有指定数目元素的迭代器
x = itertools.repeat(0, 5)
list(x)

In [None]:
# 类似map
x = itertools.starmap(str.islower, 'aBCDefGhI')
list(x)

In [None]:
# 生成指定数目的迭代器
x = itertools.tee(range(10), 2)
for letters in x:
    print(list(letters))

In [None]:
# 类似于zip，不过已较长的列表和迭代器的长度为准
x = itertools.zip_longest(range(3), range(5))
print(list(x))
y = zip(range(3), range(5))
print(list(y))

In [None]:
def gen_squares(num):
    for x in range(num):
        yield x ** 2
        print('x={}'.format(x))

for i in gen_squares(4):
    print('x ** 2={}'.format(i))
    print('--------------')


我们不难发现，生成器函数计算出x的平方后就挂起退出了，但他仍然保存了此时x的值，而yield后的print语句会在for循环的下一轮迭代中首先调用，此时x的值即是上一轮退出时保存的值。
